О создании OCR-слоя в дежавю. Вопрос знатокам
Опубликовано вс, 14/04/2013 - 00:19 пользователем sad369
Forums: Есть одна проблема с работой DjvuOCR, может кто-то знает решение?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 день
sem14 RE:Серия "Символы времени" издательства "Аграф" 3 дня Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 6 дней нэнси RE:Подайте бедному копеечку на книжку с литреса... 1 неделя tvv RE:faq brainstorm =) 1 неделя Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 1 неделя Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя larin RE:абонемент не обновлен 2 недели sem14 RE:За иллюминатором (серия) - чего не хватает? 2 недели sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 2 недели Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 недели larin RE:Пропал абонемент 3 недели tvv RE:DNS 3 недели MrMansur RE:<НРЗБ> 1 месяц Stager RE:Беженцы с Флибусты 1 месяц Tramell RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц Впечатления о книгах
Sello про Нечаев: АнтиNаполеон (История, Публицистика)
30 01 Не смог дочитать до конца, хотя до этого несколько прочитанных книг Нечаева дали повод составить об авторе благоприятное мнение. В аннотации написано про "глобальный бренд" по имени Наполеон, но в содержании нечто обратное: ……… Оценка: нечитаемо
Олег Макаров. про Карелин: Торговец Правдой 1 (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
30 01 Феерическая чушь. Как будто взяли штампы и наштамповали. Оценка: нечитаемо
Oleg68 про Хайнлайн: Туннель в небе [Tunnel In The Sky ru] (Научная фантастика)
27 01 Мне понравилось. Не понял отзыв об американских детишках. Американский автор должен писать о советских детишках? Так для этого есть Головачев и другие.
Stager про Оченков: Гроза над Бомарзундом [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
26 01 Первую я с трудом осилил. Автор, конечно, ни в чём не разбирается, но исторический наброс любопытен. А дальше... Автор совсем ни в чём не разбирается... Ну да, сталей у него не было, но было естественно-легированное шведское ……… Оценка: плохо
mysevra про Сейгер: Дом на краю темноты [litres] [Home Before Dark] (Триллер, Детективы: прочее)
26 01 Неоправданно затянуто и невыразительно. Разочарование было бы меньше, если бы книга не упоминалась во всех попадающихся мне списках «самых страшных историй». Оценка: неплохо
mysevra про Гроут: Сила благодарности [litres] (Психология, Самосовершенствование, Психотерапия и консультирование)
26 01 Большинство из нас даже не заметили, как превратились из «ух ты!» в вечно недовольных и сердито бубнящих големов. Оценка: отлично!
mysevra про Леушкин: Турбо-Суслик. Как прекратить трахать себе мозг и начать жить (Психология)
26 01 Мне очень нравится то, что обещают в результате. Но меня беспокоит формулировка. То есть, если это работает, то я буду добровольно грузить в своё подсознание абсолютно непроверенную чужую установку, даже не зная её сути. У ……… Оценка: неплохо
alexk про Грин: Метод Грина. Твоя жизнь — твой сценарий (Экономика)
25 01 серийный предприниматель"? Чикатилла от бизнеса?
polyn про Вендиг: Книга несчастных случаев [litres] (Ужасы, Триллер, Мистика)
25 01 Эта книга стала не открытием, а разочарованием. Слишком затянуто, слишком сумбурно, слишком заумно. Оценка: неплохо
polyn про Валентайн: Принц из книжного [litres] (Современные любовные романы)
25 01 Поклонникам молодёжной романтики, думаю, книга понравится. Оценка: хорошо
vudy про Март: Темный континент (Боевая фантастика, Самиздат, сетевая литература)
24 01 ... мебель разбросана в беспорядке, который держится уже много лет" И тому подобное убожество. Оценка: нечитаемо
udrees про Верхотуров: «Джамаат Таблиги». Самая закрытая секта в мире (Публицистика, Документальная литература)
24 01 Книга для более-менее подготовленного читателя из-за обилия специфических исламских мусульманских терминов. Хоть бы сноску внизу делали, что означает то или иное слово. А так книга описывает историю возникновения и деятельность ……… Оценка: хорошо |
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
На этом сайте: http://djvu-soft.narod.ru/index.htm пробовали пошарится, вопросы позадавать?
На нём спецов по работе с форматом DjVu гораздо больше, чем здесь.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Судя по числу дежавю книг, появившихся здесь за последний год, здесь тоже книгоделов хватает. Но, разумеется я задал тот же вопрос на специализированном форуме у Ершова.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
занимаюсь дежавюками, но с таким не сталкивался и не заморачивался, поскольку встроенная в djvu express editor оцр от iris коряво понимает русский язык, а ежли через файнридер распознавать - нафига тогда джвю? :D сразу уж тогда в фб2
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Что-то у меня туго с объединением. Я использую сильно облегченную версию DEE, кажется, там нет этой функции. Если я правильно понял, то полная версия может объединить графику одного файла с текстовым слоем другого?
OCR от DEE использовать смысла нет. Проще заново весь файл через файнридер прогнать. Но проблема в том, что в файле №1 уже был спеллчек сделан перед сохранением в дежавю. Терять такую работу это не выход.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Может поможет эта тема?
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Совет господина Zadd
успешно сработал! Премного благодарен! Хотя немного муторно по одной странице косяки вычищать, но другого способа видимо нет. Правда распознавал "чистовую" версию с черно-белым текстом, а как повел бы себя DjvuOCR на этот раз не скажу. Обошелся файнридеровскими дежавюшками (несколько файлов по одной странице), которые прикрепил к итоговому файлу.
Небольшая поправка: раньше делали. Сейчас это уже моветон.
Upd. По здравому размышлению хочу добавить, что проблема разрешена лишь частично. Все же примерно 60 страниц (из 560) окажутся с новым, не таким качественно исправленным текстовыи слоем, каким он был после спеллчека Голмы1. Так что жалоба на работу djvuOCR остается в силе.