Вы здесьПроблемы и приемы OCR: dewarp
Опубликовано ср, 06/05/2009 - 04:06 пользователем Ulenspiegel
Если при сканировании книжка не прижата плотно к предметному стеклу, участки строк, находящиеся вблизи разворота, искривляются. При сильном искривлении (заползание на уровень соседней строки) программы распознавания приходят от таких червячков в недоумение. Не знает ли всемогущий All алгоритмов и (что еще лучше) готовых программ для борьбы с таким безобразием ?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
logusss RE:Прошу переформатировать, распознать, etc... 8 часов
нэнси RE:Подайте бедному копеечку на книжку с литреса... 1 день akorish RE:Регистрация 1 неделя Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 неделя konst1 RE:Ух, как я не люблю спамеров! 1 неделя tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 1 месяц larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца Впечатления о книгах
akorish про Роман Юрьевич Прокофьев
12 05 Стеллар оставил положительные чувства, хотя последняя книга была нудноватой лично для меня. Но это не отменяет, того, что время потрачено не зря.
akorish про Прокофьев: Архив Стеллара (Фантастика: прочее, Самиздат, сетевая литература)
12 05 Ну такое, как сноски почитать. Мне было уже не интересно. Оценка: неплохо
akorish про Прокофьев: Прометей [СИ] (Боевая фантастика, Героическая фантастика, Постапокалипсис, ЛитРПГ, Самиздат, сетевая литература)
12 05 Самопожертвование, и отвага, нудновато, но дочитано. Думаю, что эта книга была уже лишней, много затянутого. Сария стоящая, почитайте. Оценка: хорошо
akorish про Прокофьев: Сфирот [СИ] (Героическая фантастика, Фантастика: прочее, ЛитРПГ, Самиздат, сетевая литература)
12 05 Переносимся в космос, все еще интересно? Ну тако-то да, но уже нудновато.
akorish про Прокофьев: Эфемер [СИ] (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
12 05 Даат - как бы и нельзя договариваться, но и не договариваться нельзя ))) Что же за Дар? Сыр в мышеловке.
akorish про Прокофьев: Легат [СИ] (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
12 05 Оценка все еще Хорошо! Не так интересно как 1я и 2я, но еще интересно, новые союзники и новые враги. Читаем дальше. Оценка: хорошо
akorish про Прокофьев: Архонт [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Неожиданно интересно, новый уровень и новый замут. Читаем дальше.
akorish про Прокофьев: Мятежник [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Мысль такая, идет прокачка персонажа, уже не так захватывает, как предыдущие, но читается на интересе.
akorish про Прокофьев: Заклинатель [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 3я книга сдает позиции по отношению к предыдущим, но читать не надоедает. Оценка: хорошо
akorish про Прокофьев: Трибут [СИ] (Боевая фантастика, Героическая фантастика, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Вторая книга не подкачала, легкое чтиво на сон грядущий. Хоть немного и не дотянула до первой, но читать стоит. Оценка: отлично!
akorish про Прокофьев: Инкарнатор [СИ] (ЛитРПГ, Самиздат, сетевая литература)
12 05 Первая книга залетела на ура! Прочитал как новый жанр, как игра в тексте. Ждал последующие книги. Однозначно рекомендую. Оценка: отлично!
akorish про Джордж Оруэлл
12 05 1984 лучший перевод - это Леонид Бершидский. Сильная книга в отличном современном переводе. Почему так легко читается по сравнению с другими переводчиками? Да по тому, что современно адаптировано. Очень рекомендую именно в его переводе. |
Комментарии
Отв: Проблемы и приемы OCR: dewarp
Насчет алгоритмов не знаю (хотя Файнридер вроде что то делает) но как вариант решения за $500 смотри тут: http://lib.rus.ec/node/131676
Отв: Проблемы и приемы OCR: dewarp
Э нет, кривой скан в данном случае - уже данность :( В смысле - готовый DJVU
Отв: Проблемы и приемы OCR: dewarp
В FineReader 8, которым я пользуюсь, в настройках "1. Сканировать/открыть" есть опция "Устранить искажение строк". Очень даже помогает.
В 9-й версии наверняка тоже есть.
Отв: Проблемы и приемы OCR: dewarp
Есть , "streighten lines" и "desкew" - кто из них кто уже не помню за ненадобностью.
можно на страницу провести операцию а можно применить ко всем , но я бы советовал постранично ибо некоторые страницы наоборот как раз портит.
Отв: Проблемы и приемы OCR: dewarp
Да вы чего, издеваетесь, панове ?! deskew - есть, это исправление перекоса (когда книжку положили непараллельно границам окна),
Отв: Проблемы и приемы OCR: dewarp
deskew - это совсем из другой оперы.
Возьмите ложку. Положите ее на стол под уголм 45градусов к краю. Исправьте положение ложки. А теперь СОГНИТЕ ложку поплам и попрубуйте исправить перекос относительно края тем же способом
Отв: Проблемы и приемы OCR: dewarp
В моем случае ложка выглядит примерно так: Я думал, что это именно warp
Отв: Проблемы и приемы OCR: dewarp
Я не издеваюсь , я же сказал что не помню, значит не deskew а второй - staighten text lines:
Отв: Проблемы и приемы OCR: dewarp
Теоретически в 8 и 9 Файнридерах имеется встроенный механизм коррекции:
На практике, выработанной на 4м ещё файнридере, лучшим удалителем искажений в зоне разворота служит левая рука, прижимающая книгу к сканеру в момент сканирования... :)
...Каких либо отдельных программ, позволяющих выпрямлять строки я никогда не встречал. Теоретически это можно проделать в фотошопе, но... страницу, пусть две. А сотню? Сомневаюсь.
Отв: Проблемы и приемы OCR: dewarp
АААА!!!! Спасибо, Jolly Roger - ака, и вправду есть! Они его спрятали неочевидным образом.
Если кто-нибудь еще на эти грабли наступит, тулза работает и выглядит вот так:
Отв: Проблемы и приемы OCR: dewarp
Дык а я о чем ?
Отв: Проблемы и приемы OCR: dewarp
Виноват, подумал, что она в опциях сканирования сидит.
Отв: Проблемы и приемы OCR: dewarp
Вроде бы именно такие искривления исправляет Book Restorer. Подробности на ru-board.
Отв: Спасибо!
Век живи - век учись... Действительно, есть и отдельная программа под задачу:
http://djvu-soft.narod.ru/scan/curved_text.htm
...как я понимаю, у неё настроек побогаче будет. Видимо, для сложных случаев может оказаться предпочтительней.
Отв: Проблемы и приемы OCR: dewarp
На сорсфорже была утилитка unpaper - она, кажется, умела автоматически делать обработку сканированных страниц, выравнивая картинки, зачищая поля и выравнивая интенсивность фона. Заодно резала на страницы, если сканировался разворот.
Отв: Проблемы и приемы OCR: dewarp
http://unpaper.berlios.de
А строки, AFAIK, не ровняет.
Но вобщем ничего, пользуюсь периодически.
Отв: Проблемы и приемы OCR: dewarp
Если нужно подготовить скан для создания дежавю, то лучше выпрямить строки программой BookRestorer. Там же можно сделать все остальное (чистка, обрезка и т. д.)
Отв: Проблемы и приемы OCR: dewarp
Покажите, плз, мне нормально выпрямленные букресторером строки
Я пробовал это делалать, у меня не получилось. У моих знакомых по ру-боарду тоже.
Отв: Проблемы и приемы OCR: dewarp
Показать в буквальном смысле не могу, т. к. не сохраняю исходники во-первых, и не помню какие именно строки были выпрямленыв во-вторых. Но этой функцией пользовался не раз и не два. Настройки дефолтные. Правда, изгиб касался максимум 3-4 строк внизу страницы. Обычно все же стараюсь прижимать книгу к сканеру :) Совсем уж бракованный скан проще переснять, чем маяться с ним.