V170848 Два капитана
Опубликовано ср, 20/10/2010 - 11:37 пользователем Рыжий Тигра
Forums: Два капитана Изобилует ошибками сканирования/OCR - по 3-5 ошибок на страницу. На самом деле это не отдельный "с нуля" скан книги (равно как и его первоисточник - восьмой том "Библиотеки приключений" в формате .doc в библиотеке Ершова), а скопипизженный из более ранних источников текст, разбавленный иллюстрациями. По крайней мере, тексты этот и http://lib.rus.ec/b/68345 идентичны - отличаются только наличием-отсутствием точек в названиях глав. :-( Чтобы убедиться - достаточно поискать фразы из первого абзаца первой главы первого тома: "Двор сеял у самой реки, и по веснам", "а потом вода принесла и осторожно положила на берег я самого почтальона". Правильный, без "осканок", текст есть у Гугль-бука (http://books.google.com/books?id=GPsoPTBc7fsC&pg=PA7&dq=%22%D0%B0+%D0%BF%D0%BE%D1%82%D0%BE%D0%BC+%D0%B2%D0%BE%D0%B4%D0%B0+%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0+%D0%B8+%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE+%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0+%D0%BD%D0%B0+%D0%B1%D0%B5%D1%80%D0%B5%D0%B3+%D0%B8+%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE+%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&hl=ru&ei=AhO_TLeAOYKQjAf_oYWbAg&sa=X&oi=book_result&ct=result&resnum=1&ved=0CCgQ6AEwAA#v=onepage&q=%22%D0%B0%20%D0%BF%D0%BE%D1%82%D0%BE%D0%BC%20%D0%B2%D0%BE%D0%B4%D0%B0%20%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0%20%D0%B8%20%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE%20%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0%20%D0%BD%D0%B0%20%D0%B1%D0%B5%D1%80%D0%B5%D0%B3%20%D0%B8%20%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE%20%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&f=false) (как извлечь текст - не знаю; изображения страниц получить можно, но это 150 dpi от силы) и http://my-shop.ru/shop/books/441482.html (на странице ссылка "Заглянуть внутрь") (фрагмент - первые 20 страниц и оглавление). Если кто знает, где можно получить полный текст, - отзовитесь!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 21 час
weis RE:Прошу переформатировать, распознать, etc... 2 недели larin RE:Заплатила, а абонемента нет и скачать ничего не могу! 4 недели sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц akorish RE:Регистрация 1 месяц Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 месяц Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 месяц konst1 RE:Ух, как я не люблю спамеров! 2 месяца tvv RE:DNS 2 месяца sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 2 месяца larin RE:Заблокирован 2 месяца konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 месяца Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 3 месяца fixel RE:Пропал абонемент 3 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 4 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 4 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 5 месяцев sem14 RE:Серия "Символы времени" издательства "Аграф" 5 месяцев Впечатления о книгах
udrees про Михайлов: Пепел доверия-3 (Боевая фантастика, Ужасы, Постапокалипсис, Самиздат, сетевая литература)
28 06 Отличная третья книга из серии про зомбиапокалипсис, хотя конечно там не совсем зомби. Но такого описания конца света в стиле «зомби» и таких противников мне еще не встречалось. Слишком сильных, быстрых, пока не умных и многочисленных. ……… Оценка: отлично!
udrees про Атаманов: Стратег из ниоткуда. Книга третья (Героическая фантастика, Фэнтези, Самиздат, сетевая литература)
28 06 Все отлично. Написано просто, живо, увлекательно. Персонажи тоже яркие и уникальные, как люди, так и нелюди. Предоставленные герою умения оказываются очень полезными в схватке с главными противниками, фактически, помогают ……… Оценка: отлично!
udrees про Каменистый: Рунный практик (Боевая фантастика, Фэнтези, Попаданцы, ЛитРПГ)
28 06 Прекрасное продолжение. Конечно это приключение, где у главного героя все получается, все срабатывает в нужный момент, и как у Бэтмена, для подходящего случая всегда припасен нужный гаджет в кармане, очень кстати оказавшийся ……… Оценка: отлично!
udrees про Мантикор: Тьма в отражении (Боевая фантастика, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
28 06 Автор продолжает свое повествование, правда вся книга будет скорее не про путь вниз, а наверх и вбок. Все написано в том же стиле, увлекательно с описанием новых мест и монстров. Глав с перечислением характеристик всех героев ……… Оценка: отлично!
udrees про Мантикор: Истинный враг (Боевая фантастика, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
28 06 Продолжение увлекательное, стиль повествования все такой же, но на сей раз действий больше, чем разговоров. Отряд героя продолжает спуск по Стене, и сейчас каждый уровень является обиталищем самых опасных монстров. Но как ……… Оценка: отлично!
trampak про Мясников: Великая Отечественная. 10 000 фактов о войне (История)
27 06 Россия никогда не начинает войн, она их завершает."- эта лживая фраза ставит под сомнение , что автор историк. А кто соврал однажды... Оценка: нечитаемо
Paul von Sokolovski про Логинов: Свет в окошке (Социальная фантастика)
27 06 Очень хорошая, тяжёлая и светлая книжка. То, что все знают - мы живы, пока о нас помнят... у Логинова получает некоторое материальное (?) воплощение. Как быстро мы развеемся? И кто будет помнить нас? Читать, или хотя бы пробовать - всем, всем, всем.
Олег Макаров. про Борчанинов: Лейтенант космического флота [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
26 06 Написано хорошо, но не захватывает. Шаблонное космооперное начало. Бросил Оценка: плохо
Олег Макаров. про Иванов: Псоглавцы (Социальная фантастика, Ужасы, Триллер)
26 06 Прочитал. такое впечатление, как в детстве, когда тебе обещали что-то а потом формально выполнили, но радости никакой это не доставило. Не знаю, как по-другому объяснить Оценка: плохо
Олег Макаров. про Смолин: Морпех 1: Сухой Лиман (Альтернативная история, Боевик, Самиздат, сетевая литература)
26 06 Не могу такое читать; опять «герой сво» попадает в 1941 и там становится прям вообще героем Оценка: нечитаемо
Олег Макаров. про Сухов: Обнуленный [СИ] (Боевая фантастика, Космическая фантастика, Попаданцы, Самиздат, сетевая литература)
26 06 Идея возможно интересная, но пишет предельно занудно. Оценка: нечитаемо
Олег Макаров. про Ростов: Выжившие (Боевая фантастика, Постапокалипсис, Самиздат, сетевая литература)
26 06 Картонные герои, бумажные диалоги. Оценка: плохо |
Отв: V170848 Два капитана
Мне принесли книгу 8й том библиотеки приключений. Возьмусь вычитать и сверить, тем более, что это совпадает с моим желанием перечитать произведение. Сканировать вряд ли буду, но будем посмотреть... ;-)
Отв: V170848 Два капитана
Так что прошу прощения, что пытаюсь кого-то припахать, :-) но лучше отсканируй и поделись сырым сканом. 300 dpi, 8-бит серый, можно завернуть в JPEG 80-90%. Иллюстрации тоже имеет смысл переделать - их лучше сканить в 600 dpi и упаковывать беспотерьным сжатием (PNG); если поверх ч/б иллюстрации почёркано какими-ньдь карандашами или фломастерами - можно восстановить, но тогда её скан должен быть в цвете.
Я сейчас добиваю "Восставшую Луну" Хайнлайна, до конца недели сделаю и смогу заняться "Двумя капитанами": для начала отOCR'ю и сравню (кстати, давно пользуюсь вот таким способом - http://www.flibusta.net/node/83676#comment-192053), а если особого эффекта не даст - тогда уже буду делать по старинке, с вычиткой и правкой...
Отв: V170848 Два капитана
SergeyR, сорри, но личка, похоже, не ходит - отзовусь тут:
> причем предпочтительно именно в том виде и с тем текстом, как я его помню! ;-)
Дык аналогично! :-) Правда, я его читал в другом издании - серо-голубая картонная обложка с рисунком - Саня и Николай Антонович, - но рисунки были те же.
> думал, что глазами вычитать будет проще, а, теперь даже и не знаю...
Я на такое тоже нарвался - как раз когда купил сканер и сделал первые книги: http://lib.rus.ec/b/184697 и http://lib.rus.ec/b/184698 - они на процентов 80 совпадают, глазами я выловил по паре сотен опечаток, а на сличении двух файлов - где-то с полтысячи. С тех пор и держу на вооружении методику http://www.flibusta.net/node/83676#comment-192053 - помогает даже при вычитках с одного и того же текста, а тем более если это с разных сканов.
> думаю, что вряд ли нужно сканировать иллюстрации в 600 dpi, потом все равно ведь придется загрублять до 72.



Загрублять - да (хотя до 72 - это уже слишком). Но при прочих равных с 600-dpi'йной однобитной картинки можно с аккуратным сглаживанием уменьшить до 120-150-dpi'йной, с 300 dpi предел - 75, а с исходного 150 dpi даже 50-dpi'йная будет выглядеть довольно похабно. Это раз. Два - при 600 dpi при чистке исходного серого скана хорошо видна природа дефектов картинки - то ли это мелкая деталь изображения, то ли сопля от размазанной краски, то ли щепочка в бумаге; при 300 dpi этого не видно - приходится напрягать фантазию; да и дорисовывать погибшие мелкие детали при большом разрешении удобнее.
Вот в качестве примера - последний рисунок к книге "Сироты квартала Бельвилль" (все рисунки можешь глянуть здесь):
сырьё - 600 dpi, 256-серый:
готовый - 600 dpi, однобитный ч/б (день ушёл на чистку, но зато ж смотрится! :-) ):
готовый для книги - 133 dpi, 7 уровней серого:
(все три кликабельны и увеличиваются)
> но все равно частенько на месте раздела страниц бывают "тени" [...] Правда это существенно только для рисунков.

Для готовых рисунков - однобитных - это как раз пофиг, а при реставрации плавным градиентом плотности фона можно пренебречь, а перед формированием однобитного я такие вещи обычно затушёвываю/забеливаю вручную. Куда хуже - перекос линий возле корешка.
Кроме того, если сканируешь файн-ридером, то для текста надо включать режимы "делить страницы" и "исправлять перекос" - тогда ФР ищет что0то похожее на почти горизонтальные строки текста и "выпрямляет" их; представляешь, во что он может превратить рисунок? :-) А рисунки ФРом сканировать таки удобно - но в отдельный проход и с выключенными коррекциями и делением на страницы.
Кстати, картинки можно делать и без теней, и даже почти без геометрических искажений, если ложить книгу на сканер корешком вдоль хода каретки так, чтобы корешок был как можно ближе к середине каретки:
(серый - корпус сканера, тёмно-серый - стекло, синий - книга, красный - границы рисунка)
> Мне [...] оказалась приписанной как "автору" книга "Русская кухня: Традиции и обычаи" http://lib.rus.ec/b/191031
Кто-то уже успел исправить раньше, чем я до неё добрался.
Отв: V170848 Два капитана
Единственное, что меня хоть немного убеждает в необходимости 600-dpi'шного сканирования, так это возможная правка, конечно, природа дефектов будет видна лучше. А вот "72 - это уже слишком", почему "слишком"? никто же ведь не собирается печатать с fb2 (хотя такие вопросы-пожелания я слышал, но это уже, по-моему извращение...). А разрешение читалки, на которые fb2 и рассчитан, иногда или от 72 далек, или точки такого размера, что разрешение рисунка все равно не спасет. Вот сейчас "размер" страницы в скане получается что-то порядка 1800х1200 точек. Некоторые из рисунков книги такого же размера. Хорошо есть и мЕньшие. Да и в fb2 ведь рекомендуется делать иллюстрации, что-то порядка, не более 300х400, поправьте, если ошибся. Вот и получается, куда же еще бОльшее разрешение, только в расчете на гипотетическую правку.
Иль я в чем-то ошибаюсь?.. 8-)
Отв: V170848 Два капитана
Лично я привык делать 482×728 - такая картинка как раз умещается в страничку CoolReader 3.0.28 в полноэкранном двухстраничном режиме на "рабочем столе" 1024×768, а на экране "буки" остаётся с полсантиметра полей. Но уже перехожу на 580×740, благо последние раскопки :-) в алгоритме сжатия PNG позволяют упихать штриховую картинку такого размера в 50-100 килобайт. (Однобитная 600-dpi'йная полностраничная (2600×3800) штриховая иллюстрация, кстати, после чистки ужимается до примерно такого же размера.)
Отв: V170848 Два капитана
Ну в общем, как говорится: "Не прошло и года..." ;о) Книга наконец сделана, вычитана и выложена -
http://lib.rus.ec/b/241172
Спасибо Рыжему Тигре, что он сподвиг меня на сканирование, иначе вычитывание отняло бы куда больше времени и сил!
В принципе должен заметить, что каких-то глобальных потерь текста ранее имевшийся в библиотеке вариант не имел, разве что досадные ошибки типа: "дом сеял", да и то не слишком многочисленные.
Но все равно не жалею, что сделал работу заново. Зато теперь я в своей книге уверен, как это не глупо и не самоуверенно звучит... ;о)
Но все равно, если будут замечания просьба написать, сюда или в личку.
Более того, как уже написал в комментарии получил большое удовольствие от чтения, чего и вам всем желаю!
Отв: V170848 Два капитана
Отв: V170848 Два капитана
Спасибо огромное! И сподвигнувшему, а особо сделавшему!
Ещё может быть старую версию удалить стОит?