Вы здесьТекстовый pdf из сканов
Опубликовано чт, 09/12/2010 - 08:07 пользователем golma1
Forums: Текстовый pdf, сделанный из сканов, - намного удобнее для хранения и при вычитке, чем любой другой вариант. Я только не очень поняла, какие вопросы при этом возникают. ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 5 часов
larin RE:Оплатил,но абонемент не отображается 10 часов Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 11 часов Larisa_F RE:Современная корейская литература. Книжная серия... 12 часов Океана RE:Подайте бедному копеечку на книжку с литреса... 1 день larin RE:Оплатил, но абонемент не отображается 5 дней sd RE:Fishing 5 дней Алексей111111111111 RE:Оплатила,но абонемент не отображается 6 дней sd RE:Доступ 27 1 неделя kopak RE:Беженцы с Флибусты 1 неделя Isais RE:Вадим Иванович Туманов - Всё потерять - и вновь начать с... 1 неделя Isais RE:Семейственность в литературе 1 неделя Isais RE:Древний Рим. Подборка книг 1 неделя Саша из Киева RE:"Экс" и "нео": разноликие правые 2 недели medved RE:Предупреждение: "зеркала" флибусты 3 недели Isais RE:Соседи 4 недели babajga RE:Как сова отправилась в отпуск 1 месяц Саша из Киева RE:Горящие паруса 1 месяц Впечатления о книгах
Barbud про Панфилов: Старые недобрые времена. Книга 1 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
26 07 Хорошее произведение о российских традиционных ценностях, бережно пронесенных народом через века. Оценка: отлично!
udrees про Лей: Инвазия. Книга 2 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
26 07 Вторая книга получилась на мой взгляд поскучнее чем первая. Автор уже не скрывает своей аналогии с «Чужими», называет напарницу Рипли, у корабля название «Ностромо», матка, трутни. Но в целом сюжет второй книги почти полностью ……… Оценка: хорошо
udrees про Докинз: Самое грандиозное шоу на Земле [доказательства эволюции] [The Greatest Show on Earth: The Evidence for Evolution ru] (Биология)
26 07 Хорошая книга, написанная доступным языком. Объясняет основные перипетии эволюции, как происходили виды и как они видоизменялись. Я в общем-то в какой-то степени креационист, мне трудно представить как животные сознательно ……… Оценка: хорошо
udrees про Вальтер: Инволюция [СИ litres] (Боевая фантастика, Социальная фантастика, Постапокалипсис, Самиздат, сетевая литература)
26 07 Наркоманский высер. Книга третья про похождения нариков и дегенератов во время апокалипсиса. Везде убийства, разврат, пытки, извращения и мат-перемат. Герои в принципе не могут связать пару слов без мата и оскорблений. Хотя ……… Оценка: неплохо
mysevra про Яворницкий: Том 1. Быт запорожской общины (История, Военная документалистика)
25 07 Монументальный труд. Мне, конечно же, наиболее интересным показался первый том. Оценка: отлично!
mysevra про Далин: Болотный шёлк (Фэнтези)
25 07 Вроде зарисовка, а для кого-то – целая счастливая жизнь. Красиво, как всегда у этого автора. Оценка: отлично!
mysevra про Сапковский: Распутье Воронов (Фэнтези)
25 07 Вот и раскрыта тайна резни в Каэр Морхене. Геральт тут непривычный, этакий большелапый лопоухий щенок, но уже с правильными, узнаваемыми чертами, накось. Прочитала с удовольствием, единственный минус – мало. Оценка: отлично!
OldF про Ангелов: Народный словарь СВО (Документальная литература, Юмористическая проза, О войне, Новелла, Сатира)
25 07 Попытка исторгнуть нечто со спущенными трусами. Потратил пару минут на просмотр предыдущих выс***в, этот точно с диагнозом, неизлечим. Оценка: нечитаемо
Саблезубый Заяц про Герасименко: Огонь сильнее мрака (Юмористическая фантастика, Научная фантастика, Городское фэнтези)
24 07 Почему книга отдельно? Это же из серии "Пневма".
Александр Лагода про Маканин: Удавшийся рассказ о любви [сборник] (Современная проза)
24 07 Файл невалиден. Готовлю замену.
StrelaVV про Карелин: Лекарь Империи. Книга 2 [СИ] (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
24 07 Первая книга понравилась, продолжение есть - читаю... Оценка: отлично!
Олег Макаров. про Шопперт: КВЖД [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
23 07 Забавно. Попаданец не борзеет, даже песен и стихов не ворует из будущего. Прогрессорствует довольно-таки аккуратно в рамках своих возможностей, но без фанатизма. Хотя странно, что школьный учитель физики круто умеет в военизированное ……… Оценка: нечитаемо |
Отв: Текстовый pdf из сканов
Не надо цитировать мультики, википедию, и растекаться мыслями. Мы и без википедии знаем, что TIFF - формат без потерь, а JPEG - с потерями. Еще с тех времен, когда вики не было. Речь не о теории, а о практике конкретной работы.
но по факту распознается не хуже
Отв: Текстовый pdf из сканов
Если знаешь, зачем тогда людей в заблуждение вводишь "голословными измышлениями"?
По какому факту?
У нас с Вами факты разные:
я Вам про Фому, Вы мне про Ерёмуя Вам факты привел, Вы сказали, что факты неправильные. Чем они неправильные? Они что, дают неправильный мёд? Или просто обзываете то, что неугодно Вам "неправильными" фактами.Я тоже по факту говорю: распознание с TIFF лучше, чем с JPEG,а Вы отвечаете: "Это всё теория, а на практике всё наоборот!"
Если бы я ничего не распознавал, я бы с Вами может и согласился, но мне тоже приходилось распознавать, и поэтому я знаю, что и практика говорит то же самое, что и теория.
Отв: Текстовый pdf из сканов
А вот не надо. Не надо замусоривать ветку по конкретному вопросу своими измышлениями.
Откройте новую и расскажите там всем о том, что JPEG 300dpi в оттенках серого ФР "не любит". В-)
Отв: Текстовый pdf из сканов
Да я бы, как грится, с радостью.
Но тогда в этой ветке останутся измышления niksi, на которые, как покажется, никто не дал отпор!
Так что приходится тут, что ж поделаешь...
Отв: Текстовый pdf из сканов
Читать умеешь? НЕ НАДО БЫЛО НАЧИНАТЬ. ТЕБЕ.
Еще раз. Джпеги 300 и тифы 300 распознаются примерно с одинаковым кол-вом ошибок. Одно не лучше другого. Хочешь оспорить - приводи примеры. Одних и тех же сканов, распознанных с тифоф и джпегов, с указанием кол-ва ошибок в одном и другом случае. В новой теме. Иначе говорить не о чем. Я с удовольствием признаю, что не прав, если это будет ДОКАЗАНО.
Отв: Текстовый pdf из сканов
Да, пожалуйста.
И я там обязательно напишу, что ВСЕ сканы, полученные мною от niksi и Ronja_Rovardotter, распознаются с минимальным количеством ошибок. В каком формате и с каким разрешением они сделаны, расскажут сами сканировщики. В-)
Отв: Текстовый pdf из сканов
Реплика убойная!
Я ж не знал, что на мою вполне невинную реплику будет столь громкий ор с
метанием какашекобзывааниями.Отв: Текстовый pdf из сканов
Давно я так не веселился. :-)
Отв: Текстовый pdf из сканов
(хихикает) Вот мне всегда кажется, что если я понимаю, то уже тогда точно и все понимают, а вот поди ж ты... Не бывает JPEG без потерь. Вот просто не бывает и все. Бывает сжатие с максимальным качеством. Ага, для JPEG-ов максимальным. )))
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Видимо, необходимо все же отметить для тех, у кого еще не очень много опыта по оцифровке книг, что опытные и великолепные сканировщики, такие как niksi и Ronja_Rovardotter, и опытные и отличные OCR-щики, такие как Голма, обмениваются сканами именно в jpg, что значительно проще и быстрее. Такие сканы замечательно распознаются, и работать с их сканами - одно удовольствие.
Необходимо так же предупредить новичков об осторожности при принятии на веру утверждений и советов Zadd-а, т.к. в них энтузиазм и поспешность в суждениях, как правило, преобладает над знанием и умением. Полезно делать на это поправку, не отвергая, впрочем, и некоторой части его советов.
Отв: Текстовый pdf из сканов
Хм. Опробовал оба способа на 256-сером 300-dpi'йном скане, уже распознанном и (в меру возможностей ФР) вылизанном. У ФР получаются либо редкостно говённые картинки (даже акробат-ридер их через раз в упор не понимает), либо полноценные серые картинки, но сотни мег размера, зато с уже готовым текстом. У акробата - соответственно, ч/б картинки - ляля, размер на двух с чем-то сотнях страниц - меньше десятка метров, но текст никакой.
Ну и третий способ, который до сих пор юзаю, - выгрузить из файн-ридера однобитные ч/б картинки, их опять загрузить, распознать и сделать .pdf, - сочетает слабовыраженные недостатки предыдущих способов (картинка не особо хороша и текст так себе, размер в раза полтора побольше, чем после акробата).
А нельзя ли (ценой не чрезмерно больших трудозатрат) скрестить оба способа и получить файн-ридерный текст с акробатной картинкой?
Отв: Текстовый pdf из сканов
Сделать после распознавания в FR-е pdf по способу TaKir-а, но не для web, а с хорошим качеством, а потом ужать в Акробате готовый pdf?
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Что-то Acrobat не хочет tiff-файлов...
Acrobat 9.0.0 а файлы цветные.
FineReader'ом из 75 страниц никак меньше 26 мегов pdf не получается.:(
Отв: Текстовый pdf из сканов
Таки получилось. Правда из другой книжки в сером цвете. 380 страниц - 15 Мегов. Очень хорошо.
Спасибо Голма!
Страницы