Вы здесьПроект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.
Опубликовано пт, 04/04/2008 - 01:59 пользователем soshial
Форум пока очень неудобный для этого, так что пока будем обсуждать здесь...
Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;)
я предлагаю "сплочиться" =D
просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.)
Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет.
СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ.
FAQ:
> Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу.
Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =)
что хотите то и выбираете)
> С каким форматом предстоит работать?
с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =)
общая информация здесь и тут
в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;)
1. общая информация о формате
2. описание тегов и простой пример книги.
3. как сделать книгу
4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только
5. несколько статей и инструкций по fb2
6. Создание электронных книг в формате FictionBook 2.1: практическое руководство
> Условия, правила вычитки, форматирования?
правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.)
[quote]а теперь главное!
в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
macs1112 RE:Подайте бедному копеечку на книжку с литреса... 2 дня
sem14 RE:Книжная серия «Сlio» издательства "Евразия" 3 дня Isais RE:Национальный конкурс на лучшее литературное произведение... 3 дня Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 дня sem14 RE:Современная корейская литература. Книжная серия... 3 дня sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 4 дня larin RE:Оплатил,но абонемент не отображается 4 дня larin RE:Оплатил, но абонемент не отображается 1 неделя sd RE:Fishing 1 неделя Алексей111111111111 RE:Оплатила,но абонемент не отображается 1 неделя sd RE:Доступ 27 1 неделя kopak RE:Беженцы с Флибусты 1 неделя Isais RE:Вадим Иванович Туманов - Всё потерять - и вновь начать с... 2 недели Isais RE:Семейственность в литературе 2 недели Isais RE:Древний Рим. Подборка книг 2 недели Саша из Киева RE:"Экс" и "нео": разноликие правые 2 недели medved RE:Предупреждение: "зеркала" флибусты 4 недели Isais RE:Соседи 1 месяц Впечатления о книгах
miri.ness_ про Катаев: Трава забвенья (Биографии и Мемуары)
30 07 Да, "Трава забвения" - отличная книга, как и "Алмазный мой венец", обложка от которого есть, а книги в этой раздаче нет. Как-то непонятно, какую третью повесть кто-то имел в виду: "Святой колодец" или "Уже написан Вертер"? ……… Оценка: отлично!
Олег Макаров. про Илья Городчиков
30 07 Удивительное отсутствие у автора умения согласовывать предложения. Невозможно читать
epoost про Спрингер: Энола Холмс и маркиз в мышеловке [The Case Of The Missing Marquess] (Детская проза)
30 07 Данная книга представлена в формате фото и нуждается в OCR и конвертации в формат FB2.
Никос Костакис про Петр Алмазный
29 07 Nicout, не будем спорить, был ли доступен автору приведенный вами список "гранита науки". Вполне достаточно того, что тост шашлычника из "Кавказской пленницы" ("Так випьем за кибэрнэтикэ!") был услышан каждым обывателем ………
alexk про Гурба: Мифы Китая [litres] (Мифы. Легенды. Эпос)
29 07 Хрень. Не читать. К тому же вместо половины иллюстраций - QR-коды.
Oleg68 про Кобен: Главный подозреваемый [The Final Detail ru] (Крутой детектив, Детективы: прочее)
28 07 Как всегда у автора, очень интересно и непредсказуемо. Оценка: отлично!
Лысенко Владимир Андреевич про Земляной: Мастер духов 1 (Альтернативная история, Социальная фантастика, Попаданцы, Самиздат, сетевая литература)
28 07 Хорошее произведение, читается легко. Оценка: отлично!
lemma7 про Гурский: 500 спойлеров. Мировое приключенческое кино в буквах (Справочники)
28 07 Спасибо большое за то, что книга наконец появилась в сети! Оценка: отлично!
Barbud про Панфилов: Старые недобрые времена 2 (Альтернативная история, Приключения: прочее, Попаданцы, Самиздат, сетевая литература)
28 07 После многих бед и лишений ГГ наконец-то добыл себе свободу и не столь уж малую денежку, которой при разумном применении хватило бы на безбедную жизнь рантье. Но свобода и деньги сыграли с ним злую шутку - он-то в обеих своих ……… Оценка: неплохо
Barbud про Гросов: Инженер Петра Великого (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
28 07 Производственный роман в антураже петровских времен, но представление об этих временах у автора весьма туманное. Мне не зашло из-за разных анахронизмов и исторических ляпов. Сломался и удалил где-то на середине опуса, когда ……… Оценка: нечитаемо
Nicout про Петр Алмазный
28 07 Как насчет совкового утверждения "генетика и кибернетика - продажные девки империализма"? :-) "Посмотрим на хронологию. 1948 год. Вышла книга «Кибернетика, или управление и связь в животном и машине» Норберта Винера. В ………
Никос Костакис про Алмазный: Телохранитель Генсека. Том 1 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
27 07 Я поэтому и обратил на него внимание, зацепился за слово «кибернетика». Неожиданно в семьдесят шестом году"". Да ну??? А когда, по мнению ув. автора в обиходе появилось слово "кибернетика"? |
Комментарии
Отв: Проект по вычитке книг.
В принципе могу вычистить дубли Донцовой, вставить недостающий фрагмент Тэд Уильямс, ну и попробовать сделать красиво "предложено юзером amyat Подборка военной литературы "
Отв: Проект по вычитке книг.
Жаль а то хотел сделать "Пушкин Стихи не для дам распознать, сделать fb2 http://hagen.ifolder.ru/7492089"
Отв: Проект по вычитке книг.
По-моему, что-то промелькнуло, что эта книга в сети есть. Давайте подождём немного, может, кто-то (с более хорошей памятью) откликнется. ;)
А всё остальное записываю за Вами. Слово - не воробей. :Р
Итак, Донцова и Тэд Уильямс - замётано. :)
Когда закончите, отпишитесь, пожалуйста. Спишемся, я сброшу Вам несколько файлов из "подборки военной литературы".
Договорились?
Отв: Проект по вычитке книг.
"Стихи не для дам"
Сейчас прошелся Гуглом: слова hagen-а потвердились, не видно такой книги. Почему же уважаемому rodent81 не взять эту книгу в работу? Просто сами тексты Пушкина уже распознаны, вычитаны и переведены в html на rvb и feb-web, часть уже есть здесь. Нужно распознать предисловие и примечания, а потом все тексты собрать в один док.
Отв: Проект по вычитке книг.
Ни в коем случае не возражаю. ;) И если уважаемый rodent81 всё ещё настроен, беру на себя обязательство сделать необходимые пометки в таблице. :)
Отв: Проект по вычитке книг.
Беру :)
И Пушкина тоже беру :)
Отв: Проект по вычитке книг.
Отметила. :)
Отв: Проект по вычитке книг
Сдуру взялась делать структуру вот в этой книжке http://lib.rus.ec/b/114534. Билась я с ней и так, и этак, но я все равно не знаю, как ее разумно структурировать.
Так что придется мне просить пардону и постыдно дезертировать.
Это по сути энциклопедический словарь, и FB2 для такого типа книг, по-моему, вообще не подходит. А оптимально подходит для них вовсе даже фомат CHM. Но его я делать не умею. Оптимальность этого формата прекрасно демонстрируется вот здесь http://www.fact400.ru/mif/reich/oglavl.htm, я когда искала информацию о книге, наткнулась на этот сайт. Там вышеупомянутая энциклопедия лежит. С фотографиями. Если кто умеет делать chm-файлы, может сотворите книжечку?
Отв: Проект по вычитке книг
Очень хорошо понимаю. Я тоже спасовала перед этой книгой.
Подождём настоящих умельцев. ;)
Отв: Проект по вычитке книг
Из списка взяла на вычитку "Последний рыцарь" http://lib.rus.ec/b/119322.
Отв: Проект по вычитке книг
Сделано.
пушкин
Сделал Пушкина из пдф в microsoft word, ошибки проверил - нет. Кто сделает фб2?
Отв: пушкин
Выкладывайте. Кто-нибудь когда-нибудь сделает. ;)
Пушкин Стихи не для дам
В формате microsoft word, нужно сделать фб2, орфографию не править, там оригинальная орфография!!!
http://slil.ru/26080435
http://www.rapidshare.ru/761184
Отв: Проект по вычитке книг, подобный альдебарановскому и олдма
Я вообще-то имела в виду, что Вы в библиотеку выложите. ;)
Ладно, я скачаю, выложу. :)
Отв: Проект
К сожалению я не знаю как и куда, если обьясните, то впредь буду делать только так :)
Отв: Проект
Вот. :)
А вообще здесь очень много полезной информации.
Отв: Проект
Забавно ))))
Буду читать rtfm )))
Отв: Проект
Первую неделю Вы ничего не можете менять в библиотеке. Антивандальная мера.
Отнеситесь с пониманием. ;)
Отв: Проект
rodent81: Если позволите, несколько замечаний по оформлению: разбивка на колонки не нужна, строка в стихотворении – это абзац, а не разрыв строки, убирать переносы. golma1: Не могли бы вы подсказать ссылки на материалы по подготовке документов после сканирования? Я бы поместил их в Делаем fb2 книгу.
Отв: Проект
К сожалению, нет. Просто не знаю.
Все мои знания - из накопленного опыта и неоценимой помощи, которую мне многократно оказывали на форуме.
Я пользуюсь FineReader'ом, получаю с его помощью из jpg, pdf или djvu текстовый документ.
Обрабатываю его (в формате rtf) при помощи программы OcrPad, там много полезных (уже встроенных) скриптов для чистки текста.
А далее - как обычно с текстовым документом.
Отв: Проект
Не знаю, то или нет, но у Змея есть ценные "Рекомендации по сканированию книг" http://zmiy.by.ru/#help Они во многом повторяются, часть недоступна уже (вот, кстати, из закладок: http://www.oldsf.ru/OCR.html - там сменился домен. Таки смотри ж, ещё что-то находится... я думал "С.Ф" уже умерла совсем), но в целом рекомендации хороши.
Отв: Проект
Спасибо golma1 и Jolly Roger. Хелп от Змия, когда то читал, пригодилось.
Отв: Проект
Учту на будущее, просто со стихами впервые работал, поэтому оставил как было в оригинале.
Отв: Проект
Дык я не против, прекрасно понимаю ситуацию. Поэтому пока и заливаю на сторонние сервера :)
Отв: Проект по вычитке книг
Скачал отсюда "Война за 'Асгард'" Кирилла Бенедиктова (http://lib.rus.ec/b/6133) Benediktov_Voyna_za_Asgard.6133.fb2 При открытии файла выскакивает ошибка - XML parse error: not wellformed (invalid token) at line 201, column 371. Ещё не приходилось редактировать и исправлять что либо в этом формате, поэтому решил обратиться к специалистам. Исправте кто может...
Отв: Проект по вычитке книг
Попробуйте теперь эту.
Отв: Проект по вычитке книг
Спасибо. Я правда тоже рабочую нашел, поменял с той что была, но как-то криво получилось: нет размера файла, не догадался анотацию добавить и т.д. Так что я наверное её удалю, так как они абсолютно одинаковае внутри, хоть и размеры разные. У Вас красивее получилось.
Отв: Проект по вычитке книг
Смотрите, какая интересная библиотека: http://ae-lib.org.ua/ (Сайт на украинском, но книги там на многих языках)
Никто не хочет перевести книжки в fb2?
Отв: Проект по вычитке книг
Чтобы ссылки не терялись, сделала отдельную тему.
А это можно исправить?
Сейчас обнаружил, что файлы с произведениями Рея Бредбери имеют назсание
Bredberi_
Хотя следовало бы Bradbury.
Я понимаю, что это транслит с русского произношения, но все-таки!
Готов этим заняться, если скажете, как это сделать.
Это, очевидно, касается и других авторов, которые писали на языках, использующих латиницу.
Отв: А это можно исправить?
Вопрос поименования файлов многократно поднимался. При заливке файлы могут иметь какое угодно название (даже правильное ;) ), но при скачке все они получат траскрибированное на латиницу русское имя. И (пока?) ничего с этим поделать нельзя.
Сверил тексты
Сегодня сверил тексты
Рей Бредбери 451 градус по Фаренгейту
В архиве 2 варианта:
http://lib.rus.ec/b/66537 498K
и http://lib.rus.ec/b/103371 678K
Тексты идентичны.
Во втором варианте добавлены иллюстрации.
Отчет о проделанной работе+ вопрос
Добавлено сегодня:
Урсула Ле Гуин - Планета Роканона v 2.1 вычитано
Генри Лайон Олди - Гроза в безначалье v 1.2 - дополнительное форматирование, опечатки
Генри Лайон Олди - Сеть для миродержцев v 1.2 — дополнительное форматирование, опечатки
Генри Лайон Олди - Иди куда хочешь v 1.2 — дополнительное форматирование, опечатки
Генри Лайон Олди - Мы плывем на запад v1.01 - аннотация, жанр, издание
Генри Лайон Олди - Посети меня в моем одиночестве...[=Лодочник] v1.01 - аннотация, жанр, издание (убрал дубль)
Генри Лайон Олди - Сын Черной Вдовы v1.01 - аннотация, жанр, издание
Генри Лайон Олди - Цель оправдывает средства v1.01 - аннотация, жанр, издание
В процессе заливки вылез непонятный глюк.... "Sequence name" теперь берется из "Publisher info", а не из "Title info" чё так!? Неправильно как-то....
Отв: Отчет о проделанной работе+ вопрос
Да, экспериментальным путем вычислено, что серия из publisher-info имеет приоритет. Надо исправить - проставить правильную серию.
Отв: Проект
Отсеял половину Донцовой, подправил названия. Переделываю Пушкина - с учётом пожеланий.
Отв: Проект
Там у Донцовой еще осталась куча дублей. Вы позже продолжите? :)
Отв: Проект
Конечно, доделаю обязательно. Просто связь плохая, приходится частями делать :) Пока не доделаю не уйду :))
Отв: Проект
Договорились. Но Вы вообще не уходите. Зачем? :)
Отв: Проект
Иногда нужно отдыхать от всего ;) но я быстро вернусь :)
Лукьяненко "Осенние визиты"
Слегка почистил Олди (удалил4-5 дублей)
Взял на форматирование Лукьяненко - Осенние визиты
PS И если это не противоречит общественном принцыпам запишите на меня Олдей, я и так решил все откорректировать и переформатировать, чтоб лишнюю работу не делать и ни с кем рогами не бодаться)))
Отв: Лукьяненко "Осенние визиты"
Отмечено. :)
Отв: Лукьяненко "Осенние визиты"
Спасибочки)
Отв: Проект
Переделал Пушкина, конвертнул в фб2 и залил на http://slil.ru/26090161 . Посмотрите, может что надо поправить.
Завтра дочищу Донцову а на неделе доперевожу и вставлю кусок из Уильямса.
На след. неделе залью Сафарли "Туда без Обратно", вот только досканирую и проверю.
Отв: Подскажите плиз.
Пытаюсь залить новую книгу - Павел Когоут "Палачка". Оно говорит мне, что не может опознать жанр. Файл сейчас на ftp лежит в oldvagrant\kogout_pavel_palachka.zip.
Или тут http://qmm.pisem.net он же kogout_pavel_palachka.zip
Я, конечно, где-то не прав, но где неправ - не понимаю. Снова шерстить весь FAQ как-то многодельно. Может кто подскажет?
Да, автор новый.
Отв: Подскажите плиз.
Я посмотрела файл. Там надо кое-что доделать. Если возьмётесь, скажу что именно. Или сама исправлю.
Насчёт жанра - там продублирован 2 раза один и тот же жанр. Может быть, дело в этом?
Отв: Подскажите плиз.
golma1, пожалуйста снимите меня с вычитки Пушкина. Неопределенное время ничего не смогу делать на свом компе.
Прошу у всех прощения за то, что так долго тянул.
Отв: Подскажите плиз.
Я сниму, конечно. Но предполагаю, что эта работа Вас благополучно дождётся. ;)
Отв: Проект по вычитке книг
Скажите, конечно.
Я бы предпочел попробовать самостоятельно все поправить.
Спасибо!
Да, и что такое ошибка 80..020..06 в FBE. Он ее вовсех файлах выдает и не дает сохраняться, паскуда.
Отв: Проект по вычитке книг
Насчёт ошибки не знаю. Но если не даёт сохраняться, то что-то со структурой. Попробуйте пройтись ещё раз в Source - несоответствие начальных и закрывающих тегов, лишние эмфазисы или стронги и многое другое. К сожалению, больше ничего не могу подсказать.
Нужно исправить:
1. убрать второй титл (оставить первый - до первой секции)
2. вынести первые два абзаца в аннотацию
3. выделить субтитлы
4. унифицировать сноски: вместо note 1 должно быть [1] - в FBE есть специальный скрипт; убрать "звёздочки" перед сносками
5. озаглавить body примечаний
6. проверить на разорванные абзацы - в FBE есть специальный скрипт
7. заменить кавычки на "ёлочки" - в FBE есть специальный скрипт, но требуются некие навыки для его использования
8. в дескрипшене убрать дубль жанра
На первый взгляд, всё. ;)
Страницы