Вы здесьНеправильные книги
Опубликовано пн, 30/03/2009 - 21:01 пользователем Marked
Решил вот заменить свою библиотеку, скачанную оттуда-отсюда, на fb2 файлы... Смотрю на Либрусеке (по алфавиту, как у меня книги в папках лежат): Айзек Азимов "Тупик". Здесь вместо него лежит рассказ Генри Каттнера "Порочный круг". Следующая папка - Кевин Андерсон, серия "Сага Семи Солнц". Первые две книги здесь на либрусеке поменяны местами. (названия правильные, текст неправильный). Эта ошибка распространенная, так как в астовском издании в серии "Золотая библиотека фантастики" они тоже поменяны местами. На фензине, кстати, лежит аналогично... Следующая книга Пол Андерсон "Орион взойдет". Скачал, открываю - там только "от автора" и полторы строчки текста... и все.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 36 мин.
larin RE:Заблокирован 1 день NickNem RE:Подайте бедному копеечку на книжку с литреса... 1 день alexk RE:Прошу переформатировать, распознать, etc... 3 дня konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 недели Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 недели fixel RE:Пропал абонемент 2 недели sem14 RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 4 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 1 месяц Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 2 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 2 месяца tvv RE:faq brainstorm =) 2 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 месяца larin RE:абонемент не обновлен 2 месяца sem14 RE:За иллюминатором (серия) - чего не хватает? 2 месяца sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 2 месяца Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 месяца Впечатления о книгах
tvv про Лотош: Одинокие искры над бездной (Космическая фантастика, Социальная фантастика, Самиздат, сетевая литература)
03 04 Текст третьей книги на сайте автора, http://lotosh.1gb.ru/txt/5-03 call of the infinity.htm
lorealke про Ковтунов: Путь Строителя (Фэнтези, Попаданцы, ЛитРПГ, Самиздат, сетевая литература)
03 04 Жанровое клише, доведённое до полнейшего абсурда: очередной супер-спец умирает и вселяется в тело местного чмыря, чтобы под руководством пьющего деда/наставника утирать нос картонным мажорам. Сюжет, враги и обстоятельства ……… Оценка: плохо
дядя_Андрей про Шарапов: Между светом и тьмой [СИ] (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
03 04 Если честно, то до последнего надеялся, что князем объявят Константина. Озадачен. Оценка: хорошо
Stager про Федотова: По следу скорпиона (Фэнтези)
02 04 Ну за 611 аудиторию можно всё простить. Но оно и само неплохо. Оценка: хорошо
Олег Макаров. про Пинчук: Степень бессмертия (Боевая фантастика, Городское фэнтези, Самиздат, сетевая литература)
01 04 Идея интересная, но написано... так, как написано Нечитаемо. Оценка: нечитаемо
Олег Макаров. про Босин: Донатор (Научная фантастика, Самиздат, сетевая литература)
01 04 Итальянец переезжает в Россию, чтобы платить меньше налогов. У меня всё. Оценка: нечитаемо
Олег Макаров. про Линник: Обменный фонд (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
31 03 Путешествие в 1940й год. Криминал. Ограбление музеев. Спецслужбы. Честный вор. Линник пишет стабильно качественно. Оценка 5 Оценка: отлично!
Олег Макаров. про Роман Смирнов (самиздат)
30 03 «Рядовой гвардии запаса» уже с первых слов понятно, что у этого Ярмонкина шляпа слетает постоянно
mysevra про Престон: Граница льдов [= Ледовый барьер] [The Ice Limit ru] (Научная фантастика, Триллер)
28 03 Такая книга фурор не произведёт и перечитывать её вряд ли захочешь, а вот для одного раза вполне достойно. Оценка: хорошо
mysevra про Силлов: Закон Проклятого [litres] (Боевая фантастика)
28 03 Неплохая задумка: кто не любит истории об особенных людях. Кот, опять же, знатный. А изложено паршивенько, кустарно изложено. Оценка: неплохо
mysevra про Хань: Тишина. Спокойствие в мире, полном шума (Психология, Самосовершенствование)
28 03 Прекрасная книга. Конечно, если не забывать практиковать, а вот тут уже проблемка. Оценка: хорошо |
Комментарии
Отв: Неправильные книги
НЕ СКАЧИВАЙТЕ КНИГИ-FB2 В ФОРМАТЕ TXT !!!
Отв: Неправильные книги
Интересно... А зачем тогда в выпадающем списке есть txt? Для красоты? Или "шоб было"?
...Не поверю, что из fb2 так трудно сделать текст автоматом.
Отв: Неправильные книги
Сделать нетрудно.
Текущий конвертор использует встроенный в пых парсер XML, который молча падает на любой ошибке.
Всё никак не соберусь переписать.
Отв: Неправильные книги
А-а. Так вот оно почему не стреляет - не заряжено...
Илья, я вскоре всё равно для одной затеи буду писать на Перле "извлекатель текста из fb2". Без парсера, конечно. Если тебя Перл устроит, можно будет сделать перловую тхт-конвертилку.
Отв: Неправильные книги
Лучше бы перловую xml-проверялку, а в идеале и чинилку.
Глянь parcer.inc, туда встроить внешнюю утилиту будет непросто.
Отв: Неправильные книги
Не, это я точно не потяну :(
Отв: Неправильные книги
Эээ... не замечал. Но в принципе - могу помочь. К тому же - в PHP больше одного xml-парсера.
Другой путь получения txt - выбросить всю разметку регулярным выражением.
Отв: Неправильные книги
Перловому можно сказать, что ошибки XML нужно игнорировать.
Есть ли такое решение для пыха? Если есть - это было бы идеально, мне проще поменять парсер, чем писать его самому.
Получение txt - побочный результат.
Основные задачи, решаемые парсером:
1. Вытаскивание оглавления и обложки
2. Онлайн-чтение
3. Генерация html для выкачки
4. Генерация txt.
Отв: Неправильные книги
Я скачивал в формате fb2 :) А также открывал онлайн. Одинаково - только одна строчка...
Отв: Неправильные книги
Файл книги "Орион взойдет" - 1082 K. Это при том, что он текстовый, без обложки, иллюстраций и прочих изображений. Подумайте, могут ли полторы строчки текста весить больше мегабайта? Откройте в любом текстовом редакторе, включая "блокнот" - и убедитесь в том, что кроме второй строчки текста есть и третья.
Невалидный, с точки зрения fb2, символ в 42-й строке файла - это, согласитесь, отличается от неполного текста книги.
Отв: Неправильные книги
Правильно, а также с точки зрения программ, fb2 читающих...
Отв: Неправильные книги
Насчет текста - скачивается зип размером 1.22 Кбайта. Почему - Ларин уже ответил, "недостаток конструкции", как говорили в известном фильме :)
Но зип с fb2 скачивается вполне "нормальный" - размером 460 Кбайт. Хотя... Его действительно не могут открыть FBReader и CoolReader, но AlReader все же открывает. Что-то не так...
Отв: Неправильные книги
В данном случае - да, файл полный. Однако нормально его прочитать проблематично. Тот кто делал файл, видимо, не осознал, что теги <> - зарезервированы в XML. В файле в галочки выделены комментарии переводчика. Отсюда и ошибки при открытии - программы думают, что это тег. В любом случае - это ошибка, просто другая. Так что все равно нужно проверять, что создается и заливается...
Отв: Неправильные книги
Файл сделан с помощью LibRusEc kit. Все претензии к злобному тупому компьютеру :)
Отв: Неправильные книги
Ну, тогда уж к программисту. Надо учесть знаки <> в исходном файле (если не html/xml) и заменять их при конвертации на другие скобки... Попробую заменить скобки вручную и перезалить...
Отв: Неправильные книги
Может, кто и Агатой Кристи займется? У нее в половине книг используются знаки <>...
Отв: Неправильные книги
Точно не я, у меня к детективам весьма негативное отношение(кроме Маклина). Вот фантастика и фэнтези - это пожалуйста...
Отв: Неправильные книги
Потихоньку делаю, но никак не соберусь сделать всё и сразу...
Отв: Неправильные книги
Сделал больше половины файла "ориона", а тут уже выложили нормальную версию... Вот так вот, хочешь сделать, а все равно не дадут. В следующий раз промолчу :)
Отв: Неправильные книги
Конечно, это обидно. Но если бы Вы в названии файла, который взялись починять, добавили бы слово "правка" или "вычитка", то вероятность пересечения с кем-либо еще все таки сильно уменьшилась бы.
Отв: Неправильные книги
Гм, не знал, не знал...
Отв: Неправильные книги
Можно попробывать прогнать тексты через FB2Fix. Большая часть невалидных файлов исправляется, правда я не уверен, что он что либо важное в структуре документа не гробит.
Отв: Неправильные книги
Не гробит. У rusec-файлов нет структуры. У других файлов правда тоже не гробит ;) Оччень полезная программка.
Отв: Неправильные книги
Попробовал на старой версии "Ориона" - действительно помогло. Правда, программка консольная (по крайней мере та версия, что я скачал). Кстати, в той версии файла, что там появился, нет этих самых примечаний переводчика. Хотя в плане разметки она лучше. Думаю, стоит выложить рядом еще одну версию.