Вы здесьНеправильные книги
Опубликовано пн, 30/03/2009 - 21:01 пользователем Marked
Решил вот заменить свою библиотеку, скачанную оттуда-отсюда, на fb2 файлы... Смотрю на Либрусеке (по алфавиту, как у меня книги в папках лежат): Айзек Азимов "Тупик". Здесь вместо него лежит рассказ Генри Каттнера "Порочный круг". Следующая папка - Кевин Андерсон, серия "Сага Семи Солнц". Первые две книги здесь на либрусеке поменяны местами. (названия правильные, текст неправильный). Эта ошибка распространенная, так как в астовском издании в серии "Золотая библиотека фантастики" они тоже поменяны местами. На фензине, кстати, лежит аналогично... Следующая книга Пол Андерсон "Орион взойдет". Скачал, открываю - там только "от автора" и полторы строчки текста... и все.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 4 дня
Nicout RE:Прошу переформатировать, распознать, etc... 2 недели akorish RE:Регистрация 3 недели Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 3 недели Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 3 недели konst1 RE:Ух, как я не люблю спамеров! 4 недели tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 1 месяц larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 месяца Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 месяца fixel RE:Пропал абонемент 2 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 3 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 4 месяца tvv RE:faq brainstorm =) 4 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 4 месяца Впечатления о книгах
virtcatty про Горъ: Ухорез - 3 (Боевая фантастика, Фэнтези, Самиздат, сетевая литература)
27 05 Для tvv: Перейди на Флибу прямо сейчас, там есть и без картинок.
francuzik про Яманов: Питбуль и Митрофанушка [СИ] (Боевая фантастика, Фэнтези, Современная проза, Попаданцы, Самиздат, сетевая литература)
25 05 На удивление хорошая книга. Не ожидал даже. Оценка: хорошо
Barbud про Смолин: Дело №1979 (Альтернативная история, Детективы: прочее, Самиздат, сетевая литература)
24 05 Начал читать, через несколько минут закралось нехорошее подозрение, что этот стиль мне знаком, и называется он "нейросетевое творчество". Что-то сразу выдает - то ли короткие рубленые предложения, то ли повторы идентичных ………
Dead_Space про Гэддис: Распознавания (Классическая проза, Историческая проза)
24 05 Огромное спасибо, давно ждал, только вчера проверял на флибусте наличие, а её оказывается тут выложили. Оценка: отлично!
mysevra про Сабин: Викка для начинающих. Основы философии и практики [Wicca for Beginners: Fundamentals of Philosophy & Practice ru] (Религия, Эзотерика)
24 05 На мой дилетантский взгляд, просто замечательно: чётко, ясно, по существу и без нагнетания эзотерической зауми. Кто заинтересовался, тот будет искать дальше. Оценка: отлично!
mysevra про Иванов: Вегетация (Киберпанк, Постапокалипсис)
24 05 Хорошо пишет, и идея отличная, почти злободневная. Но слишком тягостно-упадническое ощущение, безнадёжные персонажи (все эти бабёшки, работяги, озабоченные 20 летние пубертаты), беспросветная грязь и бытовой цинизм – знать ……… Оценка: неплохо
mysevra про Огнев: Тихое [litres] (Ужасы)
24 05 Дивная история! Это даже больше относится к жанру НФ. Оригинально, динамично, увлекательно, присутствует редкий зверь «обоснуй». Я буду фанатом этого автора. Оценка: отлично!
Lan2292 про Сухов: Реабилитант [СИ] (Боевая фантастика, Космическая фантастика, Попаданцы, Самиздат, сетевая литература)
23 05 Очень понравилось, всем рекомендую. Оценка: отлично!
Sello про Филдинг: История приключений Джозефа Эндруса и его друга Абраама Адамса (Классическая проза)
21 05 Литература того времени: черное - это черное, белое - это белое, никаких оттенков. Если любовь - то возвышенная, если мошенник - так закоренелый негодяй. Обязательный, как календарь, счастливый конец для хороших людей. Для ………
Дей про Эльфийский бык
20 05 Вот вроде бы грамотно пишет автор, и занимательно, но из-за дичайшего изобилия троеточий кажется, будто все герои умственно неполноценные. Сколько ни берусь, не могу читать.
Wik@Tor про Старый: Прошка-Паровоз (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
20 05 Ремейк книги Лынькова "МИКОЛКА-ПАРОВОЗ"!
Sadok про Зурков: Бои местного значения [litres] (Альтернативная история, Боевая фантастика, Попаданцы)
19 05 уже даже названия плагиатят Оценка: нечитаемо |
Комментарии
Отв: Неправильные книги
НЕ СКАЧИВАЙТЕ КНИГИ-FB2 В ФОРМАТЕ TXT !!!
Отв: Неправильные книги
Интересно... А зачем тогда в выпадающем списке есть txt? Для красоты? Или "шоб было"?
...Не поверю, что из fb2 так трудно сделать текст автоматом.
Отв: Неправильные книги
Сделать нетрудно.
Текущий конвертор использует встроенный в пых парсер XML, который молча падает на любой ошибке.
Всё никак не соберусь переписать.
Отв: Неправильные книги
А-а. Так вот оно почему не стреляет - не заряжено...
Илья, я вскоре всё равно для одной затеи буду писать на Перле "извлекатель текста из fb2". Без парсера, конечно. Если тебя Перл устроит, можно будет сделать перловую тхт-конвертилку.
Отв: Неправильные книги
Лучше бы перловую xml-проверялку, а в идеале и чинилку.
Глянь parcer.inc, туда встроить внешнюю утилиту будет непросто.
Отв: Неправильные книги
Не, это я точно не потяну :(
Отв: Неправильные книги
Эээ... не замечал. Но в принципе - могу помочь. К тому же - в PHP больше одного xml-парсера.
Другой путь получения txt - выбросить всю разметку регулярным выражением.
Отв: Неправильные книги
Перловому можно сказать, что ошибки XML нужно игнорировать.
Есть ли такое решение для пыха? Если есть - это было бы идеально, мне проще поменять парсер, чем писать его самому.
Получение txt - побочный результат.
Основные задачи, решаемые парсером:
1. Вытаскивание оглавления и обложки
2. Онлайн-чтение
3. Генерация html для выкачки
4. Генерация txt.
Отв: Неправильные книги
Я скачивал в формате fb2 :) А также открывал онлайн. Одинаково - только одна строчка...
Отв: Неправильные книги
Файл книги "Орион взойдет" - 1082 K. Это при том, что он текстовый, без обложки, иллюстраций и прочих изображений. Подумайте, могут ли полторы строчки текста весить больше мегабайта? Откройте в любом текстовом редакторе, включая "блокнот" - и убедитесь в том, что кроме второй строчки текста есть и третья.
Невалидный, с точки зрения fb2, символ в 42-й строке файла - это, согласитесь, отличается от неполного текста книги.
Отв: Неправильные книги
Правильно, а также с точки зрения программ, fb2 читающих...
Отв: Неправильные книги
Насчет текста - скачивается зип размером 1.22 Кбайта. Почему - Ларин уже ответил, "недостаток конструкции", как говорили в известном фильме :)
Но зип с fb2 скачивается вполне "нормальный" - размером 460 Кбайт. Хотя... Его действительно не могут открыть FBReader и CoolReader, но AlReader все же открывает. Что-то не так...
Отв: Неправильные книги
В данном случае - да, файл полный. Однако нормально его прочитать проблематично. Тот кто делал файл, видимо, не осознал, что теги <> - зарезервированы в XML. В файле в галочки выделены комментарии переводчика. Отсюда и ошибки при открытии - программы думают, что это тег. В любом случае - это ошибка, просто другая. Так что все равно нужно проверять, что создается и заливается...
Отв: Неправильные книги
Файл сделан с помощью LibRusEc kit. Все претензии к злобному тупому компьютеру :)
Отв: Неправильные книги
Ну, тогда уж к программисту. Надо учесть знаки <> в исходном файле (если не html/xml) и заменять их при конвертации на другие скобки... Попробую заменить скобки вручную и перезалить...
Отв: Неправильные книги
Может, кто и Агатой Кристи займется? У нее в половине книг используются знаки <>...
Отв: Неправильные книги
Точно не я, у меня к детективам весьма негативное отношение(кроме Маклина). Вот фантастика и фэнтези - это пожалуйста...
Отв: Неправильные книги
Потихоньку делаю, но никак не соберусь сделать всё и сразу...
Отв: Неправильные книги
Сделал больше половины файла "ориона", а тут уже выложили нормальную версию... Вот так вот, хочешь сделать, а все равно не дадут. В следующий раз промолчу :)
Отв: Неправильные книги
Конечно, это обидно. Но если бы Вы в названии файла, который взялись починять, добавили бы слово "правка" или "вычитка", то вероятность пересечения с кем-либо еще все таки сильно уменьшилась бы.
Отв: Неправильные книги
Гм, не знал, не знал...
Отв: Неправильные книги
Можно попробывать прогнать тексты через FB2Fix. Большая часть невалидных файлов исправляется, правда я не уверен, что он что либо важное в структуре документа не гробит.
Отв: Неправильные книги
Не гробит. У rusec-файлов нет структуры. У других файлов правда тоже не гробит ;) Оччень полезная программка.
Отв: Неправильные книги
Попробовал на старой версии "Ориона" - действительно помогло. Правда, программка консольная (по крайней мере та версия, что я скачал). Кстати, в той версии файла, что там появился, нет этих самых примечаний переводчика. Хотя в плане разметки она лучше. Думаю, стоит выложить рядом еще одну версию.