Вы здесьОбновление скрипта "Поиск по набору регэкспов" для FBE - тестируем!
Опубликовано пт, 06/09/2019 - 04:13 пользователем TaKir
Дошли руки существенно дополнить, обновить, почистить и структурировать по смыслу скрипт "Поиск по набору регэкспов" для Fiction Book Editor (FBE). Автор этого скрипта (как и многих других скриптов для FBE) - Sclex, за что ему отдельное гран мерси. Наполнение скрипта мое, Sclex-а + учтены все возможные пожелания книгоделов из двух старых здешних тем: Типичные ошибки распознавания... Пользоваться и тестировать могут все желающие, отзывы, примеры, предложения по улучшению категорически приветствуются. Просьба приводить конкретные примеры: - ошибок скрипта, ложных срабатываний Очень приветствуется помощь тех, кто хорошо знаком с регулярными выражениями для дальнейшего совершенствования скрипта. Ссылка на последнюю версию скрипта (30-09-2019): альтернативные ссылки: Заменить этим файлом имеющийся файл (или положить новый вариант скрипта рядом) в папке: Скрипту удобнее назначить горячую клавишу F2 (меню: Сервис-Настройки-Клавиши-Скрипты-Поиск по набору регэкспов). Перед запуском данного скрипта лучше обработать текст скриптами "Генеральная уборка", "Латиница в кириллице" По мере накопления отзывов о работе скрипта, планирую периодически пополнять скрипт и выкладывать обновленную версию. P.S. На Флибусте открыта аналогичная тема, можно писать в любую.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Nicout RE:Прошу переформатировать, распознать, etc... 19 часов
нэнси RE:Подайте бедному копеечку на книжку с литреса... 2 дня akorish RE:Регистрация 1 неделя Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 неделя konst1 RE:Ух, как я не люблю спамеров! 2 недели tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 1 месяц larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца Впечатления о книгах
chebur про Кристиан Пино
13 05 Сказки очень интересные и необычные, впервые прочитала их уже взрослой.
SeNS про Boston: Токен за токеном (История, Околокомпьютерная литература, Научпоп)
13 05 Книга, на удивление, весьма "читабельная", и написана в стиле американских tech writers. Содержит весьма интересные исторические экскурсы, а также множество неизвестных широкой публике фактов. Настоятельно рекомендуется к чтению всем интересующимся ИИ/LLM. Оценка: отлично!
akorish про Роман Юрьевич Прокофьев
12 05 Стеллар оставил положительные чувства, хотя последняя книга была нудноватой лично для меня. Но это не отменяет, того, что время потрачено не зря.
akorish про Прокофьев: Архив Стеллара (Фантастика: прочее, Самиздат, сетевая литература)
12 05 Ну такое, как сноски почитать. Мне было уже не интересно. Оценка: неплохо
akorish про Прокофьев: Прометей [СИ] (Боевая фантастика, Героическая фантастика, Постапокалипсис, ЛитРПГ, Самиздат, сетевая литература)
12 05 Самопожертвование, и отвага, нудновато, но дочитано. Думаю, что эта книга была уже лишней, много затянутого. Сария стоящая, почитайте. Оценка: хорошо
akorish про Прокофьев: Сфирот [СИ] (Героическая фантастика, Фантастика: прочее, ЛитРПГ, Самиздат, сетевая литература)
12 05 Переносимся в космос, все еще интересно? Ну тако-то да, но уже нудновато.
akorish про Прокофьев: Эфемер [СИ] (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
12 05 Даат - как бы и нельзя договариваться, но и не договариваться нельзя ))) Что же за Дар? Сыр в мышеловке.
akorish про Прокофьев: Легат [СИ] (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
12 05 Оценка все еще Хорошо! Не так интересно как 1я и 2я, но еще интересно, новые союзники и новые враги. Читаем дальше. Оценка: хорошо
akorish про Прокофьев: Архонт [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Неожиданно интересно, новый уровень и новый замут. Читаем дальше.
akorish про Прокофьев: Мятежник [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Мысль такая, идет прокачка персонажа, уже не так захватывает, как предыдущие, но читается на интересе.
akorish про Прокофьев: Заклинатель [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 3я книга сдает позиции по отношению к предыдущим, но читать не надоедает. Оценка: хорошо
akorish про Прокофьев: Трибут [СИ] (Боевая фантастика, Героическая фантастика, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Вторая книга не подкачала, легкое чтиво на сон грядущий. Хоть немного и не дотянула до первой, но читать стоит. Оценка: отлично! |
Комментарии
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Ну, я не специалист-филолог, но мне кажется, скрипт должен ориентироваться на литературный, а не на просторечный вариант.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Не буду спорить. Свою задачу я вижу в том, чтобы набрать статистику. Что из нее учитывать, а что не учитывать, думаю должны решать разработчики.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Идеальный скрипт в любом случае не сделать.
Писалось выше - улучшить бы "Генеральную уборку".
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Пока не вижу примеров для доработки скрипта, кроме прилипшего многоточия и удаления пробела перед маркером сноски.
Какие улучшения нужны?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
А апостроф?
...предусмотреть замену всех возможных различных вариаций апострофов - ´ ʼ ′ ˙ ΄ - на ' (буква «э» на англ. раскладке), который U+0027.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Прошу прощения, но не совсем понял, в связи с чем возник этот вопрос? Если ответить коротко - да, в курсе, но, по-моему, про нижнее подчеркивание я ничего не писал? И на его проверку не жаловался. Может, конечно, что-то запамятовал, уточните, если не сложно, почему вы меня об этом спрашиваете.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Можно попросить ссылку? И уточните, о чем идет речь: о названии книги (печатное издание) или имени файла? Нижнее подчеркивание использую в имени файла. Это давняя привычка, обусловленная определенными причинами. А вот в названии книги - что-то за собой такого не помню. Если дадите ссылку, проверю по своим оригиналам. Может быть, это какая-то ошибка, тем более, что она есть "во многих файлах". Надо посмотреть, что это такое.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Теперь еще по поводу работы скрипта, столкнулся с моментами, вызвавшими легкое удивление:
скрипт иногда обнаруживает, а иногда пропускает полужирное начертание отдельной буквы предлог "и", местоимение "я". Удивило, что иногда полужирное начертание обнаруживается, а иногда нет. Может, конечно, он реагирует на что-то иное, совпадающее с полужирным начертанием.
Также пропускает сочетание ., (точка и запятая). Также пропускает слово нащ (должно быть - наш). Но это, видимо, тоже относится к орфографическим ошибкам, которые скрипт не проверяет?
Добавлено позже:
Обрабатывал скриптом книгу, в которой при распознавании был пропущены все дефисы в словах типа как-то, кто-то кто-либо, когда-либо и т.д. Заметил, что скрипт пропускает словосочетание дватри (два-три); и тотмто (том-то в выражении "в том-то и дело")
Страницы