Вы здесьОбновление скрипта "Поиск по набору регэкспов" для FBE - тестируем!
Опубликовано пт, 06/09/2019 - 04:13 пользователем TaKir
Дошли руки существенно дополнить, обновить, почистить и структурировать по смыслу скрипт "Поиск по набору регэкспов" для Fiction Book Editor (FBE). Автор этого скрипта (как и многих других скриптов для FBE) - Sclex, за что ему отдельное гран мерси. Наполнение скрипта мое, Sclex-а + учтены все возможные пожелания книгоделов из двух старых здешних тем: Типичные ошибки распознавания... Пользоваться и тестировать могут все желающие, отзывы, примеры, предложения по улучшению категорически приветствуются. Просьба приводить конкретные примеры: - ошибок скрипта, ложных срабатываний Очень приветствуется помощь тех, кто хорошо знаком с регулярными выражениями для дальнейшего совершенствования скрипта. Ссылка на последнюю версию скрипта (30-09-2019): альтернативные ссылки: Заменить этим файлом имеющийся файл (или положить новый вариант скрипта рядом) в папке: Скрипту удобнее назначить горячую клавишу F2 (меню: Сервис-Настройки-Клавиши-Скрипты-Поиск по набору регэкспов). Перед запуском данного скрипта лучше обработать текст скриптами "Генеральная уборка", "Латиница в кириллице" По мере накопления отзывов о работе скрипта, планирую периодически пополнять скрипт и выкладывать обновленную версию. P.S. На Флибусте открыта аналогичная тема, можно писать в любую.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
marynn RE:Подайте бедному копеечку на книжку с литреса... 10 часов
Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 6 дней sem14 RE:Серия "Символы времени" издательства "Аграф" 1 неделя Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 неделя tvv RE:faq brainstorm =) 1 неделя Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 недели Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели larin RE:абонемент не обновлен 2 недели sem14 RE:За иллюминатором (серия) - чего не хватает? 3 недели sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 3 недели Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 3 недели larin RE:Пропал абонемент 4 недели tvv RE:DNS 1 месяц MrMansur RE:<НРЗБ> 1 месяц Stager RE:Беженцы с Флибусты 1 месяц Tramell RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц Впечатления о книгах
Дей про Псевдоним «Испанец»
03 02 Такое впечатление, что во время написания первой и 2/3 второй книг у автора был жесточайший спермотоксикоз. Секс, секс, секс, сейчас, вчера был, завтра будет, мысли о сексе, пошлые шутки, постоянное упоминание члена (да, как ………
Stager про Сальников: Петровы в гриппе и вокруг него (Современная проза)
02 02 Не осилил. Унылая бессмысленная тягомотина, написанная совершенно не по-русски. Кстати, такой стиль был популярен в те времена, и я сильно позже понял, что это подражание ещё более кретинской англоязычной литературе. Оценка: нечитаемо
MrMansur про Симоньян: В начале было Слово – в конце будет Цифра [litres] (Современная проза)
02 02 Шикарная книга, которую надо не только читать, но и перечитывать через время, сравнивая ощущения и случившееся в реальной жизни. Оценка: отлично!
mysevra про Мишарин: Серебряная свадьба (Драматургия: прочее)
02 02 Искала из-за пьесы «Княжны», остальное не заинтересовало. Как же замечательно изобразила Дашу Ольга Волкова в телеспектакле – благодаря ей вещь получилась действительно изумительной. Оценка: отлично!
mysevra про Престон: Гора Дракона [Mount Dragon ru] (Триллер)
02 02 Прочитала с удовольствием, динамично, увлекательно и неожиданно: беда пришла, откуда не ждали. Конечно, технически-медицинские вопросы вне моей компетенции и, подозреваю, там есть к чему придраться. Я же придираюсь к воинственно ……… Оценка: отлично!
mysevra про Шакилов: Хозяин Янтаря (Боевая фантастика, Постапокалипсис)
02 02 Откуда такой разудалый боевичок с хахоньками, первая книга нормальная же была? Оценка: плохо
Oleg68 про Кристенсен: Полубрат [Halvbroren ru] (Современная проза)
31 01 Долго читал. Неоднозначная книга. С одной стороны,- интересная, С другой,- как- то рывками. Оценка: хорошо
udrees про Леруа: Мутанты: О генетической изменчивости и человеческом теле [Mutants: On Genetic Variety and the Human Body ru] (Биология)
31 01 Отличная книга, написанная как можно более доступным языком про генетику, язык генов и как мутации в них влияют на человека. Приводится все это на примерах достаточно известных мутаций – сросшиеся близнецы, волосатые люди, ……… Оценка: отлично!
udrees про Атаманов: Первая зима [СИ] (Фэнтези, ЛитРПГ, Самиздат, сетевая литература)
31 01 Хорошо написано в жанре литРПГ, хорошее продолжение. Герой и его альянс продолжают свое развитие в новом мире. Нюансом является то, что есть боги-валлары, которые вмешиваются в игровой процесс, собственно так его они и именуют. ……… Оценка: хорошо
udrees про Атаманов: На службе Фараона [СИ] (Фэнтези, ЛитРПГ, Самиздат, сетевая литература)
31 01 Вторая книга написана не хуже первой и держит в напряжении на всем протяжении повествования. Рассказ как обычно идет от двух лиц – человека и котенка. Приключений навалом, написано просто и живо. Немного конечно коробит, когда ……… Оценка: хорошо
udrees про Атаманов: Котёнок и его человек [СИ] (Фэнтези, Самиздат, сетевая литература)
31 01 Хорошее произведение в жанре литРПГ и попаданца. Начало конечно скомканное, читателя сразу бросают в бой, как говорится. Скучное начало быстро пролетает, так как героя сразу перебрасывают в сказочный мир, хотя вру, не сразу ……… Оценка: хорошо |
Комментарии
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Ну, я не специалист-филолог, но мне кажется, скрипт должен ориентироваться на литературный, а не на просторечный вариант.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Не буду спорить. Свою задачу я вижу в том, чтобы набрать статистику. Что из нее учитывать, а что не учитывать, думаю должны решать разработчики.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Идеальный скрипт в любом случае не сделать.
Писалось выше - улучшить бы "Генеральную уборку".
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Пока не вижу примеров для доработки скрипта, кроме прилипшего многоточия и удаления пробела перед маркером сноски.
Какие улучшения нужны?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
А апостроф?
...предусмотреть замену всех возможных различных вариаций апострофов - ´ ʼ ′ ˙ ΄ - на ' (буква «э» на англ. раскладке), который U+0027.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Прошу прощения, но не совсем понял, в связи с чем возник этот вопрос? Если ответить коротко - да, в курсе, но, по-моему, про нижнее подчеркивание я ничего не писал? И на его проверку не жаловался. Может, конечно, что-то запамятовал, уточните, если не сложно, почему вы меня об этом спрашиваете.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Можно попросить ссылку? И уточните, о чем идет речь: о названии книги (печатное издание) или имени файла? Нижнее подчеркивание использую в имени файла. Это давняя привычка, обусловленная определенными причинами. А вот в названии книги - что-то за собой такого не помню. Если дадите ссылку, проверю по своим оригиналам. Может быть, это какая-то ошибка, тем более, что она есть "во многих файлах". Надо посмотреть, что это такое.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Теперь еще по поводу работы скрипта, столкнулся с моментами, вызвавшими легкое удивление:
скрипт иногда обнаруживает, а иногда пропускает полужирное начертание отдельной буквы предлог "и", местоимение "я". Удивило, что иногда полужирное начертание обнаруживается, а иногда нет. Может, конечно, он реагирует на что-то иное, совпадающее с полужирным начертанием.
Также пропускает сочетание ., (точка и запятая). Также пропускает слово нащ (должно быть - наш). Но это, видимо, тоже относится к орфографическим ошибкам, которые скрипт не проверяет?
Добавлено позже:
Обрабатывал скриптом книгу, в которой при распознавании был пропущены все дефисы в словах типа как-то, кто-то кто-либо, когда-либо и т.д. Заметил, что скрипт пропускает словосочетание дватри (два-три); и тотмто (том-то в выражении "в том-то и дело")
Страницы