Типичные ошибки распознавания - собираем статистику для скрипта ФБЕ

Вы здесь Главная » Блоги » Блог пользователя TaKir Типичные ошибки распознавания - собираем статистику для скрипта ФБЕ Опубликовано чт, 06/01/2011 - 11:12 пользователем TaKir Собираю статистику по наиболее частым типичным ошибкам распознавания для включения их в скрипт ФБЕ: Варианты: пе (не), оп (он), пи (ни), ва (за), пее (нее), опа (она)... Прошу участвовать всех желающих. Дополненный список я хочу включить в недавно обновленный скрипт "Поиск по набору регэкспов", автор Sclex (http://groups.google.com/group/fiction-book-editor/browse_thread/thread/b4700ee54d255384), работающий под ФБЕ. Собранная статистика еще больше упростит отлов косяков сканирования и, соответственно, позволит более качественно и быстро делать верстку отсканенных книг и быстрее находить косяки в уже сделанных книгах тем, кто занимается их правкой-вычиткой. Сейчас данный скрипт у меня ищет: - смесь латиницы с кириллицей во всех вариантах, - смесь букв с цифрами, - неправильные дефисы-тире, - мусор после скана, - концы строк без знаков препинания - неполный курсив слова - указанные выше типичные ошибки распознавания и другие подозрительные места. Использование этого скрипта заметно сокращает время работы над книгой в ФБЕ. Блог пользователя TaKir Войдите или зарегистрируйтесь, чтобы отправлять комментарии Комментарии Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 30/01/2011 - 15:54 пользователем chas Закончил книгу, где использовал данный скрипт. Призведя вычитку, убедился. что ляпов практически нет. Скрипт сработал на отлично. В тексте осталась только замена "ьщ" на "ыц". Ещё раз спасибо TaKir, да и вообще всем, принявшим участие в его создании. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 31/01/2011 - 13:22 пользователем Алексей_Н Неожиданно выпало: "щей" вместо "шеи". Можно и не заметить, оба слова в словаре присутствуют. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пн, 31/01/2011 - 13:25 пользователем Pawel Вот еще, из довольно частых: Айда - Аида, ай - аи. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пт, 04/02/2011 - 13:10 пользователем shokons Добавляю: Ищет смесь регистров (кириллица ) проимерно так: проБа или ПРоба. Не трогает имена собственные addRegExp("[а-яё][А-ЯЁ]","","Найдено: смесь регистров"); addRegExp("[А-ЯЁ][А-ЯЁ][а-яё]","","Найдено: смесь регистров"); Слипшиеся слова....А то..., .....И то tagRegExp("(?< ![а-яё])ато(?![а-яё])","i","Найдено: слово \"ато\" (\"а то\" с опечаткой)."); tagRegExp("(?< ![а-яё])ито(?![а-яё])","i","Найдено: слово \"ито\" (\"и то\" с опечаткой)."); Удалить пробелы перед восклицательным знаком (!) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пт, 04/02/2011 - 13:52 пользователем shokons А вообще - убойный скрипт!! Ещё раз спасибо Такиру и Склексу!! Может кому пригодится - я задублировал три таких скрипта - с небольшими изменениями, каждый на своей кнопке. Это касается украинских, болгарских букв ( у меня они выставлены в ФР и я частенько забываю их откл/вкл)), специальных знаков итд. В общем - каждый себе может подобрать набор. ОЧЕНЬ убыстряет и улучшает Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 05/02/2011 - 07:31 пользователем Sclex Полагаю, стоит включить версию скрипта с регэкспами ТаКир'а в следующий релиз FBE. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 05/02/2011 - 08:24 пользователем golma1 Sclex написал: Полагаю, стоит включить версию скрипта с регэкспами ТаКир'а в следующий релиз FBE. +1. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 05/02/2011 - 12:17 пользователем Pawel вес - все Круглов - Круглое Валет - Балет рот - рог Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 12/02/2011 - 06:29 пользователем shokons Случайно обнаружил, что скрипт не ищет буква+знак препинания+цифра Это могут быть цифры пропущенных сносок примерно в таком виде: Текст,3...Текст)3... Текст.3... Текст»3.... Предлагаю добавить: addRegExp("[A-Za-zА-яЁё»).,][0-9]","","Найдено:Подозрение на пропущенную сноску"); К сожалению не получилось добавит сюда комп. кавычки - начинает выдавать ошибку скрипта. Для целенаправленного поиска только таких цифр можно проводить и рег. выражением: [A-Za-zА-яЁё"»).,][\d] УПД: Если сделать так: addRegExp("[A-Za-zА-яЁё\"»).,][0-9]","","Найдено:Подозрение на сноску"); То комп.кавычку+цифра находится нормально (пришлось дополнительно вставить слеш) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 22/02/2011 - 09:12 пользователем Sclex В регэкспе была ошибка, поправил: addMacros("<откр-закр-em-str>","<emphasis>\|</emphasis>\|<strong>\|</strong>"); tagRegExp("([а-яёa-z]<откр-закр-em-str>)?[а-яёa-z]<откр-закр-em-str>(<emphasis>\|</emphasis>)<откр-закр-em-str>([а-яёa-z]<откр-закр-em-str>)+","i","Найдено: курсивность части слова."); (Заменил один плюс на звездочку.) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 22/02/2011 - 09:14 пользователем Sclex Упс. Вместо "ответить" кликнул на "изменить", в итоге затер старое сообщение. Или форум сглючил? Вряд ли. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пт, 18/02/2011 - 11:15 пользователем Алексей_Н Хорошо бы добавить точку с запятой (;) в конце абзаца. Иногда вместо двоеточия перед прямой речью выскакивает. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 19/02/2011 - 03:45 пользователем wotti Алексей_Н написал:* Хорошо бы добавить точку с запятой (;) в конце абзаца. Иногда вместо двоеточия перед прямой речью выскакивает. Да неплохо бы! Всем привет. Когда починят добавлялку? Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 19/02/2011 - 10:12 пользователем Алексей_Н вамп = вами II = И попятно = понятно Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 19/02/2011 - 11:13 пользователем shokons Алексей_Н написал: вамп = вами II = И попятно = понятно первое и третье можно будет добавить, а вот со вторым проблемы могут возникнуть. Скрипт будет показывать ВСЕ вхождения "И" (как отдельно стоящего слова) и боюсь их может быть многовато ((( Я вот ещё думаю, может добавить V+любую цифру? Довольно часто встречается вместо дроби (напр. 1/2 Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 19/02/2011 - 11:16 пользователем Алексей_Н В скрипт нужно добавить не "И", а "II" с пробелами с обоих сторон. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 19/02/2011 - 13:11 пользователем s_Sergius Алексей_Н написал: В скрипт нужно добавить не "И", а "II" с пробелами с обоих сторон. И скрипт будет останавливаться на каждом “II”? Боюсь для исторических текстов с обилием имен типа Екатерина II это не совсем хорошо. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 19/02/2011 - 13:23 пользователем Алексей_Н Сейчас скрипт останавливается на каждой "б" (частица), "яи" (в словах типа "хозяин"), и эти случаи встречаются чаще, чем "Екатерина II". Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 19/02/2011 - 13:46 пользователем s_Sergius Насчет "хозяина", "яиц" и т.п. спорить не буду, а вот одиночная "б" встречается довольно редко, поэтому не раздражает. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 19/02/2011 - 11:31 пользователем shokons Сорри, я наверное не так понял. У меня просто чаще встречается ошибка, когда вместо римской цифры - выдаёт "И" )) tagRegExp("(?< ![а-яё])вамп(?![а-яё])","i","Найдено: слово \"вамп\" (\"вами\" с опечаткой)."); tagRegExp("(?< ![а-яё])попятно(?![а-яё])","i","Найдено: слово \"попятно \" (\"понятно\" с опечаткой)."); tagRegExp("(?< ![а-яё])II(?![а-яё])","i","Найдено: слово \"II\" (\"И\" с опечаткой)."); Хочу ещё раз подчеркнуть - скрип целесообразно иметь не один. Лучше его поделить на несколько, оставив в каждом необходимые+специфические. Ведь всё-таки есть разница по частоте ошибок в разных жанрах - свои словечки (жаргонизмы) есть в фантастике, свои слова в политической, научной или другой литературе. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 20/02/2011 - 09:16 пользователем F.CYXOB Здравствуйте, все! Большое спасибо Sclex-у за срипты, а TaKir-у - что открыл эту тему! Попробовал - очень полезно! И, конечно, уже дополнил кое-чем, о чём вспомнил. Вот это дополнение. В файле скрипта от Sclex-а "Поиск по набору регэкспов_TaKir_24_01_2011.js" после строки // -------------конец блока TaKir - регэкспы:--------------- я добавил следующие (прошу строго не судить - чайник): // -------------начало блока F.CYXOB - регэкспы:-------------- tagRegExp("(ыо)","i","Найдено: часть слова \"ыо\" (\"ью\" с опечаткой?).","",1); tagRegExp("(ыш)","i","Найдено: часть слова \"ыш\" (\"ьни\" с опечаткой?).","",1); tagRegExp("(?#(![а-яё])ужо(?![а-яё])","i","Найдено: слово \"ужо\" (\"уже\" с опечаткой, если это не просторечие).","",1); addRegExp("^[Л][\\x20\\xA0\\t\\n\\r\\f]","i","Найдено: буква Л вместо А в начале строки"); addRegExp("^[Л][.,:;!\?]","i","Найдено: буква Л вместо А в начале строки"); addRegExp("^[Д][\\x20\\xA0\\t\\n\\r\\f]","i","Найдено: буква Д вместо А в начале строки"); addRegExp("^[Д][.,:;!\?]","i","Найдено: буква Д вместо А в начале строки"); addRegExp("^[Н][\\x20\\xA0\\t\\n\\r\\f]","i","Найдено: буква Н вместо И в начале строки"); addRegExp("^[Н][.,:;!\?]","i","Найдено: буква Н вместо И в начале строки"); addRegExp("[\\x20][.,:;!\?]","i","Найдено: пробел перед знаком препинания"); addRegExp("[\\x20][»”’]","i","Найдено: пробел перед закрывающей кавычкой"); addRegExp("[…][.,]","i","Найдено: трёхточие с прилегающим справа знаком препинания"); // ~~~~~~~~~~ идея про строчные в начале предлож. от Рыжего Тигры. С усовершенствованием от F.CYXOB'а: addRegExp("^[a-zа-яё]","","Найдено: строчная буква в начале строки"); addRegExp("[A-Za-zА-яЁё][….!\?][\\x20][a-zа-яё]","","Найдено: строчная буква в начале предложения."); // ~~~~~~~~~~ идея про сноски от shokons. С усовершенствованием от F.CYXOB'а: addRegExp("[A-Za-zА-яЁё][»….,:;!\?«)(\"”“][0-9]","i","Найдено: Подозрение на пропущенную сноску"); // -------------конец блока F.CYXOB - регэкспы:--------------- Пару символов "#(" в третьей строке tagRegExp надо заменить на левую угловую скобку. Конечно, старшие товарищи меня пусть поправят, если что... Спасибо! Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 20/02/2011 - 06:05 пользователем Алексей_Н По ходу работы над очередной книгой, выискиваются еще случаи: отда, вместо отца конда, вместо конца лидами, вместо лицами Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 20/02/2011 - 10:45 пользователем Igorek67 Встретил сегодня ф вместо гр. А еще у меня истоия вот такая открылась, может уже здесь и писал кто: Я раньше не особо не обращал внимания на точки и запятые перед тире в прямой речи. Вдруг обратил и огорчился. Например предложение: "— Ты же меня знаешь — гнили не подсуну, — ответил взводный, — Драться умеют все." И в книге и по-правилам: "— Ты же меня знаешь — гнили не подсуну, — ответил взводный. — Драться умеют все." То-есть перед заглавной буквой должна стоять точка, А перед маленькой запятая: "— Как букашку под микроскопом — вот что я хотел сказать, — буркнул он." В книгах проставлено верно, а наши вычитывальщики вместо точки перед заглавной часто ставят запятую. Или файнридер им ставит. Но не обращают внимания. Нельзя ли это как-то скриптом находить? Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 20/02/2011 - 10:50 пользователем Алексей_Н А не пробовали использовать скрипт "Точка, тире, буква"? Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 20/02/2011 - 11:56 пользователем Igorek67 Алексей_Н написал: А не пробовали использовать скрипт "Точка, тире, буква"? СПАСИБО, ДОБРЫЙ ЧЕЛОВЕК! Так и пришлось 2.5 ставить. :) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 24/02/2011 - 13:03 пользователем mikebb Смешные очепатки - ЖЗЛ Гулыга "Гегель" http://lib.rus.ec/b/188976/read "Неловкий, старообразный, неряшливо одетый, у женщин он успехом используется." Узнаем что Гегель учился на геологическом факультете "Это не мешает Гегелю в двадцать лет стать магистром философии. По заведенному на геологическом факультете" Который он закончил не много ни мало в осенью 4793 года!!! "Консисториальный экзамен осенью 4793 года — последняя дань пребыванию на студенческой скамье." И ещё Fr10 устойчиво фамилию Бальтазар распознавал как Бсихьтазар или Балыпазар Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано ср, 02/03/2011 - 14:43 пользователем golma1 "еше" вместо "еще" Я себе уже сама добавила. Подглядела, как ТаКир сделал. ;) Но коль скрипт в этом виде собираются добавлять в следующий релиз, то не мешало бы включить и эту весьма распространённую ошибку. :) Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 12/03/2011 - 06:18 пользователем chas Есть вопрос. Номера строк в стихотворных произведения сильно отвлекают (мешают) при чтении. Я представил эти номера над строкой и мне очень понравилось (кому интересно, можно посмотреть http://lib.rus.ec/b/269388). Так вот нужно ли и можно ли это автоматизировать? Делать это ручками можно, но занимает много времени. Прошу извинить за то, что не совсем в тему. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 12/03/2011 - 10:19 пользователем Sclex Если опишете поподробней, как вы себе представляете функциональность и интерфейс такого скрипта, может, когда-нибудь сделаю. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано сб, 12/03/2011 - 06:21 пользователем Алексей_Н Не помню, отмечалось или нет: "Аза" вместо "А за". Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 19/04/2011 - 05:06 пользователем JonVic sd написал: открыл Test.doc WordPad-ом, сохранил как Test0.doc, новый документ открыл обычным Вордом, выделил, перетащил в ФБЕ - стилей нет, ни одного! Лекарство - WordPad Ой-ей, чуть не забыл: в WordPad-е выделил все и назначил размер шрифта 12, на всякий случай, ФБЕ такой размер нравится. *Точно! Помогает.* Сам раньше вставлял прямо из WordPad-а, но заметил не хорошую тенденцию - стилей нет - хорошо, но пропали пустые строки в тексте - очень плохо. TaKir - отличный скрипт! Вот в копилку: ои -> он го -> по или то нот -> пот И такой вопрос - была книга, где дефис не распознался, имеет ли смысл в добавлении: гдето -> где-то какогото -> какого-то изза -> из-за какойто -> какой-то чтото -> что-то... Скрипт слипшихся слов - игнорирует эти ошибки... Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 19/04/2011 - 07:24 пользователем wotti JonVic написал: И такой вопрос - была книга, где дефис не распознался, имеет ли смысл в добавлении: гдето -> где-то какогото -> какого-то изза -> из-за какойто -> какой-то чтото -> что-то... Скрипт слипшихся слов - игнорирует эти ошибки... это проверяется спелчеком. если это вставлять (вы представляете СКОЛЬКО частоупотребляемых слов с дефисами есть в русском языке?) затормозим работу скрипта до полного аута Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 19/04/2011 - 09:09 пользователем Алексей_Н Почему "часто употребляемых"? Слов, типа "чтото, какогото" и т. п. в русском языке нет. И если скрипт поможет выявить эти ошибки - прекрасно. Скрипт ведь будет искать не слова с дефисами, а именно случаи без дефисов. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 19/04/2011 - 11:02 пользователем wotti Виноват невнимательно прочитал и не вник. ((( Алексей, если имеется ввиду окончание слов на "то". То может быть. Правда много будет и холостых срабатываний (просто, запросто, итд) Но мне довольно часто попадаются слитные - какнибудь, какойлибо итд. В своё время мне Склекс присылал выборку слов с дефисами в тхт (надо поискать куда засунул) так этот тхт весил немерянно. ПС кстати - изза - в исходном скрипте есть Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано пт, 29/04/2011 - 02:59 пользователем JonVic нот -> вот Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 15/05/2011 - 08:19 пользователем Алексей_Н "чю" вместо "что" Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 15/05/2011 - 08:34 пользователем PrePress Слово "полста" часто распознается как "полета". Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вс, 15/05/2011 - 18:47 пользователем x10327 PrePress написал: Слово "полста" часто распознается как "полета". +1. Надо бы в скрипт добавить. Сейчас делаю книгу, автор любит слово полста... Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано вт, 31/05/2011 - 02:34 пользователем Алексей_Н 06 - вместо "об" 01 - вместо "от" Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано ср, 29/06/2011 - 09:13 пользователем Aldio эго = это И вот это: "но" после слова и в обрамлении пробелов, скорее всего нужно "по". Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано ср, 29/06/2011 - 18:50 пользователем Roxana Да, тоже хотела про "но" написать. Как правильно такую строчку прописать в скрипте, чтобы она не искала все подряд "но"? А именно сочетание "конец слова" + пробел + но + пробел. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано ср, 29/06/2011 - 20:05 пользователем Aldio "[а-я] но " Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 30/06/2011 - 06:27 пользователем Roxana Спасибо, попробую. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 30/06/2011 - 07:31 пользователем golma1 Aldio написал: "[а-я] но " Не годится. После запятой (если это правильно "но") тоже стоит пробел. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 30/06/2011 - 10:50 пользователем Aldio golma1 написал: Aldio написал: "[а-я] но " Не годится. После запятой (если это правильно "но") тоже стоит пробел. Годится. Запятая в множество [а-я] не входит. Пользуюсь давно - работает. Причём это один из наиболее упускаемых даже при хорошей вычитке багов. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 30/06/2011 - 11:23 пользователем golma1 Aldio написал: golma1 написал: Aldio написал: "[а-я] но " Не годится. После запятой (если это правильно "но") тоже стоит пробел. Годится. Запятая в множество [а-я] не входит. Пользуюсь давно - работает. Причём это один из наиболее упускаемых даже при хорошей вычитке багов. Хммм... Напиши тогда полную строку, пожалуйста. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 30/06/2011 - 11:36 пользователем Aldio golma1 написал: Хммм... Напиши тогда полную строку, пожалуйста. Пытался - не выходит. Режется. Единственное, я делал это под оператором addRegExp а не tagRegExp. Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 30/06/2011 - 12:14 пользователем golma1 Aldio написал: golma1 написал: Хммм... Напиши тогда полную строку, пожалуйста. Пытался - не выходит. Режется. Единственное, я делал это под оператором addRegExp а не tagRegExp. Чё-то у меня не получается. :( А в тэге "code" тоже режется? Или сделай вместо круглых скобок фигурные. Очень бы хотелось пользоваться. По поводу пропущенных точек: есть отдельный скрипт, но он останавливается перед каждый именем собственным. Я пользуюсь "точка, тире, буква" - он ищет неправильные знаки в прямой речи. Твой может больше? Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 30/06/2011 - 12:12 пользователем wotti golma1 написал: Хммм... Напиши тогда полную строку, пожалуйста. `tagRegExp("[а-яё] (но) ","i","Найдено: слово "но" ("но " без запятой).");` Отв: Типичные ошибки распознавания - собираем статистику ... Постоянная ссылка (Permalink) Опубликовано чт, 30/06/2011 - 12:24 пользователем golma1 wotti написал: golma1 написал: Хммм... Напиши тогда полную строку, пожалуйста. `tagRegExp("[а-яё] (но) ","i","Найдено: слово "но" ("но " без запятой).");` О, спасибо, Миша. Я не увидела и сама пыталась писать. Твой скрипт действительно находит в указанном месте, а в следующем уже нет. :( "вид но" Как такое может быть? Я написала addRegExp, но он ВСЕ "но" ищет. :( А мне нужно только те, у которых до пробела нет запятой. Страницы « первая ‹ предыдущая 1 2 3 4 5 6 7 следующая › последняя »	Вход на сайт Имя пользователя * Пароль * Запомнить меня Регистрация Забыли пароль? Навигация Книги Издательские серии Премии Рекомендации Библиотечное ЧаВо Вычитка Про вычитку Технические темы Последние материалы Поиск по блогам и форумам Поиск книг Фильтр-список Популярные книги User menu Чёрно-белый список Книжная полка Последние комментарии Aliki RE:Подайте бедному копеечку на книжку с литреса... 2 часа Алексей111111111111 RE:Оплатила,но абонемент не отображается 2 часа sd RE:Доступ 27 1 день kopak RE:Беженцы с Флибусты 3 дня Isais RE:Вадим Иванович Туманов - Всё потерять - и вновь начать с... 4 дня Isais RE:Семейственность в литературе 1 неделя Isais RE:Древний Рим. Подборка книг 1 неделя Саша из Киева RE:"Экс" и "нео": разноликие правые 1 неделя medved RE:Предупреждение: "зеркала" флибусты 2 недели Isais RE:Соседи 3 недели babajga RE:Как сова отправилась в отпуск 3 недели Саша из Киева RE:Горящие паруса 1 месяц Саша из Киева RE:Подвиг героев - судьба страны. МНР: люди и годы 1 месяц commodore RE:Письма 1 месяц Саша из Киева RE:Три минуты истории 1 месяц nehug@cheaphub.net RE:Как бы с этим побороться и побороть? 2 месяца Саша из Киева RE:Книги на латышском языке 2 месяца stevecepera RE:Список современных французских писателей? 2 месяца Впечатления о книгах StrelaVV про Ляпина: Срочно требуется ведьма [СИ] (Городское фэнтези, Любовная фантастика, Самиздат, сетевая литература) 20 07 Очень симпатичная история, легко читается, ГГ чудесная, адекватная ведьмочка ne_fanat про Княжич Юра 20 07 Сначала было более-менее интересно. Потом автор ударился в веганство, читерство, ГГ покрутел настолько, что в 5 книге его убивали аж пятеро наикрутейших магов, но так и не убили. А больше всего раздражают выплеснутые автором ……… polyn про Ефимова: Отель «Китовый райк» [СИ] (Классический детектив, Иронический детектив, Детективы: прочее, Самиздат, сетевая литература) 20 07 С нетерпением жду продолжения. Оценка: отлично! Chernovol про Карпов: Княгиня Ольга (История, Биографии и Мемуары) 20 07 Интересно. России тогда же не существовало, было Московское царство. Оценка: плохо dolle про Иванов: Вегетация (Киберпанк, Постапокалипсис) 20 07 Отличная социальная фантастика в антураже роуд-муви с детективным налётом. Оценка: отлично! mysevra про Престон: Золотой город [Thunderhead ru] (Приключения: прочее) 19 07 Очень интересно, совсем как в детстве – история о приключениях! Но, матерь котья, слишком неторопливо и размерено. Оценка: хорошо mysevra про Бородин: Молниеносный Баязет (Историческая проза) 19 07 Редко когда получаешь такое удовольствие от чтения исторического романа - браво! всей трилогии. Оценка: отлично! mysevra про Миронов: Двенадцатая дочь (Юмористическая фантастика, Фэнтези, Попаданцы) 19 07 На мой вкус, с сюжетом и фольклором всё штатно, а вот с юмором немного (много! много!) перебор. Оценка: неплохо udrees про Вальтер: Симбиоз [СИ litres] (Боевая фантастика, Научная фантастика, Постапокалипсис, Самиздат, сетевая литература) 19 07 Книга конечно не для широкого чтения, написана в очень вульгарном стиле про похождения четверки полных отморозков – наркоманов, алкоголиков, шлюх, дегенератов – в мире пост-апокалипсиса. Но единственное они обладают сверх-способностями, ……… Оценка: неплохо udrees про Циммер: Планета вирусов (Биология, Научпоп) 19 07 Может это особенность присущая вирусам или сама книга получилась такая, но мне больше понравилась книга Циммера про паразитов, там он развернулся достаточно широко. Про вирусов конечно он тоже в книге описал достаточно популярно ……… Оценка: хорошо udrees про Циммер: Паразит – царь природы [Тайный мир самых опасных существ на Земле] [litres] (Медицина, Научная литература: прочее) 19 07 Очень познавательная книга про паразитов. При всем своем отвращении к этим животным, прочел книгу со смесью удовольствия и ужаса. В общем-то полезно было узнать про их роль в природе и их способности к выживанию. Была отсылка ……… Оценка: отлично! udrees про Лей: Инвазия (Космическая фантастика, Самиздат, сетевая литература) 19 07 Интересные приключения наемника в космосе. Можете считать, что это тот же сюжет про Чужого или Чужих в космосе, где доблестный космодесантник вступает с ними в борьбу практически в одиночку. Так что сюжет понятен. Даже созвучно ……… Оценка: хорошо больше впечатлений