скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
wvd RE:Подайте бедному копеечку на книжку с литреса... 2 дня
nehug@cheaphub.net RE:Как бы с этим побороться и побороть? 1 неделя Саша из Киева RE:Книги на латышском языке 1 неделя stevecepera RE:Список современных французских писателей? 2 недели etorus2008 RE:Отв: Помогите найти книгу по описанию 3 недели lemma7 RE:Чёрный нимб и другие истории, исполненные неизъяснимого ужаса 4 недели Wedmak RE:Помогите найти!.. #2 4 недели sem14 RE:Координация сканирования и вычитки 1 месяц babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц Isais RE:Мои открытия 1 месяц kopak RE:О группе Дятлова. О той самой, того самого... 1 месяц A5. RE:Не присылает пароль на почту 1 месяц babajga RE:Плюмаж 1 месяц babajga RE:Блошкинс и Фрю. Опасное путешествие 1 месяц alexk RE:Багрепорт - 2 2 месяца babajga RE:Удивленная сова 2 месяца Larisa_F RE:Серия «Квадрат» издательства «Текст» 2 месяца Aleks_Sim RE:Беженцы с Флибусты 2 месяца Впечатления о книгах
APN1968 про Три сапога - пара
28 05 Мне понравились первые две книги. Местами есть юмор, сюжет пока интересный. Буду читать дальше.
дядя_Андрей про Над Кубанью
28 05 Увы, но у автора нет мастерства Алексея Толстова, эпичности Михаила Шолохова, поэтики Андрея Губина, очарования Виктора Лихоносова и бесшабашности Артёма Весёлого. Как жаль.
mikebb про Лимонов: Москва майская (Современная проза)
28 05 Офигеть! Если не знать год написания, то это про сегодняшнюю ситуацию и споры прям из соцсетей. Как это ему удалось угадать или Эдуард уже тогда был свободным человеком и видел всю зашоренность левых и правых!? Оценка: отлично!
Igrina про Андрей Асковд (Чётокакто)
27 05 Я начала читать и прибежала, чтобы добавить тексту. Это ГЕНИАЛЬНО, давно так не смеялась! Спасибо! Оценка: ОТЛИЧНО
скунс про Понарошку: Путь одиночки. Книга 2 (Боевая фантастика, Боевик, ЛитРПГ, Самиздат, сетевая литература)
27 05 Читать интересно,жду продолжения Оценка: хорошо
Mac_arenko про Эдуард Тен
26 05 Хороший язык без перегруза подробностей и излишних деталей, которые должны погрузить в среду, а на самом деле…. Сюжет ни разу не заставивший задуматься: а что там ещё новое вышло? Одним словом - очень неплохо.
RusD про Пайпс: Уроки 2014 года. Как Запад проиграл России (Политика, Публицистика)
26 05 Большой интерес представляет сопоставить даты написания и содержание. Вот день побега Януковича, к примеру в феврале 2014. Автор пишет лишь об экзистенциальной угрозе России Украине, о происходящем в Киеве - ни слова. Предсказуемое ………
Лысенко Владимир Андреевич про Романов: Повторение пройденного (Альтернативная история, Фэнтези, Попаданцы, Самиздат, сетевая литература)
26 05 Можно почитать, жду продолжения. Оценка: отлично!
mysevra про Стюарт: Хрустальный грот [The Crystal Cave ru] (Фэнтези)
26 05 Классика, чего уж там. В своё время невозможно было найти всю сагу. Сейчас читать одно удовольствие. Оценка: отлично!
mysevra про Беляев: Человек, который поднял мертвых (Исторический детектив, Триллер)
26 05 История не очень замысловатая, сюжет простой. Тут хотя бы редактора грамотного. Оценка: неплохо
mysevra про Слейт: Энергетические вампиры: защита от ментальных хищников и паразитов [litres] (Эзотерика)
26 05 По-моему, немного перебор, у авторов уже просто профессиональная деформация. За результаты не скажу, но подход масштабный и системный. Оценка: хорошо
Belomor.canal про Рубанов: Финист – ясный сокол (Современная проза)
26 05 Супер сказка! Я фентези не люблю, но тут такой ярый реал, что лучше любого будет! Оценка: отлично! |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.