скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
akorish RE:Регистрация 1 час
DGOBLEK RE:Прошу переформатировать, распознать, etc... 18 часов DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 19 часов Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 день Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 2 дня konst1 RE:Ух, как я не люблю спамеров! 3 дня tvv RE:DNS 3 недели sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 3 недели larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца Впечатления о книгах
Lan2292 про Владимиров: Отблески в зеркалах (Боевая фантастика, Самиздат, сетевая литература)
03 05 Пыталась читать прорываясь сквозь бесконечный справочник, в результате бросила. Н сколько можно, пять страниц описание плющек с подробностями а сюжета на три строчки. Оценка: неплохо
pulochka про Карина Демина
03 05 О книге"Леди,которая любила лошадей" Язык мой-враг мой! Мадам Лесина-Демина и т.д ! Вы пытаетесь подражать эпохе? Ну ,а что в итоге-дебри дремучие. Вы сами -то можете до конца прочитать свои опусы? И ведь в каждой истории ………
Олег Макаров. про Фаберже
02 05 Первые две книги серии читал с интересом, на третьей остановился Надоело. Постоянные описания «технологии изготовления» и рутина затмевают ту немногую движуху, которая всё-таки есть
Олег Макаров. про Шоу: Молодые львы [litres] (Классическая проза)
02 05 Очень хорошо написано. Глубокая вещь Но блин... Как же грустно Оценка: отлично!
Олег Макаров. про Старый: Наставникъ (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
02 05 Фуфло. Шовинизм, учитель истории, ненавидящий всех иностранцев и т.д. Z литература, хотя и другое время
Олег Макаров. про Алатова: Тетушка против [СИ] (Любовная фантастика, Самиздат, сетевая литература)
02 05 Слишком стилизована история под Лопе де Вегу или что-то такое. Неинтересно Оценка: плохо
Олег Макаров. про Ангел: Бессмертные [СИ] (Альтернативная история, Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
02 05 Очень безграмотно написано. Долго не вытерпеть Оценка: нечитаемо
Олег Макаров. про Тыналин: Криминалист (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
02 05 Очень очень очень занудно. Наверное так получается когда человек не умеет писать. хочет, старается, но не умеет Оценка: нечитаемо
Олег Макаров. про Назимов: Отставникъ (Альтернативная история, Фантастика: прочее, Самиздат, сетевая литература)
02 05 Нечитаемо: автор пишет историю в выдуманном мире чтобы не заморачиваться фактами но забывает о том что даже в выдуманном мире должна быть логика Ну и пишет откровенно слабо Оценка: нечитаемо
Олег Макаров. про Морале: Газонокосильщик (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
02 05 Ненене это ужасно Не читать его вообще больше Оценка: нечитаемо
Олег Макаров. про Парсиев: Корпорация попаданцев (Детективная фантастика, Юмор: прочее, Попаданцы, Самиздат, сетевая литература)
02 05 В начале неплохо, а потом становится как-то нелепо. не дочитал в итоге. Оценка: плохо |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.