скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Подайте бедному копеечку на книжку с литреса... 1 день
Nicout RE:Прошу переформатировать, распознать, etc... 4 дня akorish RE:Регистрация 1 неделя Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 2 недели konst1 RE:Ух, как я не люблю спамеров! 2 недели tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 1 месяц larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 2 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца Впечатления о книгах
akorish про Арчер: Бетонные джунгли (Боевая фантастика)
16 05 Прилетел поохотиться, а сам стал добычей. Хотел нае... всех, а нае.. самого себя. На самом деле книга отличная. Оценка: отлично!
akorish про Арчер: Холодная война (Боевая фантастика)
16 05 Книг и фанфиков про хищника кратно меньше, чем про чужого, эта книга отлично раскрывает период времени, когда русофобия была скрытой, и была гонка вооружений. Тут нет откровенно злых-русских ))) Прочитать нужно, книга отличная. Оценка: отлично!
akorish про Кварри: Хищник III [по мотивам фильма] (Боевая фантастика, Ужасы)
16 05 И снова перепечатка фильма на бумаге, прочитать стоит. Оценка: отлично!
akorish про Кварри: Хищник II [по мотивам фильма] (Боевая фантастика, Ужасы)
16 05 Очень точно по фильму, почти фильм переложенный на бумагу. Оценка: отлично!
akorish про Кордэйл: Хищник I (Боевая фантастика)
16 05 В далекие времена, после просмотра фильма, я - зафанател хищником, и в те годы для молодого пацаненка читать книжки было зашкваром, могла задразнить задротом, но мне досталась эта книжка и я стал читать! Мысль была такой, ……… Оценка: отлично!
akorish про Фостер: Чужой-3 [Alien - 3 ru] (Научная фантастика)
16 05 Проходная книжка, 3й фильм мне тоже не сильно нравится, но прочитать следует. Оценка: хорошо
akorish про Фостер: Чужой. Чужие. Чужой-3 [Авторский сборник] (Научная фантастика)
16 05 Прочитал как сценарий, ничего особенного, просто нужно это прочитать. Оценка: хорошо
mysevra про Престон: Меч карающий [= Остров] [Riptide ru] (Приключения: прочее)
16 05 У автора редкий талант создавать приключенческие романы. Всегда что-то новое и неожиданное, изложенное ярко и живо. В конце традиционно какая-нибудь подстава. P.S. Переводчик записал амишей в индейцы, что удивило даже ……… Оценка: отлично!
mysevra про Чекмарев: Пулемет над пропастью (Детективная фантастика, Космическая фантастика, Самиздат, сетевая литература)
16 05 Что-то не везёт в этот раз. Да, а с запятыми тут отдельная история, абсолютно непредсказуемая. Оценка: плохо
mysevra про Шарапов: Вход только для мертвых (Боевик, Исторический детектив)
16 05 Самое интригующее в книге – это название, потом будет грустнее. Довольно подробно, скучно почти как в жизни, ждёшь-ждёшь чего-то. В общем, чисто за попытку стилизации. Оценка: хорошо
akorish про Наумова: Наверху (Научная фантастика)
14 05 Рипли - посол Земли от Чужих ))) Альтернативная история. Очень интересная концовка альтернативной серии книг про разумных Чужих. Однозначно стоит прочитать. |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.