скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
sem14 RE:Серия "Символы времени" издательства "Аграф" 17 часов
Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 3 дня нэнси RE:Подайте бедному копеечку на книжку с литреса... 4 дня tvv RE:faq brainstorm =) 5 дней Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 1 неделя Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя larin RE:абонемент не обновлен 1 неделя sem14 RE:За иллюминатором (серия) - чего не хватает? 1 неделя sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 1 неделя Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 недели larin RE:Пропал абонемент 3 недели tvv RE:DNS 3 недели MrMansur RE:<НРЗБ> 3 недели Stager RE:Беженцы с Флибусты 4 недели Tramell RE:Серия "Библиотека французской литературы" (Макбел) 4 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 1 месяц Впечатления о книгах
Stager про Оченков: Гроза над Бомарзундом [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
26 01 Первую я с трудом осилил. Автор, конечно, ни в чём не разбирается, но исторический наброс любопытен. А дальше... Автор совсем ни в чём не разбирается... Ну да, сталей у него не было, но было естественно-легированное шведское ……… Оценка: плохо
mysevra про Сейгер: Дом на краю темноты [litres] [Home Before Dark] (Триллер, Детективы: прочее)
26 01 Неоправданно затянуто и невыразительно. Разочарование было бы меньше, если бы книга не упоминалась во всех попадающихся мне списках «самых страшных историй». Оценка: неплохо
mysevra про Гроут: Сила благодарности [litres] (Психология, Самосовершенствование, Психотерапия и консультирование)
26 01 Большинство из нас даже не заметили, как превратились из «ух ты!» в вечно недовольных и сердито бубнящих големов. Оценка: отлично!
mysevra про Леушкин: Турбо-Суслик. Как прекратить трахать себе мозг и начать жить (Психология)
26 01 Мне очень нравится то, что обещают в результате. Но меня беспокоит формулировка. То есть, если это работает, то я буду добровольно грузить в своё подсознание абсолютно непроверенную чужую установку, даже не зная её сути. У ……… Оценка: неплохо
alexk про Грин: Метод Грина. Твоя жизнь — твой сценарий (Экономика)
25 01 серийный предприниматель"? Чикатилла от бизнеса?
polyn про Вендиг: Книга несчастных случаев [litres] (Ужасы, Триллер, Мистика)
25 01 Эта книга стала не открытием, а разочарованием. Слишком затянуто, слишком сумбурно, слишком заумно. Оценка: неплохо
polyn про Валентайн: Принц из книжного [litres] (Современные любовные романы)
25 01 Поклонникам молодёжной романтики, думаю, книга понравится. Оценка: хорошо
vudy про Март: Темный континент (Боевая фантастика, Самиздат, сетевая литература)
24 01 ... мебель разбросана в беспорядке, который держится уже много лет" И тому подобное убожество. Оценка: нечитаемо
udrees про Верхотуров: «Джамаат Таблиги». Самая закрытая секта в мире (Публицистика, Документальная литература)
24 01 Книга для более-менее подготовленного читателя из-за обилия специфических исламских мусульманских терминов. Хоть бы сноску внизу делали, что означает то или иное слово. А так книга описывает историю возникновения и деятельность ……… Оценка: хорошо
udrees про Атаманов: Задача выжить (Боевая фантастика)
24 01 Написано просто про выживание обычного парня с толпой девушек из монастыря в мире постапокалипсиса в стиле «Дня независимости». Прилетели злобные пришельцы, которые сразу без разговоров стали утюжить всех землян. Правда вторжение ……… Оценка: хорошо
udrees про Атаманов: Тестировщик игровых сценариев [СИ] (ЛитРПГ, Самиздат, сетевая литература)
24 01 Хороший сюжет в жанре литРПГ, героя тоже выбрали небоевого класса, гоблина, да еще травника. Герой конечно хорошо отыгрывает своего персонажа, старается его развивать и сделать игру интересной. В общем приключения конечно ……… Оценка: хорошо
udrees про Володин: Газлайтер. Том 5 (СИ) (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
24 01 Особо оригинального в 5-й книге нету в сравнении с 4-й. Все те же интриги, конфликты с дворянами, усиленный рост героя в характеристиках, постоянный успех у женского пола. В общем стиль все тот же. Написано достаточно просто, ……… Оценка: неплохо |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.