Книга А.Я.Шайкевича "Дистрибутивно статистический анализ языка русской прозы(1851-1867 гг) - описывает методику анализа среднего интервала текст.
То есть, для того чтобы провести адекватный дистрибутивно- статистический анализ необходимо разделить исходный текст на отдельные фрагменты длиной 40 слов(если можно так выразиться). Далее используется теория биномиального распределения с поправкой на неслучайность и проверяется наличие существенной связи двух элементов в данном корпусе прозы. Полученные данные сопоставляются с результатами внешнего анализа.
Применение данного метода к реальному корпусу прозы позволяет выявить текстовые связи слов и фразы и сделать выводы о структурных особенностях русского языка данного периода. Также данный метод может быть использован для анализа других текстов, что позволит более эффективно проводить лингвистический и социолингвистический анализ. Книга также содержит рекомендации для практического применения данного метода и предполагает дальнейший мониторинг за изменениями языковых норм в контексте истории культуры России.
Электронная Книга «Дистрибутивно-статистический анализ языка русской прозы 1850—1870-х гг. Том 3» написана автором А. Я. Шайкевич в 2021 году.
Минимальный возраст читателя: 12
Язык: Русский
Серии: Studia philologica
ISBN: 978-5-907290-61-7
Описание книги от А. Я. Шайкевич
Том 3 монографии посвящен анализу среднего интервала текста. Исследуемый корпус прозы автоматически членится на фрагменты по 40 слов. Если совместная встречаемость двух слов во фрагментах существенно превышает величину, подсчи1анную на основе нулевой гипотезы, делается вывод о наличии связи между этими словами. В результате возникает огромная сеть текстуальных связей слов. Показан способ выявления кластеров в этой сети.