Программа Анализирует Неологизмы В Википедии.

Компьютерная программа под названием Дух времени , созданный учеными из Ирландии, был представлен на Европейская конференция по искусственному интеллекту несколько дней назад. Программа осуществляет поиск в Википедия слова, которых нет в официальном лингвистическом справочнике ВордНет .

База данных WordNet считается справочной базой данных в том смысле, что именно она обычно используется в компьютерных системах для автоматического анализа смысла текстов.

Эти системы активно используют маркетологи и специалисты по нейролингвистическому программированию (НЛП).

Утилита Zeitgeist находит неологизмы, то есть новые слова, только что появившиеся в человеческом языке.

Они могут быть довольно широко распространены в блогосфере и даже появляться в Википедии, но не считаются официальной лексикой.

Однако для того, чтобы лингвистические программы, анализирующие блогосферу, работали, они должны иметь примерное значение.

Zeitgeist решает эту проблему.

Когда программа встречает неологизм в Википедии, она проверяет ссылки с этой страницы, чтобы найти ключевые слова для описания неологизма.

Программа не читает документы по этим ссылкам, а лишь берет их названия.

Например, в статье «гастропаб» (неологизм; паб, специализирующийся на кулинарии) есть ссылки на статьи «паб» и «кулинария», и это дает подсказку к слову.

По мнению разработчиков Zeitgeist, ссылочная структура Википедии отражает отношения между различными понятиями и идеями.

К сожалению, люди имеют тенденцию размещать ссылки повсюду.

Чтобы это не мешало алгоритмам, программа Zeitgeist фильтрует неотвеченные ссылки.

Если связанный документ не ссылается на страницу с неологизмом, то этот документ игнорируется.

Правда, программа не всегда работает корректно.

Например, в статье о «феминаци» (женщинах, ненавидящих мужчин) есть упоминания о феминизме и нацизме, но феминаци не имеют ничего общего с доктриной национал-социализма.

В этом случае программа может выйти из строя.

Но это случается довольно редко.

В 75% случаев Zeitgeist работает достаточно надежно, чтобы создать правильную коннотацию для того или иного неологизма.

Многие коммерческие компании интересуются этой технологией, поскольку хотят получать актуальные и достоверные отчеты о том, что люди пишут об их продуктах в блогах и на форумах.

В этих текстах много жаргонных слов и неологизмов.

Живой язык меняется очень быстро, а языковые основы обновляются с опозданием.

Таким образом, Википедия является идеальным источником информации для компьютерных лингвистов, даже несмотря на использование неологизмов.

официально запрещено правила народной энциклопедии.

Теги: #дух времени #Википедия #коннотация #маркетологи #бренд-менеджмент #Чулан

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.