Компьютерная программа под названием Дух времени , созданный учеными из Ирландии, был представлен на Европейская конференция по искусственному интеллекту несколько дней назад. Программа осуществляет поиск в Википедия слова, которых нет в официальном лингвистическом справочнике ВордНет .
База данных WordNet считается справочной базой данных в том смысле, что именно она обычно используется в компьютерных системах для автоматического анализа смысла текстов.
Эти системы активно используют маркетологи и специалисты по нейролингвистическому программированию (НЛП).
Утилита Zeitgeist находит неологизмы, то есть новые слова, только что появившиеся в человеческом языке.
Они могут быть довольно широко распространены в блогосфере и даже появляться в Википедии, но не считаются официальной лексикой.
Однако для того, чтобы лингвистические программы, анализирующие блогосферу, работали, они должны иметь примерное значение.
Zeitgeist решает эту проблему.
Когда программа встречает неологизм в Википедии, она проверяет ссылки с этой страницы, чтобы найти ключевые слова для описания неологизма.
Программа не читает документы по этим ссылкам, а лишь берет их названия.
Например, в статье «гастропаб» (неологизм; паб, специализирующийся на кулинарии) есть ссылки на статьи «паб» и «кулинария», и это дает подсказку к слову.
По мнению разработчиков Zeitgeist, ссылочная структура Википедии отражает отношения между различными понятиями и идеями.
К сожалению, люди имеют тенденцию размещать ссылки повсюду.
Чтобы это не мешало алгоритмам, программа Zeitgeist фильтрует неотвеченные ссылки.
Если связанный документ не ссылается на страницу с неологизмом, то этот документ игнорируется.
Правда, программа не всегда работает корректно.
Например, в статье о «феминаци» (женщинах, ненавидящих мужчин) есть упоминания о феминизме и нацизме, но феминаци не имеют ничего общего с доктриной национал-социализма.
В этом случае программа может выйти из строя.
Но это случается довольно редко.
В 75% случаев Zeitgeist работает достаточно надежно, чтобы создать правильную коннотацию для того или иного неологизма.
Многие коммерческие компании интересуются этой технологией, поскольку хотят получать актуальные и достоверные отчеты о том, что люди пишут об их продуктах в блогах и на форумах.
В этих текстах много жаргонных слов и неологизмов.
Живой язык меняется очень быстро, а языковые основы обновляются с опозданием.
Таким образом, Википедия является идеальным источником информации для компьютерных лингвистов, даже несмотря на использование неологизмов.
официально запрещено правила народной энциклопедии.
Теги: #дух времени #Википедия #коннотация #маркетологи #бренд-менеджмент #Чулан
-
Пузырьковое Золото
19 Oct, 24 -
«Я Аладдин»
19 Oct, 24 -
Незначительные Улучшения Облака Тегов
19 Oct, 24 -
Почему Я Не Люблю Apple
19 Oct, 24 -
История Одного Бэкдора
19 Oct, 24