Как Яндекс Использует Лингвистику В Поиске

Яндексу приходится отвечать на десятки миллионов запросов каждый день.

Поисковая система должна иметь возможность обрабатывать их быстро и точно.

Без использования лингвистики поисковая система сможет найти только точные совпадения в проиндексированных документах.

Чтобы найти нужные документы, системе необходимо правильно определить язык запроса, исправить опечатки, выполнить морфологический анализ каждого слова, расширить запрос синонимами или даже переформулировать его.

В этой лекции Алексей Зобнин постарался дать студентам Малый ШАД ответы на следующие вопросы:

  • Почему нам нужно учитывать морфологию?
  • Как и почему мы определяем язык запроса и документа?
  • Что такое языковой корпус?
  • Что такое языковые модели и как они используются в поиске?
  • Как проводится морфологический анализ внесловарных слов?
  • Как определить правильное значение и морфологическую парадигму омонимов?
  • Какие типы опечаток бывают и как их исправить?
  • Что такое расширения запросов и чем они могут быть полезны?
Страница лекции Изначально лекция предназначена для старшеклассников, но и взрослые смогут почерпнуть из нее много полезного.

Презентацию можно скачать Здесь .

Лекции в Малом ШАД посвящены информатике, математике, лингвистике и смежным областям знаний.

Спикеры – ведущие ученые, специалисты высокотехнологичных компаний и преподаватели известных университетов.

После каждой лекции проводится дискуссия с аудиторией и ответы на вопросы.

Мы стараемся поддерживать в наших классах неформальную атмосферу посещения школ и конференций.

Лекции полностью независимы друг от друга, и студенты могут свободно выбирать интересные темы.

Занятия бесплатны.

Теги: #Алгоритмы #поиск #лингвистика #морфология

Вместе с данным постом часто просматривают: