Яндексу приходится отвечать на десятки миллионов запросов каждый день.
Поисковая система должна иметь возможность обрабатывать их быстро и точно.
Без использования лингвистики поисковая система сможет найти только точные совпадения в проиндексированных документах.
Чтобы найти нужные документы, системе необходимо правильно определить язык запроса, исправить опечатки, выполнить морфологический анализ каждого слова, расширить запрос синонимами или даже переформулировать его.
В этой лекции Алексей Зобнин постарался дать студентам Малый ШАД ответы на следующие вопросы:
- Почему нам нужно учитывать морфологию?
- Как и почему мы определяем язык запроса и документа?
- Что такое языковой корпус?
- Что такое языковые модели и как они используются в поиске?
- Как проводится морфологический анализ внесловарных слов?
- Как определить правильное значение и морфологическую парадигму омонимов?
- Какие типы опечаток бывают и как их исправить?
- Что такое расширения запросов и чем они могут быть полезны?
Презентацию можно скачать Здесь .
Лекции в Малом ШАД посвящены информатике, математике, лингвистике и смежным областям знаний.
Спикеры – ведущие ученые, специалисты высокотехнологичных компаний и преподаватели известных университетов.
После каждой лекции проводится дискуссия с аудиторией и ответы на вопросы.
Мы стараемся поддерживать в наших классах неформальную атмосферу посещения школ и конференций.
Лекции полностью независимы друг от друга, и студенты могут свободно выбирать интересные темы.
Занятия бесплатны.
Теги: #Алгоритмы #поиск #лингвистика #морфология
-
Мсп Управляют Налогами С Drake Host
19 Oct, 24 -
Пятница. Программистский Бред 4.1
19 Oct, 24 -
Как Пишутся Книги
19 Oct, 24 -
Вр - Выпуск №44
19 Oct, 24 -
Услуги Wcf Ria. Начинать. Часть 1
19 Oct, 24