[OTUS] Pазработчик BigData. Модуль 3 из 5 (2018)

  • Автор темы I AM
  • 2418
  • Обновлено
  • 15, Jul 2018
  • #1
OTUS Pазработчик BigData. Модуль 3 из 5



О курсе В настоящее время каждый сервис или устройство генерируют огромное количество данных.

С помощью методов машинного обучения из данных стало возможным извлекать полезные знания.

По этой причине данные становятся самым ценным ресурсом в бизнесе, а умение извлекать из данных информацию - одним из самых востребованных умений.

Для того, чтобы внедрять использование данных в бизнесе, необходимо обладать набором специальных знаний и навыков.

Цель курса - освоить основные темы и инструменты, позволяющие находить полезную информацию в данных и внедрять ее использование в боевое окружение.

В нашем курсе мы научим основам анализа данных: расскажем о предобработке данных, типичных задачах и основных алгоритмах машинного обучения, а также научимся обрабатывать объемы данных, для обработки которых недостаточно одной машины.

Все задачи будут проработаны на практике как на учебных, так и на реальных данных.

Также будут рассмотрены типичные задачи, встречающиеся в разных видах компаний.

В результате прохождения курса слушатель сможет самостоятельно реализовывать весь процесс от поиска знаний в данных до построения процесса по обработке данных в боевом окружении, будет обладать знаниями, необходимыми для изучения более сложных методов машинного обучения.
Программа курса: Чаще всего в окружении, в котором приходится работать, данные не готовы для анализа, у них произвольный формат и много ошибок.

Например, это данные из баз знаний, открытых API, данные из различных информационных систем партнеров.В третьем модуле рассматриваются вопросы сбора и очистки данных, разбираются типичные задачи бизнеса.

Например, это предсказание ctr, ltv.

Дополнительно рассмотрим специальные алгоритмы анализа данных - это работа с временными рядами, рекомендательными системами, текстами, графами.
Занятие 19: Рекомендательные системы Типы рекомендательных систем.

Векторное пространство (тот же TF-IDF) и content-based модели, повторение стандартных метрик корреляций: Пирсон, косинусная мера, Джаккарт.

Offline метрики и метрики ранжирования.

Построение простой content-based модели.

Item(user)-based CF. Использование CF для implicit feedback.

Построение CF модели (item-based или MF)
ДЗ Применение алгоритма рекомендаций для датасета фильмов.
Занятие 20: Временные ряды Что такое временные ряды и простые модели построения прогнозов.

Разложение временного ряда на компоненты: тренд, сезонность, цикл, ошибка.

Стационарность ряда.

Модели класса AR, MA, ARMA, ARIMA.

Построение прогноза на примере данных.

Модели ARIFMA.

Нелинейные модели, библиотека Prophet от Facebook.

Векторные модели
Занятие 21: Latent Dirichlet Allocation
ДЗ
Применение LDA для категоризации текстов.
Занятие 22: Алгоритмы на графах Социальные сети
Занятие 23: Нейронные сети, обучение нейронных сетей Основы: перцептрон и синапсы, функция активации, примеры задач. Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
ДЗ Реализация алгоритма обратного распространения ошибки и применение простой сети на mnist.
Занятие 24: Сверточный слои, каскады, визуализация признаков Сверточный слои, каскады, визуализация признаков. Нормализация и регуляризация: batchnorm, dropout. Архитектуры нейросетей: обзор архитектур AlexNet, ResNet, GoogLenet.
Предыдущие части:
[OTUS] Pазработчик BigData. Часть 1 из 5

[OTUS] Pазработчик BigData. Часть 2 из 5

Скачать:
Скрытая информация :: Авторизуйтесь для просмотра »

I AM


Рег
23 Jul, 2011

Тем
49554

Постов
57426

Баллов
552966
  • 31, Jan 2019
  • #2
OTUS Pазработчик BigData. Модуль 3 из 5



О курсе В настоящее время каждый сервис или устройство генерируют огромное количество данных.

С помощью методов машинного обучения из данных стало возможным извлекать полезные знания.

По этой причине данные становятся самым ценным ресурсом в бизнесе, а умение извлекать из данных информацию - одним из самых востребованных умений.

Для того, чтобы внедрять использование данных в бизнесе, необходимо обладать набором специальных знаний и навыков.

Цель курса - освоить основные темы и инструменты, позволяющие находить полезную информацию в данных и внедрять ее использование в боевое окружение.

В нашем курсе мы научим основам анализа данных: расскажем о предобработке данных, типичных задачах и основных алгоритмах машинного обучения, а также научимся обрабатывать объемы данных, для обработки которых недостаточно одной машины.

Все задачи будут проработаны на практике как на учебных, так и на реальных данных.

Также будут рассмотрены типичные задачи, встречающиеся в разных видах компаний.

В результате прохождения курса слушатель сможет самостоятельно реализовывать весь процесс от поиска знаний в данных до построения процесса по обработке данных в боевом окружении, будет обладать знаниями, необходимыми для изучения более сложных методов машинного обучения.
Программа курса: Чаще всего в окружении, в котором приходится работать, данные не готовы для анализа, у них произвольный формат и много ошибок.

Например, это данные из баз знаний, открытых API, данные из различных информационных систем партнеров.В третьем модуле рассматриваются вопросы сбора и очистки данных, разбираются типичные задачи бизнеса.

Например, это предсказание ctr, ltv.

Дополнительно рассмотрим специальные алгоритмы анализа данных - это работа с временными рядами, рекомендательными системами, текстами, графами.
Занятие 19: Рекомендательные системы Типы рекомендательных систем.

Векторное пространство (тот же TF-IDF) и content-based модели, повторение стандартных метрик корреляций: Пирсон, косинусная мера, Джаккарт.

Offline метрики и метрики ранжирования.

Построение простой content-based модели.

Item(user)-based CF. Использование CF для implicit feedback.

Построение CF модели (item-based или MF)
ДЗ Применение алгоритма рекомендаций для датасета фильмов.
Занятие 20: Временные ряды Что такое временные ряды и простые модели построения прогнозов.

Разложение временного ряда на компоненты: тренд, сезонность, цикл, ошибка.

Стационарность ряда.

Модели класса AR, MA, ARMA, ARIMA.

Построение прогноза на примере данных.

Модели ARIFMA.

Нелинейные модели, библиотека Prophet от Facebook.

Векторные модели
Занятие 21: Latent Dirichlet Allocation
ДЗ
Применение LDA для категоризации текстов.
Занятие 22: Алгоритмы на графах Социальные сети
Занятие 23: Нейронные сети, обучение нейронных сетей Основы: перцептрон и синапсы, функция активации, примеры задач. Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
ДЗ Реализация алгоритма обратного распространения ошибки и применение простой сети на mnist.
Занятие 24: Сверточный слои, каскады, визуализация признаков Сверточный слои, каскады, визуализация признаков. Нормализация и регуляризация: batchnorm, dropout. Архитектуры нейросетей: обзор архитектур AlexNet, ResNet, GoogLenet.
Предыдущие части:
[OTUS] Pазработчик BigData. Часть 1 из 5

[OTUS] Pазработчик BigData. Часть 2 из 5

Скачать:
Папка из Облака Mail.Ru
 

netcatnew


Рег
02 Jan, 2019

Тем
126

Постов
2641

Баллов
3901
Тем
49554
Комментарии
57426
Опыт
552966

Интересно