Перевод Книги Эндрю Нга «Страсть К Машинному Обучению» Главы 49 И 50

предыдущие главы 49. Плюсы и минусы кросс-тренинга Продолжим рассматривать систему распознавания речи:

Перевод книги Эндрю Нга «Страсть к машинному обучению» Главы 49 и 50

Большинство элементов этого конвейера созданы без использования машинного обучения (разработаны людьми или спроектированы вручную):

МФЦК представляет собой набор аудиофункций, извлеченных путем математической обработки частот, не требующих алгоритмов обучения.
Это обеспечивает удобную свертку входящего сигнала с потерей неважной информации.
Фонемы - изобретение лингвистов.
С их помощью создается упрощенная модель звуков живой речи.
Как и любая модель сложного явления, фонемы несовершенны; качество системы, частью которой они являются, ограничено их несовершенным отражением реальности.

С одной стороны, компоненты ручной сборки ограничивают потенциальную производительность речевой системы.

С другой стороны, их использование имеет определенные преимущества:

Функции MFCC устойчив к некоторым свойствам речи, не влияющим на смысл сказанного, например к тону голоса.
Их использование упрощает задачу алгоритма обучения.
Фонемы , если они правильно отражают звуки реальной речи, помогают алгоритму обучения улавливать основные элементы звука, улучшая качество его работы.

Теперь посмотрим на сквозную систему:

Перевод книги Эндрю Нга «Страсть к машинному обучению» Главы 49 и 50

Эта система не может воспользоваться результатами созданных вручную алгоритмов, которые работают независимо от имеющихся данных.

Как следствие, если обучающая выборка мала, система со сквозным обучением может работать хуже, чем конвейер с элементами, не требующими обучения (конвейер, спроектированный вручную).

Однако при наличии большого обучающего набора система сквозного обучения не ограничивается недостатками MFCC или моделей фонем.

Если алгоритм обучения представляет собой большую нейронную сеть и имеется достаточно обучающих данных, то у системы есть потенциал превзойти систему, использующую алгоритмы, не обучающиеся, и, возможно, даже приблизиться к оптимальному уровню ошибок.

Системы сквозного обучения, как правило, работают хорошо, когда на обоих концах — входе и выходе — имеется много размеченных данных.

В примере с распознаванием речи для обучения потребуется большая выборка пар (записанная речь, ее расшифровка).

Когда данные такого типа недоступны в достаточном количестве, к сквозному обучению следует подходить с большой осторожностью.

Если вы работаете над проблемой машинного обучения с очень ограниченным обучающим набором, большая часть работы вашего алгоритма должна полагаться на человеческое понимание решаемой проблемы.

То есть система в основном будет состоять из компонентов, содержащих необучающиеся алгоритмы (ручная инженерия).

Если вы решите не использовать сквозное обучение, вам придется решить, из каких компонентов должен состоять ваш пайплайн и как из них построить работающую систему.

В следующих главах мы дадим несколько советов по проектированию таких конвейеров.

50. Выбор компонентов конвейера: доступность данных Что следует учитывать при выборе элементов несквозной конвейерной системы? Выбор компонентов и их взаимосвязь существенно влияют на качество работы всей системы.

Важным фактором также является возможность легко собирать обучающие данные для каждого компонента.

Например, рассмотрим архитектуру сквозного алгоритма автономного вождения:

Перевод книги Эндрю Нга «Страсть к машинному обучению» Главы 49 и 50

Машинное обучение можно использовать для обнаружения автомобилей и пешеходов.

Более того, существует множество размеченных образцов для компьютерного зрения, содержащих обилие изображений с автомобилями и пешеходами.

Вы также можете использовать краудсорсинг (например, Amazon Mechanical Turk) для маркировки дополнительных данных.

Таким образом, относительно легко получить данные для обучения детектора автомобилей и детектора пешеходов.

Давайте посмотрим на различия между сквозным подходом:

Перевод книги Эндрю Нга «Страсть к машинному обучению» Главы 49 и 50

Для обучения такой системы требуется большое количество конкретных данных, отражающих связь между изображением камеры и поворотом руля (пара: Изображение, Направление рулевого колеса).

Сбор такого образца требует много времени и денег.

Нужен специально оборудованный транспорт и время водителя.

Потребуется большой парк таких автомобилей и огромное количество часов вождения для того, чтобы обучающая выборка охватила широкий спектр возможных сценариев развития реальных ситуаций на дорогах.

Отсутствие таких образцов и высокая стоимость их создания затрудняют обучение сквозной системы.

Гораздо проще получить крупные маркированные образцы с изображениями автомобилей или пешеходов.

В общем, если для обучения «промежуточных модулей» конвейера доступны большие выборки (например, детектор автомобилей или пешеходов), то можно рассмотреть возможность использования конвейера, состоящего из нескольких компонентов.

Этот несквозной подход был бы предпочтительнее, поскольку он позволяет использовать все доступные данные.

Я считаю, что до тех пор, пока не будет доступно больше данных для обучения сквозных систем, сквозной (конвейерный) подход значительно более перспективен для разработки систем автономного вождения: его архитектура лучше соответствует имеющимся данным.

продолжение Теги: #Машинное обучение #Профессиональная литература

Последнее изменение: 2024-10-19 21:10:22

Вместе с данным постом часто просматривают:

Перевод Книги Эндрю Нга «Страсть К Машинному Обучению» Главы 49 И 50

Аничков Дмитрий Сергеевич

Илон Маск И Его Вторая Жена В Третий Раз Подали На Развод

От Идеализма К Депрессии: Вниз По Лестнице Выгорания

Успехи Китая В Импортозамещении: Китай Разработал Игровые Видеокарты С Нуля И Не Только

Увеличьте Свою Экономию С Canon Maxify: Компактные Струйные Принтеры Для Рабочих Групп Среднего Размера И Домашних Офисов

Sony Призналась, Что Личные Данные Пользователей Playstation Network Были Украдены

Mefeedia — Англоязычная Поисковая Система Видеоновостей

«Буква Закона»: Немного О Защите Персональных Данных

Поиск Связей На Примере Нефть-Рубль

Mail.ru Запускает «Троецарствие»

Автор Статьи

Роман Иванов

Интересно

Bobocomm – Создатели Рекламы...

Growbydata — Программное Обеспечение Для Конкурентной Разведки...

Neolive - Программное Обеспечение Для Цифровых Вывесок...

Casey Powell Lacrosse 18 Xbox One X S Активация...

Увеличение Трафика На Выставке За Пределами Выставочного Зала...

Партнерам Нужна Надежная Маркетинговая Стратегия, Чтобы Добиться Успеха В...

Федуленков...

Dima Manisha