Что Я Узнал О Машинном Обучении, Поработав В 12 Стартапах

Всем привет. Поработав в 12 стартапах по машинному обучению, я узнал восемь полезных идей о продуктах, данных и людях.

Все стартапы были из разных сфер (финтех, биотехнологии, здравоохранение, образовательные технологии) и находились на разных стадиях: как на предпосевной стадии, так и на стадии поглощения крупной компанией.

Моя роль тоже изменилась.

Я был стратегическим консультантом, главой отдела анализа данных, перегруженным работой штатным сотрудником.

Все эти компании пытались создать хороший продукт, и многим это удалось.

В ходе работы я пришел к следующим выводам:



Продукт важнее ИИ

Эти стартапы разрабатывают продукты, а не изучают искусственный интеллект. Как преданный математик, меня изначально больше интересовали машинное обучение и создание новых методов и алгоритмов.

Вскоре я понял, что даже точные модели машинного обучения сами по себе бесполезны.

Ценность ИИ и машинного обучения напрямую связана со стоимостью продукта, в котором они используются.

Цель стартапа — научиться создавать продукты на основе машинного обучения.

При таком подходе иногда оказывается, что машинное обучение — не самый эффективный инструмент. Иногда дело не в поставленной задаче, а в процессе ее решения.

Даже в таких ситуациях полезно обращаться к ученым: они используют научный, основанный на данных подход. Однако не тратьте время на ИИ, если вам нужно исправить процесс.



Стремитесь к синергии между данными и продуктом

Вы не сможете создать что-то ценное, добавив в существующий продукт прогнозы, основанные на модели машинного обучения.

Сильный ИИ — это не дополнение к продукту, это его основа.

В таких случаях именно ИИ создает ценность.

Такие продукты разрабатываются с учетом этого факта: в них и продукт, и данные работают синергетически.

Если все сделано правильно, результатом является взаимодействие, которое я называю «комбинацией продукта и данных».

Продукт реализует весь потенциал данных и в то же время генерирует новые данные, необходимые для улучшения.

Работа с искусственным интеллектом требует больше, чем просто инженеров и специалистов по обработке данных.

Работа над ценностью продукта идет быстрее, если в обсуждении участвует и остальная часть команды, от менеджеров по продукту до руководителей.

Это требует такого уровня знаний и приверженности, к которому еще не привыкли даже инженеры стартапов.



Сначала данные, потом искусственный интеллект

Искусственный интеллект и машинное обучение требуют большого количества высококачественных данных.

Создавая продукт с нуля, подумайте о сборе данных с первого дня.

Прежде чем внедрять технологию искусственного интеллекта в существующий продукт, приготовьтесь вложить значительные средства в разработку данных и архитектурные изменения.

Сначала узнайте стоимость продукта, а уж потом приступайте к работе.

Чем лучше обработка данных, тем информативнее аналитика – это критично для развития компании.

Это продемонстрирует ценность продукта и привлечет инвесторов.

Начните думать о машинном интеллекте, как только аналитика станет надежной.



Инвестируйте в общение

Для создания продукта нужны квалифицированные продакт-менеджеры и поддержка руководства.

Сильный искусственный интеллект и глубокое обучение интересуют многих, но люди за пределами ИТ-индустрии не понимают эти технологии.

Чтобы обсуждать машинное обучение и искусственный интеллект, вам необходимо понимать статистику: неэффективное общение приводит к нереалистичным ожиданиям.

Менеджер по продукту и инженеры по обработке данных должны постоянно обсуждать бизнес-метрики и их воплощение в продукте.

Особенно это важно для инженеров: для эффективной работы им необходимо углублять свои знания как в своей области, так и в сфере бизнеса.



«Простые и очевидные решения» не так очевидны

Как я уже упоминал выше, зачастую проще решить данную проблему, используя простые и очевидные методы.

Отчасти это происходит потому, что сегодняшние «простые и очевидные» решения вчера были сложными и оригинальными.

Использовать сейчас word2vec так же легко, как регресс .

Каждый день появляется все больше новых инструментов, и понимание этих инструментов важно для специалиста по данным.

Появление новых инструментов с открытым исходным кодом привело к тому, что проприетарные платформы в машинном обучении больше не являются эффективным решением.

Конечно, стоит использовать собственные алгоритмы, если они эффективны в вашей отрасли и для решения вашей задачи.

Но давайте оставим исследования глубокого обучения Google и сосредоточимся на проблемах бизнеса.



Если есть сомнения, покажите данные пользователям

Важно установить обратную связь с рынком на раннем этапе.

Однако машинное обучение требует данных, сбор которых занимает много времени.

В этом и проблема: как проанализировать картинку без больших объемов данных? Чаще всего лучшее решение — показать пользователям накопленные данные.

Не имеет значения, если у вас мало данных: люди обрабатывают только небольшие объемы данных за раз.

Посмотрите, как пользователи взаимодействуют с данными: что они игнорируют, а в чем хотят разобраться подробнее? Это поможет вам понять, насколько потенциально ценны ваши данные для вашего бизнеса.



Укрепить доверие

Доверие является основой успеха большинства технологий: люди хотят доверять технологиям, которые они используют. Некоторые люди беспокоятся, что автоматизация лишит их работы, в то время как другие полагаются на технологии для принятия важных решений.

В обоих случаях важно доверие к приложениям и алгоритмам машинного обучения.

Если искусственный интеллект не помогает человеку принимать решения, а решает за него, пользователи быстро теряют доверие к приложению.

Доверие легко потерять и чрезвычайно сложно вернуть.

Создавайте продукты, которым люди будут доверять.

Делитесь статьей с коллегами, делайте выводы и работайте продуктивно.

Если у вас есть чем поделиться, пишите в комментариях.

Дополнительную информацию о машинном обучении см.

Telegram-канал Нейрон (@neurondata).

Знаний всем! Теги: #Машинное обучение #python #Лайфхаки для гиков #Большие данные #мл #Интеллектуальный анализ данных #личный опыт

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.