«Эволюция Музыки»: Несколько Слов Об Алгоритмах Рекомендаций Стриминговых Сервисов

Миллионы людей во всем мире пользуются сервисами потоковой передачи музыки, то есть слушают песни, не загружая их на свои устройства.

Сегодня этот рынок имеет огромный потенциал.

За первое полугодие 2016 года количество аудиопотоков в США удвоился , по сравнению с 2015 годом.

Более того, к концу 2015 года число подписчиков музыкальных стримингов по всему миру составило 68 миллионов, и эта цифра продолжает расти.

Сегодня на этом рынке работает множество популярных компаний: от зарубежных Spotify, Pandora, 8tracks до российских Яндекс.

Музыки и Zvooq. Почему пользователи так любят стриминг? Потому что это удобно – не нужно заморачиваться с физическим носителем, не нужно скачивать музыку на свое устройство – все песни буквально в шаговой доступности.

Но одна из главных причин популярности стриминга — музыкальные рекомендации.



«Эволюция музыки»: Несколько слов об алгоритмах рекомендаций стриминговых сервисов

/ Фото Патрик Нигрен СС Кажется, каждому из нас надоела музыка, которую мы «прослушали полностью», и хочется чего-то нового, поэтому такие сервисы, как Tidal и Apple Music, предлагают подборку песен, соответствующих нашему музыкальному вкусу.

Для создания плейлиста компании используют огромное количество данных, обрабатываемых машинными алгоритмами.

Брайан Уитмен, старший научный сотрудник Spotify и соучредитель Echo Nest, посвятил всю свою профессиональную карьеру" учит компьютеры под музыку».

Он выделяет четыре подхода к анализу музыки для вынесения рекомендаций: использование данных о популярности песни (количество прослушиваний и покупок песни) и мнений критиков, а также лирический анализ и акустический анализ.

Первые два типа анализа имеют один существенный недостаток – они не способствуют продвижению музыки малоизвестных исполнителей, поэтому мы уделим внимание двум оставшимся вариантам.



Акустический и текстовый анализ

Можно сказать, что история компании Echo Nest началась в тот момент, когда Уитмен, еще будучи студентом, создал программу, анализирующую музыкальные блоги с использованием технологий обработки естественного языка.

Сегодня его алгоритм развился и постоянно сканирует сеть, сканируя около 10 миллионов страниц, связанных с музыкой.

Любая фраза, появляющаяся в Интернете и связанная с музыкой, проходит через системы Echo Nest в поисках дескрипторов, ключевых слов и связанных терминов.

Однако каждый термин имеет свой вес, который указывает на его важность (по сути, он отражает вероятность того, что кто-то опишет песню этим словом).

Списки рекомендаций создаются путем сопоставления идентифицированных дескрипторов с дескрипторами любимых песен пользователей.

Что касается второго метода формирования рекомендаций — акустического анализа, — то он в чистом виде сервисом не используется.

Говорить о качественном распознавании, например, музыкальных инструментов, пока нельзя.

Однако, несмотря на это, анализ сигналов играет очень важную роль в работе рекомендательных алгоритмов.

Например, люди хотят, чтобы плейлисты были «плавными»: за тихой и спокойной песней не может следовать громкая, а в плейлистах, составленных для пробежек, темп должен постепенно увеличиваться.

Анализ песни начинается с разбивки звука на небольшие фрагменты размером от 200 мс до 4 с, в зависимости от того, насколько быстро меняется рисунок песни.

Затем для каждого сегмента определяются громкость и тембр, а также определяются используемые музыкальные инструменты; устанавливается, к какой части произведения (припеву, куплету и т. д.) принадлежит этот сегмент. Далее полученная информация объединяется и анализируется с помощью инструментов машинного обучения.

Это дает нам возможность понять песню на высоком уровне.

После этого композиция получает специальные метки (энергия, живость и другие), выполняющие описательную функцию.

Именно благодаря разработке таких мощных технологий Echo Nest стала мировым лидером в области алгоритмов анализа музыки.

По этой причине в 2014 году его купили гиганты потоковой передачи музыки Spotify. Spotify является мировым лидером в области потоковой передачи музыки с 30 миллионами платных подписчиков.

В то же время компания получает тысячи восторженных отзывов о своих рекомендательных услугах.

Своим успехом компания обязана совместной фильтрации.

Такой подход позволяет прогнозировать предпочтения пользователя на основе его истории потребления контента — лайков, количества воспроизведений и т. д. — путем сравнения с данными других пользователей.

Таким образом, алгоритм без вмешательства человека определяет песни, которые идеально подходят для клиентов.



Будущее рекомендательных услуг

Однако существуют технологии, способные вывести рекомендательные услуги на совершенно другой уровень.

Сандер Дилеман, исследователь Google DeepMind, был соавтором статьи , в котором утверждалось, что нейронные сети и глубокое обучение могут обрабатывать аудиорекомендации гораздо эффективнее, чем совместная фильтрация.

Дилеман начал изучать возможности сверточных нейронных сетей с 7–8 слоями.

В частности, он использовал алгоритм т-СН? , который позволяет визуализировать многомерные данные.

Сети, которые обучал Дилеман, научились распознавать музыкальные инструменты, аккорды и даже гармонии и прогрессии.

Первый уровень сети определил 256 различных фильтров, таких как «поющее вибрато» и «большой барабан».

Более того, сеть самостоятельно нашла и объединила китайские поп-песни в плейлисты.

Решение Дилемана хорошо зарекомендовало себя, и в случае успешного тестирования на реальной системе оно будет использоваться совместно с данными других алгоритмов.

Однако стриминговые сервисы не останавливаются только на анализе песен и личных музыкальных предпочтениях клиентов.

Около года назад Spotify объявил о своем намерении собирать данные о местоположении, контактах и голосе пользователей.

Спустя полгода стало известно еще одно нововведение: Spotify объединенный Совместно с Runkeeper усилия по использованию телосложения клиентов для создания треков, идеально подходящих для их темпа бега.

Всего несколько лет назад это казалось фантастикой.

Возможно, в будущем датчики движения в телефонах смогут определять, бежите ли вы, едете на велосипеде или ведете машину.

Датчик сердечного ритма поможет определить степень вашего стресса или беспокойства.

Кроме того, о многом могут рассказать и данные о физическом состоянии пользователей во время сна.

Предпочтения, частота сердечных сокращений, движение, сон.

Что будут учитывать будущие рекомендации – погоду, уровень дофамина в крови? Существующие технологии уже кажутся невероятными, но есть все предпосылки для того, чтобы все стало еще более невероятным.

P.S. Дальнейшее чтение: Наш Дайджест IaaS — 30 материалов о применимости облачных технологий.

Теги: #Машинное обучение #Разработка мобильных приложений #Разработка сайтов #Разработка электронной коммерции #системы рекомендаций #музыкальные сервисы #it-city

Вместе с данным постом часто просматривают: