Мы Делимся Самым Большим Пластом Данных По Онлайн-Обучению В Рф С Проектами В Области Лингвистики, Персонализации, Педагогического Дизайна, Ml.

Перед Новым годом команда Михаила Свердлово Свердлова объявлено , который готов делиться анонимными данными уроков Skyeng с внешними исследователями и стартапами.

Вскоре после праздников мы поговорили с Мишей о том, о каких данных идет речь, что с ними уже делают и почему получить собственный набор данных можно только написав ему на почту.



Мы делимся самым большим пластом данных по онлайн-обучению в РФ с проектами в области лингвистики, персонализации, педагогического дизайна, ML.

— Если вы делитесь данными, то почему бы просто не загрузить куда-нибудь набор данных? Самый большой корпус английского языка в России, по моему мнению, составляет 10 тысяч позиций.

К концу января в нашей школе было проведено более 9,1 миллиона уроков по всему миру — насколько мне известно, только в китайских школах есть большой выбор онлайн-обучения и индивидуальных уроков.

Мы знаем, что происходило и как менялись действия учителя и ученика на протяжении всех уроков, которые мы преподавали; у нас есть отслеживание истории всех упражнений для них.

Это около 120 метрик для учителей, а также около 300 параметров для детей двух возрастных групп (4-11 и 11-18 лет) и взрослых разного возраста, города, статуса (например, студенты) и так далее.

И это точно не все параметры, которые мы можем собрать — кажется, мы можем использовать в 2-3 раза больше.

В этом томе история «вот ссылка на набор данных, кто хочет раскрутить» Это вряд ли сработает. — Кому вы готовы выгружать наборы данных по запросу? Первый тип потенциальных партнеров — это ученые и организации, которые занимаются фундаментальными исследованиями, пишут статьи и так далее.

Обычно им нужна база для исследований – мы готовы ею стать.



Сейчас, например, мы обсуждаем совместные нейрофизиологические исследования с одним из крупнейших университетов страны, а также партнерами из Кембриджа и Аризоны.

Сначала мы хотим взять текущий контент, разметить его определенным образом, а нейрофизиологи проведут тест на людях, которые будут к ним приходить и учиться в таких «шапках-ушанках».

Мы поймем, как материалы работают на целевую аудиторию, какие у них есть психологические и неврологические особенности, а затем сможем обучить модель на ретроданных, чтобы менять контент и форматы, делая их максимально удобными для студента.

.

Параллельно мы сейчас анализируем те же метрики фокусировки и освоения материала с одним из стартапов по аудио- и видеопотокам.

— Какие выгоды получит каждая сторона? 1. Мы изначально все делаем бесплатно друг для друга.

2. Результаты исследования принадлежат обеим сторонам – неважно, был ли эксперимент удачным или неудачным, мы можем писать совместные статьи, быть справочной базой и т. д.

3. Если результат исследования окажется положительным, партнер может коммерциализировать его, а мы использовать для собственных нужд.

Мы также готовы продемонстрировать клиентам нашего партнера конечные результаты в сфере образования.

Но давайте сразу обсудим вопрос неконкуренции – это базовое условие.

Например, мы сразу договорились с нейрофизиологами, что если речь идет о продукте, то они не должны продавать его нашим прямым конкурентам в течение года-двух.

Грубо говоря, вы можете сразу продать его китайским военным, а когда-нибудь позже — другой онлайн-школе английского языка.

Это еще не отточенная юристами формулировка, но выглядит она примерно так.

— Ок, а если к тебе придет коммерческий проект? Нас также интересуют компании, которые внедряют инструменты ML в образовании или даже в других сферах.

Это могут быть инструменты персонализации образовательных траекторий, синтеза или анализа речи, мотивации в процессе обучения, психологии и так далее.



Мы уже работаем с такими людьми — например, определяем несколько пилотов на пару преподавателя и ученика.

Поэтому стартапы, которые работают над ускорением процесса получения новых знаний, механиками и методиками быстрого долгого и глубокого запоминания, заняты рекомендательными системами и так далее — тоже приходите.

Опять же, необходимо будет обсудить вопрос неконкуренции.

- Хорошо, а как все это выглядит для партнера? Напишите мне в [email protected] : Расскажите о своих компетенциях и желаемых темах, обсудим.

Когда все согласовано, мы подписываем договор и продолжаем творить историю в образовании.

На нашей стороне будет несколько ребят — проектов, которые вас подберут и помогут своевременно получать все загрузки, запускать эксперименты и так далее.

Партнер передает нам алгоритмы и/или логику, мы запускаем механический анализ и отдаем партнеру уже агрегированный текстовый файл с описанием.

Реальные данные – изображения, видео, аудио – партнеру не передаются.

А в остальном.

Пишите, не стесняйтесь, или задавайте вопросы в комментариях, постараюсь ответить, как смогу.

Теги: #Машинное обучение #python #Открытые данные #наборы данных английского языка #наборы данных онлайн-образования #образование для школьников #образование для взрослых #нейрофизиология в образовании

Вместе с данным постом часто просматривают: