Перед Новым годом команда Михаила Свердлово Свердлова объявлено , который готов делиться анонимными данными уроков Skyeng с внешними исследователями и стартапами.
Вскоре после праздников мы поговорили с Мишей о том, о каких данных идет речь, что с ними уже делают и почему получить собственный набор данных можно только написав ему на почту.
— Если вы делитесь данными, то почему бы просто не загрузить куда-нибудь набор данных?
Самый большой корпус английского языка в России, по моему мнению, составляет 10 тысяч позиций.
К концу января в нашей школе было проведено более 9,1 миллиона уроков по всему миру — насколько мне известно, только в китайских школах есть большой выбор онлайн-обучения и индивидуальных уроков.
Мы знаем, что происходило и как менялись действия учителя и ученика на протяжении всех уроков, которые мы преподавали; у нас есть отслеживание истории всех упражнений для них.
Это около 120 метрик для учителей, а также около 300 параметров для детей двух возрастных групп (4-11 и 11-18 лет) и взрослых разного возраста, города, статуса (например, студенты) и так далее.
И это точно не все параметры, которые мы можем собрать — кажется, мы можем использовать в 2-3 раза больше.
В этом томе история «вот ссылка на набор данных, кто хочет раскрутить» Это вряд ли сработает. — Кому вы готовы выгружать наборы данных по запросу? Первый тип потенциальных партнеров — это ученые и организации, которые занимаются фундаментальными исследованиями, пишут статьи и так далее.
Обычно им нужна база для исследований – мы готовы ею стать.
Сейчас, например, мы обсуждаем совместные нейрофизиологические исследования с одним из крупнейших университетов страны, а также партнерами из Кембриджа и Аризоны.
Сначала мы хотим взять текущий контент, разметить его определенным образом, а нейрофизиологи проведут тест на людях, которые будут к ним приходить и учиться в таких «шапках-ушанках».
Мы поймем, как материалы работают на целевую аудиторию, какие у них есть психологические и неврологические особенности, а затем сможем обучить модель на ретроданных, чтобы менять контент и форматы, делая их максимально удобными для студента.
.
Параллельно мы сейчас анализируем те же метрики фокусировки и освоения материала с одним из стартапов по аудио- и видеопотокам.
— Какие выгоды получит каждая сторона? 1. Мы изначально все делаем бесплатно друг для друга.
2. Результаты исследования принадлежат обеим сторонам – неважно, был ли эксперимент удачным или неудачным, мы можем писать совместные статьи, быть справочной базой и т. д.
3. Если результат исследования окажется положительным, партнер может коммерциализировать его, а мы использовать для собственных нужд.
Мы также готовы продемонстрировать клиентам нашего партнера конечные результаты в сфере образования.Но давайте сразу обсудим вопрос неконкуренции – это базовое условие.
Например, мы сразу договорились с нейрофизиологами, что если речь идет о продукте, то они не должны продавать его нашим прямым конкурентам в течение года-двух.
Грубо говоря, вы можете сразу продать его китайским военным, а когда-нибудь позже — другой онлайн-школе английского языка.
Это еще не отточенная юристами формулировка, но выглядит она примерно так.
— Ок, а если к тебе придет коммерческий проект? Нас также интересуют компании, которые внедряют инструменты ML в образовании или даже в других сферах.
Это могут быть инструменты персонализации образовательных траекторий, синтеза или анализа речи, мотивации в процессе обучения, психологии и так далее.
Мы уже работаем с такими людьми — например, определяем несколько пилотов на пару преподавателя и ученика.
Поэтому стартапы, которые работают над ускорением процесса получения новых знаний, механиками и методиками быстрого долгого и глубокого запоминания, заняты рекомендательными системами и так далее — тоже приходите.
Опять же, необходимо будет обсудить вопрос неконкуренции.
- Хорошо, а как все это выглядит для партнера? Напишите мне в [email protected] : Расскажите о своих компетенциях и желаемых темах, обсудим.
Когда все согласовано, мы подписываем договор и продолжаем творить историю в образовании.
На нашей стороне будет несколько ребят — проектов, которые вас подберут и помогут своевременно получать все загрузки, запускать эксперименты и так далее.
Партнер передает нам алгоритмы и/или логику, мы запускаем механический анализ и отдаем партнеру уже агрегированный текстовый файл с описанием.
Реальные данные – изображения, видео, аудио – партнеру не передаются.
А в остальном.
Пишите, не стесняйтесь, или задавайте вопросы в комментариях, постараюсь ответить, как смогу.
Теги: #Машинное обучение #python #Открытые данные #наборы данных английского языка #наборы данных онлайн-образования #образование для школьников #образование для взрослых #нейрофизиология в образовании
-
Батарея Электропитания
19 Oct, 24 -
Йеринг, Рудольф Фон
19 Oct, 24 -
Выпущен Linux Mint 12 «Lisa» Rc
19 Oct, 24 -
Браво. Робот-Трансформер
19 Oct, 24 -
Выпуск Imagecms 4.3
19 Oct, 24