Виктор Кантор — Об Учебе В Мфти, Работе В Abbyy, Яндексе, Мтс И Каким Должен Быть Датасайентист

В прошлом году директор Центра больших данных МТС Виктор Кантор вошел в рейтинг Forbes самых перспективных россиян до 30 лет. Специально для блога МТС руководитель образовательного проекта МТС МТС.

Тета Савва Демиденко поговорил с Виктором о его пути в мир больших данных – от учебы в МФТИ до работы в МТС, о том, почему специалист должен преподавать, а также о нашем образовательном проекте.



Виктор Кантор — об учебе в МФТИ, работе в ABBYY, Яндексе, МТС и каким должен быть датасайентист

Савва: Начнем с учебы.

Я знаю, что ты учился в МФТИ.

Ты специально туда пошёл? Виктор: Мой двоюродный брат учился в МФТИ.

Я родом из небольшого города Губкина с населением 70 тысяч жителей, расположенного недалеко от железорудного рудника.

Я часто каламбур говорю, что после 18 лет всем губкинцам намекают, что пора задуматься о карьере, имея в виду этот карьер.

Поэтому мне очень хотелось получить хорошее образование, чтобы разнообразить свой путь.

Был пример сестры и ее мужа, у которых в жизни все шло хорошо, и мне хотелось того же.

Я успешно выступал на школьных олимпиадах и очень любил — и люблю по сей день — физику, поэтому поступил в МФТИ.

Савва: Трудно было играть? Виктор: Это сложно, но я решил поступать в МФТИ в девятом классе, и у меня было три года на подготовку.

Очень помогло то, что мне действительно нравилось учиться.

Савва: Начало учебы в университете было спокойным? В первом семестре был случай, когда я несколько недель подряд спал по два часа, потому что по ночам сидел в читальном зале.

В моем родном городе у меня не было доступа к такому объему информации по математике и физике, но потом она вдруг появилась и меня увлекло.

В отличие от моего поколения, сегодняшние абитуриенты наконец научились пользоваться Интернетом.

Я думал, что если старых крутых преподавателей советской школы постепенно станет меньше, то и в МФТИ пойдёт меньше людей из нашего города.

И тут я узнаю, что в МФТИ поступил человек, который когда-то участвовал в выездной олимпиаде, которую я привез в родной город. Я его спрашиваю: «Как ты попал в МФТИ, как это возможноЭ» А он мне говорит: «Я просто гуглил.

Вам нужен ЕГ? решать? Я погуглил, научился решать всевозможные задачи, сдал GCSE? и поступил в МФТИ».

Это совершенно другое мышление.

Савва: Чуть ранее вы сказали, что «привезли Олимпиаду в свой город».

Зачем тебе это? Виктор: Я просто хотел, чтобы другие дети из моего города тоже смогли поступить в хороший университет. Савва: Бытует мнение, что МФТИ входит в тройку лучших вузов и стоит рядом с ШАД (Школой анализа данных) и МГУ (Московским государственным университетом).

Это верно? Виктор: Это так, но они все же немного другие.

Я считаю, что на современном уровне развития науку о данных следует изучать на уровне бакалавра, а SAD по своему позиционированию ближе к магистратуре.

Этим я ни в коем случае не хочу принижать ШАД, это очень круто, мне понравилось там учиться и преподавать, просто сейчас то, что раньше можно было преподавать в магистратуре по науке о данных, неплохо было бы перетащить в степень бакалавра.

Увеличился объем накопленных знаний.

Мне кажется, что в бакалавриате должны остаться какие-то фундаментальные вещи.

Например, как работают обработка естественного языка и компьютерное зрение, какие у них подходы.

А в магистратуре уже нужна практика, показывающая, как все это применять, чтобы в итоге получить какой-то крутой продукт. Савва: Был ли у тебя любимый предмет в МФТИ? Виктор: Да, теоретик.

Представьте, что есть предмет по физике, в котором нет ограничений по используемому оборудованию, и при этом вы любите математику.

Савва: Как вы думаете, внутри МФТИ сильное сообщество? Я слышал много историй о том, как люди после окончания учебы становились друзьями и помогали друг другу.

Ничего подобного я больше нигде не видел.

Виктор: Сообщество действительно есть, но я бы не сказал, что это единое сообщество.

Скорее, это множество небольших групп студентов-физиков и технических специалистов, которые пытаются поддержать друг друга и саму команду физиков и технологий.

Существуют различные благотворительные фонды, пожертвования выпускников.

Кстати, мы с коллегами недавно внесли свой вклад в новый фонд, который должен обеспечить некоторые базовые потребности студентов: интернет, проезд в поездах и так далее.

Еще в сообществе есть проблема, что люди сильно ассоциируются с тем хорошим местом, в котором они оказались.

Бытует мнение, что «все, кто учился в Физтехе, очень крутые».

В конце концов, это выглядит довольно жутко.

Физтех — действительно классное место, но это не значит, что любой выпускник автоматически становится крутым только потому, что он в этом сообществе.

Как говорится, не место делает человека, а человек делает место.

Савва: Что вы думаете о Вышке? Виктор: Башня очень классная, мне нравится.

У них современный и деловой подход к образованию.

Есть места, где преподавание воспринимается как призвание: его нельзя никак оценить, это своего рода искусство.

Но образование – это услуга, и она должна предоставляться качественно.

В Вышке это прекрасно понимают. Они также понимают, что для эффективного предоставления этой услуги им необходимо привлекать лучших специалистов, труд которых должен хорошо оплачиваться.

И что нет необходимости жестко регулировать этот процесс или слишком его бюрократизировать: определенная доля свободомыслия приводит к тому, что люди более творчески подходят к своей работе.

Савва: Какие впечатления остались после тренировки? Виктор: После – не совсем корректная формулировка, потому что люди начинают работать еще в университете.

Сначала мы с ребятами сделали один стартап, потом другой, и все они были посвящены науке о данных и обработке текстов.

В МФТИ на моей кафедре был курс-акселератор, где мне нужно было создать и запустить собственный технологический стартап.

Это было забавно, учитывая, что остальная нагрузка курса лежала на тебе.

Все эти стартапы, конечно же, провалились, за исключением тех, чьи основатели были заняты своим проектом, пренебрегая учебой.

И это на самом деле правильно, что люди смогли расставить приоритеты.

С годами я понял, что гораздо круче делать что-то, когда ты знаешь, как это делать.

Поэтому неудивительно, что эти студенческие поделки, как правило, ничем не заканчивались: мы просто всему учились.

Для меня путь стартапа в области науки о данных был трудным.

Первые два года у меня ничего не получалось, потом стало понемногу получаться, но дойти до этого было очень больно.

Мне приходилось сталкиваться с неконтролируемыми задачами без какой-либо разметки, без возможности обучить алгоритм с преподавателем.

А это значит, что они решены плохо.

После «университетского стартапа», который мы закрыли, я пошел работать C++-разработчиком в ABBYY. Стоит сказать, что я обожаю «плюсы», это потрясающий язык, но одно дело — решить учебные задачи на C++ или «запустить» алгоритм, и совсем другое, когда нужно просто сделать первый класс, второй класс и как они будут работать друг с другом, взаимодействовать с другом.

Креатива в этом мягко говоря мало, и мне скучно.

Потом меня взяли в отдел образовательных проектов ABBYY, где я отвечал за работу с кафедрами МФТИ, кафедрами компьютерной лингвистики, распознавания изображений, но не занимался программированием и наукой о данных.

В это время я получил предложение от Yandex Data Factory и практически пошёл туда, но меня удержали предложением: пусть ты потратишь 50% своего времени на обучение и столько же времени на машинное обучение.

Савва: Это идеальная ситуация.

Виктор: Да, это было супер идеально.

Еще был забавный момент — примерно в это же время мне написал Гугл с предложением пообщаться о работе.

Я был молод и горяч, и радостно ответил им: «Знаете, я не думаю, что Google способен предложить мне что-то столь же интересное, как ABBYY».

Думаю, что я до сих пор нахожусь в каком-то черном списке, потому что Google за всю мою жизнь мне больше ни разу не писал.

Это было весело, в этом было свое очарование.

Но, несмотря на встречное предложение от ABBYY, в моих задачах были определенные недостатки, а Яндекс очень изобретательно предлагал некоторые варианты, и в итоге я оказался в Yandex Data Factory. Менее чем через полгода за меня «проголосовали», а затем я работал над всевозможными рекомендательными системами, заказными проектами машинного обучения и участвовал в различных коммерческих тендерах.

Позже я перешёл в Яндекс.

Такси на позицию Chief Data Scientist. Мы выросли и сделали много классных вещей.

После работы в Яндексе я обратил внимание на сферу корпоративного образования.

Я провел некоторое обучение и некоторые консультации.

Это был крутой опыт. В какой-то момент я подумал, что, возможно, стоит немного присмотреться к рынку труда и не отвечать отказами на все предложения.

Вот как я встретил МТС Банк , которому нужно было обновить скоринговую модель, и Mail.ru, где стояла задача запустить Академию больших данных за два-три месяца.

Я начал заключать договор с банком, просто чтобы что-то сделать своими руками.

К тому времени я уже давно не сталкивался с подобным и мне было грустно.

Я подумал: «Неужели я стал совсем бесполезен и ничего не могу делать, мне нужно работать руками».

Савва: А как, твои руки помнят? Виктор: Руки помнят, а я работал с тем, что другие люди оставили в наследство.

Думаю, те, кто хоть раз парсил чужой код, поймут мои эмоции.

Это было тяжело, но очень поучительно.

Саму скоринговую модель мои предшественники построили очень хорошо, она работала стабильно и практически не устарела.

Потом в какой-то момент появился крупный МТС, и они меня очень деликатно выследили.

Но к тому времени он уже запустил Академию больших данных.

Савва: Чем конкретно ты сейчас занимаешься в МТС? Виктор: Сейчас я отвечаю за все направление Big Data; моя официальная должность называется Директор Центра Больших Данных.

По сути, это, наверное, CDO — человек, который отвечает за то, какие данные мы собираем, как ими управляем, монетизируем и так далее.

У меня большая команда — более 300 человек — из людей разных специальностей, не только специалистов по обработке данных.

А задач у нас огромное количество.

Если говорить о направлениях работы, то это, конечно, телеком и те продукты экосистемы МТС, которые существуют уже давно.

Еще есть финтех, геоаналитика, задачи для медиасервисов и несколько очень смелых экспериментов в области автоматизации внешнего найма с помощью ML и тому подобного.

Возможно, они не сверхприбыльные, но мы верим в их потенциал: либо они укрепят экосистему МТС, либо рынок вырастет и будет интересным и прибыльным.

Савва: Где столько умных людей найти, чтобы это сделать? Виктор: С его начала Направления больших данных МТС наняла много умных людей из хороших вузов.

Но вы можете сделать это, когда вы ищете джуниора или начинающего мидла, когда вы ищете сеньоров или лидов, вам уже нужно знать их по имени, отслеживать их текущий карьерный статус и приглашать их как можно скорее.

Это уже ручная работа.

Савва: То есть нужно создать какое-то сообщество, в котором были бы люди, и желательно поближе к МТС? Виктор: Мне кажется, это спорный вопрос, потому что в современном мире людям сложно полюбить сообщество, которое ближе к одной компании.

Все так или иначе за свободу, за открытость.

Но такие сообщества все равно должны появиться.

Поэтому сейчас все компании, в которых есть отличные специалисты, имеют такие сообщества и свои школы.

И я считаю, что это хорошо, потому что это дает больше возможностей для образования и больше перспектив для развития.

Кстати, о перспективах и возможностях.

МТС запустила новую программу долгосрочной мотивации для членов продуктовой команды и наиболее эффективных сотрудников.

Мотивируйте сотрудников реальными акциями компании.

В 2022 году в программе примут участие ИТ-специалисты и менеджеры цифровых продуктов МТС.

Так акционеры получат приятный финансовый бонус к зарплате и еще один стимул создавать крутые продукты.

Савва: МТС тоже недавно открыла свою школу МТС.

Тета, вы к этому приложили руку.

Можете ли вы рассказать мне об этом? Виктор: В Tete я отвечаю за направление Data Science. Оказываю посильную помощь с поиском преподавателей, составлением программы и попытками понять, как внести в обучение немного нашей специфики.

Мне хотелось бы донести мысль о том, что у наших студентов есть возможность не просто сделать что-то крутое: обучить нейрон или написать крутые алгоритмы.

С их помощью можно сделать что-то полезное для людей в осязаемом бизнесе, развивающемся в течение длительного времени.

Савва: Вы читаете лекции студентам? Виктор: Конечно.

Во-первых, мне интересно знакомиться со студентами, потому что для меня главное — люди.

Неважно, обучение это или работа.

Меня дико мотивируют люди, с которыми я работаю, я хочу понять, как они живут, что их интересует, почему они пришли сюда, чего хотят в будущем.

Во-вторых, мне очень нравится преподавать.

Серьезно, я просто улетаю в какое-то пространство, когда читаю лекцию или семинар, в этот момент все мои проблемы исчезают куда-то в никуда.

У меня бывает, что после занятий я думаю: ну и чего же я такая радостная? На самом деле все совсем плохо, тут надо решать, тут решать, а тут вообще непонятно, что делать.

Но потрясающее чувство вдохновения никуда не деть – оно просто фантастика.

Савва: Есть ли романтика в преподавании? Виктор: Есть, и для меня это немного отличается от того, что любят говорить люди.

Обычно говорят, что вы что-то даете другим и влияете на их судьбы.

Я лично рассматриваю это как перекладывание ответственности, потому что вместо того, чтобы использовать имеющиеся у вас знания, вы отдаете их другим, как передаёте горячую картошку – вперёд, разбирайтесь с этими знаниями.

Я долго не мог ответить себе на вопрос: как такое может быть, оказывается, не совсем ответственно.

Но дело в том, что машинное обучение действительно можно использовать в миллионе разных мест. Запускаем ли мы корабли в космос, лечим ли рак или разработаем что-то еще через 10 лет — я даже не представляю, что это может быть — машинное обучение может быть полезно везде.

Когда ты сам работаешь в определенной сфере, ты применяешь свои знания узко в одном месте.

И когда вы делитесь этими знаниями, вы в конечном итоге используете их во многих областях.

Поэтому, когда ты читаешь лекцию, ты, может быть, на сто пятьдесят миллионов от запуска корабля в космос.

И это круто.

Савва: Я знаю, что ты прошел курс по науке о данных.

Можете ли вы рассказать нам немного об этом? Виктор: Изначально все начиналось как спецкурс по физике и технологиям, а я помогал человеку, который его запустил и, по сути, привел меня в науку о данных.

В какой-то момент у него уже не было времени, я начал преподавать курс самостоятельно и дал ему название «Data Mining в действии» (DMIA).

Data Mining — это именно интеллектуальный анализ данных; сейчас это слово не в моде, потому что появилось «Data Science».

Время от времени в науке происходит ребрендинг, чтобы деньги все равно выделялись на какие-то направления, но мы не можем провести ребрендинг курса, потому что все уже запомнилось как ОМВД.

Курс длился девять лет, потом у нас был перерыв из-за пандемии, а сейчас мы переосмысливаем формат. Когда я был единственным, кто проходил курс, это было совершенно спонтанно.

Курс по-настоящему развился, когда ко мне присоединились другие ребята и начали преподавать отдельные направления, а также когда ко мне присоединился Мели Драл, с которым мы записались на специализацию по машинному обучению на Coursera. Так она очень раскрутила наш курс, он со временем стал самостоятельным и переехал в Москву, потому что к нам уже приезжали люди со всей Москвы, а мы еще были в Долгопрудном (где находится Физико-технический институт).



Виктор Кантор — об учебе в МФТИ, работе в ABBYY, Яндексе, МТС и каким должен быть датасайентист

Савва: «Мели учился в школе МТСЭ» Виктор: Да, к счастью, совместными усилиями нам удалось ее уговорить.

Очень редко один учитель сочетает в себе хороший практический опыт и хороший опыт преподавания.

Под хорошим практическим опытом я подразумеваю опыт работы на разных должностях.

Если обучать студентов будет обычный джуниор, он, конечно, будет учить и учить очень хорошим и полезным вещам, но это будет совсем не то же самое, что учить тимлида или опытного дата-сайентиста, который еще помнит и может показать, как все сделано руками.

Если взять человека, который прошел большой путь, умеет работать и при этом хорошо учит, то это просто бриллиант. В случае с Эmelie это именно такая история, и я очень надеюсь, что слушатели ее оценят. А если они этого не оценят, то со временем поймут, насколько это круто.

И я очень надеюсь, что какое-то количество таких людей нам еще удастся привезти.

Савва: Какой курс вы можете порекомендовать? Виктор: Я рекомендую наш специализация на Coursera , который мы записали - это если прямо сейчас.

Но надо сказать, что у нас, как у преподавателей, есть некоторые обязательства по обновлению контента, и мы что-то обновим в обозримом будущем.

Я определенно рекомендую Специализация Эндрю Н.

в области глубокого обучения .

Многие говорят, что она недостаточно сильна, недостаточно технична, но это говорят люди, привыкшие к тому, что к ним приходит лектор и сразу заполняет всю доску интегралами и тому подобным.

Мне кажется, в простом бытовом смысле это очень хорошая специализация.

Я однозначно могу порекомендовать любые курсы, которые будут выпущены в нашей школе, потому что я позабочусь о том, чтобы там все было хорошо.

Савва: По поводу математической основы.

Это нужно или нет? Виктор: Я думаю, с ней проще.

В то же время есть люди, которые не очень хорошо разбираются в математике, но являются хорошими разработчиками.

А есть люди, которые не очень хороши в разработке, но являются хорошими математиками.

Последние часто менее полезны на практике.

Я не хочу сказать ничего плохого о математиках, они замечательные, но на самом деле нужно, чтобы это работало, а не так, чтобы было математически красиво.

При этом совместить практическую пользу с математической красотой вполне возможно, нужно лишь правильно расставить приоритеты своих целей.

Савва: Бытует мнение, что дата-сайентисты обычно плохо пишут свой код. Нужно ли мне как-то с этим работать? Виктор: К сожалению, это правда, и с этим нужно работать.

Потому что чем меньше у вас самостоятельных отдельных боевых единиц, тем сложнее им приходится в ситуации, когда какие-то ресурсы где-то простаивают. Допустим, разработчик занят, ему нужно срочно доделать еще что-то, но его что-то ждет. специалист по данным и не может минимально реорганизовать свой код, чтобы каким-то образом аккуратно перетащить его в производство.

Это не очень хорошо.

Конечно, нужно накачаться.

Но нам нужно понимать, что когда мы инвестируем свое время во что-то, мы не инвестируем его во что-то другое.

Поэтому, если выбор стоит между чтением статьи о каком-то особом экзотическом типе нейронов, который практически не используется, и практикой разработки, то лучше научиться разрабатывать.

И если выбор стоит между разработкой и выяснением того, какие метрики имеет смысл использовать в этой бизнес-задаче, как правильно спроектировать A/B-тест, какой опыт есть у других людей, то лучше позволить это сделать дата-сайентисту, чем накачиваться его навыки развития.

Савва: Может ли дата-сайентист жить без английского? Виктор: Возможно, но это будет сложно.

И это актуально не только для Data Scientist. Многие интересные вещи сначала выходят на английском языке.

Если вы сможете с ними ознакомиться только тогда, когда они будут переведены на русский язык, вы подпишете, что для вас нормально отставать в карьерном развитии на несколько лет. Савва: Посмотрите, есть, например, младший датасайент, потом мидл, потом лид. Есть ли у лида дальнейшие пути роста, во что они обычно превращаются? Виктор: Я был просто ведущим.

Сейчас я отвечаю за большие данные и подчиняюсь непосредственно президенту компании, так что, как видите, в целом карьерный путь может быть довольно долгим.

Лид может стать главным специалистом по данным, главный специалист по данным может стать директором по большим данным или, например, захотеть перейти к истории, более ориентированной на продукт. В частности, у нас есть дружная компания YouDo, в которой директор по продукту был главным специалистом по данным.

Савва: Как вы думаете, как воспитать в себе эту гибкость? Вы с этим родились или изучаете какие-то дисциплины? Виктор: Она воспитана самым естественным образом.

В смысле, через боль, просто если тебе ее не хватает, то дальше тебя никто не отпустит. Как только вы увидите, что вас пропустили чуть дальше, вы сможете понять, что, видимо, вы что-то сделали в правильном направлении или вам просто повезло.

Но со временем статистика все равно накапливается.

Поэтому, когда вы видите, что в карьере есть какое-то узкое место, это повод задуматься – «что я делаю не такЭ» Савва: Спасибо, что ответили на наши вопросы! Виктор: Спасибо и Вам, было очень приятно пообщаться! Видеоверсия полного интервью.

Теги: #Машинное обучение #Интервью #Карьера в ИТ-индустрии #курсы #Образовательный процесс в ИТ #Большие данные #Биографии компьютерных фанатов #учеба #преподавание #Физтех

Вместе с данным постом часто просматривают: