«Дата-сайенс-сообщество — камерная тусовка, поэтому нетворкинг — наше все»

Как в Яндекс Такси нанимают дата-сайентистов

27 июня 2022
Время чтения:  6 мин

Мы постоянно рассказываем, как разные компании закрывают конкретные позиции в IT. Например, можете прочитать про наем аналитиков, мобильных разработчиков и девопс-инженеров

На очереди дата-сайентисты (Data Scientist) — относительно новая профессия, которая находится на пике популярности. Такие специалисты нужны многим компаниям, но на рынке дефицит сильных кандидатов. 

Мы поговорили о найме дата-сайентистов с Анастасией Куприяновой из Яндекс Такси. Анастасия рассказала, чем занимаются эти специалисты, где их искать и как устроен отбор на эту позицию.

 

Анастасия Куприянова, тимлид подбора в направлениях аналитики и ML, Яндекс Такси

Кто такие дата-сайентисты и чем они занимаются

Дата-сайентисты строят модели для обработки данных — например, нейросети, модели машинного обучения и компьютерного зрения. Модели позволяют быстрее обрабатывать большие массивы данных и тестировать гипотезы, автоматизируют принятие решений.

Типичный пример — система банковского скоринга. Раньше решение о выдаче кредита принимал специальный человек — андеррайтер. Но потом дерево решений переложили в модель, которая сама определяет, одобрить заявку или отказать. 

В Яндекс.Такси модели отвечают за построение маршрутов и распределение заказов. Например, водитель получает уведомление о заказах, которые находятся близко к нему, а не по всей Москве. А еще с помощью моделей мы сегментируем аудиторию пользователей и находим наилучшие каналы коммуникации.  

Дата-сайентист — это молодая профессия, раньше ее не существовало. Люди, которые выполняли схожие задачи, в различных сферах назывались по-разному: аналитики, модельеры, скорингисты, актуарии, кванты. С 2019 года начался бум на data science, и все стали «дата-сайентистами». 

Это сильно мешает в поиске: человек, который делает отчеты в экселе, тоже может называть себя дата-сайентистом. Поэтому нельзя просто ориентироваться на название должности в резюме: надо читать про задачи, которые решал кандидат, смотреть, с каким технологическим стеком он работал.

Сложно сказать, какие конкретно задачи должен решать дата-сайентист: работодатели вкладывают разный смысл в эту роль. Например, есть организации с четким функциональным разделением: один специалист занимается предобработкой данных, другой создает модели, третий выводит эти модели в продакшен. А в некоторых компаниях, в том числе в Яндексе, за все эти процессы отвечает один человек.    

Поэтому, когда ваш заказчик просит найти дата-сайентиста, важно понять, что именно он вкладывает в это понятие: вариантов может быть много.

 

Зарплатные ожидания дата-сайентистов

Дата-сайенс — популярное направление, а рынок перегрет крупными игроками, которые готовы платить высокие зарплаты, чтобы заполучить достойного специалиста. 

В июне 2022 года зарплатные ожидания кандидатов на рынке примерно такие:

 
 

Эти цифры нельзя анализировать в отрыве от мотивационных пакетов. Например, кто-то может компенсировать более низкий оклад опционами и премиями.

Зарплатные ожидания кандидатов сильно зависят от экономических и политических событий. В марте 2022 года, когда падал рубль, люди просили привязать зарплату к курсу доллара. Сейчас же кандидаты ссылаются на уровень вознаграждения в западных компаниях, потому что активно общаются с иностранными работодателями.

Тенденции каждый месяц разные, но крупный бизнес не так быстро реагирует на эти изменения. Поэтому ситуация с зарплатами дата-сайентистов на рынке сейчас примерно такая же, как и в самом начале 2022 года. 

 

Где искать дата-сайентистов

Чаще всего поиск холодный. Если разместить вакансию, то можно собрать много откликов, но большинство из них будут нерелевантными. Мы работаем со всеми возможными источниками кандидатов: LinkedIn, Kaggle, Хедхантером, профессиональными группами и сообществами, вузами и курсами, проводим стажировки. Расскажу о некоторых источниках подробнее.

 

Сообщество ODS

ODS — сообщество аналитиков и дата-сайентистов в Slack, откуда мы нанимали целые команды. Но есть нюанс: советую публиковать вакансии от лица нанимающего менеджера, а не рекрутера — так к ним будет больше доверия. 

 

Каналы в телеграме

Профессиональных каналов довольно много, но я выделю следующие: 

 

Kaggle

Это социальная сеть для дата-сайентистов, где они соревнуются в решении задач. Если зайти в профиль кандидата на Kaggle, то можно посмотреть все его медали за участие в конкурсах и оценить профессиональный уровень. 

Но стоит хорошо подумать, прежде чем гоняться за чемпионами. Многие из них зарабатывают себе на жизнь победами на соревнованиях и не рассматривают возможность трудоустройства. Кроме того, если человек хорошо решает задачи на конкурсах, совсем не обязательно, что он будет столь же эффективен в реальной работе, когда нужно глубоко погрузиться в продукт и специфику бизнеса.  

 

HeadHunter

Хороших кандидатов можно найти везде, в том числе и на Хедхантере. Просто придется потратить больше времени на проверку резюме. Но этот источник вполне подходит, если вам нужен стажер или джун.

 

Вузы и курсы

МФТИ, МГУ, ВШЭ — классический набор университетов, откуда компании забирают талантливых кандидатов. Многие крупные игроки взаимодействуют с этими вузами: открывают кафедры, ищут амбассадоров в студенческих сообществах. 

Однажды на прошлой моей работе мы наняли сразу трех одногруппников за месяц — они пришли друг за другом. Дата-сайентисты вообще часто мигрируют из одной компании в другую не по одному, а группами.

Сейчас появляется все больше курсов по работе с данными — спрос рождает предложение. Выпускников этих курсов можно брать на стажировки или даже сразу в штат на начальные позиции. Например, Яндекс сотрудничает с ШАД — Школой анализа данных. 

 

Стажировки

Мы любим выращивать сотрудников внутри. С помощью стажировок Яндекс находит молодых звездочек и закрывает около 25% вакансий ежегодно. Стажеры выполняют задачи под руководством наставника, общаются с будущим руководителем и попадают в штат, если все складывается удачно.

 

Соревнования

Хакатоны — это еще один инструмент привлечения внимания к бренду работодателя и вакансиям. Дата-сайентисты обожают соревноваться и ломать голову. Чем интереснее и сложнее задачи, тем больше внимания они привлекают: если хорошо подготовиться к ивенту, то можно собрать толпу потенциальных кандидатов около вашего стенда или стола. 

Важно понимать: даже если дата-сайентист тратит время на ваши задачи, это совершенно не говорит о его желании попасть к вам на работу. Многие специалисты посещают соревнования ради удовольствия, а не для трудоустройства. 

 

Внутренняя база кандидатов

У нас общая база кандидатов и практически бесшовный процесс коммуникации рекрутеров внутри всего Яндекса, ведь мы единая структура. Поэтому к нам могут попадать кандидаты из иных направлений бизнеса. И наоборот: допустим, человек не подошел нам в Яндекс Такси, но оказался интересен другим командам.

 

Этапы найма дата-сайентистов

 

HR-скрининг

Рекрутер спрашивает кандидата о его задачах, опыте и стеке технологий, а также сам отвечает на вопросы. Отсев идет по следующим критериям:

  1. Стек — если кандидат не работает с нашими инструментами, скорее всего, будет отказ.
  2. Базовые знания в математике — на скрининге мы даем простые задачи, например на теорию вероятностей.  
  3. Задачи. Если человек хочет заниматься нейросетями, не стоит его звать, чтобы строить простые логистические регрессии: мэтча не будет. Точно так же бесполезно рассматривать сениора на джуновые задачи.
 

Техническое интервью

Этот этап состоит из 2 секций — каждая в среднем длится по часу. Первая секция посвящена теории и практике машинного обучения, вторая — написанию кода на Python и C++.

Технические секции проводит не нанимающий менеджер, а специальный интервьюер, который осуществляет независимую оценку. Как правило, на этапе технического интервью не обсуждается конкретная вакансия: распределение и выбор происходит уже позже — на финалах. 

 

Финалы

Финал — это отдельная встреча кандидата с потенциальным руководителем. Они общаются о жизни и бизнес-процессах, обсуждают кейсы, чтобы понять, подходят ли друг другу. 

Финалов может быть несколько, если претендент заинтересовал разные команды. В таком случае выбор конкретной команды за кандидатом. Нанимающие менеджеры будут предлагать ему свои вакансии, но финансовые условия остаются одинаковыми при любом выборе — «убеждать деньгами» нельзя. 

 

Софт-скиллы дата-сайентиста

Требования по софтам зависят от позиции и задач, которые будет решать специалист. Например, для джунов критически важна стрессоустойчивость и обучаемость. Если же дата-сайентисту предстоит тесно общаться с бизнесом, то на первый план выходят коммуникабельность и умение доносить свои мысли.

 

Хард-скиллы дата-сайентиста

В первую очередь кандидату нужна хорошая математическая база — как минимум знание теории вероятностей и математической статистики. Обычно эта база формируется за счет образования. 

Если посмотреть на портрет успешного кандидата, то картина будет стандартной: технический вуз и специальность, связанная с математикой, физикой, информатикой или экономикой. Встречаются и самоучки: я слышала историю, как профессиональный скрипач погрузился в математику и анализ данных, хорошо подготовился и успешно прошел техническое интервью на джуновую позицию.

Кроме того, нужны знания языков программирования, библиотек и фреймворков. Причем у Яндекса своя специфика: наши дата-сайентисты не только создают модели, но и выводят их в продакшен, то есть встраивают в код. Поэтому в дополнение к Python кандидату желательно еще и знать C++.

 

Специфика найма дата-сайентистов

 

Фокус на задачи

Для кандидатов важны задачи: если они скучные или слишком простые, то найти сильного специалиста будет сложно, даже за хорошие деньги. Поэтому при снятии заявки стоит расспросить нанимающего менеджера: 

  1. Что конкретно предстоит делать будущему сотруднику.
  2. Какие задачи будут рутинными.
  3. В каком объеме придется заниматься документацией — дата-сайентисты этого не любят. Дело в том, что любая модель должна быть описана, чтобы работать с ней мог не только ее создатель. Поэтому уточните у нанимающего менеджера, кто будет документировать модели.
 

Сложный скрининг резюме

Релевантный кандидат может называть себя как угодно — хоть аналитиком, хоть ML-девопсом. Поэтому важно внимательно изучать текст резюме, а не просто пробегать по нему глазами в поисках ключевых слов.

 

Нетворкинг творит чудеса

Многие вакансии я закрываю через знакомых. DS-сообщество — это камерная тусовка, куда важно попасть рекрутеру. Поэтому нетворкинг — наше все.  

 

Главное: что стоит знать про наем дата-сайентистов

  1. Где искать кандидатов:
  • LinkedIn,
  • Kaggle,
  • сообщество ODS,
  • Хедхантер — для найма стажеров и джунов,
  • профессиональные каналы в телеграме,
  • вузы и курсы,
  • стажировки,
  • хакатоны,
  • внутренняя база резюме. 
  1. Если вы организуете или участвуете в ивенте для дата-сайентистов, то заготовьте интересные задачи — это рецепт успеха. При этом готовность решать задачи не говорит о желании трудоустроиться к вам — не радуйтесь раньше времени.
  2. Хард-скиллы дата-сайентиста: хорошая математическая база на основе технического образования, знание Python, основных библиотек и фреймворков.
  3. Софт-скиллы: коммуникабельность и умение доносить свою точку зрения до бизнеса. Джунам будет полезна обучаемость и стрессоустойчивость.
  4. Этапы отбора в Яндекс Такси:
  • HR-скрининг,
  • первая техническая секция — по теории и практике машинного обучения,
  • вторая техническая секция — по коду,
  • финалы.
  1. Интересные задачи мотивируют дата-сайентистов сильнее денег. Поэтому обязательно уточните у нанимающего менеджера, что предстоит делать новому сотруднику, придется ли ему работать с рутиной и составлять документацию на модели.
  2. Занимайтесь нетворкингом, чтобы подружиться с DS-сообществом и эффективнее закрывать вакансии.

Еще из рубрики “Экспертиза”