Москва
Санкт-Петербург
Нижний Новгород
Екатеринбург
Сочи
Ростов-на-Дону
data
Инженер данных в Яндекс Go
Фотография автора вакансии

Фёдор Лаврентьев

Директор по данным Екома и Райдтеха

Бизнес-решения в Яндекс Go (и в Такси в частности) принимаются на основе накопленных в компании данных. Актуальные, полные и правдивые данные формирует Служба разработки платформы управления данными (DMP).

Мы ищем лучших инженеров данных, которые в команде с лучшими аналитиками будут проектировать и оптимизировать сложнейшие расчеты и алгоритмы. А ещё разрабатывать инструментарий для сотен бизнес-пользователей.

Что нужно делать:

  • оптимизировать нетривиальные ETL-процессы обработки больших данных;
  • извлекать из исходных данных ценную информацию и скрупулезно обрабатывать ее для последующего анализа;
  • работать с данными на каждом из этапов их трансформации: от появления информации в конкретном источнике до монетизации полученных знаний;
  • работать над реализацией стабильного расчета бизнес-метрик вместе с командой аналитиков;
  • поддерживать и модифицировать созданное решение, отвечать за доступность сервиса и корректность данных, предоставляемых для принятия решений.

Вот этого мы ждём от вас:

  • уверенно программируете на Python;
  • знаете классические алгоритмы и структуры данных;
  • работали с отладчиками и верификаторами;
  • хорошо знаете SQL и понимаете устройство современных реляционных баз данных;
  • понимаете и можете объяснить необходимость непрерывной интеграции и непрерывной доставки (CI/CD), преимущества использования Git и ревью кода.

Будет плюсом такой ваш опыт:

  • руководили стажерами или начинающими специалистами; — работали по методологии Agile;
  • участвовали в проектировании хранилищ данных;
  • работали со стеком технологий Hadoop, Spark, Hive;
  • создавали сложные высоконагруженные процессы ETL и ELT (плюсом будет знание инструментов Luigi, Airflow);
  • разрабатывали процессы обработки сложных событий (CEP) во времени, приближенном к реальному (Kafka Streams, Spark, Flink);
  • работаете со специализированными аналитическими базами данных (Greenplum, Vertica, ClickHouse, Teradata);
  • работаете с аналитическими инструментами на базе Python (Jupyter, Pandas, SciPy, Matplotlib, Bokeh);
  • программируете на C++;
  • размещаете в публичных репозиториях свой код или статьи с примерами работ.
Фотография автора цитаты

Юрий Мещеряков

Head of Recruitment Екома и Райдтеха

У нас многоступенчатый отбор — так получается объективнее и быстрее. Сейчас вы отправите резюме, и если всё сложится, то в ближайшие 3-5 дней мы пришлём вам приглашение. Что ждёт вас дальше, читайте на странице для подготовки к интервью.