Создаём ML для Яндекс Лавки, чтобы нужные продукты всегда были под рукой

Мы занимаемся машинным обучением для Яндекс Лавки. Наши алгоритмы помогают находить продукты, формировать корзину, доставлять заказы вовремя и открывать новые возможности сервиса. Это core-технология, без которой Лавка не смогла бы работать так же эффективно для миллионов пользователей.
Развиваем параллельно шесть направлений. Поиск — чтобы нужный товар находился с первого запроса. Рекомендации — чтобы корзина собиралась в несколько кликов. Реклама и маркетинг — чтобы пользователи получали релевантные предложения и выгодные скидки. Логистика — строим модели для прогноза времени доставки, оптимизации смен курьеров и их мотивации. AI-интеграции — экспериментируем с умными помощниками и автоматизацией, внедряем передовые технологии в продукт.
Аватарка
Даня Ткаченко
Руководитель службы ML-сервисов Яндекс Лавки
Три года назад нас было всего несколько человек — бывшие инженеры из Дзена, которые умели делать рекомендации. Пришли в Лавку — совсем молодой ещё тогда сервис, показали что умеем. Коллеги поверили в нас и дали зелёный свет. И вот теперь мы не только строим рекомендации, но и делаем поиск, рекламу, помогаем с маркетингом, внедряем AI во всякие процессы, подключились к логистике. Круто смотреть, как за эти годы мы выросли из небольшой группы в настоящую самостоятельную ML-службу.
читать далее
50%+ GMV Лавки это Поиск и Рекомендации
10+ ранжирующих поверхностей
4 языка поиска
10% рабочих часов курьеров — результат улучшенного планирования смен
20+ млн. пользователей получают персональные скидки каждый день
Наши разработки
Рекомендации
Рекомендательная платформа персонализирует пользовательский опыт на всех ключевых поверхностях приложения — от главного экрана до чекаута. В основе лежат ансамбли моделей ретривала и ранжирования, которые позволяют глубоко понимать контекст и намерения пользователя. Для этого используем как классические бустинговые, так и state-of-the-art нейросетевые подходы, включая DCN-v2 и Argus, а также проводим эксперименты с semantic ids.
Поиск
Поисковый движок построен на гибридной архитектуре, которая сочетает sparse-индексацию на основе BM25 и dense retrieval. Семантический поиск реализован с помощью дистиллированных трансформерных NLP-моделей, генерирующих эмбеддинги товаров, что позволяет находить релевантные результаты по описанию или составу. Для ускорения обработки запросов используется LLM-кеш.
Реклама
Рекламная AdTech-платформа работает на основе аукционов второй цены с ML-таргетингом, который использует пользовательские сигналы, историю покупок и контекст сессии. Ключевая особенность — собственная модель прогнозирования инкрементальной выручки. Она учитывает органическую вероятность покупки и позволяет отделить реальный эффект рекламы от каннибализации органической выдачи.
Прикладной AI
В основе прикладных AI-решений лежат LLM- и VLM-модели, организованные в агентские системы. Их разработка и эксплуатация происходят на нашей собственной платформе. Такая инфраструктура позволяет автоматизировать рабочие процессы и создавать клиентские продукты, например умный ассистент «Лавка AI». Он помогает пользователям планировать покупки и выбирать рецепты.
Логистика
Система управления логистикой работает в реальном времени и обеспечивает точность доставки до минуты. В её основе — целый комплекс ML-моделей. Промис-модели прогнозируют время подготовки заказа и его прибытия к клиенту, анализируя потоки данных из дарксторов, состояние дорожной сети и исторические данные. Параллельно рекомендательная система подбирает для курьеров оптимальные слоты, балансируя скорость, загрузку сети и экономическую эффективность.
Маркетинг
Система управления промо-акциями персонализирует скидки и другие предложения. В её основе лежат ML-модели, которые прогнозируют инкрементальный рост продаж, оценивая эластичность спроса на основе пользовательских и товарных данных. На выходе моделей работает оптимизационный алгоритм, который распределяет скидки с учётом заданных бюджетных ограничений. Эффективность новых подходов и exploration-гипотез валидируется через постоянные A/B-тесты.
Стек
  • VH3
  • Reactor
  • DJ
  • DJ
Читайте и смотрите про наши технологии
Tue Jan 20 2026 11:17:29 GMT+0300 (Moscow Standard Time)