Создаём ML-инструменты для партнёров Маркета

Наша команда разрабатывает ML-алгоритмы, которые помогают продавцам Маркета увеличивать продажи. Мы создаём системы ранжирования товаров и рекламные аукционы, чтобы продавцы могли эффективно продвигать свои товары. Наши технологии, изначально созданные для Маркета, теперь применяются и в других сервисах: Go, Еде и Лавке.

Помимо продвижения, мы помогаем управлять товарными запасами. Наши алгоритмы прогнозируют спрос и дают рекомендации по закупкам, чтобы на складах всегда были нужные товары. Еще одно направление — работа с контентом. Мы управляем каталогом из миллиардов товаров, который постоянно обновляется: появляются новые позиции, а старые изменяются или удаляются.

Александр Воронцов
Руководитель ML рекламы и партнёрских продуктов Яндекс Маркета
Мне хочется, чтобы дальше наши технологии становились проще для людей, а не сложнее. Иногда кажется, что вокруг слишком много сложных систем и громких идей, а в итоге человеку просто неудобно. Когда мы начали делать AI-помощника для продавцов, то быстро поняли, что главное не в том, чтобы построить ещё одну модель, а в том, чтобы она реально помогала. Чтобы можно было поговорить с ней по-человечески и получить толковый ответ.
Я не думаю про будущее как про что-то большое и грандиозное. Просто хочется делать инструменты, которые работают здесь и сейчас, честно и понятно. Маленькими шагами, но с вниманием к деталям и к людям, для которых всё это делается. Это, наверное, и есть то, что даёт смысл всей нашей работе.
читать далее

30K+ RPS
160K+ продавцов

50M+ пользователей Маркет
10K+ CPU cores
100+ GPU для обучения и рантайма

Наши разработки
AI-помощник для продавцов
Разработали интеллектуального помощника на основе LLM. Система базируется на каскаде моделей: классификатор интентов маршрутизирует запрос, семантический поиск извлекает контекст, а генеративная модель формирует ответ. Для повышения качества поиска мы обучили собственные эмбеддеры через contrastive loss на синтетических данных. Сценарии аналитики реализованы через агентский runtime: вместо жёстких скриптов модель динамически управляет контекстом и вызывает внешние инструменты для получения real-time статистики.
MLOps
Мы разработали собственную MLOps-платформу на Python, которая работает поверх YT — это наш аналог Hadoop. Система полностью автоматизирует жизненный цикл моделей: от сбора данных и переобучения до валидации и развёртывания в продакшене. Это позволяет нам эффективно управлять десятками моделей на Catboost и обеспечивать их бесшовное обновление.
Нейросети
под нагрузкой
Кроме CatBoost, мы используем большие нейросети — от сотен миллионов до миллиардов параметров. Наша инфраструктура позволяет автоматически разворачивать их на GPU в виде сервисов. Эти сервисы выдерживают нагрузку в десятки тысяч запросов в секунду и оптимально распределяют вычислительные ресурсы между несколькими моделями одновременно.
Контент-система будущего
Мы управляем каталогом Маркета из миллиарда товаров, который постоянно меняется. Чтобы поиск был точным, а новые товары мгновенно попадали на витрину, наши ML-системы обрабатывают десятки тысяч позиций в секунду, извлекая все нужные параметры. Это возможно благодаря нашей основной технологии — созданию SoTA эмбеддингов из текстов и картинок, которые используются всеми ML-алгоритмами сервиса.
Ранжирование рекламы
Поиск — основной канал продаж на Маркете. Мы разработали систему платного продвижения, которая позволяет продавцам получать больше внимания пользователей. Для этого мы глубоко интегрировали рекламные механики во все этапы поискового ранжирования: от учёта ставок в алгоритмах подбора кандидатов до финального аукциона. Наша ключевая экспертиза — находить оптимальный баланс между релевантностью выдачи для покупателя и эффективностью рекламы для продавца
Стек

backend

ML

  • LLM
Читайте и смотрите
Wed Jan 14 2026 12:40:48 GMT+0300 (Moscow Standard Time)