Разработчик объектного поиска

Яндекс помогает миллионам пользователей решать свои повседневные задачи: от выбора фильма и покупки билета в кино до планирования отпуска в незнакомой стране. Некоторые из этих задач носят информационный характер, другие приводят к необходимости долгого выбора.

Многие из этих задач связаны с объектами, существующими в реальном мире: фильмами, людьми, книгами, достопримечательностями, играми, музыкой, животными и т. п.

Наша команда занимается автоматическим сбором данных и построением базы таких объектов. Информация об объектах приходит из большого количества источников – Википедия, Кинопоиск, Яндекс.Музыка, специализированные сайты с данными и т. п. А затем сливается в объекты, обогащается, уточняется и приходит пользователю Яндекса в различных сценариях.

Примеры задач, которые решает наша команда:

  • Как обогатить данные по объектам и установить правильные связи между ними?
  • Как понять, что страницы про художника на двух разных сайтах – это страницы про один и тот же объект?
  • Как быстро подключить новый источник информации к базе?
  • Как наиболее эффективно сериализовать объект для нужд процесса сборки?
  • Как обеспечить свежесть и актуальность данных по объектам?
  • Как построить правильную модель иерархии для того или иного типа объектов?

Какие задачи вас ждут

  • совершенствовать инфраструктуру сборки объектной базы, улучшать качество данных, дополнять эти данные для создания новых возможностей использования объектного ответа в различных сценариях поиска.

Мы ждём, что вы

  • знаете Python и С++;
  • знаете базовые алгоритмы и структуры данных.

Будет плюсом, если вы

  • имеете опыт применения машинного обучения.
Спасибо за отклик!

Мы свяжемся с вами в течение недели.

Fri Feb 09 2024 12:47:58 GMT+0300 (Moscow Standard Time)