Исследователь-разработчик в Поиск

Благодаря постоянным усовершенствованиям алгоритмов ранжирования люди могут за считаные секунды получать ответы на сложные и замысловатые вопросы. Мы предлагаем вам возможность работать в команде, от которой напрямую зависит качество поисковой выдачи Яндекса.

По сути дела, наша работа — это непрерывное соревнование по машинному обучению. Базовый уровень, который мы стараемся превзойти, невероятно высок: согласно метрикам качества, алгоритм веб-ранжирования Яндекса часто оказывается впереди конкурентов в русскоязычном сегменте. Поэтому каждый новый шаг в улучшении дается непросто, но мы следим за последними результатами в смежных научных областях и используем передовой опыт в своих экспериментах и внедряемых моделях.

====Вам предстоит:

близко познакомиться с инфраструктурой Поиска — ключевого сервиса Яндекса;
ежедневно обрабатывать колоссальные объемы данных;
реализовывать свои идеи от прототипа через эксперименты и оценку внедряемости до продуктового кода, который будет работать при каждом запросе в поиске Яндекса;
применять свои знания машинного обучения для анализа самых разнообразных пользовательских запросов;
находить закономерности в поведении пользователей, используя множество поисковых логов;
в составе большой команды единомышленников участвовать в подготовке таких запусков, как ((https://yandex.ru/blog/company/algoritm-palekh-kak-neyronnye-seti-pomogayut-poisku-yandeksa «Палех»)) и ((https://yandex.ru/korolev/ «Королёв»));
увидеть пользу от проделанной работы на графиках возвращаемости пользователей.

====Для работы вам понадобятся:

уверенные знания C++ и STL (большая часть программного кода в Поиске написана на С++);
владение основными алгоритмами и структурами данных (эффективность кода критична как для поискового рантайма, так и для экспериментальных проектов: чем эффективнее решение, тем быстрее вы сможете проверить гипотезу);
знание основ машинного обучения и математической статистики, а также опыт их практического применения (вам не должны быть чужды термины «регрессия, классификация, кросс-валидация, нейронная сеть, математическое ожидание» и др., особенно приветствуется практический опыт решения задач автоматической обработки текстов);
опыт работы разработчиком или исследователем от одного года (мы особенно заинтересованы в людях, имеющих опыт в анализе неструктурированных данных и в машинном обучении).

====Плюсами будут: