Благодаря постоянным усовершенствованиям алгоритмов ранжирования люди могут за считаные секунды получать ответы на сложные и замысловатые вопросы. Мы предлагаем вам возможность работать в команде, от которой напрямую зависит качество поисковой выдачи Яндекса.
По сути дела, наша работа — это непрерывное соревнование по машинному обучению. Базовый уровень, который мы стараемся превзойти, невероятно высок: согласно метрикам качества, алгоритм веб-ранжирования Яндекса часто оказывается впереди конкурентов в русскоязычном сегменте. Поэтому каждый новый шаг в улучшении дается непросто, но мы следим за последними результатами в смежных научных областях и используем передовой опыт в своих экспериментах и внедряемых моделях.
====Вам предстоит:
- близко познакомиться с инфраструктурой Поиска — ключевого сервиса Яндекса;
- ежедневно обрабатывать колоссальные объемы данных;
- реализовывать свои идеи от прототипа через эксперименты и оценку внедряемости до продуктового кода, который будет работать при каждом запросе в поиске Яндекса;
- применять свои знания машинного обучения для анализа самых разнообразных пользовательских запросов;
- находить закономерности в поведении пользователей, используя множество поисковых логов;
- в составе большой команды единомышленников участвовать в подготовке таких запусков, как ((https://yandex.ru/blog/company/algoritm-palekh-kak-neyronnye-seti-pomogayut-poisku-yandeksa «Палех»)) и ((https://yandex.ru/korolev/ «Королёв»));
- увидеть пользу от проделанной работы на графиках возвращаемости пользователей.
====Для работы вам понадобятся:
- уверенные знания C++ и STL (большая часть программного кода в Поиске написана на С++);
- владение основными алгоритмами и структурами данных (эффективность кода критична как для поискового рантайма, так и для экспериментальных проектов: чем эффективнее решение, тем быстрее вы сможете проверить гипотезу);
- знание основ машинного обучения и математической статистики, а также опыт их практического применения (вам не должны быть чужды термины «регрессия, классификация, кросс-валидация, нейронная сеть, математическое ожидание» и др., особенно приветствуется практический опыт решения задач автоматической обработки текстов);
- опыт работы разработчиком или исследователем от одного года (мы особенно заинтересованы в людях, имеющих опыт в анализе неструктурированных данных и в машинном обучении).
====Плюсами будут:
- знакомство с нейронными сетями и глубоким обучением;
- знание Python и bash;
- опыт работы с моделью вычислений MapReduce.