ML-разработчик в группу данных Яндекс Переводчика

Наш сервис помогает переводить тексты, веб-страницы, фото и видео на 100+ языках B2C- и B2B-клиентам, в том числе многим сервисам Яндекса. Мы используем нейросетевые модели, которых обучаем на терабайтах качественных текстов, а чтобы их получить, обрабатываем петабайты данных, собранных роботами Яндекса со всего интернета. Эта задача требует как больших вычислительных мощностей, так и применения ML-моделей на разных этапах обработки данных.

Мы ищем разработчика, который поможет улучшать пайплайны сбора данных для обучения: повышать стабильность и прозрачность кода и воспроизводимость запусков, обучать ML-модели.

Какие задачи вас ждут

Улучшения качества собираемых данных
В основе всех ML-моделей лежат данные, и чем они лучше, тем лучше качество получившейся модели. Наши пайплайны сбора данных состоят из большого количества отдельных ML-моделей, запускаемых на больших данных. Вам предстоит повышать качество моделей перевода за счёт улучшения эвристик и ML-моделей для сбора данных.

Обучение и оценка качества ML-моделей
Конечная цель вашей работы — улучшить качество переводов, которые видят пользователи. Вы будете обучать модели и оценивать их качество. Эта сложная задача, в решении которой вы столкнётесь как с автоматическими, так и с ручными метриками оценки.

Мы ждём, что вы

  • Разрабатывали на C++ и Python
  • Знакомы с методами машинного обучения

Будет плюсом, если вы

  • Работали с большими данными, знакомы с парадигмой MapReduce
  • Знакомы с SQL (используем его поверх MapReduce, чтобы сэкономить время)
  • Знакомы с Deep Learning в NLP (Nature Language Processing), работали с LLM (Large Language Models)

Что мы предлагаем

Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят стоматология, ежегодные чекапы, неотложная помощь за рубежом, лечение критических заболеваний, в том числе онкологии, и страхование от несчастных случаев.

А также:
  • психотерапия в офисе или онлайн-сервисах;
  • лазерная коррекция зрения через год работы;
  • ведение беременности и роды — через два года.
Страховка для родственников по системе 80/20

Мы оплачиваем 80% стоимости ДМС для детей и супругов, вы — остальные 20%.

В Яндексе есть всё, чтобы постоянно развиваться и учиться новому: внутренняя образовательная платформа, менторство и программы для начинающих и опытных руководителей.

А также:
  • оплата участия в профильных конференциях;
  • скидка 50% на изучение иностранных языков.

Кроме того, в Яндексе есть внутренние проекты, где наши сотрудники делятся экспертизой, обсуждают сложные темы и разбирают кейсы своих проектов.

Во всех крупных офисах Яндекса есть спортзалы со всем необходимым: тренажёрами, спортивным инвентарём, душевыми, шкафчиками для одежды и вещей.

Можете заниматься самостоятельно, а можете с корпоративным тренером.

А также:
  • бесплатные онлайн-тренировки с FITMOST;
  • скидки в фитнес-клубах, бассейнах, студиях йоги, скалодромах и других местах.
Спортивный клуб Яндекса

В Яндексе есть спортивный клуб и много спортивных команд. У них есть свои лидеры, чаты, программы тренировок. А ещё они регулярно участвуют в забегах, триатлонах, «Гонке героев», футбольных и других соревнованиях.

Вы сможете присоединиться к существующим командам или собрать свою.

Гибкий график

У нас нет фиксированного времени начала и конца рабочего дня — работайте так, как удобно вам и вашей команде.

Гибридный формат

Если для ваших задач не нужно быть в офисе каждый день, можно приходить 2–3 раза в неделю.

Всё для детей

Страхование, детские дни в офисе, подарки на рождение детей и чекапы при планировании беременности.

Жилищные займы

Льготная ставка на покупку жилья и улучшение жилищных условий — в зависимости от стажа, позиции и результатов ревью. Действует для сотрудников, работающих в российских офисах Яндекса.

Спасибо за отклик!

Мы свяжемся с вами в течение недели.

Fri Feb 09 2024 12:47:58 GMT+0300 (Moscow Standard Time)