Разработчик оркестратора жизненного цикла серверов HaaS

У Яндекса большой парк серверов, распределённых по нескольким дата-центрам и обслуживающих внутренние облака Поиска, Cloud и других сервисов Яндекса. Мы строим систему, которая позволяет автоматически управлять серверами внутренних облаков и доводить их утилизацию до максимума. Сейчас система управляет примерно 98% мощностей компании — сотнями тысяч серверов, на которых запущены миллионы экземпляров наших приложений.

Наша команда разрабатывает систему, которая предоставляет пользователям оборудование как сервис (HaaS) и позволяет:

  • автоматизировать процессы управления серверами, диагностировать и устранять проблемы;
  • обеспечивать работоспособность серверной инфраструктуры Яндекса;
  • создавать инструментарий для координации плановых работ над серверами.

Какие задачи вас ждут

  • разрабатывать, развивать и поддерживать систему управления серверами внутреннего облака Яндекса;
  • работать с большими объёмами данных;
  • поддерживать синхронизацию систем и компонентов, создавать сложную распределённую систему, которая взаимодействует с большим количеством сервисов;
  • разрабатывать серверную часть распределённой системы и утилиты, которые запускаются в командной строке;
  • взаимодействовать с командами RnD, NOC, SRE, дата-центров, внутренней инфраструктуры и другими пользователями.

Мы ждём, что вы

  • разрабатывали на Python и/или Go;
  • умеете писать рабочий, поддерживаемый и тестируемый код;
  • локализовывали и устраняли проблемы в распределённых системах;
  • понимаете, как устроен стек TCP/IP;
  • разрабатывали в POSIX-окружении;
  • проектировали, разрабатывали и сопровождали высоконагруженные распределённые сервисы.
Спасибо за отклик!

Мы свяжемся с вами в течение недели.

Fri Feb 09 2024 12:47:58 GMT+0300 (Moscow Standard Time)