Технический менеджер в платформу Observability

Платформа Observability Яндекса позволяет легко и быстро получить однозначный ответ о состоянии систем в любой момент.

В состав платформы входят количественный мониторинг, алертинг, система нотификаций, логи и трейсы. Практически все команды Яндекса пользуются возможностями платформы для мониторинга состояния своих сервисов — как внешних, так и внутренних. Кроме этого, сервис Мониторинг доступен пользователям Yandex Cloud.

Вызовы, которые перед нами стоят:

  • Построение единой платформы, в которую легко, удобно и по общим принципам встраиваются другие сервисы, позволяющие пользователям быстро получать ответ о состоянии своих систем на основе всех имеющихся в платформе данных
  • Развитие новых для нас сервисов — логов и трейсов — и встраивание их в платформу
  • Упрощение порога входа для пользователей и решение популярных пользовательских сценариев из коробки. В качестве примеров можно привести автоматическую поставку метрик, дашбордов и алертов от сервисов, используемых пользователями, развитие комьюнити и инструментов для шеринга популярных решений
  • Поддержка в платформе опенсорс-решений: Prometheus, Kubernetes, Grafana и других

Наша команда
Мы работаем в матричной структуре. У нас несколько выделенных команд, которые совместно занимаются развитием платформы: бэкенд, фронтенд, менеджеры, дизайнеры и системные администраторы.

Мы ищем технического продуктового или проектного менеджера, который вместе с нами будет отвечать за развитие платформы в целом и за отдельные её направления.

Какие задачи вас ждут

Сопровождение и развитие сервиса Yandex Cloud Logging
Сервис Yandex Cloud Logging позволяет пользователям Yandex Cloud читать и записывать логи сервисов и пользовательских приложений. Его также активно используют команды сервисов Yandex Cloud.

Мы планируем наращивать функциональность для решения большего количества пользовательских сценариев: построение графиков и дашбордов по логам, аналитика по логам, алерты по данным из логов, интеграция с другими сервисами Yandex Cloud и многое другое. Кроме этого, перед нами стоит большая задача: построить единую платформу Observability, которая позволит пользователям Yandex Cloud работать с метриками, логами, трейсами и алертами в единой системе.

Сопровождение и развитие внутреннего сервиса логирования
Мы разрабатываем систему, которая собирает данные с пользовательских хостов и приложений в виде логов и позволяет оперативно находить, наблюдать события в приложении и реагировать на них. Уже сейчас сервис встроен в единую платформу Observability и позволяет пользователям работать со всей телеметрией их сервисов в режиме единого окна. Нам предстоит наращивать функциональность и увеличивать поток на запись в систему — уже сейчас это более 16 Гбит/с потока на запись.

В разработке мы ориентируемся на Datadog, Grafana Loki, Scuba и другие популярные сервисы.

Сопровождение и развитие Unified Agent — агента для поставки телеметрии
Каждый из многочисленных сервисов Яндекса публикует логи и метрики, а Unified Agent запускается вместе с сервисом и отвечает за сбор, первичную обработку, локальное хранение данных и их передачу в централизованные системы мониторинга и поставки. Наши ближайшие аналоги — Fluentd, Logstash, Amazon CloudWatch Agent, Datadog Agent. У агента гибкий язык конфигурирования потоков данных, который позволяет произвольно стыковать источники данных с получателями и промежуточными фильтрами. С помощью системы плагинов можно легко добавлять новые типы источников, получателей и фильтров.

Агент запускается в Яндексе на десятках тысяч контейнеров, и его оптимизация принесёт существенную пользу компании. Помимо этого, агент входит в состав Yandex Cloud как основное средство сбора метрик с виртуальных машин — вы можете самостоятельно попробовать его в деле. В ближайшее время мы планируем опубликовать исходный код агента и развивать его как опенсорс-решение.

Мы ждём, что вы

  • Отвечали за развитие продукта или отдельных его частей
  • Обладаете отличными навыками управления проектами, планирования и приоритизации задач
  • Обладаете аналитическими навыками, способны анализировать данные, извлекать ценные инсайты и принимать обоснованные решения
  • Умеете расставлять приоритеты и решать задачи в срок
  • Умеете управлять обсуждениями и фиксировать результаты
  • Точно и внятно выражаете мысли устно и письменно, разговариваете с разработчиками на одном языке
  • Хотите погрузиться в предметную область и стать экспертом в области инфраструктуры распределённых систем
  • Знаете инструменты мониторинга, трассировки и анализа логов, такие как Prometheus, Grafana, ELK, Jaeger и другие (будет преимуществом)

Что мы предлагаем

Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят стоматология, ежегодные чекапы, неотложная помощь за рубежом, лечение критических заболеваний, в том числе онкологии, и страхование от несчастных случаев.

А также:
  • психотерапия в офисе или онлайн-сервисах;
  • лазерная коррекция зрения через год работы;
  • ведение беременности и роды — через два года.
Страховка для родственников по системе 80/20

Мы оплачиваем 80% стоимости ДМС для детей и супругов, вы — остальные 20%.

В Яндексе есть всё, чтобы постоянно развиваться и учиться новому: внутренняя образовательная платформа, менторство и программы для начинающих и опытных руководителей.

А также:
  • оплата участия в профильных конференциях;
  • скидка 50% на изучение иностранных языков.

Кроме того, в Яндексе есть внутренние проекты, где наши сотрудники делятся экспертизой, обсуждают сложные темы и разбирают кейсы своих проектов.

Во всех крупных офисах Яндекса есть спортзалы со всем необходимым: тренажёрами, спортивным инвентарём, душевыми, шкафчиками для одежды и вещей.

Можете заниматься самостоятельно, а можете с корпоративным тренером.

А также:
  • бесплатные онлайн-тренировки с FITMOST;
  • скидки в фитнес-клубах, бассейнах, студиях йоги, скалодромах и других местах.
Спортивный клуб Яндекса

В Яндексе есть спортивный клуб и много спортивных команд. У них есть свои лидеры, чаты, программы тренировок. А ещё они регулярно участвуют в забегах, триатлонах, «Гонке героев», футбольных и других соревнованиях.

Вы сможете присоединиться к существующим командам или собрать свою.

Гибкий график

У нас нет фиксированного времени начала и конца рабочего дня — работайте так, как удобно вам и вашей команде.

Гибридный формат

Если для ваших задач не нужно быть в офисе каждый день, можно приходить 2–3 раза в неделю.

Всё для детей

Страхование, детские дни в офисе, подарки на рождение детей и чекапы при планировании беременности.

Жилищные займы

Льготная ставка на покупку жилья и улучшение жилищных условий — в зависимости от стажа, позиции и результатов ревью. Действует для сотрудников, работающих в российских офисах Яндекса.

Спасибо за отклик!

Мы свяжемся с вами в течение недели.

Fri Feb 09 2024 12:47:58 GMT+0300 (Moscow Standard Time)