Назад к опыту работы
Опыт работы

Руководитель направления

Clearway integrations
Россия

Руководитель направления «Мониторинг и управление»

Возглавил направление разработки и сопровождения системы мониторинга корпоративного парка персональных ПК для крупного российского банка с флотом более 80 000 рабочих станций. Пришел в команду с критическими процессными и инфраструктурными дефицитами: хаотичная сборка с локальных машин разработчиков, ручная поставка дистрибутивов длительностью 80 часов, отсутствие архитектурной документации и инфраструктура разработки, размещенная в публичном облаке. За 12 месяцев сформировал масштабируемую команду, построил enterprise-grade контур CI/CD и выпустил два production-релиза, обеспечив непрерывность разработки и поставки на всех этапах трансформации.

Ключевые обязанности

  • Стратегическое и оперативное руководство направлением разработки системы мониторинга корпоративного парка ПК (80 000+), включая планирование релизов, управление техническим долгом и приоритизацию бэклога
  • Формирование, масштабирование и менторинг кросс-функциональной команды: расширение штата с 14 до 30 специалистов (программисты, QA, аналитики, архитекторы, владелец продукта, менеджер), организация найма и онбординга
  • Проектирование и внедрение автоматизированного контура CI/CD на базе GitLab CI, Terraform и cloud-init: zero-to-deploy развертывание всей подсистемы мониторинга из исходных текстов с автоматическим созданием ВМ и публикацией артефактов
  • Проектирование и развёртывание платформы наблюдаемости (observability) на базе Prometheus, Grafana и OpenSearch: централизованный сбор метрик и логов с 30+ сервисных подсистем, визуализация состояния инфраструктуры и настройка алертинга для оперативного реагирования
  • Организация и проведение нагрузочных испытаний системы мониторинга: подготовка тестовых сценариев, координация с инфраструктурной командой заказчика, анализ узких мест и верификация отказоустойчивости под нагрузкой
  • Проведение архитектурного аудита системы, восстановление и создание архитектурных артефактов и технической документации, полностью отсутствовавших при входе в проект
  • Управление взаимодействием со смежными командами, ответственными за компоненты продукта, обеспечение интеграционной согласованности и разрешение кросс-функциональных зависимостей
  • Внедрение метрик производительности разработки (velocity, commit frequency) и data-driven подхода к оценке динамики команды и прогнозированию сроков поставки
  • Обеспечение бесперебойной разработки и параллельной поставки релизов заказчику в период миграции инфраструктуры и построения автоматизации без простоев для существующих процессов

Основные достижения

  • Масштабирование команды x2 за 12 месяцев: Увеличил штат направления с 14 до 30 человек, в том числе удвоил состав тестировщиков и аналитиков, привел второго системного архитектора; построил процессы найма, онбординга и распределения задач, сохранив продуктивность в период активного роста
  • Zero-to-Deploy CI/CD: сокращение времени поставки с 80 часов до 1 часа: Спроектировал и реализовал инфраструктуру разработки, позволяющую автоматически развернуть всю подсистему мониторинга с нуля из исходных текстов 30+ микросервисов: Terraform и cloud-init создают виртуальные машины, инициализируют окружение и публикуют скомпилированные компоненты на целевые сервера, сократив time-to-deploy с 80 ручных часов до 1 часа полностью автоматизированного pipeline
  • Платформа наблюдаемости для 30+ сервисов: Развернул стек Prometheus + Grafana + OpenSearch, обеспечив централизованный сбор метрик и логов сервисов, визуализацию ключевых показателей доступности и производительности системы мониторинга, а также оперативный алертинг для команды сопровождения
  • Нагрузочные испытания с двукратным запасом по выдерживаемой нагрузке: Провёл полноценные нагрузочные тесты системы мониторинга, подтвердив стабильную работу при нагрузке, эквивалентной 160 000 рабочих станций, что обеспечило 100%-ный запас производительности относительно текущего флота заказчика (80 000 ПК) и гарантию масштабирования без деградации сервисов
  • Бесшовная миграция инфраструктуры разработки: Выполнил миграцию GitLab и трекера задач из публичного облака во внутренний периметр без остановки разработки и потери истории, обеспечив соответствие требованиям информационной безопасности и сохранив непрерывность delivery
  • 10-кратный рост производительности разработчиков: Внедрил измерение commit velocity как метрику динамики команды; средний показатель вырос с 0,5 коммита в день до 5 коммитов в день на разработчика, что отражает стабилизацию процессов, снижение блокеров и повышение прозрачности задач
  • Архитектурный аудит и создание артефактов: Провел полный аудит существующей системы, восстановил и формализовал архитектурные документы, отсутствовавшие при входе, создав основу для дальнейшего масштабирования системы и onboarding новых инженеров
  • Два production-релиза за год с параллельной трансформацией: Выпустил два полноценных релиза системы мониторинга в промышленную эксплуатацию, включая промежуточный релиз, переданный заказчику в период активного построения CI/CD (6 месяцев); доказал возможность одновременной трансформации инфраструктуры и непрерывной поставки бизнес-функций
  • Налаживание cross-team взаимодействия: Выстроил регулярные интеграционные практики со смежными командами, ответственными за входящие в продукт компоненты, устранив ранее существовавшие задержки на стыках и обеспечив синхронизированную поставку фич по всему технологическому стеку продукта

Технологии и навыки

LeadershipTeam ScalingHiringCI/CDGitLabTerraformCloud-initDevOpsSystem ArchitectureAuditRelease ManagementEnterprise Monitoring100k+ EndpointsBankingAgileZero-to-DeployInfrastructure as CodePerformance MetricsCross-Team CollaborationC#.NETPostgreSQLObservabilityGrafanaPrometheusOpenSearchLoad TestingPerformance Testing