Дмитрий Андреев

Системный архитектор и инженер-программист с многолетней практикой в проектировании высоконагруженных систем, управлении инженерными командами и внедрении критически важного ПО — от стартапов в сфере ИИ до системно значимых банков.

Астрахань / удаленно

Резюме Habr GitHub

Текущая позиция

Чем я занимаюсь сейчас

Руководитель направления

Clearway integrations

янв. 2025 г. — наст. время

Россия

Руководитель направления «Мониторинг и управление»

Возглавил направление разработки и сопровождения системы мониторинга корпоративного парка персональных ПК для крупного российского банка с флотом более 80 000 рабочих станций. Пришел в команду с критическими процессными и инфраструктурными дефицитами: хаотичная сборка с локальных машин разработчиков, ручная поставка дистрибутивов длительностью 80 часов, отсутствие архитектурной документации и инфраструктура разработки, размещенная в публичном облаке. За 12 месяцев сформировал масштабируемую команду, построил enterprise-grade контур CI/CD и выпустил два production-релиза, обеспечив непрерывность разработки и поставки на всех этапах трансформации.

Ключевые обязанности

Стратегическое и оперативное руководство направлением разработки системы мониторинга корпоративного парка ПК (80 000+), включая планирование релизов, управление техническим долгом и приоритизацию бэклога
Формирование, масштабирование и менторинг кросс-функциональной команды: расширение штата с 14 до 30 специалистов (программисты, QA, аналитики, архитекторы, владелец продукта, менеджер), организация найма и онбординга
Проектирование и внедрение автоматизированного контура CI/CD на базе GitLab CI, Terraform и cloud-init: zero-to-deploy развертывание всей подсистемы мониторинга из исходных текстов с автоматическим созданием ВМ и публикацией артефактов
Проектирование и развёртывание платформы наблюдаемости (observability) на базе Prometheus, Grafana и OpenSearch: централизованный сбор метрик и логов с 30+ сервисных подсистем, визуализация состояния инфраструктуры и настройка алертинга для оперативного реагирования
Организация и проведение нагрузочных испытаний системы мониторинга: подготовка тестовых сценариев, координация с инфраструктурной командой заказчика, анализ узких мест и верификация отказоустойчивости под нагрузкой
Проведение архитектурного аудита системы, восстановление и создание архитектурных артефактов и технической документации, полностью отсутствовавших при входе в проект
Управление взаимодействием со смежными командами, ответственными за компоненты продукта, обеспечение интеграционной согласованности и разрешение кросс-функциональных зависимостей
Внедрение метрик производительности разработки (velocity, commit frequency) и data-driven подхода к оценке динамики команды и прогнозированию сроков поставки
Обеспечение бесперебойной разработки и параллельной поставки релизов заказчику в период миграции инфраструктуры и построения автоматизации без простоев для существующих процессов

Основные достижения

Масштабирование команды x2 за 12 месяцев: Увеличил штат направления с 14 до 30 человек, в том числе удвоил состав тестировщиков и аналитиков, привел второго системного архитектора; построил процессы найма, онбординга и распределения задач, сохранив продуктивность в период активного роста
Zero-to-Deploy CI/CD: сокращение времени поставки с 80 часов до 1 часа: Спроектировал и реализовал инфраструктуру разработки, позволяющую автоматически развернуть всю подсистему мониторинга с нуля из исходных текстов 30+ микросервисов: Terraform и cloud-init создают виртуальные машины, инициализируют окружение и публикуют скомпилированные компоненты на целевые сервера, сократив time-to-deploy с 80 ручных часов до 1 часа полностью автоматизированного pipeline
Платформа наблюдаемости для 30+ сервисов: Развернул стек Prometheus + Grafana + OpenSearch, обеспечив централизованный сбор метрик и логов сервисов, визуализацию ключевых показателей доступности и производительности системы мониторинга, а также оперативный алертинг для команды сопровождения
Нагрузочные испытания с двукратным запасом по выдерживаемой нагрузке: Провёл полноценные нагрузочные тесты системы мониторинга, подтвердив стабильную работу при нагрузке, эквивалентной 160 000 рабочих станций, что обеспечило 100%-ный запас производительности относительно текущего флота заказчика (80 000 ПК) и гарантию масштабирования без деградации сервисов
Бесшовная миграция инфраструктуры разработки: Выполнил миграцию GitLab и трекера задач из публичного облака во внутренний периметр без остановки разработки и потери истории, обеспечив соответствие требованиям информационной безопасности и сохранив непрерывность delivery
10-кратный рост производительности разработчиков: Внедрил измерение commit velocity как метрику динамики команды; средний показатель вырос с 0,5 коммита в день до 5 коммитов в день на разработчика, что отражает стабилизацию процессов, снижение блокеров и повышение прозрачности задач
Архитектурный аудит и создание артефактов: Провел полный аудит существующей системы, восстановил и формализовал архитектурные документы, отсутствовавшие при входе, создав основу для дальнейшего масштабирования системы и onboarding новых инженеров
Два production-релиза за год с параллельной трансформацией: Выпустил два полноценных релиза системы мониторинга в промышленную эксплуатацию, включая промежуточный релиз, переданный заказчику в период активного построения CI/CD (6 месяцев); доказал возможность одновременной трансформации инфраструктуры и непрерывной поставки бизнес-функций
Налаживание cross-team взаимодействия: Выстроил регулярные интеграционные практики со смежными командами, ответственными за входящие в продукт компоненты, устранив ранее существовавшие задержки на стыках и обеспечив синхронизированную поставку фич по всему технологическому стеку продукта

LeadershipTeam ScalingHiringCI/CDGitLabTerraformCloud-initDevOpsSystem ArchitectureAuditRelease ManagementEnterprise Monitoring100k+ EndpointsBankingAgileZero-to-DeployInfrastructure as CodePerformance MetricsCross-Team CollaborationC#.NETPostgreSQLObservabilityGrafanaPrometheusOpenSearchLoad TestingPerformance Testing

Подробнее

Опыт работы

Избранные этапы карьеры

Все позиции

Ведущий системный архитектор

Бэлл Интегратор

авг. 2023 г. — дек. 2024 г.

Россия

Ведущий системный архитектор

Работал в роли ведущего системного архитектора и технического руководителя заказных консалтинговых проектов в банковском секторе. Отвечал за полный цикл enterprise delivery: от анализа требований и проработки архитектуры под существующие legacy-ограничения до запуска production-решений в инфраструктуре заказчика. В условиях строгих требований информационной безопасности и регуляторных норм банковской сферы сформировал кросс-функциональные команды, выстроил процессы Agile-разработки и развернул инфраструктуру CI/CD с нуля. Ключевой проект — создание HR-Tech платформы для крупного системно значимого банка, интегрированной с корпоративной экосистемой управления персоналом.

Ключевые обязанности

Анализ требований бизнес-заказчиков из банковского сектора и проработка целевой системной архитектуры с учетом legacy-ландшафта, регуляторных ограничений и требований информационной безопасности
Техническое руководство кросс-функциональной командой разработки: распределение задач между программистами, QA-инженерами, системными аналитиками и DevOps-специалистами; проведение архитектурных и код-ревью
Проектирование enterprise-решений на стеке ASP.NET Core / .NET Framework и Angular с интеграцией в существующий банковский контур через REST API и корпоративные сервисные шины
Создание с нуля инфраструктуры разработки и эксплуатации: настройка GitLab CI, контейнеризация сервисов в Docker, оркестрация в Kubernetes, управление инфраструктурой как кодом (IaC) на Terraform
Внедрение полного цикла Continuous Integration / Continuous Delivery, обеспечивающего автоматизированную сборку, тестирование и развертывание в закрытом контуре банка без нарушения требований ИБ
Планирование проектов, управление бэклогом и приоритизация задач в соответствии со сроками, бюджетом и ожиданиями стейкхолдеров со стороны заказчика
Проектирование схем данных в PostgreSQL с учетом требований к целостности, производительности и аудируемости персональных данных кандидатов

Основные достижения

HR-Tech платформа Промсвязьбанка (job.psbank.ru): Спроектировал с нуля и вывел в промышленную эксплуатацию систему публикации вакансий, управления откликами и цифрового формирования анкет кандидатов, интегрированную с корпоративными HR-системами банка; обеспечил end-to-end автоматизацию процесса подбора персонала от размещения вакансии до передачи данных в кадровый учет
Инфраструктура разработки с нуля: За короткий стартовый период развернул полноценный замкнутый контур разработки на базе GitLab CI, Docker и Kubernetes, обеспечив автоматизированную сборку, прогон тестов и деплой артефактов
Управление кросс-функциональной командой: Сформировал и выстроил эффективные процессы взаимодействия команды разработки, аналитиков и DevOps, достигнув предсказуемой скорости поставки фич в условиях консалтинговой разработки с жесткими сроками и фиксированным бюджетом
Enterprise-интеграция с банковским ландшафтом: Реализовал надежную интеграцию HR-платформы с действующими системами управления персоналом банка через корпоративные API-шлюзы, обеспечив синхронизацию статусов вакансий, откликов и кандидатских профилей в реальном времени
Terraform IaC и стандартизация сред: Внедрил подход Infrastructure as Code на Terraform, что позволило воспроизводимо разворачивать среды разработки, тестирования и промышленной эксплуатации, сократив время подготовки нового контура с нескольких дней до часов и исключив «дрейф конфигураций»
Архитектура под банковские ограничения: Разработал архитектурное решение с учетом требований сегментации сети, шифрования персональных данных кандидатов (включая ПДН и биографические данные) и аудита доступа, обеспечив соответствие внутренним стандартам ИБ банка и требованиям регулятора к обработке кадровых данных

System ArchitectureBankingFinTechHR-TechC#ASP.NET Core.NET FrameworkAngularPostgreSQLGitLab CIDockerKubernetesTerraformCI/CDDevOpsEnterprise IntegrationBacklog ManagementTeam Leadership

Подробнее

Technical Product Owner / Владелец продукта

МТС (MWS / MTS Cloud)

июнь 2021 г. — июль 2023 г.

Астрахань/Удаленно

Технический Product Owner (Cloud IaaS)

Владелец продукта и технический лидер направления IaaS-маркетплейса в крупнейшем российском облачном провайдере МТС. Вывел с нуля (zero-to-one) в коммерческую эксплуатацию сервис управления шаблонами виртуальных машин cloud.mts.ru/marketplace, ставший ключевым элементом экосистемы облачных продуктов. Осуществлял полный цикл product management: от стратегического роадмапа и формирования Agile-команды до архитектурного дизайна, code review и запуска production-инфраструктуры. Обеспечил соответствие решения требованиям информационной безопасности, корпоративным стандартам разработки и регуляторным нормам.

Ключевые обязанности

Управление продуктом & стратегия: Формирование видения продукта, роадмапа и приоритизация бэклога для облачного маркетплейса шаблонов ВМ; стратегическое и тактическое планирование развития IaaS-продукта в соответствии с OKR бизнес-юнита
Agile & Командное лидерство: Создание кросс-функциональной команды разработки с нуля; внедрение процессов Scrum/Kanban, спринт-планирование, ретроспективы и оценка в баллах пользовательских историй; менторинг разработчиков и проведение ревью кода артефактов
Техническая архитектура: Проектирование архитектуры высоконагруженного распределенного сервиса на микросервисной парадигме; проектирование API и интеграционных контрактов для взаимодействия с облачной платформой МТС
DevOps & Инфраструктура: Настройка CI/CD-конвейеров в GitLab CI, оркестрация контейнеров в Docker и Kubernetes; управление промышленным кластером и базами данных PostgreSQL; обеспечение наблюдаемости и отказоустойчивости сервиса
Курирование Backend & Frontend: Техническое руководство разработкой backend на Golang и frontend-компонентов на TypeScript; контроль качества кода, архитектурных решений и соблюдения стандартов безопасности
Управление стейкхолдерами: Взаимодействие с C-level, бизнес-аналитиками, юристами и службой информационной безопасности; согласование организационно-процессных и правовых аспектов запуска публичного маркетплейса
Аналитика & Решения на основе данных: Закладывание аналитического фундамента продукта; построение воронки метрик конверсии, churn rate и adoption rate шаблонов ВМ для принятия продуктовых решений на основе данных

Основные достижения (с метриками)

Zero-to-One Launch: За 12 месяцев с нуля разработал и вывел в коммерческую эксплуатацию сервис управления шаблонами виртуальных машин, интегрированный с публичным облаком МТС, обеспечивший самостоятельную подготовку ВМ для корпоративных клиентов
Масштабируемый каталог: Запустил в промышленную эксплуатацию 20 шаблонов виртуальных машин с наиболее востребованными ОС (Windows Server, Ubuntu, CentOS, Debian, Astra Linux) и готовыми прикладными решениями, сократив time-to-market развертывания типовой инфраструктуры заказчика с дней до минут
Экспоненциальный рост: Доказал масштабируемость архитектуры и достиг показателя 2x роста количества создаваемых ВМ на базе шаблонов от месяца к месяцу (month-over-month growth 2x), подтвердив product-market fit решения
Партнерская экосистема: Заложил архитектурный и процессный фундамент для интеграции внешних вендоров и ISV-партнеров, обеспечивший расширение ассортимента маркетплейса за счет сторонних приложений и конфигураций ВМ без модификации core-системы
Корпоративная безопасность & Комплаенс: Провел сервис через корпоративный аудит информационной безопасности МТС, реализовав требования к аутентификации, авторизации, шифрованию данных и изоляции мультитенантной среды на уровне Kubernetes namespaces и сетевых политик
Принятие решений на основе данных: Внедрил систему продуктовой аналитики, отслеживающую ключевые метрики: adoption rate шаблонов, конверсию из просмотра в создание ВМ, время жизни инстанса и паттерны использования, что позволило обосновать инвестиции в развитие маркетплейса на уровне топ-менеджмента
Процессная зрелость: Оптимизировал процесс доставки от коммита до промышленной среды через GitLab CI/CD и Kubernetes, сократив lead time для фичи с двух недель до 3-4 дней и достигнув частоты релизов 2-3 раза в спринт без прерывания работы промышленной среды

Product ManagementCloud ComputingIaaSMarketplaceKubernetesDockerGitLab CI/CDGolangTypeScriptPostgreSQLJiraConfluenceAgileScrumHighloadDevOpsVM TemplatesMicroservices

Подробнее

Весь опыт работы

Компетенции

Ключевые технические и управленческие навыки

Все навыки

Инженерное лидерство

Построение и руководство высокоэффективными инженерными организациями

Формирование командНаставничествоТехническая стратегияПодбор персонала+6

Cloud & DevOps

Инфраструктура, развертывание и операционное совершенство

AzureAlibaba CloudDockerKubernetes+10

Разработка серверных приложений и программных интерфейсов

Проектирование надежных и масштабируемых серверных систем

C++C#GolangASP.NET+13

Edge AI и встраиваемые системы

Оптимизация LLM для Edge-устройств, промышленная автоматизация и робототехника

Edge AILLMComputer VisionRobotics+8

Образование

Академический фундамент и квалификация

Подробнее

Инженер по специальности 2201

Таганрогский радиотехнический университет

Высшее образование — Инженер по специальности 2201 «ЭВМ, комплексы, системы и сети»

Младший инженер по специальности 2201

Астраханский колледж вычислительной техники

Среднее профессиональное образование — Специальность 2201 «Вычислительные машины, комплексы, системы и сети»