Обязанности:
• Участие в анализе архитектуры low-code BPM-платформы и микросервисных решений с точки зрения эксплуатации, отказоустойчивости и сопровождаемости;
• Формирование и предоставление рекомендаций по улучшению архитектуры сервисов, интеграций и инфраструктурных решений с целью повышения стабильности и масштабируемости;
• Анализ архитектурных решений при внедрении новых компонентов, интеграций и изменений в продуктивной среде;
• Участие в разборе архитектурных причин инцидентов и деградаций производительности;
• Оценка технических и операционных рисков при изменениях архитектуры и конфигураций
• Содействие внедрению best practices эксплуатации, мониторинга и логирования распределённых систем.
• Обеспечение сопровождения тестовых и продуктивных сред low-code BPM-платформы;
• Анализ и устранение сложных и критических инцидентов 3-й линии поддержки в микросервисной архитектуре;
• Диагностика проблем на уровне:
• backend-сервисов (Java / Spring Boot),
• интеграций и API,
• очередей сообщений (Kafka),
• баз данных (PostgreSQL, Oracle),
• поисковых систем (Elasticsearch);
• Анализ логов и трассировок с использованием централизованных систем логирования (ELK);
• Анализ метрик, алертов и показателей производительности в системах мониторинга (Grafana);
• Участие в релизах, деплое и сопровождении изменений в рамках CI/CD и GitOps-процессов (ArgoCD);
• Контроль стабильности сервисов в Kubernetes-среде, анализ состояния ресурсов и окружений;
• Проведение анализа первопричин инцидентов (RCA), подготовка корректирующих и предупреждающих мероприятий;
• Взаимодействие с командами разработки, DevOps и 1–2 линией поддержки для устранения системных проблем;
• Участие в стабилизации платформы после релизов и внедрений.
• Консультирование и методологическая поддержка специалистов 1–2 линий и менее опытных инженеров 3-й линии поддержки;
• Участие в обучающих сессиях, разборе инцидентов и внутрикомандных технических встречах;
• Взаимодействие с архитекторами, разработчиками, DevOps и другими подразделениями для обеспечения устойчивой эксплуатации платформы;
• Взаимодействие с подразделениями информационной безопасности по вопросам эксплуатации и устранения уязвимостей;
• Подготовка и актуализация эксплуатационной документации, инструкций и runbook’ов;
• Ведение и развитие базы знаний по инцидентам, типовым проблемам и решениям;
• Документирование причин инцидентов, технических ограничений и рекомендаций по улучшению эксплуатации;
• Участие в формировании стандартов и регламентов поддержки и сопровождения.
Требования:
Став частью команды Forte, ты получишь:
- Конкурентную заработную плату и бонусы за персональную эффективность.
- График работы 5/2 с 9:00-18:00 в комфортном офисе;
- Жизнь внутри компании с ее корпоративными мероприятиями: тимбилдинги, челленджи, спортивные турниры, благотворительные акции;
- Заботу о здоровье с медицинским страхованием, а также DayOff в честь дня рождения и за выслугу лет;
- Выгодную рассрочку в крупные фитнес-клубы;
- Доступ к корпоративной библиотеке для непрерывного обучения и саморазвития.