• Разработка и поддержка микросервисной инфраструктуры для инференса скоринговых моделей.
• Контейнеризация ML-моделей с использованием Docker и оркестрация сервисов через Kubernetes (K8s).
• Разработка и поддержка сервисов для деплоя и инференса моделей (REST/gRPC микросервисы).
• Интеграция с ML-platform инструментами: MLflow, BentoML, Seldon Core или аналогичными ML-serving решениями.
• Администрирование серверной инфраструктуры для ML-платформы.
• Поддержка и администрирование инфраструктурных сервисов: o Мониторинг/наблюдаемость (Prometheus, Grafana) o логирование (Loki) o объектное хранилище (MinIO) o базы данных (PostgreSQL).
• Настройка мониторинга, алертинга и наблюдаемости ML-сервисов.
• Управление доступами пользователей и сервисов (создание учетных записей, выдача прав).
• Планирование ресурсов и capacity planning под нагрузки инференса моделей.
• Настройка и поддержка CI/CD процессов (GitLab CI/CD) для сборки и деплоя сервисов.
• Взаимодействие с командами Data Science при внедрении моделей в production.
• Опыт работы с ML/MLOps инфраструктурой или платформами для деплоя моделей, понимание полного жизненного цикла ML-моделей (ML lifecycle): разработка, управление версиями, деплой, мониторинг и сопровождение моделей в production