Задачи, которые ты будешь выполнять:
Установка и настройка сервисов в Kubernetes
Установка, обновление и патчинг KubeFlow, MLFlow и Linux (production-окружение)
Мониторинг и анализ производительности кластеров (CPU, RAM, I/O, Network)
Управление жизненным циклом ML-моделей:
автоматизация деплоя (inference)
мониторинг производительности и качества моделей
настройка CI/CD пайплайнов
Поддержка команд Data Engineering / Data Science в части инфраструктуры
Администрирование и оптимизация распределения ресурсов Kubernetes
Обеспечение безопасности и разграничения доступов (Kerberos, ACL, RBAC)
Участие в разработке и развитии архитектуры Big Data платформы
Нам по пути, если у тебя есть:
Высшее техническое образование
Опыт администрирования Linux (production level)
Опыт работы с:
Kubernetes
KubeFlow/MLFlow
Cassandra
Kafka, Zookeeper
Git
Опыт развертывания и масштабирования кластеров (Cassandra, KubeFlow)
Навыки автоматизации (Bash/Python)
Понимание CI/CD принципов (GitLab CI/ArgoCD/GitHub Actions - будет плюсом)
Понимание архитектуры ETL/ELT процессов
Понимание принципов работы распределённых систем
Будет плюсом:
Мы предлагаем тебе: