Что нужно делать?
1. Разработка и доработка ML-моделей
* Разработка моделей машинного обучения и глубокого обучения (CV, NLP, Multimodal, VLM).
* Использование фреймворков: PyTorch, TensorFlow, Hugging Face Transformers.
* Тонкая настройка (fine-tuning) готовых моделей на собственных данных.
* Конвертация моделей в ONNX и оптимизация с помощью TensorRT для ускорения инференса.
2. Работа с данными
* Предобработка, очистка и анализ больших объёмов данных.
* Взаимодействие с VectorDB (например, FAISS, Chroma, Weaviate, Pinecone) в задачах RAG.
3. RAG и векторный поиск
* Проектирование систем Retrieval-Augmented Generation (RAG).
* Индексация документов, извлечение контекста с помощью embedding-моделей.
* Интеграция с LLM (в том числе через Hugging Face или OpenAI API).
* Построение пайплайнов для чата с документами или внутренней базы знаний.
4. Деплой и продакшн
* Разработка REST API с использованием FastAPI или Flask.
* Контейнеризация моделей и приложений с помощью Docker и Docker + GPU (nvidia-docker).
* Оркестрация и масштабирование через Kubernetes.
* Работа с RabbitMQ для асинхронной очереди задач и микросервисной архитектуры.
5. Мониторинг и сопровождение
* Мониторинг качества и производительности моделей в продакшене (latency, drift, accuracy).
* Логирование, алерты, перезапуск пайплайнов при сбоях.
* Регулярное переобучение и откат моделей при необходимости.
6. Взаимодействие в команде
* Совместная работа с DevOps, аналитиками, инженерами и продуктовой командой.
* Участие в код-ревью, проектировании архитектуры решений.
* Поддержка экспериментов с LLM/VLM и их интеграция в реальные продукты.
Условия: