Обязанности:
Разработка, обучение и оптимизация моделей машинного обучения (NLP, классификация, генеративные модели, embeddings, retrieval).
Построение и улучшение пайплайнов обработки текстовых данных: очистка, разметка, препроцессинг, векторизация.
Разработка и интеграция моделей в продакшн (FastAPI, Docker, CI/CD).
Оптимизация inference: квантование, тюнинг, ускорение на GPU/CPU, работа с большими наборами данных.
Построение поисковых и рекомендательных систем (BM25, semantic search, reranking).
Разработка внутренней ML-инфраструктуры: мониторинг моделей, A/B-тесты, метрики качества.
Работа с большими языковыми моделями (LLMs): prompting, finetuning, RAG-архитектуры.
Взаимодействие с командой разработки для внедрения моделей в существующие сервисы.
Уверенный опыт работы ML Engineer/DS/NLP Engineer.
Глубокие знания в NLP: embeddings, transformers, seq2seq, классификация, NER, semantic similarity, retrieval.
Опыт работы с фреймворками: PyTorch, TensorFlow, HuggingFace Transformers, SentenceTransformers.
Умение строить и оптимизировать модели на GPU (CUDA, quantization, ускоренные attention-механизмы).
Опыт работы с векторными базами данных (Qdrant, Milvus, FAISS) и поисковыми движками (Elasticsearch, OpenSearch).
Знание Python на продакшн-уровне, опыт создания сервисов на FastAPI.
Уверенная работа с Docker, Git, Linux-средой.
Понимание принципов MLOps — будет плюсом.
Плюсом будет опыт работы с LLM (Qwen, Llama, DeepSeek) и построения RAG-систем.
Работа над крупными и технологическими проектами с упором на NLP и LLM.
Возможность предлагать и реализовывать собственные архитектурные решения.
Гибкий график, удалённый или гибридный формат.
Конкурентная зарплата, обсуждается индивидуально по уровню.
Доступ к GPU-ресурсам, современным ML-стекам, крупным датасетам.
Профессиональный рост: участие в конференциях, internal R&D, разработка собственных моделей.
Дружная команда, минимум бюрократии, быстрые циклы разработки