Обязанности
Твоя роль — проектирование устойчивых и масштабируемых AI-систем.
AI Architecture: проектировать Agent Orchestrator, RAG-архитектуры и многошаговые AI-потоки (multi-step flows).
LLM & Model Layer: работать с несколькими LLM, настраивать Model Router и оптимизировать стоимость, задержку (latency) и использование токенов.
Performance & Scaling: оптимизировать работу GPU, пропускную способность (throughput) и настраивать автоскейлинг для high-load сценариев.
Safety & Observability: внедрять механизмы защиты от галлюцинаций и промпт-инъекций, настраивать AI-tracing и мониторинг поведения агентов.
Требования
Бэкграунд: ты в первую очередь отличный Python-разработчик (Production-level, FastAPI, Async) с опытом работы от 2 лет и выше.
Экспертиза в ИИ: глубокое понимание LLM, RAG (embedding pipelines, vector DB) и архитектуры ИИ-агентов.
Инструментарий: опыт работы с LangChain, Haystack или LlamaIndex, а также с векторными БД (Milvus, Pinecone и др.).
Системный подход: понимание принципов работы распределенных систем (K8s, Kafka) и API design (REST/gRPC).
Условия