AI Inference Engineer
Elite Business Group
Казахстан, Алматы, Бостандыкский район
3 дня назад
Иностранная IT-компания в поиске талантливых Задачи Оптимизация LLM (quantization, distillation). TensorRT, ONNX Runtime, vLLM. Edge deployment (Coral TPU, Jetson). Latency cost optimization. Требования 3+ года inference, TensorFlow Serving. C++ Python, ...
almaty.hh.kz