Senior HPC / GPU Infrastructure Engineer

Small, ТМ (Скиф Трейд, ТОО) Казахстан, Алматы 2026-03-06 13:18:13

Описание

On-prem GPU-кластер для training/R&D (8× NVIDIA H200, 2 TB RAM/node, HPE, Slurm, Lustre, InfiniBand).

Ищем инженера в полное ownership, который сам спроектирует и выстроит архитектуру эксплуатации: стандарты, наблюдаемость, безопасность, производительность.
Мы строим ML-платформу практически с нуля и можем предложить максимальную свободу по решениям — важно, чтобы платформа работала и была удобной для ML-команды.

Задачи:
  • Workload orchestration (Slurm / HPC) — очереди/partitions, политики приоритетов и лимитов, fair-share, GRES, сопровождение multi-node training.
  • Compute runtime (GPU + контейнеры) — NVIDIA drivers, CUDA/driver compatibility, стабильные и воспроизводимые контейнерные окружения (в т.ч. под training).
  • Data plane (Storage) — эксплуатация Lustre, права/квоты/striping, I/O tuning и работа с локальными NVMe (scratch/cache).
  • Network fabric (Connectivity + InfiniBand) — routing/VLAN/DNS, связность кластера с внутренними сервисами, базовая эксплуатация и диагностика InfiniBand.
  • Identity, access & multi-tenancy (Security) — централизованная аутентификация (FreeIPA/LDAP), разграничение доступа к ресурсам/данным, sudo policies.
  • Reliability & operations (Observability + инциденты + perf debugging) — мониторинг/алерты (Prometheus/Grafana), runbooks, инцидент-менеджмент, системный troubleshooting и поиск узких мест (Slurm/GPU/Storage/Network), capacity planning.

Ближайшие задачи:

  • Стабилизировать и стандартизировать эксплуатацию (процессы, мониторинг, типовые сценарии).
  • Развести training и inference workloads (политики, изоляция, ресурсные границы).
  • Спроектировать inference-слой (Kubernetes-based) и план внедрения.

Требования:

  • Senior Linux (storage/FS/ACL, perf troubleshooting).
  • Практический опыт эксплуатации Slurm.
  • Опыт с NVIDIA GPU-серверами (drivers/CUDA/runtime, диагностика).
  • Понимание HPC и распределённых задач.
  • Сильная сеть: routing / VLAN.

Будет плюсом:

  • Lustre, InfiniBand.
  • FreeIPA/LDAP.
  • HPE (iLO/BIOS/firmware — если приходилось).
  • Kubernetes (особенно on-prem).

Похожие вакансии

  • Senior/Lead Machine Learning Engineer

    Epam Kazakhstan (Эпам Казахстан),ТОО Казахстан, Алматы 22 дня назад
    ... work alongside diverse teams to engineer strategic solutions beyond traditional machine- ... AI ML solutions on cloud infrastructure using ML engineering and MLOps ... interpersonal skills to liaise with senior business stakeholders, clients and team ...
    almaty.hh.kz
  • Senior QA Test Automation Engineer

    Неткрэкер Текнолоджи Казахстан Казахстан, Алматы, проспект Назарбаева, 223блок2Б день назад
    ... на позицию: QA Test Automation Engineer Обязанности Участие в процессах поиска, ...
    almaty.hh.kz
  • AI Platform Engineer

    Andersen Казахстан, Алматы 17 дней назад
    ... as an AI Platform Engineer, LLM Infrastructure Engineer or in a similar role ... for 4+ years.- Solid experience working with LLM system architecture and infrastructure, including multi‑agent orchestration ...
    almaty.hh.kz
  • Lead Engineer (Microsoft)

    Неткрэкер Текнолоджи Казахстан Казахстан, Алматы, проспект Назарбаева, 223блок2Б 24 дня назад
    ... and proactive Lead Engineer to oversee our global Windows server infrastructure and lead a team of ... of our IT infrastructure. What you’ll do: Team Leadership & ... experience in leading infrastructure projects (migrations, upgrades, new deployments). ...
    almaty.hh.kz
  • Senior Network Security Engineer (Сетевой инженер)

    Неткрэкер Текнолоджи Казахстан Казахстан, Алматы, проспект Назарбаева, 223блок2Б 12 дней назад
    ... services with the automation tools. Senior Network Security Engineer will work closely with other ... of the Cisco ISE Infrastructure. Maintain support of corporate Remote ... such as Cisco AnyConnect Infrastructure. Maintain support of internal- and ...
    almaty.hh.kz
  • DevOps / MLOps Engineer (Core Team)

    KOZ AI Казахстан, Алматы, проспект Аль-Фараби, 77/2 4 дня назад
    ... , PyTorch, RAG и работе с GPU-кластерами. Мы готовы обучать специфике ... ML: PyTorch, RAG, локальные LLM, GPU-инфраструктура. Data Services: Apache Iceberg, ... Outcomes, ваш переход на позицию Senior DevOps MLOps займет месяцы, а ...
    almaty.hh.kz
  • AI Engineer (Middle / Middle+ / Senior)

    от 500000 KZT
    Qamqor Kazakhstan Казахстан, Алматы, улица Кабдолова, 22Б 16 дней назад
    ... qMed AI в поиске AI Engineer (Middle Middle+ Senior). qMed AI — цифровое приложение для ... , деплой; Понимание инференса и оптимизаций (GPU CPU, квантование, скорость память); Опыт ... FastAPI (или аналог), Docker, Linux, GPU Cloud, Vector DB (Qdrant FAISS - ...
    almaty.hh.kz
  • Системный администратор / Infrastructure Engineer

    ИП Курганбекова Казахстан, Алматы 26 дней назад
    ... результата. Мы ищем системного администратора Infrastructure Engineer, который сможет выстроить и поддерживать ... опыт Linux (серверы, продакшн) • Понимание HPC-нагрузок и bottleneck’ов • Опыт работы ...
    almaty.hh.kz
  • Middle/Senior MLOps Engineer

    Kaspi.kz Казахстан, Алматы, проспект Абая, 26А 2 дня назад
    ... . Мы сейчас в поиске MLOps Engineer. Обязанности: Развитие и поддержка ML- ... -окружение. Мониторинг производительности и ресурсов (GPU, S3, кластерные системы). Работа с ... возможность влиять на архитектурные решения: GPU-кластеры B200 H200, capacity planning, ...
    almaty.hh.kz
  • DevOps / Network Engineer (Middle/Senior)

    Phaeton.KZ Казахстан, Алматы, Турксибский район, Бухтарминская улица, 4А месяц назад
    ... DevOps System Network Engineer Уверенное администрирование Linux Понимание сетей: ... Prometheus Grafana ELK Infrastructure as Code (Terraform, Ansible) Опыт ... технические решения Рост до Senior Lead DevOps Infrastructure Architect Работу в сильной backend- ...
    almaty.hh.kz
  • Senior DevOps

    Bereke Bank Казахстан, Алматы, улица Желтоксан, 191 3 дня назад
    ... -prem bare-metal облако), включая GPU-ноды, пулы, драйверы, CUDA миграции ... Cost-management (в т.ч. GPU): планирование, квоты, bin-packing, оптимизация ... cost-management (в т.ч. GPU-стоимость). Желательные: • Платформы инференса: NVIDIA ...
    almaty.hh.kz
  • Junior Associate (Corporate / M&A Practice)

    Unicase Казахстан, Алматы 2 дня назад
    ... A, dispute resolution, infrastructure, energy, and natural resources. Job ... and training from senior lawyers and partners. Develop expertise in different practice areas: corporate law, M&A, finance, infrastructure, energy, dispute resolution. Participate in ...
    almaty.hh.kz
  • Senior Data Scientist

    Genesis Group AG Казахстан, Алматы 15 часов назад
    ... systems, and building analytical infrastructure from the ground up — this opportunity is built for you. ✨ About the Role As a Senior Data Scientist, you will be ... and product experiments Data Infrastructure & Quality • Write and optimise SQL ...
    almaty.hh.kz
  • Senior Backend Developer (SaaS / AI / ML / Rust)

    от 6857 USD
    Болотина Валерия Анатольевна Казахстан, Алматы 4 дня назад
    ... and are looking for a Senior Backend Developer to take ownership ... DevOps processes (CI CD, deployment, infrastructure) Own technical decisions and backend ... of DevOps practices and cloud infrastructure Proficient with WebGPU Ability to ...
    almaty.hh.kz
  • Senior Go (Golang) Developer

    Неткрэкер Текнолоджи Казахстан Казахстан, Алматы, проспект Назарбаева, 223блок2Б 12 дней назад
    ... an international environment — join us. Senior Go Developer (AI LLM Platforms) About the Role We are looking for a senior-level Go developer who can ... decisions: API design, data modeling, infrastructure patterns, and service boundaries. Support ...
    almaty.hh.kz
  • Senior .NET Engineer (SAP)

    Andersen Казахстан, Алматы, проспект Юрия Гагарина, 124 9 дней назад
    Andersen is hiring a Senior .NET Engineer (SAP) to build a new ... -have: Experience as a .NET Engineer for 5+ years. Experience in ... and the CMIS standard. Providing senior-level expertise in SAP integration. ...
    almaty.hh.kz
  • Senior DevOps/Data Engineer (Streaming / Infrastructure)

    devs Казахстан, Алматы 10 часов назад
    ... уровня Database DevOps Data Platform Engineer, способного поддерживать и масштабировать комплексную ... стабильности пайплайнов. Database DevOps Data Infrastructure Управление и настройка различных СУБД: ...
    almaty.hh.kz
  • Middle / Senior DevOps Engineer

    Kaspi.kz Казахстан, Алматы, проспект Абая, 26А 22 дня назад
    ... , Helm) Опыт работы с nvidia gpu (промышленного уровня A100 и выше) ... ) Опыт работы с kubeflow, nvidia gpu-operator Apache Kafka (Общее понимание ...
    almaty.hh.kz
  • Senior Cloud Engineer

    от 5000 до 6000 USD
    COMTEK Inc. Казахстан, Алматы 4 дня назад
    Старший Cloud Engineer (AWS, CI CD, Automation) Мы ... в роли Cloud DevOps Platform Engineer или близких позициях.​ Глубокая практическая ... . в Azure Pipelines.​ Опыт с Infrastructure as Code, преимущественно AWS CloudFormation.​ ...
    almaty.hh.kz
  • Head of the Smart city office

    от 2500000 KZT
    Elite Business Group Казахстан, Алматы, улица Кабанбай батыра, 109 11 дней назад
    ... and scaling core technological infrastructure - telecommunications networks, IoT systems, cloud ... city or large-scale infrastructure level. Key Responsibilities: Lead PPP ... , waste sensors, fiber-optic infrastructure, autonomous shuttles, drones, and cloud ...
    almaty.hh.kz
  • Architect & Sr. Pre-Sales Engineer (Servers)

    Аванта Казахстан Казахстан, Алматы, комплекс Нурлы-Тау 18 дней назад
    ... , storage, virtualization, container, backup, cloud, HPC, SDS, HCI, AI designs, Linux ... , etc.), monitoring systems, software-defined infrastructure, network-management, Linux-OS environment. ...
    almaty.hh.kz
  • Software Support Engineer (Mining Systems)

    Leica Geosystems Kazakhstan (Лейка Геосистемс Казахстан) Казахстан, Алматы, улица Табачнозаводская, 20 22 дня назад
    ... are seeking a Software Support Engineer, to join APAC Technical Service & ... operations. As a Software Support Engineer your responsibilities will be not ... an experienced Product Support Software Engineer with experience within who is ...
    almaty.hh.kz
  • Middle / Senior NLP Engineer

    Kaspi.kz Казахстан, Алматы, проспект Абая, 26А 26 дней назад
    ... рассматриваем кандидатов на роль Middle Senior NLP Engineer.Работа полностью из офиса в ... ; Виртуальный консультант. Основные задачи ML engineer: Подготовка данных для обучения модели; ...
    almaty.hh.kz
  • Infrastructure Tech Lead

    Small, ТМ (Скиф Трейд, ТОО) Казахстан, Алматы, проспект Абая, 218/1 13 дней назад
    ... ищем Tech Lead of Infrastructure, который возьмёт на себя архитектурное ... инфраструктуры. Внедрять подходы Infrastructure as Code, автоматизации сетей, стандартизировать ... в роли Tech Lead Infrastructure Architect Engineering Lead. Вы глубоко ...
    almaty.hh.kz
  • Senior Consultant in ESG, Consulting (Almaty/Astana)

    KPMG Казахстан, Алматы 16 дней назад
    We’re currently seeking a Senior Consultant to join ... work directly with senior stakeholders, mentor junior team members, ... further As a Senior Consultant, you will: Lead ESG ... data and recommendations to senior stakeholders. Hold certifications in finance, ...
    almaty.hh.kz
  • AI Agent Developer

    devs Казахстан, Алматы 4 часа назад
    ... databases, message queues, and cloud infrastructure Proficient in frontend development (React, ... optimization, speculative decoding, and GPU memory management Experience with vector ... team). Hardware or cloud-GPU budget for experimentation. *ДЛЯ ЗАКЛЮЧЕНИЯ ...
    almaty.hh.kz
  • QA Engineer

    Andersen Казахстан, Алматы, проспект Юрия Гагарина, 124 день назад
    Andersen is hiring a QA Engineer in Almaty to support a ... digital platforms, mobile solutions, data infrastructure, cybersecurity, and open integrations. Technology ... : Experience as a Manual QA Engineer for 3+ years. Understanding of ...
    almaty.hh.kz
  • AI/ML Engineer

    Andersen Казахстан, Алматы 2 дня назад
    ... is hiring an AI ML Engineer to build scalable AI solutions ... : Experience as an AI ML Engineer or in a similar role ... LLM DevOps. Strong skills in infrastructure as code specifically in Azure ...
    almaty.hh.kz
  • Solution Engineer (crypo/payment systems)

    WIT recruitment Казахстан, Алматы 3 дня назад
    ... Solution Engineer to be the cornerstone of ... a Solution Integration Engineer or Technical Consultant in SaaS or Fintech. • Hands-on experience with crypto payments, PSP API integrations, or wallet infrastructure. • Strong background in client- ...
    almaty.hh.kz
  • Linux TestOps Engineer

    БЭЛЛ ЛАБС (BELLSOFT) Казахстан, Алматы 5 дней назад
    ... motivated, smart and talented Linux Engineer who will be responsible for ... maintain the QA process. Develop infrastructure automation and tooling to support ... as Linux package maintainer, Release Engineer, Software Tester or DevOps would ...
    almaty.hh.kz
  • QA Automation Engineer (Python)

    Andersen Казахстан, Алматы, проспект Юрия Гагарина, 124 12 дней назад
    ... is hiring a QA Automation Engineer (Python) to test and automate ... . The organization focuses on cloud infrastructure, mobile and web applications, API ... : Experience as a QA Automation Engineer (Python) for 3+ years. Familiarity ...
    almaty.hh.kz
  • IT Engineer

    Международный Аэропорт Алматы, АО Казахстан, Алматы, улица Майлина, 2 16 дней назад
    ... be responsible for. The IT Engineer for Information Systems is responsible ... . The main task of the engineer is to supervise the work ... field. Solid understanding of IT infrastructure, corporate systems, IT service management ...
    almaty.hh.kz
  • Solidity Engineer

    Andersen Казахстан, Алматы, проспект Юрия Гагарина, 124 26 дней назад
    ... is looking for a Solidity Engineer to build and evolve a ... framework for a decentralized digital infrastructure, bringing together multiple industry participants ... -haves: Experience as a Solidity Engineer for 2+ years. Proven experience ...
    almaty.hh.kz
  • Analytics Engineer / BI Engineer

    Genesis Group AG Казахстан, Алматы 11 дней назад
    ... looking for a Analytics BI Engineer with a strong engineering mindset who will design, build, and support the company’s BI and analytics infrastructure. You will help develop and ...
    almaty.hh.kz
  • Team Lead DevOps | Базовая инфраструктура

    от 4000 до 6000 USD
    Small, ТМ (Скиф Трейд, ТОО) Казахстан, Алматы 13 дней назад
    ... и hero-mode Технологический ландшафт: Infrastructure IaaS Linux Windows Server OpenStack, ... DevOps Опыт роли: Head of Infrastructure Platform Lead Lead Architect Principal Engineer с управленческой функцией Глубокое понимание: ...
    almaty.hh.kz
  • Senior Backend / DevOps Architect (Sheriff)

    от 500000 до 1000000 KZT
    SMM DRUG Казахстан, Алматы, улица Шамши Калдаякова, 47 19 дней назад
    Senior Backend DevOps Architect (Sheriff) - Почасовая ... работать как часы. Технологический стек: Infrastructure: Self-hosted Supabase, Docker. Database: ... архитектурные костыли. Кого мы ищем: Senior Lead level. Вы видели, как ...
    almaty.hh.kz
  • Senior Embedded Firmware Engineer

    ЧК ITS PARTNER LTD. Казахстан, Алматы, микрорайон Жетысу-3, 23А 10 часов назад
    ... an immediate opening for a Senior Embedded Firmware Engineer. You are expected to be ...
    almaty.hh.kz
  • AI Engineer

    Andersen Казахстан, Алматы, проспект Назарбаева, 226 2 дня назад
    Andersen is hiring an AI Engineer to build Copilot-based agents ... -haves: Experience as an AI Engineer, ML Engineer, or similar role for 3+ ...
    almaty.hh.kz
  • Sales Engineer (SaaS)

    АНТАЛ БИЗНЕС РЕШЕНИЯ (ТМ Antal Kazakhstan) Казахстан, Алматы 3 дня назад
    ... are looking for a Sales Engineer (SaaS) for a company with ... and voice channels. The Sales Engineer (Junior position) is a role ... customer meetings, including meetings with senior stakeholders and decision makers. Has ...
    almaty.hh.kz

Карточка вакансии:

  • Должность Senior HPC / GPU Infrastructure Engineer
  • Размещено: 2026-03-06 13:18:13
  • Город Казахстан, Алматы
  • Зарплата:
  • Компания: Small, ТМ (Скиф Трейд, ТОО)