SMALL — одна из крупнейших сетей супермаркетов Казахстана. Мы развиваем цифровую инфраструктуру для розницы, логистики, офисных систем, e-commerce и внутренних корпоративных сервисов. Компания строит современную базовую инфраструктуру с собственным ЦОД, развивает внутренние платформы и усиливает инженерные практики эксплуатации, автоматизации и надёжности.
Команда базовой инфраструктуры отвечает за физическую и виртуальную инфраструктурную основу компании: ЦОДы, вычислительные ресурсы, системы хранения, серверный контур, мониторинг до OS level и эксплуатационную устойчивость платформ для ИТ и бизнес-систем. В проектируемой модели именно infra-направление закрывает проектирование и эксплуатацию ЦОД, управление серверным парком, системами хранения, capacity planning, hardware lifecycle и работу с вендорами.
Мы ищем Infrastructure Engineer уровня Middle+ / Senior, который поможет развивать и эксплуатировать вычислительную и инфраструктурную основу компании, обеспечивать её отказоустойчивость, прозрачность и готовность к росту.
Ваша миссия
Поддерживать и развивать базовую инфраструктуру компании так, чтобы внутренние платформы, бизнес-критичные сервисы и команды разработки работали на надёжной, масштабируемой и управляемой инфраструктурной основе.
Чем предстоит заниматься
- Эксплуатировать и развивать инфраструктурный контур компании: серверы, виртуализацию, storage и смежные инфраструктурные сервисы
- Участвовать в развитии и эксплуатации собственного ЦОД
- Управлять серверным парком и вычислительными ресурсами
- Сопровождать системы хранения данных: SAN / NAS / Object Storage
- Обеспечивать мониторинг инфраструктуры до OS level включительно, развивать контроль доступности и производительности
- Участвовать в capacity planning: планировать рост ресурсов, выявлять узкие места, готовить предложения по масштабированию
- Обеспечивать аппаратную отказоустойчивость и резервирование инфраструктуры
- Анализировать производительность hardware и инфраструктурных компонентов
- Участвовать в устранении аварий и деградаций, взаимодействовать с подрядчиками и вендорами
- Подготавливать и сопровождать техническую документацию, схемы, стандарты эксплуатации и регламенты изменений
- Автоматизировать рутинные инфраструктурные операции там, где это даёт снижение ручного труда и операционных рисков
- Работать в связке с сетевыми инженерами, platform-инженерами, SRE, DBA и смежными ИТ-командами
Что для нас важно
Обязательные технические навыки
- Хорошее понимание архитектуры compute / virtualization / storage
- Опыт работы с системами виртуализации (RHEV\OpenStack) и серверным оборудованием enterprise-уровня
- Практический опыт работы с SAN / NAS / Object Storage
- Уверенное понимание Linux / Windows на уровне системной эксплуатации
- Опыт настройки и сопровождения мониторинга инфраструктуры и ОС (Zabbix/Grafana)
- Навыки диагностики инфраструктурных инцидентов: CPU, RAM, disk, network, storage, filesystem, I/O bottlenecks
- Понимание принципов отказоустойчивости, резервирования и HA and HL в инфраструктуре
- Опыт планирования ресурсов и оценки capacity
- Опыт взаимодействия с вендорами, техподдержкой и подрядчиками
- Базовые навыки автоматизации: Bash / PowerShell / Python / Ansible или аналогичные инструменты
- Понимание принципов change management, аккуратной работы с production и инженерной документации
Будет плюсом
- Опыт работы с инфраструктурой собственного ЦОД
- Опыт в ритейле, логистике или другой 24/7-нагруженной среде
- Опыт эксплуатации платформ виртуализации и частного облака
- Знакомство с Infrastructure as Code и automation-first подходами
- Опыт работы с Zabbix, Grafana и другими системами наблюдаемости
- Понимание сетевой инфраструктуры на уровне взаимодействия с network-командой
- Опыт участия в проектах миграции инфраструктуры, модернизации серверного или storage-контура
- Опыт подготовки инфраструктуры для Kubernetes / platform workloads
- Понимание процессов backup / DR / BCP на уровне инфраструктурного фундамента
Каким мы видим успешного кандидата
- Умеет системно разбирать проблему и находить первопричину, а не только устранять симптом
- Спокойно и собранно работает с инцидентами и аварийными ситуациями
- Понимает цену ошибок в production и умеет управлять рисками изменений
- Может работать в связке с несколькими командами: сеть, платформы, SRE, разработка, безопасность
- Умеет документировать решения, фиксировать изменения и договариваться о технических стандартах
- Готов развивать инфраструктуру не только через “ручную эксплуатацию”, но и через стандартизацию и автоматизацию
Условия работы
- Формат работы: офис, гибрид или удалённо — по договорённости
- Локация: Алматы / Астана
- Работа в ключевой инфраструктурной функции компании
- Возможность влиять на развитие собственного ЦОД и целевой инфраструктурной архитектуры
- Участие в построении современной инфраструктурной модели компании
- Бюджет на развитие, сертификации и профессиональное обучение