Компания: АО «Центр развития города Алматы»
«Мы строим умный город, используя передовые технологии аналитики и визуализации данных»
Мы расширяем свой департамент «Ситуационный центр г. Алматы» (https://smartalmaty.kz/) и ищем инженера данных, с опытом решения прикладных задач в области Smart City. Ситуационный центр отражает город в цифрах, с визуализацией и гео-пространственной аналитикой.
Обязанности:
Проектирование и настройка баз данных и хранилищ (PostgreSQL/PostGIS, ClickHouse).
Оптимизация производительности и масштабируемости БД и хранилищ.
Администрирование S3-совместимого хранилища MinIO, настройка политик хранения и доступа.
Разработка и поддержка процессов загрузки данных с веб-платформы.
Организация хранения файлов в MinIO (S3 Storage).
Создание и сопровождение DAG-ов в Apache Airflow для автоматизации обработки данных.
Настройка взаимодействия с Apache Kafka для передачи сообщений между компонентами системы.
Запись обработанных данных в OLAP-базу ClickHouse.
Публикация аналитических данных в PostGIS для дальнейшей гео-аналитики.
Очистка, нормализация и моделирование данных в рамках ETL-процессов.
Разработка и оптимизация SQL-запросов для аналитики и выгрузок.
Построение моделей данных, справочников и мастер-данных.
Автоматизация процессов сбора, обработки и визуализации данных.
Настройка мониторинга всех компонентов пайплайна (MinIO, Airflow, Kafka, ClickHouse, PostGIS).
Устранение сбоев и оптимизация времени обработки.
Подготовка технической документации по каждому компоненту пайплайна.
Согласование архитектурных решений с командой разработчиков и аналитиков.
Обучение и консультирование пользователей системы по работе с данными и пайплайном.
Требования:
Высшее техническое образование.
Опыт работы от 3 лет в области дата-инженерии, интеграции и обработки данных.
Опыт построения и сопровождения сложных ETL-процессов.
Уверенное знание SQL и Python.
Опыт работы с PostgreSQL (включая PostGIS), ClickHouse.
Навыки работы с S3-совместимыми хранилищами (MinIO или аналогами).
Опыт разработки DAG-ов и администрирования Apache Airflow.
Опыт настройки и использования Apache Kafka для обмена сообщениями.
Понимание OLAP/OLTP-систем и оптимизации запросов.
Навыки работы с форматами данных XML, JSON, CSV.
Опыт интеграций через REST API.
Навыки контейнеризации и оркестрации (Docker, Kubernetes).
Опыт работы с системами управления версиями (Git).
Знание Linux CLI и администрирования серверов.
Опыт настройки мониторинга и логирования (Prometheus, Grafana, ELK и др.).
Навыки построения аналитических моделей и дашбордов.
Знание основных методов статистики и анализа данных.
Опыт работы с большими данными, включая потоковую обработку.
Понимание принципов машинного обучения (ML) и их применения в аналитике (как преимущество).
Логическое и аналитическое мышление.
Организованность, внимательность к деталям.
Умение эффективно взаимодействовать с разработчиками, аналитиками и заказчиками.
Готовность работать в многозадачной среде и в команде.
Будет преимуществом:
Гибкие навыки:
Условия:
Работа в современном офисе в центре Алматы.
Карьерный рост и обучение за счёт компании.
Отпуск 30 дней.
До 4 премий в год.
Медицинская страховка.