Data engineer

з/п не указана

Требуемый опыт работы: 3–6 лет

Полная занятость, удаленная работа

RU-CENTER Group
4,4

Санкт-Петербург

Российская группа компаний, объединяющая ведущих
игроков на рынке интернет-инфраструктуры

Мы – команда, которая собирает, готовит и анализирует данные для принятия ключевых стратегических, оптимизационных и операционных решений в группе компаний. Среди задач, которые мы решаем:

  • Сбор статистических данных из внутренних и внешних источников в наш data-lake на базе Hadoop (по заказу внутренних заказчиков и для реализации собственных идей);

  • Создание подготовленных витрин данных для отделов бизнес/ финансовой аналитики и маркетинга;

  • Создание витрин данных со статистикой внутренних операционных показателей (в т.ч. хостинга);

  • Создание удобных инструментов для пользователей для работы с нашими решениями и статистикой;

  • Сбор и подготовка данных из открытых источников;

  • Переход от пакетного к потоковому сбору и обработке данных.

Сейчас мы ищем человека, с навыками в Data Engineering, готового участвовать в подготовке данных для внутренних пользователей. Плюсы – возможность развиваться в разных областях и много свободы для реализации своих идей и предложений.

Обязанности:

  • Разработка и поддержка автоматизированных ETL/ELT процессов на Spark/Hadoop (интеграция источников данных в Data Lake, создание витрин данных под потребности пользователей и сервисов);

  • Сбор, обработка и парсинг "сырых" данных;

  • Написание сервисов для работы с внешними источниками/потребителями данных;

  • Поддержка и развитие хранилища данных.

Must-have skills:

  • Опыт промышленной разработки на Python;

  • Уверенные знания SQL/оконные функции/CTE;

  • Опыт работы с инструментами экосистемы Hadoop: Hive, Impala;

  • Наличие опыта разработки на Python / разработки на pySpark;

  • Опыт работы с Superset/Tableau;

  • Опыт написания DAG в Airflow/Luigi/Preset;

  • Знание основных понятий и концепций из области Data Warehousing;

  • Опыт разработки витрин данных.

Несомненными плюсами будут:

  • Опыт работы с docker, k8s, kafka;

  • Опыт работы с нереляционными БД;

  • Наличие профессионального интереса к развития архитектуры данных: хранение, транспортировка, обработка, применение, обеспечение AI/ML и DataOps;

Условия:
  • Удаленный формат работы
  • График работы 5/2 с гибким началом рабочего дня
  • ДМС, с телемедициной и льготной стоматологией, скидки на фитнес и англ.язык, корпоративное оборудование
  • Также, участие в различных профессиональных митапах и конференциях.

Ключевые навыки

Python
SQL
Hadoop

Задайте вопрос работодателю

Он получит его с откликом на вакансию

Где располагается место работы?Какой график работы?Вакансия открыта?Какая оплата труда?Как с вами связаться?Другой вопрос

Вакансия опубликована 13 марта 2023 в Санкт-Петербурге

Отзывы о компании

4,4очень хорошо
Оценка Dream Job

100%

Рекомендуют
Ваши отзывы помогают людям принимать взвешенные карьерные решения
Оставить отзыв

Что говорят сотрудники

Преимущества и льготы
  • Своевременная оплата труда
  • Удаленная работа
  • Гибкий рабочий график
Программист-разработчик
Июнь 2022
Крутая команда профессионалов, крутая инфраструктура для разработчиков (k8s, CI/CD, все что хочешь короче)
Войдите, чтобы увидеть все отзывы
Войти

Похожие вакансии

Откликнитесь среди первых
Проектирование и разработка SQL-процедур, обработчиков данных на Spark (Scala) и ETL-процессов (в т.ч. AirFlow). Оптимизация производительности кода.
Какие знания и навыки для нас важны: Опыт работы с инструментарием Hadoop (HDFS, Yarn, Spark, Hive). Опыт работы с промышленными...
Санкт-Петербург, Выборгская и еще 2 
Создание единого пайплайна обновления отчетности на базе Airflow + Clickhouse + Postgres. Создание витрин с разными слоями данных (сырые данные...
Уверенное владение Python. Владение SQL, понимание принципов оптимизации запросов и организации хранения данных. Автономность и проактивность в работе - умение находить...
Санкт-Петербург, Чкаловская
Потоковая обработка событий с использованием RabbitMQ, Kafka и Flink. Сырые данные мы храним в Yandex Object Storage, а обрабатываем в...
Свободное владение SQL (на уровне оптимизации запросов). Опыт коммерческой разработки (предпочтительно на Python/Java). Опыт работы с потоками данных и...

Senior Data Scientist

от 250 000 руб.
Санкт-Петербург
Откликнитесь среди первых
Помощь выполнения сценариев чат-бота для неавторизованных пользователей. Поиск некоторой информации внутри системы для авторизованных пользователей (распознавание намерений, поиск сущностей).
Имеешь промышленный опыт работы (от постановки задачи до внедрения) в области DS/ML от 3-х лет. Умеешь решать nlp...
Санкт-Петербург
Подготовка источников данных для заказчика - маркетинг и игровая аналитика. Разработка конвейера поставки данных в виде DAG процессов для Airflow/Luigi.
Технический бэкграунд в Python от 5 лет: навык проектирования фреймворков и библиотек, умение читать и анализировать код, опыт профилирования и...
Откликнитесь среди первых
Проектирование и разработка SQL-процедур, обработчиков данных на Spark (Scala) и ETL-процессов (в т.ч. AirFlow). Оптимизация производительности кода.
Какие знания и навыки для нас важны: Опыт работы с инструментарием Hadoop (HDFS, Yarn, Spark, Hive). Опыт работы с промышленными...
RU-CENTER Group
4,4

Санкт-Петербург