Джокер
Администратор
- Регистрация
- 1 Янв 2015
- Сообщения
- 133.856
- Реакции
- 76.361
Складчина: Data Engineering Fast‑Track: Kafka → Airflow → Spark [Stepik]
Практический fast-track по data engineering: за 4–6 недель собираем рабочий конвейер Kafka → Spark → Lakehouse под управлением Airflow. Разберём batch и streaming, окна и watermark, схемы и контракты. Мини‑проекты, Docker Compose, шаблоны DAG и пайплайнов. Курс подойдёт инженерам, аналитикам и тем, кто хочет освоить современные пайплайны данных с уверенным Python.
Чему вы научитесь
Проектировать конвейер данных Kafka → Spark → Lakehouse под управлением Airflow.
Поднимать локальное окружение через Docker Compose и воспроизводимо деплоить пайплайны.
Делать batch и streaming в Spark, настраивать окна и watermark.
Читать/писать данные в Parquet и табличные форматы Delta/Iceberg, избегать «small files».
Настраивать DAG: расписания, retries, SLA, catchup, datasets.
Подключать источники/приёмники через Kafka Connect/Schema Registry, понимать EOS/idempotency.
Писать базовые тесты качества данных (freshness/completeness) и алерты по свежести.
Выполнять backfill и разруливать инциденты (сломалась схема, отставание потребителей).
Продажник:
СКАЧАТЬ СЛИВЫ КУРСОВ
Практический fast-track по data engineering: за 4–6 недель собираем рабочий конвейер Kafka → Spark → Lakehouse под управлением Airflow. Разберём batch и streaming, окна и watermark, схемы и контракты. Мини‑проекты, Docker Compose, шаблоны DAG и пайплайнов. Курс подойдёт инженерам, аналитикам и тем, кто хочет освоить современные пайплайны данных с уверенным Python.
Чему вы научитесь
Проектировать конвейер данных Kafka → Spark → Lakehouse под управлением Airflow.
Поднимать локальное окружение через Docker Compose и воспроизводимо деплоить пайплайны.
Делать batch и streaming в Spark, настраивать окна и watermark.
Читать/писать данные в Parquet и табличные форматы Delta/Iceberg, избегать «small files».
Настраивать DAG: расписания, retries, SLA, catchup, datasets.
Подключать источники/приёмники через Kafka Connect/Schema Registry, понимать EOS/idempotency.
Писать базовые тесты качества данных (freshness/completeness) и алерты по свежести.
Выполнять backfill и разруливать инциденты (сломалась схема, отставание потребителей).
Продажник:
СКАЧАТЬ СЛИВЫ КУРСОВ
Для возможности скачивать складчины и сливы курсов нужно зарегистрироваться
Возможно, Вас ещё заинтересует:
- Чтобы стать богатым, нужно быть нарциссом и психопатом [Александр Златозаров]
- Анатомия добычи: Бизнес без карт и иллюзий [Николай Щербатюк]
- Святой подонок: Инструкция по эксплуатации твоей Темной стороны [Николай Щербатюк]
- Пешкой без Спешки [Егор Колесников, Елена Филимонова] + Незаметные шахматные секреты (как обыгрывать любителей) [Сергей Жвакин, Евгений Шемонаев]
- Oreshki [Анастасия Воронова]
- Великие люди России [Лариса Клюшник] + Достижения и открытия россиян [Илья Маневич] + Чудеса России [Илья Маневич]
- Спокойствие по запросу: что делать, когда накрывает тревожность [Level One] [Татьяна Смирнова]
- Сексуальность в паре: от инфантильных источников возбуждения к взрослому наслаждению [EduNote] [Эрик Смаджа]
- На каких языках мы говорим в аналитической кабинете? [EduNote] [Юрий Баранов]
- Таблица Биона: Вертикаль [EduNote] [Елена Ливач]