Дополнительные даты проведения курса:
14.07.2025 - 12.12.2025
01.09.2025 - 30.01.2026
20.10.2025 - 20.03.2026
Продолжительность курса: 350 ак. ч.
Описание курса:
Слушатели научатся разрабатывать архитектуру данных, даже если у них нет опыта в IT. Получите востребованную профессию и реальный опыт.
Аудитория:
• Все, кто хочет научиться разрабатывать архитектуру данных.
Необходимая подготовка:
Не требуется.
Программа курса:
Модуль 1. Введение в инженерию данных
• Введение в профессию инженер данных;
• Введение в Git;
• Введение в Docker.
Модуль 2. DWH
• Введение в базы данных и теорию хранения данных. Реляционная модель данных;
• Знакомство с реляционной СУБД Postgres. Введение в SQL;
• Углубленное изучение SQL;
• Введение в DWH;
• DWH. Витрины данных;
• Погружение в DWH. Архитектура хранилищ данных;
• Современные модели данных. Data vault;
• Введение в колоночные СУБД. Clickhouse;
• Что такое BI-системы и зачем нужны. Введение в Superset. Построение дашбордов.
Модуль 3. Работа с данными
• Введение в Python. Базовые операции;
• Работа с базами данных на языке Python. Работа с внешними API;
• Введение в оркестрацию данных. Обзор Airflow;
• Погружение в Airflow.
Модуль 4. Работы с большими данными
• Введение в теорию больших данных;
• NoSQL хранилища данных. MPP-системы;
• Введение в Data Lake;
• Введение в Hadoop;
• Hive;
• Введение в теорию ETL/ELT-процессов. Обзор стека технологий;
• Введения в Scala;
• Apache Spark;
• Углубленное изучение Spark.
Модуль 5. Машинное обучение. Искусственный интеллект
• Введение в анализ данных. Базовые инструменты анализа данных на языке Python. Разведочный анализ данных;
• Введение в машинное обучение;
• Способы улучшения качества моделей в машинном обучении;
• Разработка моделей машинного обучения с использованием Pyspark;
• Введение в теорию ИИ и нейронных сетей;
• Погружение в теорию нейронных сетей. Разработка простой нейронной сети на языке Python.
Окончательная цена указывается в договоре на обучение.