Описание курса:
Вы последовательно освоите современные инструменты анализа данных и сможете на профессиональном уровне создавать модели машинного обучения. Чтобы лучше закрепить навыки, вы будете практиковаться: использовать каждый алгоритм в работе с реальными данными.
Практики и знаний, которые вы получите, будет достаточно, чтобы самостоятельно решать задачи классического ML и претендовать на Junior+ и Middle позиции Data Scientist.
Аудитория:
• Для начинающих аналитиков и специалистов в области Data Science
• Для разработчиков и других IT-специалистов
Необходимая подготовка:
• базовое знакомство с Python
• базовые знания линейной алгебры, математического анализа, математической статистики
• базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия)
Программа курса:
Модуль 1. Продвинутые методы машинного обучения: обучение с учителем
• Программа курса. Повторение основных концепций машинного обучения на практическом примере
• Метод градиентного спуска
• Повторение основных понятий задачи классификации на практике: EDA, cross-validation, метрики качества
• Деревья решений
• Ансамбли моделей
• Градиентный бустинг
• Метод опорных векторов
Модуль 2. Продвинутые методы машинного обучения: обучение без учителя
• Методы уменьшения размерности
• Обучение без учителя. K-means
• Обучение без учителя. Иерархическая кластеризация. DB-Scan
• Поиск аномалий в данных
• Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
• Алгоритмы на графах
• Алгоритмы на графах: продолжение
Модуль 3. Введение в Deep Learning
• Введение в нейросети
• PyTorch (часть 1)
• Продвинутые методы оптимизации, backpropagation и обучение нейронных сетей
• Борьба с переобучение нейросетей, взрыв и затухание градиентов
• PyTorch (часть 2)
• Сверточные сети (Convolutional Neural Networks)
• Рекуррентные сети
Модуль 4. Сбор данных. Анализ текстовых данных
• Сбор данных
• Предобработка и токенизация
• Векторные представления слов, работа с предобученными эмбеддингами
• Понятие языковой модели, RNN для работы с текстом
• Архитектура трансформер
• Transfer Learning. Архитектура BERT
• Named Entity Recognition
• Тематическое моделирование
Модуль 5. Анализ временных рядов
• Анализ временных рядов. Часть 1: Постановка задачи, простейшие методы. ARIMA-модель
• Анализ временных рядов. Часть 2: Извлечение признаков и применение моделей машинного обучения. Автоматическое прогнозирование
• Анализ временных рядов Часть 3: Кластеризация временных рядов (ищем связанные котировки акций)
Модуль 6. Рекомендательные системы
• Введение в рекомендательные системы
• Простые рекомендательные модели. Коллаборативная фильтрация
• Контентная фильтрация, гибридные подходы. Ассоциативные правила
• Методы матричной факторизации
• Практическое занятие по рекомендательным системам
• ML в Apache Spark
Модуль 7. Проектная работа
Окончательная цена указывается в договоре на обучение.