Курс: Python для машинного обучения
Продолжительность курса: 40 ак. ч.
Описание курса:
Курс посвящен применению языка Python для технологий машинного обучения. Изучаются основные библиотеки, используемые в машинном обучении и методики их использования.
• Курс рассматривает методы и библиотеки, основанные на языке Python и предназначенные для машинного обучения.
• Курс основан на опыте практического применения библиотек машинного обучения.
• Курс включает в себя не только практическую, но и теоретическую часть, и таким образом не сводится к простому «сборнику рецептов».
• Курс читается на базе ОС Linux. Обучение проводится на примере популярнейшего дистрибутива Ubuntu. Однако большинство технологий, изучаемых на курсе, могут применяться и на базе Windows.
Курс читается на основе библиотек машинного обучения Scikit-Learn и TensorFlow. В процессе обучения активно используются средства разработки Jupyter Notebook, Jupyter-Lab. Также используются облачные вычислительные ресурсs Google Colab.
Аудитория:
• Программисты Python
• Специалисты в области Data Science
Необходимая подготовка:
• Знакомство с Unix. Успешное окончание курса «Программирование на Python. Уровень 1. Базовый курс», или эквивалентная подготовка.
• Успешное окончание курса «Программирование на Python. Уровень 4. Анализ и визуализация данных: Pandas, Numpy, Matplotlib», или эквивалентная подготовка.
Программа курса:
Модуль 1. Постановка задачи машинного обучения
• Три типа машинного обучения.
• Схема построения систем машинного обучения.
• Необходимый инструментарий.
• Практика по созданию рабочего окружения и использования Anaconda и Jupyter Notebook.
Модуль 2. Обучение с учителем. Задача классификации
• Понятие нейронной сети.
• Персептрон. Определение, реализация и обучение.
• Адаптивный линейный нейрон. Определение, реализация и обучение.
• Метод градиентного спуска.
• Стохастический градиентный спуск в адаптивном линейном нейроне.
• Динамическое обучение на больших данных.
• Практика с модельными наборами и наборами данных Scikit-Learn.
• Практика в Jupyter Notebook.
Модуль 3. Библиотека scikit-learn, ее основные возможности
• Обучение персептрона.
• Метод логистической регрессии.
• Метод опорных векторов.
• Метод k ближайших соседей.
• Деревья принятия решений.
• Ансамбль произвольных деревьев.
• Практика в Jupyter Notebook.
Модуль 4. Обучение с учителем. Задача регрессии
• Обучение с учителем. Задача регрессии.
• Линейная регрессия.
• Метод наименьших квадратов.
• Метод градиентного спуска.
• Работа с выбросами. Алгоритм RANSAC().
• Бутстрап методика для коэффициентов регрессии.
• Оценка качества регрессионной модели.
• Основы нелинейной регрессии.
• Практика в Jupyter Notebook.
Модуль 5. Предобработка данных, отбор признаков и моделей
• Обработка пропущенных данных.
• Обработка категорий.
• Модели предобработки и обучения.
• Отбор значимых признаков.
• Исследование значимых признаков случайными лесами.
• Конвееры машинного обучения.
• Кросс-валидация и отбор моделей.
• Практика в Jupyter Notebook.
Модуль 6. Обучение без учителя. Кластерный анализ
• Метод k средних.
• Анализа основных компонент.
• Анализа линейного дискриминанта.
• Иерархическая кластеризация.
• Кластеризация по плотности.
• Практика в Jupyter Notebook.
Модуль 7. Основы глубокого обучения
• Графы и распределенные вычисления.
• Установка Tensorflow.
• Тензоры.
• Наборы данных.
• Прикладной интерфейс (API) Keras.
• Линейная регрессия со стохастическим градиентным спуском.
• Классификация двухслойной нейронной сетью данных Iris.
• Функции активации слоев нейронов.
• Классификация данных MNIST.
• Практика в Google Colab.
Окончательная цена указывается в договоре на обучение.
Записаться на курс