1 тема: Основные концепции машинного обучения
Понятие моделирования. Схема моделирования. Понятие машинного обучения. Типы данных. Виды машинного обучения. Входные признаки. Целевые признаки. Scikit-learn. Тренировочная выборка. Валидационная выборка. Тестовая выборка. Метрики качества.
2 тема: Линейная алгебра для машинного обучения
Создание векторов. Изображение векторов. Сложение и вычитание векторов. Умножение вектора на числа. Среднее значение векторов. Скалярное произведение. Расстояние на плоскости. Создание матриц. Операции с элементами матриц. Умножение матрицы на вектор. Транспонирование матрицы. Матричное умножение.
3 тема: Подготовка данных
Подготовка данных. Мультиколлинеарность. Кодирование. Масштабирование. Анализ остатков модели.
4 тема: Задача регрессии и линейная регрессия
Задача регрессии. Линейная регрессия. MSE. MAE. R². Математическая основа линейной регрессии.
5 тема: Классификация и логистическая регрессия
Задача классификации. Бинарная и мультиклассовая классификации. Порог классификации. Логистическая регрессия. Матрица ошибок. Accuracy. Точность, полнота, математическая основа логистической регрессии.
6 тема: Модели классификации
Метод опорных векторов. Линейное, полиномиальное ядро SVM. Ядро RBF. Метод k-ближайших соседей. Подходы к многоклассовой классификации.
7 тема: Проблема переобучения и дисбаланса классов
Проблемы переобучения и недообучения. Смещение, разброс, регуляризация.
Дисбаланс классов. Кросс-валидация.
8 тема: Модели кластеризации
Постановка задачи. Алгоритм К-средних.
Выбора количества кластеров. Алгоритм DBSCAN. Метрики качества кластеризации.
9 тема: Бутстреп в машинном обучении
А/B-тест. Расчёт доверительного интервала. Бутстреп и его применение.
10 тема: Сбор данных
Источники данных. Разметка данных. Декомпозиция задачи. Голосование по большинству.
Создание пайплайна. Sklearn Pipeline.
11 тема: Градиентный спуск
Вычислительная сложность. Время обучения линейной регрессии. Итеративные методы. Сравнение методов.
Методы оптимизации. Функция потерь. Градиент функции. Градиентный спуск. Градиентный спуск для линейной регрессии. Стохастический градиентный спуск.
12 тема: Градиентный бустинг
Ансамблевые методы. Градиентный бустинг. Регуляризация градиентного бустинга.