PYT07 — Применение Python для обработки данных
PYT07 - Применение Python для обработки данных
Описание курса:
Данный курс рассматривает основные возможности языка Python и вспомогательных библиотек для работы с большими объемами структурированных и неструктурированных данных с использованием локальных ресурсов и облачных сред. Изучаются основы машинного обучения как способа работы с неструктурированными данными на основе библиотеки Tensorflow. Также рассматриваются распространённые инструменты визуализации данных.
Аудитория курса:
Инженеры по работе с данными, а также разработчики ПО, желающие изучить основы машинной обработки данных
Предварительные требования к аудитории:
Знания языка Python на уровне курса Программирование на языке Python (PYTHON_BASIC).
Содержание курса:
1. Python для работы с данными.
Обработка данных с помощью Python
Введение в Jupyter Lab
Собственные структуры данных Python
Библиотека NumPy (цель и возможности)
Библиотека MatPlotLib (цель и возможности)
Лабораторная работа 1.
Работа с типами данных
2. Оценка данных, введение в машинное обучение
Библиотека Pandas, понятие датафреймов и операции над ними
Введение в машинное обучение
Терминология
Виды и возможности
Обучение моделей
Градиентный спуск
Hyperparameters, Losses, Learning Rate
Generalization
Сеты данных
Лабораторная работа 2.
Работа с датафреймами
Лабораторная работа 3.
Изучение зависимостей в машинном обучении
3. Tensorflow и Feature Engineering
Введение в Tensorflow и Keras
Возможности и способы использования
Готовые модели
Инструменты для создания собственных моделей
Feature Selection and Engineering
Лабораторная работа 4. Использование Tensorflow
Лабораторная работа 5.
Feature Engineering
4. Глубокое обучение и среды для обучения моделей
Глубокое обучение
Применение и возможности
Ресурсы для обучения моделей
Облачные ресурсы для обучения моделей
Лабораторная работа 6.
Глубокое обучение
Лабораторная работа 7.
Обучение моделей в подготовленной среде
5. Визуализация данных.
Библиотеки Python для визуализации
Облачные среды для визуализации данных
Статистическая оценка данных
Лабораторная работа 8. Визуализация и статистическая оценка данных