Войти

Профессия Data Scientist: машинное обучение
Вы научитесь создавать аналитические системы и использовать алгоритмы машинного обучения, освоите работу с нейросетями. Наполните портфолио и получите престижную профессию.
SkillBox
Стоимость: 95 040 р. / Разово

Целевая аудитория

Людям без подготовки в IT

Вы получите базовые навыки по программированию, аналитике, статистике и математике, которые откроют путь к карьере в Data Science и Machine Learning. Сможете использовать свои знания сразу на практике.

Программистам

Вы прокачаете свои знания и навыки в программировании на Python и R. Подтянете математику и умение мыслить как аналитик, использовать алгоритмы машинного обучения для решения бизнес-задач — и усилите портфолио мощными проектами.

Менеджерам и владельцам бизнеса

Научитесь использовать данные для построения прогнозов и оптимизации бизнес-процессов и переведёте компанию на новый уровень.

Описание курса

Длительность 19 месяцев Помощь в трудоустройстве 7 курсов в одной программе Доступ к курсу навсегда

Программа курса


Python для Data Science

  • Введение в Data Science
  • Введение в Python
  • Основы
  • Операторы, выражения
  • Условный оператор if, ветвления
  • Условный оператор if: продолжение
  • Цикл while
  • For: циклы со счетчиком
  • For: циклы со счетчиком, часть 2. Функция range
  • Цикл for: работа со строками
  • Вложенные циклы
  • Числа с плавающей точкой (int/float)
  • Функции
  • float 2
  • Установка и настройка IDE
  • Базовые коллекции: Cписки
  • Методы для работы со списками
  • List comprehensions
  • Базовые коллекции: Строки
  • Базовые коллекции: словари и множества
  • Базовые коллекции: Кортежи
  • Функции — Рекурсия
  • Работа с файлами
  • Исключения: работа с ошибками
  • Введение в ООП
  • Основные принципы ООП
  • Итераторы и генераторы

Аналитика. Начальный уровень

  • Библиотека NumPy: методы анализа массивов
  • Библиотека NumPy: способы преобразования массивов
  • Библиотека pandas: индексация и выбор данных
  • Библиотека pandas: применение функций, группировка, сортировка
  • Основы визуализации данных с помощью Matplotlib
  • Продвинутая визуализация с Matplotlib
  • Визуализация с Seaborn
  • Мастер-класс: разведочный анализ (EDA)
  • Курсовая работа. Подготовка аналитического отчёта на основе имеющихся данных в качестве помощи продюсерам образовательных программ эффективно выстраивать стратегию по обновлению и улучшению курсов
  • Чтение и запись данных: CSV, XLSX
  • Основы SQL
  • Чтение и запись данных: JSON, MongoDB
  • Работа со строками
  • Курсовая работа. Часть 1. Подготовка аналитического отчёта для HR-отдела. На основе аналитики необходимо составить рекомендации для отдела кадров по стратегии набора персонала и взаимодействию с сотрудниками
  • Курсовая работа. Часть 2. подготовка аналитического отчёта для SMM-отдела компании Skillbox на основе паблика Skillbox «ВКонтакте»

Статистика и теория вероятностей

  • Основы статистики и теории вероятностей
  • Как врать при помощи статистики

Основы математики для Data Science

  • Базовые математические объекты и SymPy. Дроби и преобразования
  • Базовые математические объекты и SymPy. Функции и дополнительные объекты
  • Функции одной переменной, их свойства и графики
  • Интерполяция и полиномы: квадратичные и кубические функции
  • Аппроксимация и преобразование функций: сдвиги, растяжения, сжатия
  • Аппроксимация и работа с производными
  • Функции нескольких переменных, их свойства и графики
  • Частные производные функции нескольких переменных
  • Векторы и матрицы. Градиент
  • Линейная регрессия и системы линейных уравнений
  • Разложение матриц. Собственные векторы и значения

Машинное обучение. Начальный уровень

  • Основные концепции Machine Learning (ML)
  • Жизненный цикл ML-проекта
  • Регрессия: метрики качества, преобразование входных данных
  • Регрессия: регуляризация и градиентный спуск
  • Классификация: kNN, наивный байесовский классификатор, деревья решений
  • Классификация: метрики качества классификации и многоклассовая классификация
  • Кластеризация
  • Дополнительные техники: понижение размерности
  • Дополнительные техники: бустинг и стекинг
  • Знакомство с Kaggle
  • Курсовая работа. Проанализировать данные телекоммуникационной компании и спрогнозировать отток пользователей на основе демографических характеристик, услуг, которыми они пользуются, длительности пользования услугами, метода и размера оплаты

Машинное обучение. Средний уровень

  • Введение в нейронные сети
  • Обучение нейронных сетей
  • Нейронные сети на практике
  • Свёрточные нейросети для задачи классификации изображений: введение в свёртки (многоканальные свёртки, рецептивное поле)
  • Свёрточные нейросети для задачи классификации изображений: продвинутые операции со свёрткой (архитектуры сетей VGG и ResNet, задача Transfer Learning для свёрточных сетей)
  • Семантическая сегментация: слабая локализация и полносвёрточные нейросети (FCN)
  • Семантическая сегментация: продвинутые архитектуры FCN для семантической сегментации
  • Детектирование объектов. Задачи классификации и локализации 
  • Детектирование объектов. Анализ и реализация R-CNN-архитектуры
  • Детектирование объектов. Разбор популярных архитектур (Fast/Faster R-CNN, YOLO, SSD) и знакомство с TensorFlow Object Detection API
  • От дискриминативных моделей к генеративным. Style transfer
  • Генеративные состязательные сети
  • Введение в NLP
  • NLP на нейросетях. Рекуррентные нейросети, классификация текстов
  • NLP на нейросетях. Языковые модели, Attention, Transformer
  • Обучение с подкреплением. Q-Learning
  • Обучение с подкреплением. Deep Q-Learning
  • Ускорение и оптимизация нейронных сетей
  • Внедрение DL моделей в production
  • Введение в рекомендательные системы и задачи ранжирования
  • Современные подходы к построению рекомендательных систем

Универсальные знания программиста

  • Как стать первоклассным программистом
  • Вёрстка email-рассылок. Советы на реальных примерах
  • The state of soft skills
  • Как мы создавали карту развития для разработчиков
  • Как общаться по email и эффективно работать с почтой
  • Повышение своей эффективности
  • Спор о первом языке программирования
  • Саморазвитие: как я не усидел на двух стульях и нашёл третий
  • Data-driven подход к продуктивности — инсайты из данных миллиона людей
  • Протокол HTTP
  • Введение в алгоритмы

Английский для IT-специалистов

  • IT Resume and CV
  • Job interview: questions and answers
  • Teamwork
  • Workplace communication
  • Business letter
  • Software development
  • System concept development and SRS
  • Design
  • Development and Testing
  • Deployment and Maintenance

Преподаватели

Валентин Пановский

Chief Data Scientist в Skillbox. Блоки «Аналитика и машинное обучение. Начальный уровень»

Михаил Овчинников

Главный методист технического направления Skillbox

Алла Тамбовцева

Преподаватель НИУ ВШЭ

Александр Джумурат

Руководитель команды разработки рекомендательной системы в ivi.ru

Дмитрий Коробченко

Deep Learning R&D инженер и менеджер в NVIDIA. Блок «Машинное обучение. Средний уровень»

Алексей Мастов

Deep Learning инженер в NVIDIA. Блок «Машинное обучение. Средний уровень»

Лидия Храмова

Team Lead Data Scientist группы бизнес-моделирования в QIWI. Блок «Статистика и теория вероятностей»

Артемий Козырь

Старший аналитик данных Wheely. Блок «Аналитика. Начальный уровень»

Андрей Мещеряков

Data Scientist в EPAM. Блок «Аналитика. Начальный уровень»

Роман Булгаков

Преподаватель информатики и программирования по специализации Python со стажем 5 лет

Оставьте отзыв первым!