Специалисты по Data Science нужны везде, где хранят и обрабатывают большие объёмы данных

Ещё их называют дата-сайентистами — Data Scientist

Освоите курс с нуля за 8 месяцев

Мощный набор навыков и инструментов

Это сейчас действительно актуально и требуется во всех вакансиях.

Python
Jupyter Notebook
Pandas
SQL
Keras
Catboost
Scikit-learn
NumPy
Matplotlib
Optuna
Постановка ML-задач
Теория вероятностей
Статистика
Обработка данных
Анализ данных

Программу обновляем каждые 3 месяца

Есть базовый и расширенный форматы — со вторым вы быстрее вырастете до уровня middle
7 тем・1 проект・~8 часов
Бесплатно
Основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимается Data Scientist. А после бесплатной части выберете подходящий формат курса: базовый или расширенный.
  • Python
  • Pandas
  • Seaborn
  • Переменные
  • Типы данных
  • Гипотезы
  • Ошибки
  • Тепловые карты
  • Базовый и расширенный формат
Moscow Catnamycs
Вывод данных на экран. CSV-файлы. Работа с таблицами. Тепловые карты. Умножение столбца на целое число.
Ошибки в коде
Синтаксические ошибки. Ошибки наименования. Ошибки при делении на ноль. Ошибки при импорте модуля.
Переменные и типы данных
Переменные. Типы данных. Арифметические операции с числами и строками.
Как выдвигать гипотезы
Гипотезы. HADI-циклы. Аналитическое мышление. Чтение графиков.
Работа в области данных
Задачи аналитика. Уточнение задач. Декомпозиция. Стадии проекта.
Машинное обучение
Модель. Обучающая и тестовая выборки. Объект и признак. Метрика Евклида. Алгоритм k-ближайших соседей (kNN). Библиотека Scikit-learn.
Примените методы группировки и суммы, сегментируете пользователей и решите задачи классификации
2
12 тем・1 проект・2 недели
Базовый Python
  • Python
  • Pandas
  • Переменные
  • Типы данных
  • Строки
  • Списки
  • Циклы
  • Условный оператор
  • Функции
  • Словари
  • Датафрейм
Переменные и типы данных
Язык Python. Переменные. Вывод объектов и данных на экран. Обработка ошибок, оператор try-except. Типы данных. Преобразования типов данных.
Строки
Индексы в строках. Срезы строк. Операции над строками. Методы строк. Форматирование строк, метод format(), f-строки.
Списки
Индексы в списках. Срезы списков. Добавление и удаление элементов. Сложение и умножение, сортировка списков. Поиск элементов в списке. Разделение строки в список строк, соединение списка строк.
Цикл For
Перебор элементов. Перебор индексов элементов. Обработка элементов списков с помощью циклов: нахождение суммы и произведения элементов.
Вложенные списки
Циклы по вложенным спискам с подсчётом значений. Добавление элементов во вложенные списки. Сортировка вложенных списков.
Условный оператор
Цикл While. Логический тип данных. Булевы значения. Логические и составные логические выражения. Условный оператор if-elif-else. Ветвления. Фильтрация списков с использованием условного оператора.
Функции
Назначение функций. Параметры и аргументы. Параметры со значениями по умолчанию. Позиционные и именованные аргументы. Возвращение результата из функции.
Словари
Ключи и значения. Поиск значения по ключу. Добавление элементов в словарь. Список словарей. Красивый вывод словарей.
Библиотека Pandas
Чтение CSV-файлов. Датафрейм. Конструктор датафрейма. Вывод первых и последних строк датафрейма. Индексация в датафреймах. Индексация в столбцах Series.
Предобработка данных
Принцип GIGO. Переименование столбцов датафрейма. Обработка пропущенных значений. Обработка явных и неявных дубликатов.
Анализ данных
Группировка данных. Сортировка данных. Основы описательной статистики. Оформление результатов.
Jupyter Notebook — тетрадь в ячейку
Интерфейс и шорткаты Jupyter Notebook.
Сравните данные пользователей Яндекс Музыки по городам и дням недели
3
6 тем・1 проект・2 недели
Предобработка данных
  • Python
  • Pandas
  • Предобработка данных
  • Обработка пропусков
  • Обработка дубликатов
  • Категоризация данных
Работа с пропусками
Конверсия. Куки. Категориальные и количественные переменные, обработка пропусков в них. Обработка пропусков в количественных переменных по категориям.
Изменение типов данных
Чтение Excel-файлов. Преобразование Series к числовому типу. Модуль числа, метод abs(). Работа с датой и временем. Обработка ошибок, оператор try-except. Объединение датафреймов, метод merge(). Сводные таблицы.
Поиск дубликатов
Классический метод поиска дубликатов. Поиск дубликатов с учётом регистра.
Категоризация данных
Декомпозиция таблиц. Категоризация по числовым диапазонам. Категоризация на основе нескольких значений в строке.
Критическое и системное мышление
Системное мышление. Причины ошибок в данных. Критическое мышление.
Проанализируете данные о клиентах банка, определите долю кредитоспособных
4
6 тем・1 проект・2 недели
Исследовательский анализ данных
  • Python
  • Pandas
  • Matplotlib
  • Анализ данных
  • Срезы данных
  • Описательная статистика
  • Гистограммы
  • Диаграмма размаха
  • Диаграмма рассеяния
  • Визуализация данных
Первые графики и выводы
Применение сводных таблиц. Гистограмма. Распределения. Диаграмма размаха.
Изучение срезов данных
Метод query(). Работа с датой и временем. Построение графиков методом plot(). Бритва Оккама.
Работа с несколькими источниками данных
Срез данных на основе внешних объектов. Добавление новых столбцов в датафрейм. Добавление данных из других датафреймов. Переименование столбцов. Объединение таблиц.
Взаимосвязь данных
Диаграмма рассеяния. Корреляция переменных. Матрица диаграмм рассеяния.
Валидация результатов
Укрупнение групп. Разбиение данных по группам.
Исследуете архив объявлений о продаже объектов недвижимости в Петербурге и Ленобласти
5
6 тем・1 проект・2 недели
Статистический анализ данных
  • Python
  • Pandas
  • SciPy
  • NumPy
  • Matplotlib
  • Комбинаторика
  • Теория вероятностей
  • Распределения
  • Проверка гипотез
Комбинаторика
Комбинации. Правило умножения. Перестановки. Количество перестановок. Размещения. Число размещений. Сочетания. Число сочетаний.
Теория вероятностей
Эксперимент. Вероятностное пространство. События. Вероятность. Пересекающиеся и взаимоисключающие события. Диаграмма Эйлера–Венна. Закон больших чисел.
Описательная статистика
Категориальные и количественные переменные. Мода и медиана. Среднее значение. Дисперсия. Стандартное отклонение. Квартили и процентили. Диаграмма размаха. Столбчатая диаграмма. Плотность частоты. Гистограмма.
Случайные величины
Случайная и дискретная случайная величина. Распределение вероятностей для дискретной случайной величины. Кумулятивная функция, математическое ожидание и дисперсия дискретной случайной величины.
Распределения
Эксперимент Бернулли. Биномиальный эксперимент. Распределения: непрерывное равномерное, нормальное и стандартное нормальное. CDF, PPF для нормального распределения. Распределение Пуассона. Аппроксимация одного распределения другим.
Проверка гипотез
Генеральная совокупность. Выборка. Выборочное распределение. Центральная предельная теорема. Односторонние и двусторонние гипотезы. P-Value. Проверка гипотезы о равенстве средних двух генеральных совокупностей.
Проверите гипотезы сервиса аренды самокатов, чтобы помочь вырастить бизнес
6
1 проект・1 неделя
Первый большой проект
Научитесь предварительному исследованию данных, сформулируете и проверите гипотезы. Найдёте закономерности в данных о продаже игры.
7
8 тем・1 проект・3 недели
Линейные модели в машинном обучении
  • Scikit-learn
  • NumPy
  • Линейная алгебра
  • Линейная регрессия
  • Задача классификации
  • Логистическая регрессия
  • Подготовка данных
Основы машинного обучения
Понятие моделирования. Схема моделирования. Понятие машинного обучения. Типы данных. Виды машинного обучения. Входные признаки. Целевые признаки. Scikit‑learn. Тренировочная выборка. Валидационная выборка. Тестовая выборка. Метрики качества.
Линейная алгебра для машинного обучения
Вектор. Векторные операции. Сходство векторов. Матрица. Матричные операции. Скалярное произведение. Матричное умножение. Определитель матрицы. Обратные матрицы.
Подготовка данных для машинного обучения
Подготовка данных. Мультиколлинеарность. Кодирование. Масштабирование. Анализ остатков модели.
Задача регрессии и линейная регрессия
Задача регрессии. Линейная регрессия. MSE. MAE. R². Математическая основа линейной регрессии.
Классификация и логистическая регрессия
Задача классификации. Бинарная и мультиклассовая классификации. Порог классификации. Логистическая регрессия. Матрица ошибок. Accuracy. Точность, полнота, математическая основа логистической регрессии.
Разработаете модель машинного обучения, которая поможет владельцам молочной фермы принимать эффективные решения
8
7 тем・1 проект・3 недели
Обучение с учителем: качество модели
  • SVM
  • kNN
  • Переобучение, недообучение
  • Гиперпараметры
  • Отбор признаков
  • Пайплайн
Модели классификации
Метод опорных векторов. Линейное, полиномиальное ядро SVM. Ядро RBF. Метод k-ближайших соседей. Подходы к многоклассовой классификации.
Проблема переобучения
Проблемы переобучения и недообучения. Смещение, разброс, регуляризация.
Проблема дисбаланса классов
Дисбаланс классов. Кросс-валидация.
Подбор гиперпараметров
Параметры. Гиперпараметры. GridSearchCV. RandomizedSearchCV. OptunaSearchCV.
Работа с признаками
One Hot Encoding. OrdinalEncoder. Утечка целевого признака. Попарная корреляция входных признаков. Feature Engineering.
Отбор признаков
Фильтрация для отбора признаков. SelectKBest. Интерпретация модели. Значимость признаков.
Пайплайн обучения
Создание пайплайна. Sklearn Pipeline.
Проанализируете покупки клиентов в ретейл-сети. Разработаете модель, которая поможет маркетологам запускать эффективные акции
9
1 проект・1 неделя
Второй большой проект
Разработаете 2 модели машинного обучения и оцените их качество. Упакуете работу в пайплайн. Смоделируете коэффициент удовлетворённости сотрудников, чтобы помочь HR-отделу компании спрогнозировать текучку кадров.
10
5 тем・1 проект・2 недели
Машинное обучение в бизнесе
  • Связь продуктовых метрик и МО
  • Доверительный интервал для A/B-теста
  • Применение бутстрепа
  • Разметка данных
  • Декомпозиция задачи
Метрики бизнеса
Оборот, себестоимость и маржинальность. Операционные расходы и операционная прибыль. Чистая прибыль. Возврат на инвестиции. Конверсии. Воронки. Онлайн- и офлайн-метрики.
Бутстреп в машинном обучении
А/B-тест. Расчёт доверительного интервала. Бутстреп и его применение.
Сбор данных
Источники данных. Разметка данных. Декомпозиция задачи. Голосование по большинству.
Обучите модель и предскажете, в каком месторождении добыча нефти принесёт наибольшую прибыль
11
7 тем・1 проект・3 недели
Базовый SQL
  • SQL
  • Базы данных
  • СУБД
  • PostgreSQL
  • SQL-запросы
  • Фильтрация данных
  • Группировка данных
  • Сортировка данных
  • Объединение таблиц
  • Подзапросы
  • Общие табличные выражения
  • Оконные функции
  • PySpark
Базы данных
База данных, СУБД, синтаксис языка SQL.
Срезы данных
ER-диаграмма. Логические и специальные операторы в SQL. Операторы работы с датой и временем. Обработка специальных значений. Условные конструкции в SQL-запросах.
Группировка и сортировка
Агрегирующие функции и их применение. Группировка данных. Сортировка данных. Группировка и сортировка по нескольким полям. Операторы HAVING, GROUP BY.
Связи и объединения таблиц
ER-диаграммы. Псевдонимы. Виды объединения таблиц. Оператор JOIN. Оператор INNER JOIN. Операторы LEFT OUTER JOIN и RIGHT OUTER JOIN. Оператор FULL OUTER JOIN. Виды присоединения: UNION и UNION ALL.
Подзапросы
Общие табличные выражения. Различие между подзапросом и присоединением. Работа со строками в PostgreSQL.
Схемы данных
Определение оконной функции. Определение и работа с окном. Особенности работы с оконными функциями. Операторы ранжирования. Расчёт кумулятивных функций. Операторы смещения.
PySpark
Распределённые системы. Структуры данных в PySpark. SQL-запросы в PySpark. RDD-датафреймы и работа с ними.
Напишете ряд запросов разной сложности к базе данных, в которой хранится информация о венчурных инвесторах, стартапах и инвестициях в них
12
5 тем・1 проект・1 неделя
Численные методы
  • Вычислительная сложность
  • Обучение нейросетей
  • Градиентный спуск
  • Градиентный бустинг
  • Функция потерь
Анализ алгоритмов
Вычислительная сложность. Время обучения линейной регрессии. Итеративные методы. Сравнение методов.
Градиентный спуск
Методы оптимизации. Функция потерь. Градиент функции. Градиентный спуск. Градиентный спуск для линейной регрессии. Стохастический градиентный спуск.
Градиентный бустинг
Ансамблевые методы. Градиентный бустинг. Регуляризация градиентного бустинга.
Разработаете модель для определения стоимости автомобиля с пробегом
13
3 темы・1 проект・1 неделя
Временные ряды
  • Анализ временных рядов
  • Прогнозирование временных рядов
  • Задача регрессии
Анализ временных рядов
Временные ряды. Ресемплирование. Скользящее среднее. Тренды и сезонность. Стационарные ряды. Разности временного ряда.
Прогнозирование временных рядов
Задача прогнозирования. Качество прогноза. Создание признаков. Обучение модели.
Построите модель и спрогнозируете пиковые нагрузки в такси
14
3 темы・1 проект・2 недели
Машинное обучение для текстов
  • Векторизация слов
  • Лемматизация
  • Эмбеддинги
  • Задача классификации
  • Задача регрессии
  • Word2vec
  • BERT
  • TF-ID
Векторизация слов
Лемматизация. Регулярные выражения. Векторизация слова. TF-ID.
Языковые представления
Эмбединги. Word2vec. BERT.
Ускорите модерацию комментариев в сообществе, автоматизировав оценку их токсичности
15
3 темы・1 проект・2 недели
Компьютерное зрение
  • Полносвязные сети
  • Свёрточные нейросети
  • Keras
  • LeNet
  • ResNet
  • Adam
Компьютерное зрение
Преобразование изображения в вектор. Аугментация. Классификация изображений.
Полносвязные сети
Полносвязные нейросети. Keras. Обучение нейронных сетей. Многослойные сети.
Свёрточные нейросети
Свёрточные слои. Свёрточные сети. LeNet. ResNet. Загрузчики данных. Adam.
Построите модель для определения приблизительного возраста человека по фотографии
16
3 темы・1 неделя
Обучение без учителя
Освоите ещё один способ машинного обучения, при котором система решает задачу без размеченных заранее данных, на основе их особенностей и структуры. Познакомитесь с задачами кластеризации и поиска аномалий.
17
1 проект・2 недели
Итоговый проект
Подтвердите, что освоили все необходимые навыки. Уточните задачу заказчика, пройдёте все стадии анализа данных и машинного обучения. Теперь без теории и поддержки наставников — всё как на реальной работе.

Будете работать над одним из проектов на выбор:
• Прогноз оттока клиентов в телекоммуникационной компании
• Предсказание параметров технологического процесса на металлургическом комбинате
18
Самостоятельно・В любое время
Дополнительные темы базового курса
Практика Python
Потренируетесь составлять запросы для получения данных. Составите датасет и обучите на нём модель. Оцените потенциальную опасность поездок для сервиса каршеринга и его клиентов.
Теория вероятностей
Вспомните или узнаете базовые термины в теории вероятностей. Потренируетесь работать с числами и выстраивать логику решения. Поработаете с заданиями, которые встречаются на собеседованиях.
Практика SQL
Решите несколько десятков дополнительных задач на отработку навыка применения SQL. Пройдёте практические задания по составлению SQL-запросов, поработаете с новыми базами данных.
Дополнительно・В любое время
Нейросети для специалистов по Data Science
Научитесь с помощью YandexGPT:
  • Генерировать гипотезы для анализа данных
  • Проверять гипотезы и предлагать улучшения
  • Оптимизировать процесс анализа данных
  • Искать информацию о методах и инструментах анализа данных
  • Вести документацию
  • YandexGPT
+7 тем・+6 проектов・+8 месяцев
Расширенный курс «Специалист по Data Science»
Расширенный формат стоит дороже, но включает в себя больше тем и проектов — чтобы усилить портфолио и повысить шансы на быстрое трудоустройство.
  • Дополнительные темы
  • Кейс для портфолио
  • Командная работа
  • Развитие софтскилов
Ещё 7 тем
Командная строка, Git, GitHub, продвинутые запросы SQL (оконные функции), работа с СУБД PostgreSQL, продвинутые инструменты PySpark, библиотека PyTorch
Ещё 6 проектов
По дополнительным темам, чтобы усилить портфолио
2 проекта на рабочих данных
Чтобы поработать в команде и получить реальный кейс в портфолио
В 2 раза больше вебинаров
Разберёте с наставниками все сложные кейсы
Больше навыков, которые помогут найти работу и быстрее вырасти до middle
Карьерный центр・1 месяц
Карьерный трек: подготовка к трудоустройству
Составите резюме, которое привлечёт внимание рекрутеров, и напишете сопроводительное письмо для откликов на вакансии. Узнаете, как правильно оформлять портфолио, и построите стратегию поиска работы.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет подготовки к трудоустройству.
Карьерный центр・До 6 месяцев
Акселерация: активный поиск работы с поддержкой HR-экспертов
Будете откликаться на вакансии, делать тестовые и ходить на собеседования, а мы вас поддержим. Например, расскажем о типичных ошибках в общении с работодателями и как их избежать. Акселерация может продолжаться до 6 месяцев — обычно этого достаточно, чтобы получить первую работу в IT.

Получите сертификат о завершении курса

Очень много практики

Ещё 7 месяцев после курса бесплатно помогаем с поиском работы — для этого у нас целый карьерный центр

10 000+ пользователей Практикума уже нашли новую работу

Это данные исследования ВШЭ — они основаны на опыте пользователей Яндекс Практикума на российском рынке труда

Как устроен курс

В программе есть модуль по YandexGPT

Работодатели ценят специалистов, которые умеют работать с нейросетями

Увидите возможности нейросетей, научитесь использовать их в работе, поймёте, когда это безопасно и этично, а когда нет

С чем YandexGPT может помочь специалисту по Data Science:
  • с генерацией и проверкой гипотез
  • ответами на вопросы о методах и инструментах анализа
  • ведением документации

Попробуйте любой формат курса бесплатно — выбрать один-единственный можно позже

  •                                        

Что входит в любой формат

  • Ещё можно платить частями Практикуму столько месяцев, сколько идёт курс. Общая стоимость будет меньше, чем в рассрочку от банка
  • Вернём деньги в любой момент за остаток курса,
    если что-то не понравится. Подробности — в 7 пункте оферты

Отвечаем на вопросы

Подойдёт ли мне этот курс?
Для тех, кто сомневается, мы спроектировали бесплатную часть, которая поможет получить ответ на этот вопрос. Если вы убедитесь, что выбранный курс вам не подходит, — это тоже положительный результат.
Можно ли освоить профессию Data Scientist с нуля за 8 месяцев?
Думаем, что да, если вы будете уделять занятиям не менее 20 часов в неделю, практиковаться и общаться с наставником. Тогда за 8 месяцев вы сможете освоить навыки специалиста по Data Science, соберёте портфолио проектов и начнёте свой путь в профессию.
Каким требованиям нужно соответствовать?
Вам не понадобятся специальные навыки или опыт — будете проходить всё с нуля. Главное — иметь компьютер и достаточно времени. Выше можно посмотреть программу, чтобы оценить количество материала и свои возможности.
Кто будет помогать мне проходить курс?
Все наставники — практикующие специалисты: сотрудники Яндекса и других крупных компаний. Программу составляют опытные методисты, а ещё действующие специалисты Яндекса, Школы анализа данных и других лидеров технологической индустрии.
Смогу ли я найти работу после курса?
Гарантий нет, но мы верим, что сможете. Работодателям важно, чтобы вы справлялись с реальными задачами, а не просто обладали набором знаний. После курса вы сможете применять знания на практике, а также мы предлагаем помощь HR-специалистов из нашего карьерного центра. Но вам точно придётся приложить усилия, чтобы найти работу: активно откликаться на вакансии, проходить собеседования, показывать свои проекты и делать тестовые задания.

По данным исследования* Высшей школы экономики, 69% пользователей Яндекс Практикума среди тех, кто хотел сменить профессию, начинают новую карьеру после курса. Больше половины из них — во время курса и в первые 2 месяца после его окончания.

* Данные исследования ВШЭ основаны на опыте пользователей Яндекс Практикума на российском рынке труда.
А если я хочу работать в Яндексе?
Некоторые участники наших курсов работают в сервисах Яндекса, в том числе и в Практикуме. Но с нашей стороны было бы нечестно что‑либо гарантировать и завышать ваши ожидания.

Без опыта попасть в крупную IT-компанию возможно, хотя и сложно. Программа составлена так, чтобы вы могли начать карьеру после курса и набраться первого опыта. С ним вам будет значительно проще претендовать на позицию в крупных компаниях.
Хорошо, а вы можете помочь с поиском работы?
Да. Вы сможете пройти подготовку к трудоустройству, которая состоит из 2 частей:

• Карьерный трек: участники курса при поддержке наших HR-экспертов составляют резюме или оформляют портфолио, пишут сопроводительные письма.
• Акселерация: участники курса начинают активный поиск работы, а мы им помогаем — отвечаем на вопросы, проводим тренировочные собеседования, предлагаем вакансии от партнёров.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет подготовки к трудоустройству.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрен перерыв, во время которого можно отдохнуть или повторить сложные темы.

Если случилось непредвиденное или понадобилось больше времени на закрепление материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более позднюю когорту. На общую стоимость курса это не повлияет.
Если не понравится, я могу вернуть деньги?
Конечно. Если курс ещё не начался, вернём всю сумму. Если уже начался, придётся оплатить прошедшие дни со старта вашей первой когорты — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Да, вы получите сертификат о завершении курса.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Курс будет стоить меньше, если оплатить его сразу целиком.

Через компанию: юридические лица также могут оплатить курс в Практикуме. Чтобы заказать счёт для оплаты, оставьте заявку на странице для корпоративных клиентов.
На каком языке проходит курс?
Всё будет на русском: теория, практические задания и вебинары, а ещё чаты с куратором, наставником и другими участниками курса.

Давайте поможем

Мы работаем с 09:00 до 18:00 по минскому времени и связываемся в течение одного дня. Если оставите заявку сейчас, то перезвоним уже в рабочее время.