Специалисты по Data Science нужны везде, где хранят и обрабатывают большие объёмы данных
Ещё их называют дата-сайентистами — Data Scientist
Освоите курс с нуля за 13 месяцев

Мощный набор навыков и инструментов

Это сейчас действительно актуально и требуется во всех вакансиях.

Python
Jupyter Notebook
Git
SQL
Командная строка
Pandas
NumPy
Matplotlib
Seaborn
SciPy
Scikit-learn
CatBoost
LightGBM/XGBoost
Shap
Optuna
AirFlow
MLFlow
Spark
Hugging Face
PyTorch
Регулярно обновляем программу, чтобы вы проходили только актуальное
Есть базовый и расширенный форматы — со вторым вы быстрее вырастете до уровня middle
7 тем・1 проект・~8 часов
Бесплатно
Основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимается Data Scientist. А после бесплатной части выберете подходящий формат курса: базовый или расширенный.
  • Python
  • Pandas
  • Seaborn
  • Переменные
  • Типы данных
  • Гипотезы
  • Ошибки
  • Тепловые карты
  • Базовый и расширенный формат
Moscow Catnamycs
Вывод данных на экран. CSV-файлы. Работа с таблицами. Тепловые карты. Умножение столбца на целое число.
Ошибки в коде
Синтаксические ошибки. Ошибки наименования. Ошибки при делении на ноль. Ошибки при импорте модуля.
Переменные и типы данных
Переменные. Типы данных. Арифметические операции с числами и строками.
Как выдвигать гипотезы
Гипотезы. HADI-циклы. Аналитическое мышление. Чтение графиков.
Работа в области данных
Задачи аналитика. Уточнение задач. Декомпозиция. Стадии проекта.
Машинное обучение
Модель. Обучающая и тестовая выборки. Объект и признак. Метрика Евклида. Алгоритм K‑ближайших соседей (KNN). Библиотека Scikit-learn.
Примените методы группировки и суммы, сегментируете пользователей и решите задачи классификации
1
3 спринта・3 темы・7 недель
Основы анализа данных с помощью SQL
  • Базы данных
  • СУБД
  • SQL
  • PostgreSQL
  • Предобработка данных
  • EDA
  • Ad-hoc-задачи
Извлечение данных
Структура баз данных и язык SQL. Извлечение данных из таблиц, их фильтрация, сортировка и агрегация. Базовые конструкции SELECT, WHERE, GROUP BY и ORDER BY. Получение данных по техническому заданию. Формирование простых аналитических выборок.
Обработка данных
Соединение таблиц (JOIN). Подзапросы. Обработка пропущенных значений и дубликатов. Преобразование данных. Создание столбцов. Работа с датой и временем. Множественные операции. Сложные SQL‑запросы для подготовки данных к анализу.
Анализ данных и ad‑hoc‑задачи
Оконные функции: агрегирующие, ранжирующие, смещения. Аналитические приёмы для проведения исследовательского анализа данных (EDA). Решение ad‑hoc‑задач от бизнеса через оконные функции и комбинацию SQL‑инструментов.
Научитесь извлекать и обрабатывать данные с помощью SQL‑запросов. Будете решать ad‑hoc‑запросы разной сложности в исследовательском анализе данных
1 проект・2 недели
Проект по модулю о SQL
Закрепите навыки извлечения данных с помощью SQL. Очистите и подготовите их для анализа, а потом соберёте витрину данных для решения ad‑hoc‑задачи бизнеса. Оформите отчёт с результатами.
2
4 спринта・4 темы・8 недель
Анализ данных с помощью Python
  • Python
  • Pandas
  • NumPy
  • Matplotlib
  • Seaborn
  • Jupyter Notebook
  • ООП
  • Терминал
  • Виртуальное окружение
  • Git
Основы Python
Базовый синтаксис. Простые алгоритмы. Переменные и типы данных. Работа со строками и списками. Логические выражения и условные операторы. Циклы и списковые включения. Вложенные конструкции, функции, множества и словари.
Предобработка данных
Ключевые техники подготовки данных к анализу. Основы библиотеки Pandas. Работа с датафреймами: индексация, фильтрация, обработка пропущенных значений и дубликатов. Преобразования. Категоризация. Работа с датой и временем.
Исследовательский анализ данных и визуализация
Выявление закономерностей и формулирование рекомендации на основе данных. Объединение датафреймов. Описательная статистика. Анализ взаимосвязей переменных. Построение сводных таблиц. Создание графиков для исследований.
Основы ООП и инструменты разработки для Data Science
Основы объектно ориентированного программирования (ООП). Классы для предобработки данных. Профессиональная среда разработки. Организация проектов на Python. Командная строка и терминал. Настройка виртуального окружения. Установка библиотек. Работа с Git и GitHub.
Подготовите данные для исследовательского анализа и проведёте его с помощью Python. Напишете скрипт предобработки. Настроите виртуальное окружение и репозиторий
1 проект・2 недели
Проект по модулю о Python
Научитесь очищать и предварительно обрабатывать данные. Проведёте исследовательский анализ и визуализируете результаты. Подготовите рекомендации для бизнеса и презентуете их.
3
3 спринта・3 темы・6 недель
Основы машинного обучения и линейные модели
  • Python
  • Pandas
  • Scikit-learn
  • Регрессия
  • Классификация
  • Jupyter Notebook
  • GridSearchCV
  • Метрики модели
Знакомство с ML и линейная регрессия
Построение и анализ первой модели. Понятие машинного обучения. Устройство данных. Типы задач. Оценка качества модели. Линейная регрессия и её обучение. Метрики и гиперпараметры.
Логистическая регрессия и задачи классификации
Базовый пайплайн построения и оценка моделей классификации. Различия в задачах классификации. Логистическая регрессия. Кросс‑валидация. Метрики Accuracy, Precision, Recall, F1 и другие. Их интерпретация. Выбор метрики для конкретной задачи.
Опорные векторы и техники классификации
Создание устойчивых и интерпретируемых моделей. Метод опорных векторов — SVM. Применение его к задачам бинарной и многоклассовой классификации. Методы отбора признаков и калибровки моделей для повышения точности предсказаний.
Обучите модель линейной регрессии и рассчитаете метрики этой модели. Решите задачу классификации. Напишете пайплайн предобработки данных и построите несколько линейных моделей
1 проект・2 недели
Проект по линейным моделям
Пройдёте полный цикл создания ML-решения: от предобработки данных и EDA до обучения моделей для задач регрессии и классификации, подбора гиперпараметров и определения наилучшего решения с точки зрения метрик.
4
4 спринта・4 темы・8 недель
Модели на основе деревьев
  • KNN
  • Решающее дерево
  • Случайный лес
  • Bias-variance tradeoff
  • Бустинг
  • Градиентный бустинг
  • Optuna
  • LightGBM
  • XGBoost
  • CatBoost
  • SHAP
Решающее дерево и KNN
Метрические алгоритмы — KNN. Решающие деревья: структура, принципы работы и ограничения. Проблемы переобучения. Методы регуляризации деревьев. Подбор гиперпараметров с помощью Optuna. Работа с данными для деревьев.
Ансамблирование моделей и Random Forest
Подходы к ансамблированию: бэггинг и стекинг. Метод случайного леса — Random Forest. Его отличие от бэггинга. Определение важности признаков. Работа с данными с временной структурой. Дисбаланс классов.
Бустинг и градиентный бустинг
Алгоритмы бустинга. Популярные библиотеки: LightGBM, XGBoost, CatBoost. Подбор гиперпараметров и интерпретация результатов моделей. Векторизация текстовых данных для их последующей обработки моделями.
Обучение без учителя
Снижение размерности и кластеризация. Выбор подходящего метода для задачи: PCA, t‑SNE, k‑means, DBSCAN. Оценка качества кластеризации. Исследование структуры данных и поиск закономерностей.
Выполните задачу регрессии с помощью KNN и решающего дерева. Обучите модель с несколькими деревьями решений и данными с дисбалансом классов. Поработаете с классификацией через градиентный бустинг
1 проект・2 недели
Проект по модулю о моделях на основе деревьев
Будете строить решения на основе алгоритмов деревьев. Извлечёте данные с помощью SQL, проведёте их очистку и исследовательский анализ, подготовите признаки для обучения модели и поэкспериментируете с её параметрами, чтобы добиться заданного уровня качества. Освоите валидацию и интерпретацию результатов модели. Оформите решение и логику работы модели в виде технической документации.
5
3 спринта・3 темы・6 недель
Валидация и тестирование моделей
  • Python
  • Pandas
  • NumPy
  • SciPy
  • Statsmodels
  • Scikit-learn
  • Airflow
  • SQL
  • PostgreSQL
  • Jupyter Notebook
  • Git
Внедрение и мониторинг моделей
Этапы жизненного цикла модели — внедрение и мониторинг. Организация пайплайнов расчёта модели в Airflow для инференса моделей. Мониторинг качества. Стабильность признаков и предсказаний. Выявление деградации модели. Переобучение.
Формулировка гипотез и основы статистики
Основы теории вероятностей и статистики. Случайные величины. Законы распределения данных. Нулевые и альтернативные гипотезы. Статистические тесты: t‑тест, множественная проверка гипотез. Оценка статистической значимости.
A/B‑тестирование и анализ экспериментов
Процесс проведения: от выбора метрик и расчёта размера выборки до анализа и проверки результатов с помощью статистических тестов (тест Манна — Уитни, z‑тест пропорций). Интерпретация результатов. Рекомендации для бизнеса.
Реализуете мониторинг качества модели через Airflow: напишете код, который автоматически читает данные за день и рассчитывает метрики. Проведёте A/B‑тест модели и проанализируете его результаты
1 проект・2 недели
Проект по модулю о валидации и тестировании моделей
Пройдёте полный цикл работы с моделью машинного обучения в продакшн-среде: научитесь читать и дорабатывать готовый код, подготовите модель к инференсу и реализуете её запуск на новых данных с помощью Airflow. Закрепите навыки работы с пайплайнами, автоматизацией процессов и системой контроля версий Git.
2 недели
Подготовка к собеседованиям по Data Science
Узнаете, как проходит техническая часть собеседований. Разберёте примеры задач, которые предлагают соискателям. Потренируетесь отвечать на вопросы, которые часто задают нанимающие менеджеры. Всё это позволит чувствовать себя уверенно на реальном интервью.
1 проект・3 недели
Итоговый проект базового курса
Пройдёте через весь жизненный цикл проекта по Data Science: от анализа данных и проблематики бизнеса до презентации результатов и внедрения решения.
+5 спринтов・+4 проекта・+15 недель
Расширенный курс «Специалист по Data Science»
У этого курса есть расширенный формат: стоит дороже, но включает в себя больше тем и проектов — чтобы усилить портфолио и повысить шансы на быстрое трудоустройство.
  • PySpark
  • MLflow
  • PyTorch
  • Hugging Face
  • Implicit
  • Scikit-learn
  • LightFM
  • Word2vec
Обработка больших данных
Работа с большими данными с помощью Apache Spark. Обработка распределённых датасетов. Оптимизация производительности. SQL в PySpark.
Трекинг экспериментов в MLflow
MLflow для логирования экспериментов и управления жизненным циклом моделей.
Введение в глубинное обучение и нейросети для изображений
Архитектура нейронных сетей: полносвязные, свёрточные. Цикл обучения и валидации модели на фреймворке PyTorch для изображений.
Нейронные сети для текстов
Модели на архитектуре трасформеров: BERT, GPT. Работа с векторным представлением текстов. Адаптация предобученной модели из Hugging Face.
Рекомендательные системы
Устройство контентных, коллаборативных и гибридных подходов. Выбор метрик. Реализация рекомендаций, готовых к внедрению в продакшн.
Дополнительный проект в Мастерской
В условиях, которые максимально приближены к реальным, выполните задачу бизнеса от настоящего заказчика. Поработаете с сырыми данными и обучите модель.
Погрузитесь в продвинутые темы: работу с большими данными, логирование экспериментов с параметрами модели, архитектуру нейросетей. Узнаете подходы к построению рекомендательных систем и научитесь разрабатывать решения, готовые к запуску в продакшн
1 проект・3 недели
Итоговый проект расширенного курса
Тоже пройдёте весь жизненный цикл проекта по Data Science, но столкнётесь с новыми техническими задачами: обработкой больших данных на PySpark и управлением экспериментами через MLflow. У вас будет выбор из двух датасетов, на которых можно выполнять проект.
Карьерный центр・1 месяц
Карьерный трек: подготовка к трудоустройству
Составите резюме, которое привлечёт внимание рекрутеров, и напишете сопроводительное письмо для откликов на вакансии. Узнаете, как правильно оформлять портфолио, и построите стратегию поиска работы.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет карьерного трека.
Карьерный центр・До 6 месяцев
Карьерный трек: акселерация
Акселерация — активный поиск работы с поддержкой HR‑экспертов. Будете откликаться на вакансии, делать тестовые и ходить на собеседования, а мы вас дистанционно поддержим. Например, расскажем, какие ошибки бывают в общении с работодателем и как их избежать. Акселерация может продолжаться до 6 месяцев — обычно этого достаточно, чтобы получить первую работу в IT.
Получите сертификат о завершении курса
Очень много практики
Ещё 7 месяцев после курса бесплатно помогаем с поиском работы — для этого у нас целый карьерный центр
10 000+ пользователей Практикума уже нашли новую работу
Это данные исследования ВШЭ — они основаны на опыте пользователей Яндекс Практикума на российском рынке труда
Как устроен курс
В программе есть модуль по YandexGPT
Работодатели ценят специалистов, которые умеют работать с нейросетями
Увидите возможности нейросетей, научитесь использовать их в работе, поймёте, когда это безопасно и этично, а когда нет
С чем YandexGPT может помочь специалисту по Data Science:
  • с генерацией и проверкой гипотез
  • ответами на вопросы о методах и инструментах анализа
  • ведением документации

Если у вас есть вопросы про курс, оставьте заявку — мы позвоним

Попробуйте любой формат курса бесплатно — выбрать один-единственный можно позже

  •                                        

Что входит в любой формат

  • Ещё можно платить частями Практикуму столько месяцев, сколько идёт курс. Общая стоимость будет меньше, чем в рассрочку от банка
  • Вернём деньги в любой момент за остаток курса,
    если что-то не понравится. Подробности — в 7 пункте оферты
Отвечаем на вопросы
Подойдёт ли мне этот курс?
Для тех, кто сомневается, мы спроектировали бесплатную часть, которая поможет получить ответ на этот вопрос. Если вы убедитесь, что выбранный курс вам не подходит, — это тоже положительный результат.
Можно ли освоить профессию Data Scientist с нуля за 13 месяцев?
На курсе вы получите всё, чтобы стать специалистом по Data Science. Но результат зависит от вас. Уделяйте курсу не меньше 15 часов в неделю, выполняйте практические задания, общайтесь с экспертами, и всё получится.
Каким требованиям нужно соответствовать?
Вам не понадобятся специальные навыки или опыт — будете проходить всё с нуля. Главное — иметь компьютер и достаточно времени. Выше можно посмотреть программу, чтобы оценить количество материала и свои возможности.
Кто будет помогать мне проходить курс?
Все наставники — практикующие специалисты: сотрудники Яндекса и других крупных компаний. Программу составляют опытные методисты, а ещё действующие специалисты Яндекса, Школы анализа данных и других лидеров технологической индустрии.
Смогу ли я найти работу после курса?
Гарантий нет, но мы верим, что сможете. Работодателям важно, чтобы вы справлялись с реальными задачами, а не просто обладали набором знаний. После курса вы сможете применять знания на практике, а также мы предлагаем помощь HR-специалистов из нашего карьерного центра. Но вам точно придётся приложить усилия, чтобы найти работу: активно откликаться на вакансии, проходить собеседования, показывать свои проекты и делать тестовые задания.

По данным исследования* Высшей школы экономики, 69% пользователей Яндекс Практикума среди тех, кто хотел сменить профессию, начинают новую карьеру после курса. Больше половины из них — во время курса и в первые 2 месяца после его окончания.

* Данные исследования ВШЭ основаны на опыте пользователей Яндекс Практикума на российском рынке труда.
А если я хочу работать в Яндексе?
Некоторые участники наших курсов работают в сервисах Яндекса, в том числе и в Практикуме. Но с нашей стороны было бы нечестно что‑либо гарантировать и завышать ваши ожидания.

Без опыта попасть в крупную IT-компанию возможно, хотя и сложно. Программа составлена так, чтобы вы могли начать карьеру после курса и набраться первого опыта. С ним вам будет значительно проще претендовать на позицию в крупных компаниях.
Хорошо, а вы можете помочь с поиском работы?
Да. Вы сможете пройти карьерный трек, который состоит из 2 частей:

• Подготовка к трудоустройству: участники курса при поддержке наших HR-экспертов составляют резюме или оформляют портфолио, пишут сопроводительные письма.
• Акселерация: участники курса начинают активный поиск работы, а мы им помогаем — отвечаем на вопросы, проводим тренировочные собеседования, предлагаем вакансии от партнёров.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет карьерного трека.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрен перерыв, во время которого можно отдохнуть или повторить сложные темы.

Если случилось непредвиденное или понадобилось больше времени на закрепление материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более позднюю когорту. На общую стоимость курса это не повлияет.
Если не понравится, я могу вернуть деньги?
Конечно. Если курс ещё не начался, вернём всю сумму. Если уже начался, придётся оплатить прошедшие дни со старта вашей первой когорты — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Да, вы получите сертификат о завершении курса.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Курс будет стоить меньше, если оплатить его сразу целиком.

Через компанию: юридические лица также могут оплатить курс в Практикуме. Чтобы заказать счёт для оплаты, оставьте заявку на странице для корпоративных клиентов.
На каком языке проходит курс?
Всё будет на русском: теория, практические задания и вебинары, а ещё чаты с куратором, наставником и другими участниками курса.

Давайте поможем

Мы работаем с 09:00 до 18:00 по минскому времени и связываемся в течение одного дня. Если оставите заявку сейчас, то перезвоним уже в рабочее время.