Освоите всё с нуля за 13 месяцев — от простого к сложному. Будете решать настоящие задачи бизнеса и практиковаться на реальных данных от лидеров индустрии.
Программа актуальна в 2025 году и отвечает требованиям работодателей
Python и его библиотеки, Jupyter Notebook, SQL, Git, AirFlow
Портфолио из 17+ проектов, каждый из которых проверит эксперт
Полезные знакомства с экспертами по анализу данных и машинному обучению
Подготовка к собеседованиям и презентация прошлого опыта
Сертификат о завершении курса
Специалисты по Data Science нужны везде, где хранят и обрабатывают большие объёмы данных
Ещё их называют дата-сайентистами — Data Scientist
От промышленности и IT до банков и коммерции
Например, Data Scientist может определить кредитоспособность клиентов банка, улучшить работу светофоров или обучить колонку с Алисой новым командам
Спрос растёт, а самих дата-сайентистов пока не так много на рынке труда
Всё больше компаний открывают отделы Data Science, чтобы оптимизировать бизнес‑процессы и увеличивать прибыль
Специалистов по Data Science не хватает, поэтому у них большие зарплаты и компании борются за них
У вас будет много разных интересных задач, но придётся всё время осваивать новые технологии и развиваться
Особенности курса
Плавный вход в Data Science
Идём от простого к сложному: вы начнёте с SQL и Python, а потом углубитесь в машинное обучение. Занятость не больше 15 часов в неделю.
Практика на реальных данных
Собрали кейсы Яндекса и наших партнёров — будете делать проекты, которые максимально приближены к настоящим бизнес‑задачам.
Общение с экспертами
На воркшопах и вебинарах, во время лайвкодинга и QA‑сессий. Ещё опытные дата‑сайентисты дадут обратную связь по вашим проектам.
Подготовка к собеседованиям
Объясним, как пройти технический отбор и использовать предыдущий профессиональный опыт в новой сфере.
Освоите курс с нуля за 13 месяцев
Мощный набор навыков и инструментов
Это сейчас действительно актуально и требуется во всех вакансиях.
Python
Jupyter Notebook
Git
SQL
Командная строка
Pandas
NumPy
Matplotlib
Seaborn
SciPy
Scikit-learn
CatBoost
LightGBM/XGBoost
Shap
Optuna
AirFlow
MLFlow
Spark
Hugging Face
PyTorch
Регулярно обновляем программу, чтобы вы проходили только актуальное
Есть базовый и расширенный форматы — со вторым вы быстрее вырастете до уровня middle
7 тем・1 проект・~8 часов
Бесплатно
Основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимается Data Scientist.
А после бесплатной части выберете подходящий формат курса: базовый или расширенный.
Python
Pandas
Seaborn
Переменные
Типы данных
Гипотезы
Ошибки
Тепловые карты
Базовый и расширенный формат
Moscow Catnamycs
Вывод данных на экран. CSV-файлы. Работа с таблицами. Тепловые карты. Умножение столбца на целое число.
Ошибки в коде
Синтаксические ошибки. Ошибки наименования. Ошибки при делении на ноль. Ошибки при импорте модуля.
Переменные и типы данных
Переменные. Типы данных. Арифметические операции с числами и строками.
Задачи аналитика. Уточнение задач. Декомпозиция. Стадии проекта.
Машинное обучение
Модель. Обучающая и тестовая выборки. Объект и признак. Метрика Евклида. Алгоритм K‑ближайших соседей (KNN). Библиотека Scikit-learn.
Примените методы группировки и суммы, сегментируете пользователей и решите задачи классификации
1
3 спринта・3 темы・7 недель
Основы анализа данных с помощью SQL
Базы данных
СУБД
SQL
PostgreSQL
Предобработка данных
EDA
Ad-hoc-задачи
Извлечение данных
Структура баз данных и язык SQL. Извлечение данных из таблиц, их фильтрация, сортировка и агрегация. Базовые конструкции SELECT, WHERE, GROUP BY и ORDER BY. Получение данных по техническому заданию. Формирование простых аналитических выборок.
Обработка данных
Соединение таблиц (JOIN). Подзапросы. Обработка пропущенных значений и дубликатов. Преобразование данных. Создание столбцов. Работа с датой и временем. Множественные операции. Сложные SQL‑запросы для подготовки данных к анализу.
Анализ данных и ad‑hoc‑задачи
Оконные функции: агрегирующие, ранжирующие, смещения. Аналитические приёмы для проведения исследовательского анализа данных (EDA). Решение ad‑hoc‑задач от бизнеса через оконные функции и комбинацию SQL‑инструментов.
Научитесь извлекать и обрабатывать данные с помощью SQL‑запросов. Будете решать ad‑hoc‑запросы разной сложности в исследовательском анализе данных
1 проект・2 недели
Проект по модулю о SQL
Закрепите навыки извлечения данных с помощью SQL. Очистите и подготовите их для анализа, а потом соберёте витрину данных для решения ad‑hoc‑задачи бизнеса. Оформите отчёт с результатами.
2
4 спринта・4 темы・8 недель
Анализ данных с помощью Python
Python
Pandas
NumPy
Matplotlib
Seaborn
Jupyter Notebook
ООП
Терминал
Виртуальное окружение
Git
Основы Python
Базовый синтаксис. Простые алгоритмы. Переменные и типы данных. Работа со строками и списками. Логические выражения и условные операторы. Циклы и списковые включения. Вложенные конструкции, функции, множества и словари.
Предобработка данных
Ключевые техники подготовки данных к анализу. Основы библиотеки Pandas. Работа с датафреймами: индексация, фильтрация, обработка пропущенных значений и дубликатов. Преобразования. Категоризация. Работа с датой и временем.
Исследовательский анализ данных и визуализация
Выявление закономерностей и формулирование рекомендации на основе данных. Объединение датафреймов. Описательная статистика. Анализ взаимосвязей переменных. Построение сводных таблиц. Создание графиков для исследований.
Основы ООП и инструменты разработки для Data Science
Основы объектно ориентированного программирования (ООП). Классы для предобработки данных. Профессиональная среда разработки. Организация проектов на Python. Командная строка и терминал. Настройка виртуального окружения. Установка библиотек. Работа с Git и GitHub.
Подготовите данные для исследовательского анализа и проведёте его с помощью Python. Напишете скрипт предобработки. Настроите виртуальное окружение и репозиторий
1 проект・2 недели
Проект по модулю о Python
Научитесь очищать и предварительно обрабатывать данные. Проведёте исследовательский анализ и визуализируете результаты. Подготовите рекомендации для бизнеса и презентуете их.
3
3 спринта・3 темы・6 недель
Основы машинного обучения и линейные модели
Python
Pandas
Scikit-learn
Регрессия
Классификация
Jupyter Notebook
GridSearchCV
Метрики модели
Знакомство с ML и линейная регрессия
Построение и анализ первой модели. Понятие машинного обучения. Устройство данных. Типы задач. Оценка качества модели. Линейная регрессия и её обучение. Метрики и гиперпараметры.
Логистическая регрессия и задачи классификации
Базовый пайплайн построения и оценка моделей классификации.
Различия в задачах классификации. Логистическая регрессия. Кросс‑валидация. Метрики Accuracy, Precision, Recall, F1 и другие. Их интерпретация. Выбор метрики для конкретной задачи.
Опорные векторы и техники классификации
Создание устойчивых и интерпретируемых моделей.
Метод опорных векторов — SVM. Применение его к задачам бинарной и многоклассовой классификации. Методы отбора признаков и калибровки моделей для повышения точности предсказаний.
Обучите модель линейной регрессии и рассчитаете метрики этой модели. Решите задачу классификации. Напишете пайплайн предобработки данных и построите несколько линейных моделей
1 проект・2 недели
Проект по линейным моделям
Пройдёте полный цикл создания ML-решения: от предобработки данных и EDA до обучения моделей для задач регрессии и классификации, подбора гиперпараметров и определения наилучшего решения с точки зрения метрик.
4
4 спринта・4 темы・8 недель
Модели на основе деревьев
KNN
Решающее дерево
Случайный лес
Bias-variance tradeoff
Бустинг
Градиентный бустинг
Optuna
LightGBM
XGBoost
CatBoost
SHAP
Решающее дерево и KNN
Метрические алгоритмы — KNN. Решающие деревья: структура, принципы работы и ограничения. Проблемы переобучения. Методы регуляризации деревьев. Подбор гиперпараметров с помощью Optuna. Работа с данными для деревьев.
Ансамблирование моделей и Random Forest
Подходы к ансамблированию: бэггинг и стекинг. Метод случайного леса — Random Forest. Его отличие от бэггинга. Определение важности признаков. Работа с данными с временной структурой. Дисбаланс классов.
Бустинг и градиентный бустинг
Алгоритмы бустинга. Популярные библиотеки: LightGBM, XGBoost, CatBoost. Подбор гиперпараметров и интерпретация результатов моделей. Векторизация текстовых данных для их последующей обработки моделями.
Обучение без учителя
Снижение размерности и кластеризация. Выбор подходящего метода для задачи: PCA, t‑SNE, k‑means, DBSCAN. Оценка качества кластеризации. Исследование структуры данных и поиск закономерностей.
Выполните задачу регрессии с помощью KNN и решающего дерева. Обучите модель с несколькими деревьями решений и данными с дисбалансом классов. Поработаете с классификацией через градиентный бустинг
1 проект・2 недели
Проект по модулю о моделях на основе деревьев
Будете строить решения на основе алгоритмов деревьев. Извлечёте данные с помощью SQL, проведёте их очистку и исследовательский анализ, подготовите признаки для обучения модели и поэкспериментируете с её параметрами, чтобы добиться заданного уровня качества. Освоите валидацию и интерпретацию результатов модели. Оформите решение и логику работы модели в виде технической документации.
5
3 спринта・3 темы・6 недель
Валидация и тестирование моделей
Python
Pandas
NumPy
SciPy
Statsmodels
Scikit-learn
Airflow
SQL
PostgreSQL
Jupyter Notebook
Git
Внедрение и мониторинг моделей
Этапы жизненного цикла модели — внедрение и мониторинг. Организация пайплайнов расчёта модели в Airflow для инференса моделей. Мониторинг качества. Стабильность признаков и предсказаний. Выявление деградации модели. Переобучение.
Формулировка гипотез и основы статистики
Основы теории вероятностей и статистики. Случайные величины. Законы распределения данных. Нулевые и альтернативные гипотезы. Статистические тесты: t‑тест, множественная проверка гипотез. Оценка статистической значимости.
A/B‑тестирование и анализ экспериментов
Процесс проведения: от выбора метрик и расчёта размера выборки до анализа и проверки результатов с помощью статистических тестов (тест Манна — Уитни, z‑тест пропорций). Интерпретация результатов. Рекомендации для бизнеса.
Реализуете мониторинг качества модели через Airflow: напишете код, который автоматически читает данные за день и рассчитывает метрики. Проведёте A/B‑тест модели и проанализируете его результаты
1 проект・2 недели
Проект по модулю о валидации и тестировании моделей
Пройдёте полный цикл работы с моделью машинного обучения в продакшн-среде: научитесь читать и дорабатывать готовый код, подготовите модель к инференсу и реализуете её запуск на новых данных с помощью Airflow. Закрепите навыки работы с пайплайнами, автоматизацией процессов и системой контроля версий Git.
2 недели
Подготовка к собеседованиям по Data Science
Узнаете, как проходит техническая часть собеседований. Разберёте примеры задач, которые предлагают соискателям. Потренируетесь отвечать на вопросы, которые часто задают нанимающие менеджеры. Всё это позволит чувствовать себя уверенно на реальном интервью.
1 проект・3 недели
Итоговый проект базового курса
Пройдёте через весь жизненный цикл проекта по Data Science: от анализа данных и проблематики бизнеса до презентации результатов и внедрения решения.
+5 спринтов・+4 проекта・+15 недель
Расширенный курс «Специалист по Data Science»
У этого курса есть расширенный формат: стоит дороже, но включает в себя больше тем и проектов — чтобы усилить портфолио и повысить шансы на быстрое трудоустройство.
PySpark
MLflow
PyTorch
Hugging Face
Implicit
Scikit-learn
LightFM
Word2vec
Обработка больших данных
Работа с большими данными с помощью Apache Spark. Обработка распределённых датасетов. Оптимизация производительности. SQL в PySpark.
Трекинг экспериментов в MLflow
MLflow для логирования экспериментов и управления жизненным циклом моделей.
Введение в глубинное обучение и нейросети для изображений
Архитектура нейронных сетей: полносвязные, свёрточные. Цикл обучения и валидации модели на фреймворке PyTorch для изображений.
Нейронные сети для текстов
Модели на архитектуре трасформеров: BERT, GPT. Работа с векторным представлением текстов. Адаптация предобученной модели из Hugging Face.
Рекомендательные системы
Устройство контентных, коллаборативных и гибридных подходов. Выбор метрик. Реализация рекомендаций, готовых к внедрению в продакшн.
Дополнительный проект в Мастерской
В условиях, которые максимально приближены к реальным, выполните задачу бизнеса от настоящего заказчика. Поработаете с сырыми данными и обучите модель.
Погрузитесь в продвинутые темы: работу с большими данными, логирование экспериментов с параметрами модели, архитектуру нейросетей. Узнаете подходы к построению рекомендательных систем и научитесь разрабатывать решения, готовые к запуску в продакшн
1 проект・3 недели
Итоговый проект расширенного курса
Тоже пройдёте весь жизненный цикл проекта по Data Science, но столкнётесь с новыми техническими задачами: обработкой больших данных на PySpark и управлением экспериментами через MLflow. У вас будет выбор из двух датасетов, на которых можно выполнять проект.
Карьерный центр・1 месяц
Карьерный трек: подготовка к трудоустройству
Составите резюме, которое привлечёт внимание рекрутеров, и напишете сопроводительное письмо для откликов на вакансии. Узнаете, как правильно оформлять портфолио, и построите стратегию поиска работы.
Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет карьерного трека.
Карьерный центр・До 6 месяцев
Карьерный трек: акселерация
Акселерация — активный поиск работы с поддержкой HR‑экспертов. Будете откликаться на вакансии, делать тестовые и ходить на собеседования, а мы вас дистанционно поддержим. Например, расскажем, какие ошибки бывают в общении с работодателем и как их избежать. Акселерация может продолжаться до 6 месяцев — обычно этого достаточно, чтобы получить первую работу в IT.
Получите сертификат о завершении курса
Очень много практики
Соберёте солидное портфолио: в базовом курсе сделаете 17 проектов, а в расширенном — 22
Будете решать конкретные задачи бизнеса и разбирать кейсы из практики. Проекты проверят эксперты и подскажут, что у вас получается хорошо, а что нужно развивать.
Проекты от настоящих заказчиков и хакатоны, чтобы получить реальный опыт
В Мастерской Практикума сможете поучаствовать в реальных проектах, почувствовать себя частью команды разработки и наладить полезные связи
Участники курса разработали решение для поиска каверов в Яндекс Музыке. Они сравнивали тексты песен и искали похожие в огромной базе данных с помощью технологий, которые освоили на курсе: NLP, мультиязычные эмбеддинги, приближённый поиск ближайших соседей, Learning to Rank.
Участники курса поработали с Буше — крупной сетью булочных и кафе в Санкт‑Петербурге. На основе полученных данных они обучили ML‑модели предсказывать вероятности оттока клиентов.
Вместе с Samokat.tесh мы организовали воркшоп для участников курса Специалист по Data Science. Они поработали с реальными задачами по отбору товаров для маркетплейса и посоревновались на платформе Kaggle.
На хакатоне участники курса помогли Яндекс Маркету оптимизировать процесс выбора упаковки: разработали продукт, который определяет нужные упаковочные материалы по описанию товара.
Ещё 7 месяцев после курса бесплатно помогаем с поиском работы — для этого у нас целый карьерный центр
Готовим к выходу на рынок IT: объясняем, как использовать предыдущий опыт и презентовать новые навыки
Резюме и сопроводительные письма
Изучаем ваш опыт и объясняем, как выделяться среди других кандидатов
Вакансии от партнёров и хакатоны
Организуем всё это, чтобы вы набрались реального опыта и быстрее вышли на новую работу
Пробные собеседования
Проводим и технические собеседования с нанимающими специалистами и интервью с рекрутерами
10 000+ пользователей Практикума уже нашли новую работу
Это данные исследования ВШЭ — они основаны на опыте пользователей Яндекс Практикума на российском рынке труда
Как устроен курс
Никаких давно снятых видео и длинных лекций
Вы проходите теорию и закрепляете её на практике в интерактивном тренажёре. Можно проходить курс во сколько и где удобно, главное — укладываться в дедлайны по проектам.
По расписанию только воркшопы с наставниками, остальное — в своём темпе
Опытные дата-сайентисты разбирают сложные кейсы и отвечают на ваши вопросы на живых воркшопах. Если не успеваете, можно смотреть в записи.
Курс в Практикуме похож на реальную работу
Программа поделена на спринты — отрезки по 2–3 недели, за которые вы изучаете тему и делаете проект. Потом отправляете его на ревью, а эксперты проверяют и комментируют. И тот же цикл дальше, пока не дойдёте до конца.
В программе есть модуль по YandexGPT
Работодатели ценят специалистов, которые умеют работать с нейросетями
Увидите возможности нейросетей, научитесь использовать их в работе, поймёте, когда это безопасно и этично, а когда нет
С чем YandexGPT может помочь специалисту по Data Science:
с генерацией и проверкой гипотез
ответами на вопросы о методах и инструментах анализа
ведением документации
Будете заниматься сами, но не в одиночестве — вас поддержит заботливая команда Практикума
Эксперты помогают разобраться, если что-то непонятно
Это тоже практикующие специалисты по Data Science —обращайтесь к ним, когда возникнут вопросы по теории или проектам.
Сослан Табуев
Аналитик-разработчик в Яндексе. В сфере Data Science работает 3 года, а в IT и математике — больше 20 лет.
Анна Осина
Руководитель отдела дата-анализа в AliExpress Россия. Занимается Data Science больше 5 лет.
Ольга Макаревич
Аналитик данных в Университете 2035. Работает в сфере Data Science 2 года.
Если у вас есть вопросы про курс, оставьте заявку — мы позвоним
Попробуйте любой формат курса бесплатно — выбрать один-единственный можно позже
Что входит в любой формат
Ещё можно платить частями Практикуму столько месяцев, сколько идёт курс. Общая стоимость будет меньше, чем в рассрочку от банка
Вернём деньги в любой момент за остаток курса,
если что-то не понравится. Подробности — в 7 пункте оферты
Отвечаем на вопросы
Подойдёт ли мне этот курс?
Для тех, кто сомневается, мы спроектировали бесплатную часть, которая поможет получить ответ на этот вопрос. Если вы убедитесь, что выбранный курс вам не подходит, — это тоже положительный результат.
Можно ли освоить профессию Data Scientist с нуля за 13 месяцев?
На курсе вы получите всё, чтобы стать специалистом по Data Science. Но результат зависит от вас. Уделяйте курсу не меньше 15 часов в неделю, выполняйте практические задания, общайтесь с экспертами, и всё получится.
Каким требованиям нужно соответствовать?
Вам не понадобятся специальные навыки или опыт — будете проходить всё с нуля. Главное — иметь компьютер и достаточно времени. Выше можно посмотреть программу, чтобы оценить количество материала и свои возможности.
Кто будет помогать мне проходить курс?
Все наставники — практикующие специалисты: сотрудники Яндекса и других крупных компаний. Программу составляют опытные методисты, а ещё действующие специалисты Яндекса, Школы анализа данных и других лидеров технологической индустрии.
Смогу ли я найти работу после курса?
Гарантий нет, но мы верим, что сможете. Работодателям важно, чтобы вы справлялись с реальными задачами, а не просто обладали набором знаний. После курса вы сможете применять знания на практике, а также мы предлагаем помощь HR-специалистов из нашего карьерного центра. Но вам точно придётся приложить усилия, чтобы найти работу: активно откликаться на вакансии, проходить собеседования, показывать свои проекты и делать тестовые задания.
По данным исследования* Высшей школы экономики, 69% пользователей Яндекс Практикума среди тех, кто хотел сменить профессию, начинают новую карьеру после курса. Больше половины из них — во время курса и в первые 2 месяца после его окончания.
* Данные исследования ВШЭ основаны на опыте пользователей Яндекс Практикума на российском рынке труда.
А если я хочу работать в Яндексе?
Некоторые участники наших курсов работают в сервисах Яндекса, в том числе и в Практикуме. Но с нашей стороны было бы нечестно что‑либо гарантировать и завышать ваши ожидания.
Без опыта попасть в крупную IT-компанию возможно, хотя и сложно. Программа составлена так, чтобы вы могли начать карьеру после курса и набраться первого опыта. С ним вам будет значительно проще претендовать на позицию в крупных компаниях.
Хорошо, а вы можете помочь с поиском работы?
Да. Вы сможете пройти карьерный трек, который состоит из 2 частей:
• Подготовка к трудоустройству: участники курса при поддержке наших HR-экспертов составляют резюме или оформляют портфолио, пишут сопроводительные письма.
• Акселерация: участники курса начинают активный поиск работы, а мы им помогаем — отвечаем на вопросы, проводим тренировочные собеседования, предлагаем вакансии от партнёров.
Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет карьерного трека.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрен перерыв, во время которого можно отдохнуть или повторить сложные темы.
Если случилось непредвиденное или понадобилось больше времени на закрепление материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более позднюю когорту. На общую стоимость курса это не повлияет.
Если не понравится, я могу вернуть деньги?
Конечно. Если курс ещё не начался, вернём всю сумму. Если уже начался, придётся оплатить прошедшие дни со старта вашей первой когорты — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Да, вы получите сертификат о завершении курса.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.
Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Курс будет стоить меньше, если оплатить его сразу целиком.
Через компанию: юридические лица также могут оплатить курс в Практикуме. Чтобы заказать счёт для оплаты, оставьте заявку на странице для корпоративных клиентов.
На каком языке проходит курс?
Всё будет на русском: теория, практические задания и вебинары, а ещё чаты с куратором, наставником и другими участниками курса.
Давайте поможем
Мы работаем с 09:00 до 18:00 по минскому времени и связываемся в течение одного дня. Если оставите заявку сейчас, то перезвоним уже в рабочее время.