Чем занимается инженер машинного обучения

Работает с данными и создаёт на их основе алгоритмы машинного обучения, которые помогают решать прикладные задачи.

Инженерная составляющая подразумевает подготовку и вывод модели в работу, поддержку её качества, улучшение эффективности. ML‑Engineer часто работает в паре со специалистами по Data Science, аналитиками данных и инженерами данных.

Получите мощный набор навыков и инструментов

DVC
MLflow
Airflow
Optuna
Docker
FastAPI
Yandex Cloud

Программа курса

Рассчитана на 4 месяца, курсу нужно уделять по 15–20 часов в неделю
6 тем・~3 часа
Бесплатно
Как стать ML-инженером
1 модуль — бесплатно, чтобы вы познакомились с ролью инженера машинного обучения и поняли, хотите ли развиваться в этом направлении
  • Переменные и типы
  • Циклы и ветвления
  • Функции
  • Библиотеки
  • Протокол HTTP
Кто такой ML‑инженер
Что это за роль и зачем она нужна, задачи ML‑инженера
Навыки ML‑инженера
Что вы уже знаете и чему нужно научиться для успешной карьеры
Отличия от других профессий
В чём разница между ML‑инженером и специалистом по Data Science, инженером или аналитиком данных, DevOps‑ и MLOps‑инженерами
О курсе
Что вас ждёт в каждом из спринтов, какие рабочие инструменты вы освоите, как будете практиковаться, сколько длится курс
Пройдёте входное тестирование и поймёте, подходит ли вам курс
2
5 тем・1 проект・3 недели
Разработка пайплайнов подготовки данных и обучения модели
  • DVC
  • AirFlow
  • S3
Подготовка и трансформация данных в Airflow
Знакомство с Airflow, первый DAG, подготовка данных для обучение базовой модели
Создание ML‑модели и настройка DVC‑пайплайна
Автоматизация подготовки данных (ETL) с помощью Airflow, обучение базовой модели, создание и запуск DVC‑пайплайна, версионирование артефактов
Для сервиса Яндекс Недвижимость настроите процесс обучения модели, которая должна помочь остановить отток клиентов
3
6 тем・1 проект・3 недели
Улучшение baseline-модели
  • MLflow
  • Optuna
  • Mlxtend
  • Продвинутый EDA
Контроль за экспериментами
Основные сущности MLflow: Tracking, Projects, Models, Model Registry, развёртывание MLflow, логирование ML‑модели, сохранение окружения, визуализация результатов, методы версионирования модели и контроль изменений, доступ к результатам и артефактам моделей через API
Конструирование признаков: Feature Engineering
Продвинутый EDA (Exploratory Data Analysis), работа с разными типами признаков: ускорение обработки, применение автоматической генерации; отбор наиболее важных признаков, организация обработки данных
Подбор гиперпараметров модели
Cтандартные методы подбора: решётчатый поиск (Grid Search) и случайный поиск (Random Search), байесовский подход; фреймворк Optuna, визуализация процесса подбора гиперпараметров — Optuna и MLflow одновременно
Улучшите качество модели с помощью Feature Engineering и оптимизации гиперпараметров
4
6 тем・1 проект・3 недели
Релиз модели в продакшен
  • Docker
  • FastAPI
  • Yandex.Cloud
  • Uvicorn
  • Prometheus
  • Grafana
Создание микросервиса
Архитектура приложений, использование FastAPI для написания микросервиса на базе ML‑модели, его сборка, отладка и запуск
Контейнеризация микросервиса
Настройка изолированного окружения, использование готовых Docker‑образов и запуск Python‑скриптов, Docker‑файл для запуска, оптимизация разработки и запуска приложений — Docker Compose
Мониторинг ML‑модели
Метрики мониторинга в продакшене, их сбор, хранение (Prometheus Server), аналитика (PromQL) и визуализация в Grafana
Создадите сервис на базе ML‑модели и развернёте его в облачной инфраструктуре
1 неделя
Перерыв
5
7 тем・1 проект・3 недели
Создание рекомендательной системы
  • Uvicorn
  • implicit
  • catboost
  • U2U, I2I, ALS
  • S3
Рекомендательные системы
Принципы и алгоритмы персональных рекомендаций, виды рекомендательных систем, «холодный старт», матрица взаимодействий
Базовые рекомендации
Коллаборативная фильтрация (ALS), контентные рекомендации, валидация рекомендательной системы
Двухстадийный подход
Генерация наборов рекомендаций с помощью разных алгоритмов, ранжирование полученных рекомендаций для отбора лучших из них
Архитектура рекомендательных систем
Типовая архитектура, онлайн‑рекомендации, сервис рекомендаций: ASGI‑сервер Uvicorn на базе фреймворка FastAPI
Разработаете рекомендательную систему для улучшения предсказаний в Яндекс Музыке, оформите сервис и выкатите его в продакшен
6
7 тем・1 проект・3 недели
Создание uplift-модели
  • S/T-learner
  • scikit-uplift
  • X/R-learner
  • uplift-деревья
Uplift-моделирование
Концепция, метрики и методы оценки качества, базовые методы, продвинутые подходы, продакшен
Решите задачу uplift‑моделирования: определитесь с аудиторией и оцените финансовый эффект
7
Самостоятельно・2 недели
Итоговый проект
Подтвердите, что освоили новые навыки, и пройдёте полный цикл работы с моделью: от формирования задачи и сбора данных до разработки модели и выкатки её в продакшен. Теперь без теории и практических заданий — всё как в реальной работе.
По желанию
Карьерное развитие
Опытные HR подготовили материалы, которые помогут вам оформить привлекательное портфолио, написать сопроводительные письма и подготовиться к собеседованиям.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет подготовки к трудоустройству.

Будете проходить курс на нашей платформе, а YandexGPT вам поможет

Когда в теории что-то непонятно, нейросеть объяснит это другими словами. А в конце каждого модуля подготовит краткий пересказ о самом главном.

Этот курс может оплатить
ваш работодатель
Полностью или разделив оплату с вами,
например 50/50 или 75/25
  • Расскажем всё про курс
  • Поделимся презентацией
  • Ответим на ваши вопросы
  • Подготовим договор и счёт

Отвечаем на вопросы

Каким требованиям нужно соответствовать?
Курс рассчитан на специалистов, у которых уже есть начальный опыт в области машинного обучения. Мы ожидаем, что вы уже:
• Знаете язык программирования Python: базовые навыки, Jupyter Notebook, библиотеки Pandas и другие.
• Знаете SQL: базовые запросы и предобработку данных внутри запроса.
• Умеете работать с данными: разбираетесь в подготовке, чистке, описательной статистике.
• Знакомы с принципами классического машинного обучения: выбором алгоритма для модели и её обучением.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрен перерыв, во время которого можно отдохнуть или повторить сложные темы.

Если случилось непредвиденное или понадобилось больше времени на закрепление материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более позднюю когорту. На общую стоимость курса это не повлияет.
Если не понравится, я могу вернуть деньги?
Конечно. Если курс ещё не начался, вернём всю сумму. Если уже начался, придётся оплатить прошедшие дни со старта вашей первой когорты — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Да, вы получите сертификат о завершении курса.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Курс будет стоить меньше, если оплатить его сразу целиком.

Через компанию: юридические лица также могут оплатить курс в Практикуме. Чтобы заказать счёт для оплаты, оставьте заявку на странице для корпоративных клиентов.
На каком языке проходит курс?
Всё будет на русском: теория, практические задания и вебинары, а ещё чаты с куратором, наставником и другими участниками курса.
В какой валюте можно оплатить курс?
Оплатить курс можно в любой валюте, кроме российских рублей.

Чтобы вам было проще сориентироваться, мы указываем примерную стоимость в долларах США, но списание будет в казахстанских тенге, а конвертация — по курсу вашего банка.

Давайте поможем

Напишите, как вас зовут и по какому номеру можно связываться — в течение 30 минут позвоним и расскажем всё про курсы