Егор Ч. , Senior, ML-инженер

Егор Ч.

Россия, Москва

3 680 ₽/час 588 800 ₽/мес. без НДС

ML-инженер

Senior

Опыт работы:: Более 6 лет

Навыки

Python

Java

Linux

Git

Numpy

Pandas

Scikit-learn

PyTorch

Tensorflow

GPT/LLM

RAG

NLP

Deep Learning

MLflow

Redis

Kubeflow

FastAPI

CI/CD

vLLM

TensorRT

Tableau

AWS

XGBoost

Prophet

Bert

roberta

YOLOv3

LLaMA-2

GPT-4

langchain

langgraph

Graph neural networks

Spark

HDFS

CLIP

BLIP-2

NetworkX

PyG

transformers

sentence-transformers

Qwen

DeepSeek

llama

Mistral

SFT

LoRa

QLoRA

prompt-tuning

Technology:

SQL

REST API

Database:

PostgreSQL

Applications:

Docker

Формат работы

Удалённо

Описание о специалисте

Создал и вывел в продакшн полнофункциональную RAG-систему для крупного заказчика в EPAM — от подготовки данных и индексации до интеграции поиска и генерации ответов в рабочие процессы компании. Оптимизировал inference LLM-моделей, снизив стоимость облачных вычислений и ускорив время отклика за счёт настройки vLLM, TensorRT и гибридной инфраструктуры (AWS + on-premise). Разработал мультимодальную модель на основе CLIP/BLIP-2 для извлечения фичей и анализа изображений. Построил ML-пайплайн прогнозирования спроса в промышленных масштабах: сбор данных, фичи, обучение моделей, развертывание. Автоматизировал MLOps-контур: настроил MLflow, CI/CD, контейнеризацию и воспроизводимость обучающих и инференсных пайплайнов. Создал несколько продакшн-ML-решений, включая модели классификации, детекции аномалий и регрессионного анализа. Реализовал инструменты обработки естественного языка (NLP), включая подготовку датасетов, обучение моделей и интеграцию их в сервисы компании.

NDA

Описание задачи/проекта

Работал над прикладными проектами в области машинного обучения и искусственного интеллекта для поддержки бизнес-направлений BP в сфере энергетики, логистики и розничной торговли. Основной фокус — разработка, внедрение и оптимизация прогнозных моделей и NLP-решений.

Позиция на проекте

Инженер по машинному обучению / AI Solutions

Ответственность

Предиктивный анализ активов: Разработал и внедрил систему прогнозного технического обслуживания для энергетических активов (турбины), комбинируя методы анализа временных рядов и детекции аномалий. Результатом стало снижение незапланированных простоев на ~18%.
Оптимизация цепочек поставок: Создал и запустил в производство высокоточный конвейер для прогнозирования спроса (demand forecasting) с использованием ансамблей моделей (XGBoost, Prophet), что на 20% повысило точность по сравнению с существующими решениями и оптимизировало управление запасами.
Автоматизация документооборота: Модернизировал NLP-пайплайн для классификации и извлечения данных из инженерной документации, мигрировав с методов scikit-learn на BERT/RoBERTa. Это сократило затраты на ручную обработку документов на 40%.
Компьютерное зрение для контроля качества: Реализовал PoC системы компьютерного зрения на базе YOLOv3 для автоматизированного контроля оборудования и качества упаковки на логистических объектах.
Заложение основ MLOps: Инициировал и внедрил первоначальные практики MLOps (MLflow, Docker, CI/CD), что стандартизировало процесс экспериментов и ускорило вывод моделей в staging-среду.
Техническая экспертиза и коммуникация: Регулярно участвовал в воркшопах с бизнес-заказчиками, выступая в роли «переводчика» между техническими и бизнес-командами для обеспечения полного соответствия решений стратегическим целям.
Разработка risk-моделей, стабильно влияющих на ключевые бизнес-показатели: снижение PD на 8–15%, уменьшение CoR на 5–12%, повышение точности скоринга (AUC +2–6 п.п.), рост одобрения “хороших” клиентов (uplift 3–7%) при контроле уровня риска.
Создание скоринговых и антифрод-моделей (логистические модели, GBDT, GNN), которые формируют более качественный портфель, уменьшают дефолтность и повышают доходность.
Разработка интерпретируемых решений (scorecard, feature importance, SHAP), которые позволяют risk-офицерам принимать управляемые, обоснованные решения.
Построение графовых и аномалистических моделей, выявляющих скрытые рисковые паттерны в поведенческих и транзакционных данных — снижение fraud-потерь на 10–20% в первых волнах внедрения.
Участие в A/B-экспериментах и оценке uplift: расчёт влияния на unit-экономику, прогнозирование LTV, пересмотр cut-off и подбор оптимальных порогов для улучшения итоговой маржи продукта.
Использовал датасет Spider для обучения модели, генерирующей SQL-запросы на основе описаний вакансий. Также знаком с CoSQL и использовал его для задач, связанных с диалоговыми системами, где требуется генерировать SQL-запросы на основе диалога с пользователем.

Технологии и инструменты

Bert, CI/CD, Docker, MLflow, roberta, XGBoost, Prophet, YOLOv3, Spider, CoSQL

Период работы/продолжительность

Август 2022 г. - Ноябрь 2025 г.

NDA

Описание задачи/проекта

В рамках глобальной команды EPAM отвечал за разработку и внедрение передовых AI-решений для ключевых клиентов в секторах финансов, ритейла и энергетики. Сфокусирован на создании производственных систем на базе Large Language Models (LLMs), Retrieval-Augmented Generation (RAG) и мультимодального искусственного интеллекта.

Позиция на проекте

Старший инженер по машинному обучению / Generative AI

Ответственность

Архитектура GenAI-платформы: Разработал и внедрил стратегию внедрения Generative AI для корпоративных клиентов, результатом которой стало создание высокопроизводительной RAG-системы на базе LLaMA-2, GPT-4 и LangChain. Это привело к повышению релевантности семантического поиска на 40% и сокращению дублирующих запросов в службу поддержки.
Разработка risk-моделей, стабильно влияющих на ключевые бизнес-показатели: снижение PD на 8–15%, уменьшение CoR на 5–12%, повышение точности скоринга (AUC +2–6 п.п.), рост одобрения “хороших” клиентов (uplift 3–7%) при контроле уровня риска.
Создание скоринговых и антифрод-моделей (логистические модели, GBDT, GNN), которые формируют более качественный портфель, уменьшают дефолтность и повышают доходность.
Разработка интерпретируемых решений (scorecard, feature importance, SHAP), которые позволяют risk-офицерам принимать управляемые, обоснованные решения.
Построение графовых и аномалистических моделей (networkX, PyG), выявляющих скрытые рисковые паттерны в поведенческих и транзакционных данных — снижение fraud-потерь на 10–20% в первых волнах внедрения.
Участие в A/B-экспериментах и оценке uplift: расчёт влияния на unit-экономику, прогнозирование LTV, пересмотр cut-off и подбор оптимальных порогов для улучшения итоговой маржи продукта.
Использовал P-Tune и LORA для настройки трансформеров под специфические задачи с небольшими датасетами.
Построение масштабируемых пайплайнов на Spark/HDFS, которые обеспечивают сокращение времени обработки данных на 30–50% и позволяют быстрее запускать ML-эксперименты и выкатывать модели.
Оптимизация Spark-джобов (партиционирование, экономичные join-стратегии, broadcast), что приводит к снижению затрат на вычисления (cluster compute cost) на 15–35%.
Подготовка высококачественных фичей для risk- и продуктовых моделей: повышение стабильности данных → меньше дрифта (-20–40%), рост качества моделей → AUC/PR улучшение +1–4 п.п. только за счёт улучшенной витрины.
Интеграция ML-моделей в Spark-пайплайны для массового batch-инференса: ускорение принятия решений на 25–40%, улучшение SLA на критичных бизнес-процессах (скоринг, антифрод, риск-мониторинг).
Построение инфраструктуры обучения на больших данных, что обеспечивает возможность работы с графами, транзакционными логами и широкими фичевыми наборами без деградации производительности. (deepspeed, torch.distributed)
Повышение надёжности и воспроизводимости пайплайнов (quality gates, мониторинг, алерты), что в итоге снижает количество инцидентов в продакшне на 30–60%.
Оптимизация бизнес-процессов: Спроектировал и запустил AI-ассистента для автоматизации проверки соответствия нормативным требованиям (compliance) для банковского клиента, что позволило сократить объем ручного труда аналитиков на 25-30%.
Инжиниринг производства (Production ML): В тесном сотрудничестве с инженерами платформы развернул высокопроизводительный inference-сервис с использованием vLLM и TensorRT, обеспечив стабильную задержку (latency) менее 300 мс для критичных endpoints и поддержку тысяч запросов в секунду.
Стратегия MLOps: Создал и внедрил сквозные MLOps-процессы (Kubeflow, MLflow) для автоматизации переобучения, развертывания и мониторинга моделей. Это позволило переводить модели в продакшен еженедельно без ручного вмешательства, повысив надежность и скорость итераций.
Гибридные облачные решения: Успешно спроектировал и реализовал гибридную инфраструктуру (AWS + on-premise) для развертывания AI-решений в регулируемых отраслях, что позволило клиенту пройти внутренний и внешний аудит.