Егор Ч. , Senior, ML-инженер

Male avatar
Егор Ч.
Россия, Москва
3 680 ₽/час 588 800 ₽/мес.
    ML-инженер
  • Senior
Опыт работы:
Более 6 лет

О специалисте

Навыки
Python
Java
Linux
Git
Numpy
Pandas
Scikit-learn
PyTorch
Tensorflow
GPT/LLM
RAG
NLP
Deep Learning
MLflow
Redis
Kubeflow
FastAPI
CI/CD
vLLM
TensorRT
Tableau
AWS
XGBoost
Prophet
Bert
roberta
YOLOv3
LLaMA-2
GPT-4
langchain
langgraph
Graph neural networks
Spark
HDFS
CLIP
BLIP-2
NetworkX
PyG
transformers
sentence-transformers
Qwen
DeepSeek
llama
Mistral
SFT
LoRa
QLoRA
prompt-tuning
Technology:
SQL
REST API
Database:
PostgreSQL
Applications:
Docker
Формат работы
Удалённо
Описание о специалисте

Создал и вывел в продакшн полнофункциональную RAG-систему для крупного заказчика в EPAM — от подготовки данных и индексации до интеграции поиска и генерации ответов в рабочие процессы компании. Оптимизировал inference LLM-моделей, снизив стоимость облачных вычислений и ускорив время отклика за счёт настройки vLLM, TensorRT и гибридной инфраструктуры (AWS + on-premise). Разработал мультимодальную модель на основе CLIP/BLIP-2 для извлечения фичей и анализа изображений. Построил ML-пайплайн прогнозирования спроса в промышленных масштабах: сбор данных, фичи, обучение моделей, развертывание. Автоматизировал MLOps-контур: настроил MLflow, CI/CD, контейнеризацию и воспроизводимость обучающих и инференсных пайплайнов. Создал несколько продакшн-ML-решений, включая модели классификации, детекции аномалий и регрессионного анализа. Реализовал инструменты обработки естественного языка (NLP), включая подготовку датасетов, обучение моделей и интеграцию их в сервисы компании.

Примеры работ

NDA
Описание задачи/проекта

Работал над прикладными проектами в области машинного обучения и искусственного интеллекта для поддержки бизнес-направлений BP в сфере энергетики, логистики и розничной торговли. Основной фокус — разработка, внедрение и оптимизация прогнозных моделей и NLP-решений.

Позиция на проекте
Инженер по машинному обучению / AI Solutions
Ответственность
  1. Предиктивный анализ активов: Разработал и внедрил систему прогнозного технического обслуживания для энергетических активов (турбины), комбинируя методы анализа временных рядов и детекции аномалий. Результатом стало снижение незапланированных простоев на ~18%.
  2. Оптимизация цепочек поставок: Создал и запустил в производство высокоточный конвейер для прогнозирования спроса (demand forecasting) с использованием ансамблей моделей (XGBoost, Prophet), что на 20% повысило точность по сравнению с существующими решениями и оптимизировало управление запасами.
  3. Автоматизация документооборота: Модернизировал NLP-пайплайн для классификации и извлечения данных из инженерной документации, мигрировав с методов scikit-learn на BERT/RoBERTa. Это сократило затраты на ручную обработку документов на 40%.
  4. Компьютерное зрение для контроля качества: Реализовал PoC системы компьютерного зрения на базе YOLOv3 для автоматизированного контроля оборудования и качества упаковки на логистических объектах.
  5. Заложение основ MLOps: Инициировал и внедрил первоначальные практики MLOps (MLflow, Docker, CI/CD), что стандартизировало процесс экспериментов и ускорило вывод моделей в staging-среду.
  6. Техническая экспертиза и коммуникация: Регулярно участвовал в воркшопах с бизнес-заказчиками, выступая в роли «переводчика» между техническими и бизнес-командами для обеспечения полного соответствия решений стратегическим целям.
  7. Разработка risk-моделей, стабильно влияющих на ключевые бизнес-показатели: снижение PD на 8–15%, уменьшение CoR на 5–12%, повышение точности скоринга (AUC +2–6 п.п.), рост одобрения “хороших” клиентов (uplift 3–7%) при контроле уровня риска.
  8. Создание скоринговых и антифрод-моделей (логистические модели, GBDT, GNN), которые формируют более качественный портфель, уменьшают дефолтность и повышают доходность.
  9. Разработка интерпретируемых решений (scorecard, feature importance, SHAP), которые позволяют risk-офицерам принимать управляемые, обоснованные решения.
  10. Построение графовых и аномалистических моделей, выявляющих скрытые рисковые паттерны в поведенческих и транзакционных данных — снижение fraud-потерь на 10–20% в первых волнах внедрения.
  11. Участие в A/B-экспериментах и оценке uplift: расчёт влияния на unit-экономику, прогнозирование LTV, пересмотр cut-off и подбор оптимальных порогов для улучшения итоговой маржи продукта.
  12. Использовал датасет Spider для обучения модели, генерирующей SQL-запросы на основе описаний вакансий. Также знаком с CoSQL и использовал его для задач, связанных с диалоговыми системами, где требуется генерировать SQL-запросы на основе диалога с пользователем.
Технологии и инструменты
Bert, CI/CD, Docker, MLflow, roberta, XGBoost, Prophet, YOLOv3, Spider, CoSQL
Период работы/продолжительность
Август 2022 г. - Ноябрь 2025 г.
NDA
Описание задачи/проекта

В рамках глобальной команды EPAM отвечал за разработку и внедрение передовых AI-решений для ключевых клиентов в секторах финансов, ритейла и энергетики. Сфокусирован на создании производственных систем на базе Large Language Models (LLMs), Retrieval-Augmented Generation (RAG) и мультимодального искусственного интеллекта.

Позиция на проекте
Старший инженер по машинному обучению / Generative AI
Ответственность
  1. Архитектура GenAI-платформы: Разработал и внедрил стратегию внедрения Generative AI для корпоративных клиентов, результатом которой стало создание высокопроизводительной RAG-системы на базе LLaMA-2, GPT-4 и LangChain. Это привело к повышению релевантности семантического поиска на 40% и сокращению дублирующих запросов в службу поддержки.
  2. Разработка risk-моделей, стабильно влияющих на ключевые бизнес-показатели: снижение PD на 8–15%, уменьшение CoR на 5–12%, повышение точности скоринга (AUC +2–6 п.п.), рост одобрения “хороших” клиентов (uplift 3–7%) при контроле уровня риска.
  3. Создание скоринговых и антифрод-моделей (логистические модели, GBDT, GNN), которые формируют более качественный портфель, уменьшают дефолтность и повышают доходность.
  4. Разработка интерпретируемых решений (scorecard, feature importance, SHAP), которые позволяют risk-офицерам принимать управляемые, обоснованные решения.
  5. Построение графовых и аномалистических моделей (networkX, PyG), выявляющих скрытые рисковые паттерны в поведенческих и транзакционных данных — снижение fraud-потерь на 10–20% в первых волнах внедрения.
  6. Участие в A/B-экспериментах и оценке uplift: расчёт влияния на unit-экономику, прогнозирование LTV, пересмотр cut-off и подбор оптимальных порогов для улучшения итоговой маржи продукта.
  7. Использовал P-Tune и LORA для настройки трансформеров под специфические задачи с небольшими датасетами.
  8. Построение масштабируемых пайплайнов на Spark/HDFS, которые обеспечивают сокращение времени обработки данных на 30–50% и позволяют быстрее запускать ML-эксперименты и выкатывать модели.
  9. Оптимизация Spark-джобов (партиционирование, экономичные join-стратегии, broadcast), что приводит к снижению затрат на вычисления (cluster compute cost) на 15–35%.
  10. Подготовка высококачественных фичей для risk- и продуктовых моделей: повышение стабильности данных → меньше дрифта (-20–40%), рост качества моделей → AUC/PR улучшение +1–4 п.п. только за счёт улучшенной витрины.
  11. Интеграция ML-моделей в Spark-пайплайны для массового batch-инференса: ускорение принятия решений на 25–40%, улучшение SLA на критичных бизнес-процессах (скоринг, антифрод, риск-мониторинг).
  12. Построение инфраструктуры обучения на больших данных, что обеспечивает возможность работы с графами, транзакционными логами и широкими фичевыми наборами без деградации производительности. (deepspeed, torch.distributed)
  13. Повышение надёжности и воспроизводимости пайплайнов (quality gates, мониторинг, алерты), что в итоге снижает количество инцидентов в продакшне на 30–60%.
  14. Оптимизация бизнес-процессов: Спроектировал и запустил AI-ассистента для автоматизации проверки соответствия нормативным требованиям (compliance) для банковского клиента, что позволило сократить объем ручного труда аналитиков на 25-30%.
  15. Инжиниринг производства (Production ML): В тесном сотрудничестве с инженерами платформы развернул высокопроизводительный inference-сервис с использованием vLLM и TensorRT, обеспечив стабильную задержку (latency) менее 300 мс для критичных endpoints и поддержку тысяч запросов в секунду.
  16. Стратегия MLOps: Создал и внедрил сквозные MLOps-процессы (Kubeflow, MLflow) для автоматизации переобучения, развертывания и мониторинга моделей. Это позволило переводить модели в продакшен еженедельно без ручного вмешательства, повысив надежность и скорость итераций.
  17. Гибридные облачные решения: Успешно спроектировал и реализовал гибридную инфраструктуру (AWS + on-premise) для развертывания AI-решений в регулируемых отраслях, что позволило клиенту пройти внутренний и внешний аудит.
Технологии и инструменты
AWS, HDFS, langchain, LoRa, MLflow, Spark, TensorRT, GPT-4, NetworkX, Kubeflow, vLLM, LLaMA-2, PyG, GBDT, GNN, P-Tune, deepspeed, torch.distributed
Период работы/продолжительность
Февраль 2020 г. - Август 2022 г.

Образование

Высшее
Аналогичные специалисты
Male avatar
Денис В.
Россия, Москва
3 200 ₽/час
    Python разработчик
  • Senior
Реализовал несколько production-систем на базе ML и Deep Learning (Computer Vision, LLM, ASR), включая рекомендательные системы, OCR и системы транскрибации. Разработал и внедрил LLM-решение для классификации и распознавания документов (Gemma-3-12B), ускорив обработку документов и автоматизировав заполнение пользовательских данных. Создал рекомендательные системы на базе ML для EdTech и промышленных сценариев, включая полный цикл: сбор данных, обучение моделей, API и деплой. Реализовал системы компьютерного зрения: детекция и трекинг объектов на видеопотоке (YOLO), подсчёт людей в ритейле, измерение геометрических параметров изделий на производстве, OCR для номеров автомобилей и документов. Разработал отказоустойчивые REST-API сервисы для ML-систем с использованием FastAPI, Docker и Linux. Выстроил ETL и data-pipeline инфраструктуру (Airflow, PostgreSQL, ClickHouse, MongoDB) для сбора и обработки маркетинговых и пользовательских данных. Имеет опыт оптимизации ML-пайплайнов и видеопроцессинга, включая ускорение inference и обработку видеопотоков. Работал с полным ML-циклом: сбор и разметка данных, обучение моделей, интеграция, деплой, поддержка и масштабирование.
    Python
    PyTorch
    Tensorflow
    FastAPI
    PostgreSQL
    Linux
    Airflow
    GOlang
    Deep Learning
    Computer Vision
    Математическая статистика
    Pandas
    Математический анализ
    ООП
    REST API
    Go
    Machine learning
    Tesseract
    EasyOCR
    OpenCV
    Scikit-learn
    YOLO
    Numpy
    Clickhouse
    C/C++
    MATLAB
    Git
    Docker
    WebSockets
    MongoDB
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста

Request Poster