Денис П. , Middle, ML-инженер

Male avatar
Денис П.
Россия, Москва
3 680 ₽/час 588 800 ₽/мес.
    ML-инженер
  • Middle
Опыт работы:
От 3 до 6 лет

О специалисте

Навыки
Python
PyTorch
Tensorflow
Scikit-learn
NLTK
XGBoost
CatBoost
RAG
Numpy
Pandas
Matplotlib
Seaborn
Clickhouse
CI/CD
MLflow
Airflow
Prometheus
Grafana
Linux
Apache Kafka
Jira
Confluence
wandb
Technology:
SQL
Database:
PostgreSQL
Applications:
Docker
Source_control:
GitHub

Примеры работ

NDA
Описание задачи/проекта

Развивал ML/NLP-решения для девелопмента: рекомендации, анализ звонков, отзывы, отток.

Позиция на проекте
ML Engineer
Ответственность
  1. Собрал рекомендательную систему по квартирам (TF-IDF + BERT), повысив CTR рекомендаций на 6%.
  2. Внедрил суммаризацию звонков, снизив нагрузку на операторов на 15%.
  3. Улучшил модель тональности отзывов на базе RoBERTa до F1 = 0.87 (+12% к прежнему решению).
  4. Оптимизировал инференс LLM (квантование): ускорение в 2 раза, снижение затрат на 10%.
  5. Построил модель оттока (XGBoost, ROC-AUC 0.90), что позволило сократить отток на 10%.
  6. Настроил мониторинг моделей (Prometheus + Grafana), сократив время реакции на деградацию качества.
Технологии и инструменты
Bert, Grafana, Prometheus, roberta, XGBoost, TF-IDF
Период работы/продолжительность
Июль 2024 г. - Февраль 2026 г.
NDA
Описание задачи/проекта

Разрабатывал модели поддержки врачебных решений на реальных клинических данных.

Позиция на проекте
Data Scientist (медицинский домен)
Ответственность
  1. Построил XGBoost-модель классификации трёх сердечных заболеваний с ROC-AUC 0.93.
  2. Создал CatBoost-модель для прогнозирования сердечной недостаточности с F1 = 0.91.
  3. Спроектировал пайплайны очистки и агрегации медицинских данных, обеспечив стабильное качество обучающих выборок.
Технологии и инструменты
CatBoost, XGBoost
Период работы/продолжительность
Июль 2022 г. - Июнь 2024 г.

Образование

Высшее
Аналогичные специалисты
Male avatar
Дмитрий К.
Россия, Москва
3 200 ₽/час
    ML-инженер
  • Middle
Повысил эффективность работы поддержки примерно на 35% за счёт внедрения комплекса ML/NLP-решений: классификация обращений, кластеризация, извлечение сущностей. Улучшил качество семантического поиска по базе знаний примерно в 1,7 раза, разработав и внедрив RAG-пайплайн (LangChain, Qdrant, FAISS). Достиг 91% точности прогнозирования инцидентов благодаря использованию ансамблей моделей (CatBoost, XGBoost) и продуманного feature engineering. Автоматизировал около 90% рутинных операций и сократил время подготовки отчетов с часов до минут, создав набор инструментов и пайплайнов (Bash, Docker, Airflow). Настроил полноценный MLOps-контур (версии моделей, деплой, мониторинг) на базе MLflow и FastAPI, обеспечив стабильный вывод моделей в прод и сопровождение. Сократил время формирования ежедневных отчётов с 3 часов до 20 минут через ETL/ELT-пайплайны (Airflow, Spark, PostgreSQL). Построил систему интерактивных дашбордов, что ускорило принятие управленческих решений примерно на 35%. Повысил конверсию за счёт A/B-тестов и статистического анализа, результаты которых легли в основу доработок продукта.
    Python
    Pandas
    Numpy
    PyTorch
    Tensorflow
    transformers
    langchain
    Scikit-learn
    CatBoost
    XGBoost
    FastAPI
    PostgreSQL
    Qdrant
    FAISS
    Redis
    Airflow
    Spark
    MLflow
    Docker
    Bash
    Linux
    Superset
    Plotly
    Seaborn
    Elasticsearch
    Parquet
    Streamlit
    Jupyter Notebook
    NLP
    RAG
Male avatar
Даниил Р.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Проектировал и выводил в продакшен модели кредитного скоринга и прогнозирования дефолта, обеспечивая стабильность и соответствие требованиям риск-процессов. Формировал и поддерживал пайплайны подготовки данных, feature engineering и валидации моделей для стабильных метрик и предсказуемой работы в продакшене. Встраивал модели в процессы андеррайтинга и collection, настраивал корректную логику принятия решений и взаимодействие со стейкхолдерами. Вёл R&D по улучшению эффективности моделей и использованию альтернативных источников данных. Развивал инфраструктуру деплоя, мониторинга и сопровождения ML-решений, включая CI/CD, Docker, MLflow и связанные инструменты.
    Python
    Numpy
    Pandas
    Scikit-learn
    XGBoost
    Lightgbm
    CatBoost
    PyTorch
    Keras
    ONNX
    HuggingFace Transformers
    Docker
    Kubernetes
    MLflow
    Airflow
    FastAPI
    Grpc
    Prometheus
    Grafana
    Apache Kafka
    Flink
    Delta Lake
    Feast
    PostgreSQL
    Clickhouse
    FAISS
    Qdrant
    Pinecone
    AWS S3
    Azure ML
    GitLab CI/CD
    Terraform
    langchain
Male avatar
Лаврентий Н.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Разработал фреймворк для создания AI-агентов на базе LangGraph, обеспечив стабильное выполнение цепочек и удобную интеграцию с сервисами компании. Построил RAG-систему, повысив качество извлечения и точность ответов моделей на 35%. Реализовал и внедрил несколько AI-агентов в продакшен для автоматизации поддержки и внутренних процессов. Создал голосового ассистента на основе LLM с использованием ASR и TTS, улучшив качество обработки пользовательских запросов. Настроил мониторинг качества моделей через MLflow, обеспечив контроль метрик и отслеживание деградации. Участвовал в проектировании и развитии ETL-процессов на базе Airflow, PostgreSQL и ClickHouse. Разработал backend-сервисы на FastAPI для интеграции LLM-функциональности и агентных сценариев. Подготовил и выпустил MVP с использованием LLM-агентов в сжатые сроки, обеспечив соответствие требованиям бизнеса.
    Python
    SQL
    Deep Learning
    PyTorch
    transformers
    llm
    NLP
    langchain
    langgraph
    RAG
    AI Agents
    lightautoml
    Lightgbm
    CatBoost
    XGBoost
    Scikit-learn
    Pandas
    ETL
    Apache AirFlow
    Docker
    docker-compose
    FastAPI
    MCP
    Redis
    Postgres
    Clickhouse
    Apache Kafka
    SQLAlchemy
    MLflow
    REST API
    Pytest
    Linux
Male avatar
Эрнест Ю.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Разработал и внедрил модели для диагностики возрастной макулярной дегенерации (OCT-изображения) с использованием SOTA-архитектур на PyTorch, адаптированных под задачу. Создал end-to-end CV-решения для промышленности и медицины (YOLOv8, ResNet, Autoencoder), включая деплой и оптимизацию через ONNX Runtime. Построил OCR-пайплайн (OpenCV + Tesseract → BERT) для автоматизированной обработки медицинских карт. Реализовал CV-систему анализа сварочных швов в реальном времени, сократив время контроля на 70% и снизив процент брака. Разработал пайплайн распознавания транспортных средств при въезде на объект, достигнув точности 94%. Построил RAG-систему с использованием LLM (LLaMA) и реализовал векторный поиск на FAISS. Участвовал в оптимизации тяжёлых вычислений на суперкомпьютерах. Является соавтором 2 научных статей в Q1-журналах (Applied Sciences).
    Python
    SQL
    PostgreSQL
    PyTorch
    OpenCV
    Scikit-learn
    transformers
    langchain
    langgraph
    Numpy
    Pandas
    Matplotlib
    Seaborn
    MLflow
    Docker
    Git
    ONNX
    YOLOv8
    ResNet
    Autoencoder
    Tesseract
    Bert
    FAISS
    llama
    Linux
Male avatar
Марат К.
Россия, Тула
3 200 ₽/час
    ML-инженер
  • Middle
Реализовал production-пайплайн сегментации повреждений аграрной техники в 4K-разрешении с F1-score 93.3% (ансамбль PIDNet + OneFormer, тайловая инференс-схема). Повысил качество моделей CV за счёт генерации синтетических данных (FLUX + LoRA): прирост F1 с 88% до 93% без ручной разметки. Ускорил пайплайн детекции повреждений в 1.4 раза, внедрив предварительную ML-фильтрацию и оптимизировав архитектуру под бизнес-требования. Улучшил OCR-модель распознавания номеров, снизив CER на 3% за счёт претрейна на расширенном собственном датасете. Протестировал использование LLM (Qwen) для OCR и синтетической разметки данных без участия человека. Реализовал zero-shot псевдоразметку с BLIP и SigLIP, увеличив объём размеченных данных в 2 раза. Разработал и вывел в продакшен систему детекции и сегментации логотипов (MAP@50 = 94%), оформленную как FastAPI-сервис. Повысил производительность YOLOX-модели для детекции персонала на 32% за счёт оптимизации бэкбона. Стандартизировал ML-эксперименты и трекинг метрик, переведя процессы на MLflow.
    Python
    SQL
    FastAPI
    PostgreSQL
    Deep Learning
    PyTorch
    Scikit-learn
    Pandas
    Numpy
    Анализ данных
    машинное обучение
    Computer Vision
    Docker
    OpenCV
    Airflow
    Plotly
    Git
    CatBoost
    XGBoost
    MLflow
    Matplotlib
    Seaborn
    PySpark
    YOLO
    CLIP
    ResNet
    U-Net
    llm
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста

Request Poster