Дмитрий К. , Middle, ML-инженер

Male avatar
Дмитрий К.
Россия, Москва
3 680 ₽/час 588 800 ₽/мес.
    ML-инженер
  • Middle
Опыт работы:
От 3 до 6 лет

О специалисте

Навыки
Python
Pandas
Numpy
PyTorch
Tensorflow
transformers
langchain
Scikit-learn
CatBoost
XGBoost
FastAPI
Qdrant
FAISS
Redis
Airflow
Spark
MLflow
Bash
Linux
Superset
Plotly
Seaborn
Elasticsearch
Parquet
Streamlit
Jupyter Notebook
NLP
RAG
Database:
PostgreSQL
Applications:
Docker
Формат работы
Удалённо
Описание о специалисте

Повысил эффективность работы поддержки примерно на 35% за счёт внедрения комплекса ML/NLP-решений: классификация обращений, кластеризация, извлечение сущностей. Улучшил качество семантического поиска по базе знаний примерно в 1,7 раза, разработав и внедрив RAG-пайплайн (LangChain, Qdrant, FAISS). Достиг 91% точности прогнозирования инцидентов благодаря использованию ансамблей моделей (CatBoost, XGBoost) и продуманного feature engineering. Автоматизировал около 90% рутинных операций и сократил время подготовки отчетов с часов до минут, создав набор инструментов и пайплайнов (Bash, Docker, Airflow). Настроил полноценный MLOps-контур (версии моделей, деплой, мониторинг) на базе MLflow и FastAPI, обеспечив стабильный вывод моделей в прод и сопровождение. Сократил время формирования ежедневных отчётов с 3 часов до 20 минут через ETL/ELT-пайплайны (Airflow, Spark, PostgreSQL). Построил систему интерактивных дашбордов, что ускорило принятие управленческих решений примерно на 35%. Повысил конверсию за счёт A/B-тестов и статистического анализа, результаты которых легли в основу доработок продукта.

Примеры работ

NDA
Позиция на проекте
ML-инженер
Ответственность
  1. Отвечал за полный цикл разработки и интеграции ML/NLP-решений, направленных на решение ключевых бизнес-задач заказчиков
  2. NLP и Работа с LLM: Разработал и внедрил комплекс ML-решений (классификация обращений, кластеризация, извлечение сущностей), что повысило эффективность работы поддержки на 35%. Работал со стеком: BERT, Sentence Transformers и GPT.
  3. Поиск и RAG: Разработал и внедрил RAG-пайплайн (LangChain, Qdrant, FAISS), повысив релевантность семантического поиска по базе знаний в 1.7 раза
  4. Классическое Machine Learning: Достиг точности прогнозирования инцидентов в 91% благодаря использованию ансамблей моделей (CatBoost, XGBoost) и feature engineering.
  5. Автоматизировал 90% ручных операций и сократил время подготовки отчетов с часов до минут за счет создания инструментов и пайплайнов (Bash, Docker, AirFlow).
  6. Настроил MLOps-процессы (версионирование, деплой, мониторинг) с использованием MLflow и FastAPI для бесшовного перевода моделей в продакшен.
Технологии и инструменты
CatBoost, Docker, FastAPI, langchain, MLflow, Pandas, PostgreSQL, Python, PyTorch, Qdrant, Scikit-learn, Superset, transformers, XGBoost, Airflow, FAISS
Период работы/продолжительность
Февраль 2024 г. - Февраль 2026 г.
NDA
Позиция на проекте
Аналитик данных / Data Scientist
Ответственность
  1. Совмещал задачи Data Analyst и Data Scientist, участвуя в создании комплексных IT-решений
  2. Автоматизировал подготовку отчетности: построил ETL/ELT-пайплайны (Airflow, Spark, PostgreSQL), сократив время формирования ежедневных отчетов с 3 часов до 20 минут
  3. Визуализация и принятие решений: Создал систему интерактивных дашбордов (Superset, Plotly), что позволило руководству клиентов принимать решения на 35% быстрее
  4. Data-Driven Product Development: Проводил A/B-тесты и статистический анализ, результаты которых легли в основу улучшения пользовательских сценариев и повышения конверсии.
  5. Применял градиентный бустинг (CatBoost, XGBoost, Random Forest) для прогнозирования спроса на материалы и оптимизации логистических маршрутов.
Технологии и инструменты
CatBoost, Docker, FastAPI, langchain, Pandas, Plotly, PostgreSQL, Python, PyTorch, Qdrant, Scikit-learn, Spark, Superset, transformers, XGBoost, Airflow
Период работы/продолжительность
Сентябрь 2022 г. - Январь 2024 г.

Образование

Неоконченное специальное
Аналогичные специалисты
Male avatar
Даниил Р.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Проектировал и выводил в продакшен модели кредитного скоринга и прогнозирования дефолта, обеспечивая стабильность и соответствие требованиям риск-процессов. Формировал и поддерживал пайплайны подготовки данных, feature engineering и валидации моделей для стабильных метрик и предсказуемой работы в продакшене. Встраивал модели в процессы андеррайтинга и collection, настраивал корректную логику принятия решений и взаимодействие со стейкхолдерами. Вёл R&D по улучшению эффективности моделей и использованию альтернативных источников данных. Развивал инфраструктуру деплоя, мониторинга и сопровождения ML-решений, включая CI/CD, Docker, MLflow и связанные инструменты.
    Python
    Numpy
    Pandas
    Scikit-learn
    XGBoost
    Lightgbm
    CatBoost
    PyTorch
    Keras
    ONNX
    HuggingFace Transformers
    Docker
    Kubernetes
    MLflow
    Airflow
    FastAPI
    Grpc
    Prometheus
    Grafana
    Apache Kafka
    Flink
    Delta Lake
    Feast
    PostgreSQL
    Clickhouse
    FAISS
    Qdrant
    Pinecone
    AWS S3
    Azure ML
    GitLab CI/CD
    Terraform
    langchain
Male avatar
Лаврентий Н.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Разработал фреймворк для создания AI-агентов на базе LangGraph, обеспечив стабильное выполнение цепочек и удобную интеграцию с сервисами компании. Построил RAG-систему, повысив качество извлечения и точность ответов моделей на 35%. Реализовал и внедрил несколько AI-агентов в продакшен для автоматизации поддержки и внутренних процессов. Создал голосового ассистента на основе LLM с использованием ASR и TTS, улучшив качество обработки пользовательских запросов. Настроил мониторинг качества моделей через MLflow, обеспечив контроль метрик и отслеживание деградации. Участвовал в проектировании и развитии ETL-процессов на базе Airflow, PostgreSQL и ClickHouse. Разработал backend-сервисы на FastAPI для интеграции LLM-функциональности и агентных сценариев. Подготовил и выпустил MVP с использованием LLM-агентов в сжатые сроки, обеспечив соответствие требованиям бизнеса.
    Python
    SQL
    Deep Learning
    PyTorch
    transformers
    llm
    NLP
    langchain
    langgraph
    RAG
    AI Agents
    lightautoml
    Lightgbm
    CatBoost
    XGBoost
    Scikit-learn
    Pandas
    ETL
    Apache AirFlow
    Docker
    docker-compose
    FastAPI
    MCP
    Redis
    Postgres
    Clickhouse
    Apache Kafka
    SQLAlchemy
    MLflow
    REST API
    Pytest
    Linux
Male avatar
Эрнест Ю.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Разработал и внедрил модели для диагностики возрастной макулярной дегенерации (OCT-изображения) с использованием SOTA-архитектур на PyTorch, адаптированных под задачу. Создал end-to-end CV-решения для промышленности и медицины (YOLOv8, ResNet, Autoencoder), включая деплой и оптимизацию через ONNX Runtime. Построил OCR-пайплайн (OpenCV + Tesseract → BERT) для автоматизированной обработки медицинских карт. Реализовал CV-систему анализа сварочных швов в реальном времени, сократив время контроля на 70% и снизив процент брака. Разработал пайплайн распознавания транспортных средств при въезде на объект, достигнув точности 94%. Построил RAG-систему с использованием LLM (LLaMA) и реализовал векторный поиск на FAISS. Участвовал в оптимизации тяжёлых вычислений на суперкомпьютерах. Является соавтором 2 научных статей в Q1-журналах (Applied Sciences).
    Python
    SQL
    PostgreSQL
    PyTorch
    OpenCV
    Scikit-learn
    transformers
    langchain
    langgraph
    Numpy
    Pandas
    Matplotlib
    Seaborn
    MLflow
    Docker
    Git
    ONNX
    YOLOv8
    ResNet
    Autoencoder
    Tesseract
    Bert
    FAISS
    llama
    Linux
Male avatar
Марат К.
Россия, Тула
3 200 ₽/час
    ML-инженер
  • Middle
Реализовал production-пайплайн сегментации повреждений аграрной техники в 4K-разрешении с F1-score 93.3% (ансамбль PIDNet + OneFormer, тайловая инференс-схема). Повысил качество моделей CV за счёт генерации синтетических данных (FLUX + LoRA): прирост F1 с 88% до 93% без ручной разметки. Ускорил пайплайн детекции повреждений в 1.4 раза, внедрив предварительную ML-фильтрацию и оптимизировав архитектуру под бизнес-требования. Улучшил OCR-модель распознавания номеров, снизив CER на 3% за счёт претрейна на расширенном собственном датасете. Протестировал использование LLM (Qwen) для OCR и синтетической разметки данных без участия человека. Реализовал zero-shot псевдоразметку с BLIP и SigLIP, увеличив объём размеченных данных в 2 раза. Разработал и вывел в продакшен систему детекции и сегментации логотипов (MAP@50 = 94%), оформленную как FastAPI-сервис. Повысил производительность YOLOX-модели для детекции персонала на 32% за счёт оптимизации бэкбона. Стандартизировал ML-эксперименты и трекинг метрик, переведя процессы на MLflow.
    Python
    SQL
    FastAPI
    PostgreSQL
    Deep Learning
    PyTorch
    Scikit-learn
    Pandas
    Numpy
    Анализ данных
    машинное обучение
    Computer Vision
    Docker
    OpenCV
    Airflow
    Plotly
    Git
    CatBoost
    XGBoost
    MLflow
    Matplotlib
    Seaborn
    PySpark
    YOLO
    CLIP
    ResNet
    U-Net
    llm
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста

Request Poster