Дмитрий К. , Middle, ML-инженер

Дмитрий К.

Россия, Москва

3 680 ₽/час 588 800 ₽/мес. без НДС

ML-инженер

Middle

Опыт работы:: От 3 до 6 лет

Навыки

Python

Pandas

Numpy

PyTorch

Tensorflow

transformers

langchain

Scikit-learn

CatBoost

XGBoost

FastAPI

Qdrant

FAISS

Redis

Airflow

Spark

MLflow

Bash

Linux

Superset

Plotly

Seaborn

Elasticsearch

Parquet

Streamlit

Jupyter Notebook

NLP

RAG

Database:

PostgreSQL

Applications:

Docker

Формат работы

Удалённо

Описание о специалисте

Повысил эффективность работы поддержки примерно на 35% за счёт внедрения комплекса ML/NLP-решений: классификация обращений, кластеризация, извлечение сущностей. Улучшил качество семантического поиска по базе знаний примерно в 1,7 раза, разработав и внедрив RAG-пайплайн (LangChain, Qdrant, FAISS). Достиг 91% точности прогнозирования инцидентов благодаря использованию ансамблей моделей (CatBoost, XGBoost) и продуманного feature engineering. Автоматизировал около 90% рутинных операций и сократил время подготовки отчетов с часов до минут, создав набор инструментов и пайплайнов (Bash, Docker, Airflow). Настроил полноценный MLOps-контур (версии моделей, деплой, мониторинг) на базе MLflow и FastAPI, обеспечив стабильный вывод моделей в прод и сопровождение. Сократил время формирования ежедневных отчётов с 3 часов до 20 минут через ETL/ELT-пайплайны (Airflow, Spark, PostgreSQL). Построил систему интерактивных дашбордов, что ускорило принятие управленческих решений примерно на 35%. Повысил конверсию за счёт A/B-тестов и статистического анализа, результаты которых легли в основу доработок продукта.

NDA

Позиция на проекте

ML-инженер

Ответственность

Отвечал за полный цикл разработки и интеграции ML/NLP-решений, направленных на решение ключевых бизнес-задач заказчиков
NLP и Работа с LLM: Разработал и внедрил комплекс ML-решений (классификация обращений, кластеризация, извлечение сущностей), что повысило эффективность работы поддержки на 35%. Работал со стеком: BERT, Sentence Transformers и GPT.
Поиск и RAG: Разработал и внедрил RAG-пайплайн (LangChain, Qdrant, FAISS), повысив релевантность семантического поиска по базе знаний в 1.7 раза
Классическое Machine Learning: Достиг точности прогнозирования инцидентов в 91% благодаря использованию ансамблей моделей (CatBoost, XGBoost) и feature engineering.
Автоматизировал 90% ручных операций и сократил время подготовки отчетов с часов до минут за счет создания инструментов и пайплайнов (Bash, Docker, AirFlow).
Настроил MLOps-процессы (версионирование, деплой, мониторинг) с использованием MLflow и FastAPI для бесшовного перевода моделей в продакшен.

Технологии и инструменты

CatBoost, Docker, FastAPI, langchain, MLflow, Pandas, PostgreSQL, Python, PyTorch, Qdrant, Scikit-learn, Superset, transformers, XGBoost, Airflow, FAISS

Период работы/продолжительность

Февраль 2024 г. - Март 2026 г.

NDA

Позиция на проекте

Аналитик данных / Data Scientist

Ответственность

Совмещал задачи Data Analyst и Data Scientist, участвуя в создании комплексных IT-решений
Автоматизировал подготовку отчетности: построил ETL/ELT-пайплайны (Airflow, Spark, PostgreSQL), сократив время формирования ежедневных отчетов с 3 часов до 20 минут
Визуализация и принятие решений: Создал систему интерактивных дашбордов (Superset, Plotly), что позволило руководству клиентов принимать решения на 35% быстрее
Data-Driven Product Development: Проводил A/B-тесты и статистический анализ, результаты которых легли в основу улучшения пользовательских сценариев и повышения конверсии.
Применял градиентный бустинг (CatBoost, XGBoost, Random Forest) для прогнозирования спроса на материалы и оптимизации логистических маршрутов.

Технологии и инструменты

CatBoost, Docker, FastAPI, langchain, Pandas, Plotly, PostgreSQL, Python, PyTorch, Qdrant, Scikit-learn, Spark, Superset, transformers, XGBoost, Airflow

Период работы/продолжительность

Сентябрь 2022 г. - Январь 2024 г.