Иван А. , Middle, ML-инженер

Male avatar
Иван А.
Россия, Москва
3 680 ₽/час 588 800 ₽/мес.
    ML-инженер
  • Middle
Опыт работы:
От 3 до 6 лет

О специалисте

Навыки
Python
API
Linux
PyTorch
Tensorflow
OpenCV
YOLO
Numpy
Pandas
FastAPI
Django Framework
Kubernetes
MLflow
Apache AirFlow
Prometheus
Grafana
GCP
Computer Vision
Technology:
SQL
HTML
HTML5
Database:
MySQL
Applications:
Docker
Формат работы
Удалённо
Описание о специалисте

Увеличил производительность CV-систем (FPS) до +50 % за счёт оптимизации inference (YOLOv8, TensorRT, ONNX). Повысил точность моделей компьютерного зрения до 92 % и отдельных CV-моделей на 15–20 %. Снизил latency инференса на 25 %, обеспечил обработку 5000+ запросов/мин при <100 мс. Запустил production-CV сервисы и AI-агентов (real-time, REST/gRPC, микросервисы). Реализовал мультимодальные решения CV + LLM + RAG (визуальный анализ + поиск по документам). Внедрил MLOps (MLflow, CI/CD, мониторинг, auto-rollback), ускорив релизы на 40 %. Снизил операционные издержки проектов до 50 % за счёт автоматизации и оптимизации ML-пайплайнов. Настроил мониторинг качества и дрейфа моделей в продакшене.

Примеры работ

NDA
Позиция на проекте
ML-инженер
Ответственность
  1. Разработка и оптимизация систем компьютерного зрения (YOLOv8, OpenCV, custom CNN, TorchScript, TensorRT).
  2. Построение пайплайнов для обработки видео и изображений (real-time детекция, сегментация, трекинг).
  3. Интеграция моделей в продакшн через REST/gRPC API и микросервисы (FastAPI, Django).
  4. Разработка backend-инфраструктуры для AI-агентов (Celery, Redis, PostgreSQL, WebSockets).
  5. Контейнеризация и оркестрация ML-сервисов (Docker, Kubernetes, Helm).
  6. Настройка CI/CD и MLOps: автоматический деплой моделей, отслеживание экспериментов (MLflow, GitHub Actions).
  7. Оптимизация inference-пайплайнов с использованием ONNX Runtime, TensorRT, FP16/INT8 quantization.
  8. Мониторинг состояния моделей и производительности (Prometheus, Grafana, Loki).
  9. Работа с мультимодальными системами: интеграция CV-моделей с LLM и RAG-компонентами (LangChain, FAISS, Qdrant).
Технологии и инструменты
Celery, Django, Docker, FastAPI, GitHub Actions, Grafana, Helm, Kubernetes, langchain, MLflow, OpenCV, PostgreSQL, Prometheus, Python, PyTorch, Redis, TensorRT, FAISS, RAG, YOLOv8, ONNX Runtime, TorchScript
Период работы/продолжительность
Март 2025 г. - Февраль 2026 г.
NDA
Позиция на проекте
ML-инженер
Ответственность
  1. Разработка и обучение моделей компьютерного зрения: custom CNN, Vision Transformers (ViT, Swin, CLIP).
  2. Построение мультимодальных систем (Vision + Text) с использованием FAISS, Pinecone и LangChain.
  3. Fine-tuning, quantization и оптимизация моделей под inference (ONNX Runtime, TensorRT, FP16/INT8).
  4. Разработка архитектуры CV-сервисов для анализа изображений, документов и видеопотоков.
  5. Реализация пайплайнов MLOps: обучение, деплой и мониторинг (MLflow, Airflow, Docker, K8s, CI/CD).
  6. Автоматизация тестирования и релизов через GitHub Actions и AWS/GCP-инфраструктуру.
  7. Prompt-engineering и адаптация LLM-моделей для мультимодальных задач (RAG-интеграции, CLIP-similarity).
Технологии и инструменты
AWS, Docker, GCP, Grafana, Kubernetes, langchain, MLflow, OpenCV, Python, PyTorch, Tensorflow, TensorRT, Airflow, FAISS, Pinecone, RAG, ONNX Runtime, Vision Transformers (ViT, Swin, CLIP)
Период работы/продолжительность
Январь 2024 г. - Февраль 2025 г.
NDA
Позиция на проекте
ML-инженер
Ответственность
  1. Обучение и внедрение моделей распознавания изображений (PyTorch, CatBoost for vision, EfficientNet, ResNet).
  2. Оптимизация пайплайнов данных для CV и search-ranking (BigQuery, PySpark, Airflow, DVC).
  3. Разработка алгоритмов semantic-matching для визуального поиска и ранжирования изображений.
  4. Анализ и трекинг метрик (IoU, mAP, Precision/Recall, F1), проведение A/B-тестов.
  5. Подготовка данных и автоматизация обучения с помощью Airflow DAGs и DVC-трекера.
  6. Контейнеризация и продакшен-деплой моделей (Docker, Kubernetes, Prometheus).
  7. Интеграция результатов CV-моделей в search-сервисы и recommendation-системы.
Технологии и инструменты
BigQuery, CatBoost, Clickhouse, Docker, DVC, Kubernetes, OpenCV, Prometheus, PySpark, Python, PyTorch, SQL, Airflow
Период работы/продолжительность
Июнь 2022 г. - Декабрь 2023 г.

Образование

Высшее
Аналогичные специалисты
Male avatar
Дмитрий К.
Россия, Москва
3 200 ₽/час
    ML-инженер
  • Middle
Повысил эффективность работы поддержки примерно на 35% за счёт внедрения комплекса ML/NLP-решений: классификация обращений, кластеризация, извлечение сущностей. Улучшил качество семантического поиска по базе знаний примерно в 1,7 раза, разработав и внедрив RAG-пайплайн (LangChain, Qdrant, FAISS). Достиг 91% точности прогнозирования инцидентов благодаря использованию ансамблей моделей (CatBoost, XGBoost) и продуманного feature engineering. Автоматизировал около 90% рутинных операций и сократил время подготовки отчетов с часов до минут, создав набор инструментов и пайплайнов (Bash, Docker, Airflow). Настроил полноценный MLOps-контур (версии моделей, деплой, мониторинг) на базе MLflow и FastAPI, обеспечив стабильный вывод моделей в прод и сопровождение. Сократил время формирования ежедневных отчётов с 3 часов до 20 минут через ETL/ELT-пайплайны (Airflow, Spark, PostgreSQL). Построил систему интерактивных дашбордов, что ускорило принятие управленческих решений примерно на 35%. Повысил конверсию за счёт A/B-тестов и статистического анализа, результаты которых легли в основу доработок продукта.
    Python
    Pandas
    Numpy
    PyTorch
    Tensorflow
    transformers
    langchain
    Scikit-learn
    CatBoost
    XGBoost
    FastAPI
    PostgreSQL
    Qdrant
    FAISS
    Redis
    Airflow
    Spark
    MLflow
    Docker
    Bash
    Linux
    Superset
    Plotly
    Seaborn
    Elasticsearch
    Parquet
    Streamlit
    Jupyter Notebook
    NLP
    RAG
Male avatar
Даниил Р.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Проектировал и выводил в продакшен модели кредитного скоринга и прогнозирования дефолта, обеспечивая стабильность и соответствие требованиям риск-процессов. Формировал и поддерживал пайплайны подготовки данных, feature engineering и валидации моделей для стабильных метрик и предсказуемой работы в продакшене. Встраивал модели в процессы андеррайтинга и collection, настраивал корректную логику принятия решений и взаимодействие со стейкхолдерами. Вёл R&D по улучшению эффективности моделей и использованию альтернативных источников данных. Развивал инфраструктуру деплоя, мониторинга и сопровождения ML-решений, включая CI/CD, Docker, MLflow и связанные инструменты.
    Python
    Numpy
    Pandas
    Scikit-learn
    XGBoost
    Lightgbm
    CatBoost
    PyTorch
    Keras
    ONNX
    HuggingFace Transformers
    Docker
    Kubernetes
    MLflow
    Airflow
    FastAPI
    Grpc
    Prometheus
    Grafana
    Apache Kafka
    Flink
    Delta Lake
    Feast
    PostgreSQL
    Clickhouse
    FAISS
    Qdrant
    Pinecone
    AWS S3
    Azure ML
    GitLab CI/CD
    Terraform
    langchain
Male avatar
Лаврентий Н.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Разработал фреймворк для создания AI-агентов на базе LangGraph, обеспечив стабильное выполнение цепочек и удобную интеграцию с сервисами компании. Построил RAG-систему, повысив качество извлечения и точность ответов моделей на 35%. Реализовал и внедрил несколько AI-агентов в продакшен для автоматизации поддержки и внутренних процессов. Создал голосового ассистента на основе LLM с использованием ASR и TTS, улучшив качество обработки пользовательских запросов. Настроил мониторинг качества моделей через MLflow, обеспечив контроль метрик и отслеживание деградации. Участвовал в проектировании и развитии ETL-процессов на базе Airflow, PostgreSQL и ClickHouse. Разработал backend-сервисы на FastAPI для интеграции LLM-функциональности и агентных сценариев. Подготовил и выпустил MVP с использованием LLM-агентов в сжатые сроки, обеспечив соответствие требованиям бизнеса.
    Python
    SQL
    Deep Learning
    PyTorch
    transformers
    llm
    NLP
    langchain
    langgraph
    RAG
    AI Agents
    lightautoml
    Lightgbm
    CatBoost
    XGBoost
    Scikit-learn
    Pandas
    ETL
    Apache AirFlow
    Docker
    docker-compose
    FastAPI
    MCP
    Redis
    Postgres
    Clickhouse
    Apache Kafka
    SQLAlchemy
    MLflow
    REST API
    Pytest
    Linux
Male avatar
Эрнест Ю.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Разработал и внедрил модели для диагностики возрастной макулярной дегенерации (OCT-изображения) с использованием SOTA-архитектур на PyTorch, адаптированных под задачу. Создал end-to-end CV-решения для промышленности и медицины (YOLOv8, ResNet, Autoencoder), включая деплой и оптимизацию через ONNX Runtime. Построил OCR-пайплайн (OpenCV + Tesseract → BERT) для автоматизированной обработки медицинских карт. Реализовал CV-систему анализа сварочных швов в реальном времени, сократив время контроля на 70% и снизив процент брака. Разработал пайплайн распознавания транспортных средств при въезде на объект, достигнув точности 94%. Построил RAG-систему с использованием LLM (LLaMA) и реализовал векторный поиск на FAISS. Участвовал в оптимизации тяжёлых вычислений на суперкомпьютерах. Является соавтором 2 научных статей в Q1-журналах (Applied Sciences).
    Python
    SQL
    PostgreSQL
    PyTorch
    OpenCV
    Scikit-learn
    transformers
    langchain
    langgraph
    Numpy
    Pandas
    Matplotlib
    Seaborn
    MLflow
    Docker
    Git
    ONNX
    YOLOv8
    ResNet
    Autoencoder
    Tesseract
    Bert
    FAISS
    llama
    Linux
Male avatar
Марат К.
Россия, Тула
3 200 ₽/час
    ML-инженер
  • Middle
Реализовал production-пайплайн сегментации повреждений аграрной техники в 4K-разрешении с F1-score 93.3% (ансамбль PIDNet + OneFormer, тайловая инференс-схема). Повысил качество моделей CV за счёт генерации синтетических данных (FLUX + LoRA): прирост F1 с 88% до 93% без ручной разметки. Ускорил пайплайн детекции повреждений в 1.4 раза, внедрив предварительную ML-фильтрацию и оптимизировав архитектуру под бизнес-требования. Улучшил OCR-модель распознавания номеров, снизив CER на 3% за счёт претрейна на расширенном собственном датасете. Протестировал использование LLM (Qwen) для OCR и синтетической разметки данных без участия человека. Реализовал zero-shot псевдоразметку с BLIP и SigLIP, увеличив объём размеченных данных в 2 раза. Разработал и вывел в продакшен систему детекции и сегментации логотипов (MAP@50 = 94%), оформленную как FastAPI-сервис. Повысил производительность YOLOX-модели для детекции персонала на 32% за счёт оптимизации бэкбона. Стандартизировал ML-эксперименты и трекинг метрик, переведя процессы на MLflow.
    Python
    SQL
    FastAPI
    PostgreSQL
    Deep Learning
    PyTorch
    Scikit-learn
    Pandas
    Numpy
    Анализ данных
    машинное обучение
    Computer Vision
    Docker
    OpenCV
    Airflow
    Plotly
    Git
    CatBoost
    XGBoost
    MLflow
    Matplotlib
    Seaborn
    PySpark
    YOLO
    CLIP
    ResNet
    U-Net
    llm
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста

Request Poster