Иван А. , Middle, ML-инженер

Male avatar
Иван А.
Россия, Москва
3 680 ₽/час 588 800 ₽/мес. без НДС
Опыт работы:
От 3 до 6 лет

О специалисте

Навыки
Python
API
Linux
PyTorch
Tensorflow
OpenCV
YOLO
Numpy
Pandas
FastAPI
Django Framework
Kubernetes
MLflow
Apache AirFlow
Prometheus
Grafana
GCP
Computer Vision
Technology:
SQL
HTML
HTML5
Database:
MySQL
Applications:
Docker
Формат работы
Удалённо
Описание о специалисте

Увеличил производительность CV-систем (FPS) до +50 % за счёт оптимизации inference (YOLOv8, TensorRT, ONNX). Повысил точность моделей компьютерного зрения до 92 % и отдельных CV-моделей на 15–20 %. Снизил latency инференса на 25 %, обеспечил обработку 5000+ запросов/мин при <100 мс. Запустил production-CV сервисы и AI-агентов (real-time, REST/gRPC, микросервисы). Реализовал мультимодальные решения CV + LLM + RAG (визуальный анализ + поиск по документам). Внедрил MLOps (MLflow, CI/CD, мониторинг, auto-rollback), ускорив релизы на 40 %. Снизил операционные издержки проектов до 50 % за счёт автоматизации и оптимизации ML-пайплайнов. Настроил мониторинг качества и дрейфа моделей в продакшене.

Примеры работ

NDA
Позиция на проекте
ML-инженер
Ответственность
  1. Разработка и оптимизация систем компьютерного зрения (YOLOv8, OpenCV, custom CNN, TorchScript, TensorRT).
  2. Построение пайплайнов для обработки видео и изображений (real-time детекция, сегментация, трекинг).
  3. Интеграция моделей в продакшн через REST/gRPC API и микросервисы (FastAPI, Django).
  4. Разработка backend-инфраструктуры для AI-агентов (Celery, Redis, PostgreSQL, WebSockets).
  5. Контейнеризация и оркестрация ML-сервисов (Docker, Kubernetes, Helm).
  6. Настройка CI/CD и MLOps: автоматический деплой моделей, отслеживание экспериментов (MLflow, GitHub Actions).
  7. Оптимизация inference-пайплайнов с использованием ONNX Runtime, TensorRT, FP16/INT8 quantization.
  8. Мониторинг состояния моделей и производительности (Prometheus, Grafana, Loki).
  9. Работа с мультимодальными системами: интеграция CV-моделей с LLM и RAG-компонентами (LangChain, FAISS, Qdrant).
Технологии и инструменты
Celery, Django, Docker, FastAPI, GitHub Actions, Grafana, Helm, Kubernetes, langchain, MLflow, OpenCV, PostgreSQL, Prometheus, Python, PyTorch, Redis, TensorRT, FAISS, RAG, YOLOv8, ONNX Runtime, TorchScript
Период работы/продолжительность
Март 2025 г. - Июнь 2026 г.
NDA
Позиция на проекте
ML-инженер
Ответственность
  1. Разработка и обучение моделей компьютерного зрения: custom CNN, Vision Transformers (ViT, Swin, CLIP).
  2. Построение мультимодальных систем (Vision + Text) с использованием FAISS, Pinecone и LangChain.
  3. Fine-tuning, quantization и оптимизация моделей под inference (ONNX Runtime, TensorRT, FP16/INT8).
  4. Разработка архитектуры CV-сервисов для анализа изображений, документов и видеопотоков.
  5. Реализация пайплайнов MLOps: обучение, деплой и мониторинг (MLflow, Airflow, Docker, K8s, CI/CD).
  6. Автоматизация тестирования и релизов через GitHub Actions и AWS/GCP-инфраструктуру.
  7. Prompt-engineering и адаптация LLM-моделей для мультимодальных задач (RAG-интеграции, CLIP-similarity).
Технологии и инструменты
AWS, Docker, GCP, Grafana, Kubernetes, langchain, MLflow, OpenCV, Python, PyTorch, Tensorflow, TensorRT, Airflow, FAISS, Pinecone, RAG, ONNX Runtime, Vision Transformers (ViT, Swin, CLIP)
Период работы/продолжительность
Январь 2024 г. - Февраль 2025 г.
NDA
Позиция на проекте
ML-инженер
Ответственность
  1. Обучение и внедрение моделей распознавания изображений (PyTorch, CatBoost for vision, EfficientNet, ResNet).
  2. Оптимизация пайплайнов данных для CV и search-ranking (BigQuery, PySpark, Airflow, DVC).
  3. Разработка алгоритмов semantic-matching для визуального поиска и ранжирования изображений.
  4. Анализ и трекинг метрик (IoU, mAP, Precision/Recall, F1), проведение A/B-тестов.
  5. Подготовка данных и автоматизация обучения с помощью Airflow DAGs и DVC-трекера.
  6. Контейнеризация и продакшен-деплой моделей (Docker, Kubernetes, Prometheus).
  7. Интеграция результатов CV-моделей в search-сервисы и recommendation-системы.
Технологии и инструменты
BigQuery, CatBoost, Clickhouse, Docker, DVC, Kubernetes, OpenCV, Prometheus, PySpark, Python, PyTorch, SQL, Airflow
Период работы/продолжительность
Июнь 2022 г. - Декабрь 2023 г.

Образование

Высшее
Аналогичные специалисты
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста

Request Poster