Иван А. , Middle, ML-инженер

Иван А.

Россия, Москва

3 680 ₽/час 588 800 ₽/мес. без НДС

ML-инженер

Middle

Опыт работы:: От 3 до 6 лет

Навыки

Python

API

Linux

PyTorch

Tensorflow

OpenCV

YOLO

Numpy

Pandas

FastAPI

Django Framework

Kubernetes

MLflow

Apache AirFlow

Prometheus

Grafana

GCP

Computer Vision

Technology:

SQL

HTML

HTML5

Database:

MySQL

Applications:

Docker

Формат работы

Удалённо

Описание о специалисте

Увеличил производительность CV-систем (FPS) до +50 % за счёт оптимизации inference (YOLOv8, TensorRT, ONNX). Повысил точность моделей компьютерного зрения до 92 % и отдельных CV-моделей на 15–20 %. Снизил latency инференса на 25 %, обеспечил обработку 5000+ запросов/мин при <100 мс. Запустил production-CV сервисы и AI-агентов (real-time, REST/gRPC, микросервисы). Реализовал мультимодальные решения CV + LLM + RAG (визуальный анализ + поиск по документам). Внедрил MLOps (MLflow, CI/CD, мониторинг, auto-rollback), ускорив релизы на 40 %. Снизил операционные издержки проектов до 50 % за счёт автоматизации и оптимизации ML-пайплайнов. Настроил мониторинг качества и дрейфа моделей в продакшене.

NDA

Позиция на проекте

ML-инженер

Ответственность

Разработка и оптимизация систем компьютерного зрения (YOLOv8, OpenCV, custom CNN, TorchScript, TensorRT).
Построение пайплайнов для обработки видео и изображений (real-time детекция, сегментация, трекинг).
Интеграция моделей в продакшн через REST/gRPC API и микросервисы (FastAPI, Django).
Разработка backend-инфраструктуры для AI-агентов (Celery, Redis, PostgreSQL, WebSockets).
Контейнеризация и оркестрация ML-сервисов (Docker, Kubernetes, Helm).
Настройка CI/CD и MLOps: автоматический деплой моделей, отслеживание экспериментов (MLflow, GitHub Actions).
Оптимизация inference-пайплайнов с использованием ONNX Runtime, TensorRT, FP16/INT8 quantization.
Мониторинг состояния моделей и производительности (Prometheus, Grafana, Loki).
Работа с мультимодальными системами: интеграция CV-моделей с LLM и RAG-компонентами (LangChain, FAISS, Qdrant).

Технологии и инструменты

Celery, Django, Docker, FastAPI, GitHub Actions, Grafana, Helm, Kubernetes, langchain, MLflow, OpenCV, PostgreSQL, Prometheus, Python, PyTorch, Redis, TensorRT, FAISS, RAG, YOLOv8, ONNX Runtime, TorchScript

Период работы/продолжительность

Март 2025 г. - Март 2026 г.

NDA

Позиция на проекте

ML-инженер

Ответственность

Разработка и обучение моделей компьютерного зрения: custom CNN, Vision Transformers (ViT, Swin, CLIP).
Построение мультимодальных систем (Vision + Text) с использованием FAISS, Pinecone и LangChain.
Fine-tuning, quantization и оптимизация моделей под inference (ONNX Runtime, TensorRT, FP16/INT8).
Разработка архитектуры CV-сервисов для анализа изображений, документов и видеопотоков.
Реализация пайплайнов MLOps: обучение, деплой и мониторинг (MLflow, Airflow, Docker, K8s, CI/CD).
Автоматизация тестирования и релизов через GitHub Actions и AWS/GCP-инфраструктуру.
Prompt-engineering и адаптация LLM-моделей для мультимодальных задач (RAG-интеграции, CLIP-similarity).

Технологии и инструменты

AWS, Docker, GCP, Grafana, Kubernetes, langchain, MLflow, OpenCV, Python, PyTorch, Tensorflow, TensorRT, Airflow, FAISS, Pinecone, RAG, ONNX Runtime, Vision Transformers (ViT, Swin, CLIP)

Период работы/продолжительность

Январь 2024 г. - Февраль 2025 г.

NDA

Позиция на проекте

ML-инженер

Ответственность

Обучение и внедрение моделей распознавания изображений (PyTorch, CatBoost for vision, EfficientNet, ResNet).
Оптимизация пайплайнов данных для CV и search-ranking (BigQuery, PySpark, Airflow, DVC).
Разработка алгоритмов semantic-matching для визуального поиска и ранжирования изображений.
Анализ и трекинг метрик (IoU, mAP, Precision/Recall, F1), проведение A/B-тестов.
Подготовка данных и автоматизация обучения с помощью Airflow DAGs и DVC-трекера.
Контейнеризация и продакшен-деплой моделей (Docker, Kubernetes, Prometheus).
Интеграция результатов CV-моделей в search-сервисы и recommendation-системы.

Технологии и инструменты

BigQuery, CatBoost, Clickhouse, Docker, DVC, Kubernetes, OpenCV, Prometheus, PySpark, Python, PyTorch, SQL, Airflow

Период работы/продолжительность

Июнь 2022 г. - Декабрь 2023 г.