Эрнест Ю. , Middle, ML-инженер

Male avatar
Эрнест Ю.
Россия, Москва
3 220 ₽/час 515 200 ₽/мес.
    ML-инженер
  • Middle
Опыт работы:
От 3 до 6 лет

О специалисте

Навыки
Python
PyTorch
OpenCV
Scikit-learn
transformers
langchain
langgraph
Numpy
Pandas
Matplotlib
Seaborn
MLflow
Git
ONNX
YOLOv8
ResNet
Autoencoder
Tesseract
Bert
FAISS
llama
Linux
Technology:
SQL
Database:
PostgreSQL
Applications:
Docker
Формат работы
Удалённо
Описание о специалисте

Разработал и внедрил модели для диагностики возрастной макулярной дегенерации (OCT-изображения) с использованием SOTA-архитектур на PyTorch, адаптированных под задачу. Создал end-to-end CV-решения для промышленности и медицины (YOLOv8, ResNet, Autoencoder), включая деплой и оптимизацию через ONNX Runtime. Построил OCR-пайплайн (OpenCV + Tesseract → BERT) для автоматизированной обработки медицинских карт. Реализовал CV-систему анализа сварочных швов в реальном времени, сократив время контроля на 70% и снизив процент брака. Разработал пайплайн распознавания транспортных средств при въезде на объект, достигнув точности 94%. Построил RAG-систему с использованием LLM (LLaMA) и реализовал векторный поиск на FAISS. Участвовал в оптимизации тяжёлых вычислений на суперкомпьютерах. Является соавтором 2 научных статей в Q1-журналах (Applied Sciences).

Примеры работ

NDA
Описание задачи/проекта

Диагностика возрастной макулярной дегенерации: Разработка и интеграция SOTA-моделей (PyTorch, ResNet, Autoencoder) для анализа OCT-изображений. Создание backend-модуля для интерпретации результатов врачами. CV-система анализа сварочных швов: Реализация решения для контроля качества сварки в реальном времени, сократившего время проверки на 70% и уменьшающего количество брака. Распознавание транспортных средств: Построение пайплайна компьютерного зрения (OpenCV, YOLOv8) с точностью распознавания 94%. OCR-пайплайн для медицинских карт: Автоматизация обработки текстов (OpenCV + Tesseract → BERT), повышение точности и скорости извлечения данных. RAG-система на базе LLM (LLaMA): Построение Retrieval-Augmented Generation решения и реализация векторного поиска FAISS.

Позиция на проекте
ML Engineer
Ответственность
  1. Разработка и интеграция SOTA-моделей (PyTorch, ResNet, Autoencoder) для анализа OCT-изображений.
  2. Создание backend-модуля для интерпретации результатов врачами.
  3. Реализация решения для контроля качества сварки в реальном времени, сократившего время проверки на 70% и уменьшающего количество брака.
  4. Построение пайплайна компьютерного зрения (OpenCV, YOLOv8) с точностью распознавания 94%.
  5. Автоматизация обработки текстов (OpenCV + Tesseract → BERT), повышение точности и скорости извлечения данных.
  6. Построение Retrieval-Augmented Generation решения и реализация векторного поиска FAISS.
Технологии и инструменты
Bert, llama, OpenCV, PyTorch, Tesseract, FAISS, YOLOv8, ResNet, Autoencoder
Период работы/продолжительность
Январь 2023 г. - Январь 2025 г.
NDA
Описание задачи/проекта

Разработка скриптов для анализа и обработки данных (pandas, NumPy). Автоматизация сбора данных из внешних источников. Подготовка визуализаций (Matplotlib, Seaborn) и SQL-запросов для PostgreSQL. Участие в оптимизации вычислений и работе с Git.

Позиция на проекте
Python-разработчик
Ответственность
  1. Разработка скриптов для анализа и обработки данных (pandas, NumPy).
  2. Автоматизация сбора данных из внешних источников.
  3. Подготовка визуализаций (Matplotlib, Seaborn) и SQL-запросов для PostgreSQL.
  4. Участие в оптимизации вычислений и работе с Git.
Технологии и инструменты
Git, Matplotlib, Numpy, Pandas, PostgreSQL, Seaborn
Период работы/продолжительность
Январь 2022 г. - Январь 2023 г.

Образование

Высшее
Аналогичные специалисты
Male avatar
Дмитрий К.
Россия, Москва
3 200 ₽/час
    ML-инженер
  • Middle
Повысил эффективность работы поддержки примерно на 35% за счёт внедрения комплекса ML/NLP-решений: классификация обращений, кластеризация, извлечение сущностей. Улучшил качество семантического поиска по базе знаний примерно в 1,7 раза, разработав и внедрив RAG-пайплайн (LangChain, Qdrant, FAISS). Достиг 91% точности прогнозирования инцидентов благодаря использованию ансамблей моделей (CatBoost, XGBoost) и продуманного feature engineering. Автоматизировал около 90% рутинных операций и сократил время подготовки отчетов с часов до минут, создав набор инструментов и пайплайнов (Bash, Docker, Airflow). Настроил полноценный MLOps-контур (версии моделей, деплой, мониторинг) на базе MLflow и FastAPI, обеспечив стабильный вывод моделей в прод и сопровождение. Сократил время формирования ежедневных отчётов с 3 часов до 20 минут через ETL/ELT-пайплайны (Airflow, Spark, PostgreSQL). Построил систему интерактивных дашбордов, что ускорило принятие управленческих решений примерно на 35%. Повысил конверсию за счёт A/B-тестов и статистического анализа, результаты которых легли в основу доработок продукта.
    Python
    Pandas
    Numpy
    PyTorch
    Tensorflow
    transformers
    langchain
    Scikit-learn
    CatBoost
    XGBoost
    FastAPI
    PostgreSQL
    Qdrant
    FAISS
    Redis
    Airflow
    Spark
    MLflow
    Docker
    Bash
    Linux
    Superset
    Plotly
    Seaborn
    Elasticsearch
    Parquet
    Streamlit
    Jupyter Notebook
    NLP
    RAG
Male avatar
Даниил Р.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Проектировал и выводил в продакшен модели кредитного скоринга и прогнозирования дефолта, обеспечивая стабильность и соответствие требованиям риск-процессов. Формировал и поддерживал пайплайны подготовки данных, feature engineering и валидации моделей для стабильных метрик и предсказуемой работы в продакшене. Встраивал модели в процессы андеррайтинга и collection, настраивал корректную логику принятия решений и взаимодействие со стейкхолдерами. Вёл R&D по улучшению эффективности моделей и использованию альтернативных источников данных. Развивал инфраструктуру деплоя, мониторинга и сопровождения ML-решений, включая CI/CD, Docker, MLflow и связанные инструменты.
    Python
    Numpy
    Pandas
    Scikit-learn
    XGBoost
    Lightgbm
    CatBoost
    PyTorch
    Keras
    ONNX
    HuggingFace Transformers
    Docker
    Kubernetes
    MLflow
    Airflow
    FastAPI
    Grpc
    Prometheus
    Grafana
    Apache Kafka
    Flink
    Delta Lake
    Feast
    PostgreSQL
    Clickhouse
    FAISS
    Qdrant
    Pinecone
    AWS S3
    Azure ML
    GitLab CI/CD
    Terraform
    langchain
Male avatar
Лаврентий Н.
Россия, Москва
2 800 ₽/час
    ML-инженер
  • Middle
Разработал фреймворк для создания AI-агентов на базе LangGraph, обеспечив стабильное выполнение цепочек и удобную интеграцию с сервисами компании. Построил RAG-систему, повысив качество извлечения и точность ответов моделей на 35%. Реализовал и внедрил несколько AI-агентов в продакшен для автоматизации поддержки и внутренних процессов. Создал голосового ассистента на основе LLM с использованием ASR и TTS, улучшив качество обработки пользовательских запросов. Настроил мониторинг качества моделей через MLflow, обеспечив контроль метрик и отслеживание деградации. Участвовал в проектировании и развитии ETL-процессов на базе Airflow, PostgreSQL и ClickHouse. Разработал backend-сервисы на FastAPI для интеграции LLM-функциональности и агентных сценариев. Подготовил и выпустил MVP с использованием LLM-агентов в сжатые сроки, обеспечив соответствие требованиям бизнеса.
    Python
    SQL
    Deep Learning
    PyTorch
    transformers
    llm
    NLP
    langchain
    langgraph
    RAG
    AI Agents
    lightautoml
    Lightgbm
    CatBoost
    XGBoost
    Scikit-learn
    Pandas
    ETL
    Apache AirFlow
    Docker
    docker-compose
    FastAPI
    MCP
    Redis
    Postgres
    Clickhouse
    Apache Kafka
    SQLAlchemy
    MLflow
    REST API
    Pytest
    Linux
Male avatar
Марат К.
Россия, Тула
3 200 ₽/час
    ML-инженер
  • Middle
Реализовал production-пайплайн сегментации повреждений аграрной техники в 4K-разрешении с F1-score 93.3% (ансамбль PIDNet + OneFormer, тайловая инференс-схема). Повысил качество моделей CV за счёт генерации синтетических данных (FLUX + LoRA): прирост F1 с 88% до 93% без ручной разметки. Ускорил пайплайн детекции повреждений в 1.4 раза, внедрив предварительную ML-фильтрацию и оптимизировав архитектуру под бизнес-требования. Улучшил OCR-модель распознавания номеров, снизив CER на 3% за счёт претрейна на расширенном собственном датасете. Протестировал использование LLM (Qwen) для OCR и синтетической разметки данных без участия человека. Реализовал zero-shot псевдоразметку с BLIP и SigLIP, увеличив объём размеченных данных в 2 раза. Разработал и вывел в продакшен систему детекции и сегментации логотипов (MAP@50 = 94%), оформленную как FastAPI-сервис. Повысил производительность YOLOX-модели для детекции персонала на 32% за счёт оптимизации бэкбона. Стандартизировал ML-эксперименты и трекинг метрик, переведя процессы на MLflow.
    Python
    SQL
    FastAPI
    PostgreSQL
    Deep Learning
    PyTorch
    Scikit-learn
    Pandas
    Numpy
    Анализ данных
    машинное обучение
    Computer Vision
    Docker
    OpenCV
    Airflow
    Plotly
    Git
    CatBoost
    XGBoost
    MLflow
    Matplotlib
    Seaborn
    PySpark
    YOLO
    CLIP
    ResNet
    U-Net
    llm
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста

Request Poster