Демьян П. , Middle, MLOps

Демьян П.

Беларусь, Минск

2 310 ₽/час 369 600 ₽/мес. без НДС

MLOps

Middle

Опыт работы:: От 3 до 6 лет
Языки:: Английский — B2
ПисьменныйРазговорный

Навыки

Python

Bash

C++

TypeScript

Java

PyTorch

Tensorflow

transformers

Anthropic Claude

Mistral AI

Weights & Biases

Streamlit

Gemini API

FastAPI

Kubernetes

Gradio

PEFT

Qdrant

SQLite

FAISS

Redis

Chroma

Elasticsearch

Git

vscode

Grafana

openai api

Anthropic API

AWS

GCP

CI/CD

n8n

llama

MLflow

Helm

Bedrock

langchain

langgraph

Jira

Cursor

Prometheus

Linux

Windows Server

Windows

Technology:

SQL

JavaScript

Applications:

Docker

Docker Compose

Database:

PostgreSQL

MySQL

MongoDB

Source_control:

GitHub

GitLab

Формат работы

Удалённо

Описание о специалисте

Опытный инженер с сильным бэкграундом в разработке и внедрении моделей машинного обучения. Обладает навыками работы с RAG и мультиагентными системами, умеет использовать облачные платформы для создания масштабируемых и надежных решений. Гибкий командный игрок, успешно работающий в разнообразных средах и ориентированный на постоянное профессиональное развитие.

Экспертиза: ML - 3+ года

Customer Support Knowledge Hub

Описание задачи/проекта

Создал интеллектуальную мультиагентную систему, оркестрируемую с помощью n8n, для работы центра знаний поддержки клиентов. Система использовала конвейер Retrieval-Augmented Generation (RAG) для точных, контекстно-зависимых ответов на обращения в службу поддержки. Входящие запросы преобразовывались в эмбеддинги, сопоставлялись через поиск по сходству с использованием pgvector в PostgreSQL и дополнялись структурированными метаданными перед передачей в LLM. Оркестрированные агенты обрабатывали загрузку FAQ, продуктовой документации и прошлых тикетов, обеспечивая постоянное обновление базы знаний. Решение было реализовано через масштабируемый бэкенд на FastAPI. Платформа позволяла пользователям вести естественный диалог с центром знаний.

Позиция на проекте

ML Engineer

Ответственность

Разработал и развернул многоагентные рабочие процессы в n8n для загрузки данных, их обогащения и обработки запросов.
Реализовал контейнеризацию с использованием Docker.
Реализовал RAG-пайплайн, объединяющий семантический поиск (pgvector) с полнотекстовым поиском на ElasticSearch и LLM для генерации ответов.
Внедрил систему кэширования для схожих запросов с целью экономии использования токенов.
Осуществлял мониторинг продакшена, анализировал логи и оперативно решал возникающие проблемы.
Оптимизировал релевантность запросов и задержку отклика за счёт настройки векторной базы данных и ранжирования результатов.
Управлял миграциями схем БД с помощью Alembic.
Развернул бэкенд-сервисы на AWS, обеспечив их высокую доступность и масштабируемость, а также настроил CI/CD.

Технологии и инструменты

Alembic, Docker, FastAPI, gemini, Git, GitHub Actions, Gradio, n8n, openAI, PostgreSQL, Python, langgraph, pgvector, openai api

Период работы/продолжительность

Февраль 2025 г. - Февраль 2026 г.

Multi-Agent CV Screening & Matching System

Описание задачи/проекта

Разработал многоагентную систему с использованием LangGraph для оптимизации процесса подбора персонала за счёт автоматизации анализа резюме и сопоставления кандидатов с вакансиями. Агенты обрабатывали резюме и описания вакансий, парсили и структурировали неструктурированные данные, а результаты сохранялись в базе данных PostgreSQL и в Pinecone для семантического поиска по сходству. Система сопоставляла резюме с вакансиями, ранжировала кандидатов и выделяла их сильные и слабые стороны, позволяя рекрутерам принимать решения быстрее и на основе более полной информации. Решение было реализовано в виде масштабируемого API на AWS с интерактивным веб-интерфейсом чата для рекрутеров.

Позиция на проекте

ML Engineer

Ответственность

Разработал и внедрил многоагентный конвейер с использованием LangGraph для загрузки, парсинга и структурированного хранения резюме.
Построил семантический поиск и ранжирование по схожести с помощью PostgreSQL и Pinecone.
Оптимизировал процесс ранжирования кандидатов для снижения задержки и повышения точности в режиме реального времени.
Разработал логику сопоставления резюме с вакансиями, ранжирования и анализа сильных/слабых сторон.
Внедрил супервизора и динамические промпты в LangGraph
Открыл доступ к возможностям системы через защищённый API, развернутый на AWS.
Реализовал веб-чат интерфейс (HTML/JavaScript) для взаимодействия рекрутера с системой.
Проводил еженедельные синхронизации с командой и заказчиком.
Участвовал в код-ревью, поддерживал техническую документацию и соблюдение лучших практик.

Технологии и инструменты

AWS, FastAPI, Gradio, langchain, PostgreSQL, Python, langgraph, Pinecone, Hugging Face Transformers, Claude Sonnet, Mistral

Период работы/продолжительность

Март 2024 г. - Январь 2025 г.

Автоматизированная Проверка Качества с использованием Computer Vision

Описание задачи/проекта

Разработал и внедрил систему визуального контроля на базе искусственного интеллекта для обнаружения дефектов в производственных деталях в реальном времени. Использовал модели компьютерного зрения на основе глубокого обучения для точного выявления царапин, вмятин, перекосов и поверхностных аномалий. Конвейер обрабатывал высококачественные изображения с камер производственной линии, применял методы предобработки и модели обнаружения аномалий, а затем предоставлял мгновенную классификацию «годен/брак» через API. Повысил точность обнаружения дефектов за счёт снижения количества пропущенных случаев и сократил объём ручной инспекции на 60%.

Позиция на проекте

ML Engineer

Ответственность

Разработал модели компьютерного зрения с использованием PyTorch для обнаружения аномалий и дефектов.
Реализовал этапы предобработки для повышения устойчивости моделей.
Создал полнофункциональный backend на FastAPI для загрузки изображений, инференса моделей и предоставления API.
Дообучил EfficientNet-B2 и YOLOv5/YOLOv8 на датасетах производственных дефектов.
Контейнеризировал систему с помощью Docker и развернул на AWS EC2 с поддержкой GPU.
Открыл возможности системы через защищённый API, развернутый на AWS.
Настроил CI/CD-пайплайны с использованием GitHub Actions для автоматического тестирования и деплоя.
Проводил регулярные демонстрации для клиента.
Применил адаптеры LoRA к Vision Transformer для захвата пространственных аномалий.

Технологии и инструменты

AWS, FastAPI, OpenCV, PostgreSQL, Python, PyTorch, Gemini API, Fine-tuning

Период работы/продолжительность

Июнь 2023 г. - Февраль 2024 г.

LLM Fine-tuning & NLP Research Платформа

Описание задачи/проекта

Разработана исследовательская платформа для тонкой настройки больших языковых моделей с использованием передовых методологий PEFT. Проект включал адаптацию предобученных моделей для конкретных доменов и языков, реализацию методов инженерии промптов и создание системы оценки качества генерации. Платформа поддерживала эксперименты с различными архитектурами LLM, включая Llama и Mistral, и использовала подходы к рассуждению для повышения качества ответов.

Позиция на проекте

ML Engineer

Ответственность

Реализовал конвейер тонкой настройки с использованием методологий LoRa, QLoRa и P-tuning для эффективной адаптации LLM.
Разработал систему prompt engineering с динамической оптимизацией запросов для различных задач.
Создал фреймворк для обучения в контексте с поддержкой few-shot и zero-shot сценариев.
Реализовал механизмы рассуждений для улучшения логических возможностей модели.
Интегрировал нескольких поставщиков LLM: Gemini, Mistral, Llama для сравнительного анализа.
Построил конвейер оценки для автоматической проверки качества дообученных моделей.
Развернул готовый к промышленной эксплуатации inference API на GCP с авто-масштабированием.

Технологии и инструменты

FastAPI, GCP, Kubernetes, llama, PostgreSQL, Python, PyTorch, transformers, Weights & Biases, Gemini API, Mistral API, LoRa/QLoRa

Период работы/продолжительность

Май 2022 г. - Июнь 2023 г.