Демьян П., Middle, MLOps

Демьян П.
Беларусь, Минск
2 310 ₽/час 369 600 ₽/мес.
    MLOps
  • Middle
Опыт работы:
От 3 до 6 лет
Языки:

Английский — B2

ПисьменныйРазговорный

О специалисте

Навыки
Python
Bash
C++
TypeScript
Java
PyTorch
Tensorflow
transformers
Anthropic Claude
Mistral AI
Weights & Biases
Streamlit
Gemini API
FastAPI
Kubernetes
Gradio
PEFT
Qdrant
SQLite
FAISS
Redis
Chroma
Elasticsearch
Git
vscode
Grafana
openai api
Anthropic API
AWS
GCP
CI/CD
n8n
llama
MLflow
Helm
Bedrock
langchain
langgraph
Jira
Cursor
Prometheus
Linux
Windows Server
Windows
Technology:
SQL
JavaScript
Applications:
Docker
Docker Compose
Database:
PostgreSQL
MySQL
MongoDB
Source_control:
GitHub
GitLab
Формат работы
Удалённо
Описание о специалисте

Опытный инженер с сильным бэкграундом в разработке и внедрении моделей машинного обучения. Обладает навыками работы с RAG и мультиагентными системами, умеет использовать облачные платформы для создания масштабируемых и надежных решений. Гибкий командный игрок, успешно работающий в разнообразных средах и ориентированный на постоянное профессиональное развитие.


Экспертиза: ML - 3+ года

Примеры работ

Customer Support Knowledge Hub
Описание задачи/проекта

Создал интеллектуальную мультиагентную систему, оркестрируемую с помощью n8n, для работы центра знаний поддержки клиентов. Система использовала конвейер Retrieval-Augmented Generation (RAG) для точных, контекстно-зависимых ответов на обращения в службу поддержки. Входящие запросы преобразовывались в эмбеддинги, сопоставлялись через поиск по сходству с использованием pgvector в PostgreSQL и дополнялись структурированными метаданными перед передачей в LLM. Оркестрированные агенты обрабатывали загрузку FAQ, продуктовой документации и прошлых тикетов, обеспечивая постоянное обновление базы знаний. Решение было реализовано через масштабируемый бэкенд на FastAPI. Платформа позволяла пользователям вести естественный диалог с центром знаний.

Позиция на проекте
ML Engineer
Ответственность
  1. Разработал и развернул многоагентные рабочие процессы в n8n для загрузки данных, их обогащения и обработки запросов.
  2. Реализовал контейнеризацию с использованием Docker.
  3. Реализовал RAG-пайплайн, объединяющий семантический поиск (pgvector) с полнотекстовым поиском на ElasticSearch и LLM для генерации ответов.
  4. Внедрил систему кэширования для схожих запросов с целью экономии использования токенов.
  5. Осуществлял мониторинг продакшена, анализировал логи и оперативно решал возникающие проблемы.
  6. Оптимизировал релевантность запросов и задержку отклика за счёт настройки векторной базы данных и ранжирования результатов.
  7. Управлял миграциями схем БД с помощью Alembic.
  8. Развернул бэкенд-сервисы на AWS, обеспечив их высокую доступность и масштабируемость, а также настроил CI/CD.
Технологии и инструменты
Alembic, Docker, FastAPI, gemini, Git, GitHub Actions, Gradio, n8n, openAI, PostgreSQL, Python, langgraph, pgvector, openai api
Период работы/продолжительность
Февраль 2025 г. - Октябрь 2025 г.
Multi-Agent CV Screening & Matching System
Описание задачи/проекта

Разработал многоагентную систему с использованием LangGraph для оптимизации процесса подбора персонала за счёт автоматизации анализа резюме и сопоставления кандидатов с вакансиями. Агенты обрабатывали резюме и описания вакансий, парсили и структурировали неструктурированные данные, а результаты сохранялись в базе данных PostgreSQL и в Pinecone для семантического поиска по сходству. Система сопоставляла резюме с вакансиями, ранжировала кандидатов и выделяла их сильные и слабые стороны, позволяя рекрутерам принимать решения быстрее и на основе более полной информации. Решение было реализовано в виде масштабируемого API на AWS с интерактивным веб-интерфейсом чата для рекрутеров.

Позиция на проекте
ML Engineer
Ответственность
  1. Разработал и внедрил многоагентный конвейер с использованием LangGraph для загрузки, парсинга и структурированного хранения резюме.
  2. Построил семантический поиск и ранжирование по схожести с помощью PostgreSQL и Pinecone.
  3. Оптимизировал процесс ранжирования кандидатов для снижения задержки и повышения точности в режиме реального времени.
  4. Разработал логику сопоставления резюме с вакансиями, ранжирования и анализа сильных/слабых сторон.
  5. Внедрил супервизора и динамические промпты в LangGraph
  6. Открыл доступ к возможностям системы через защищённый API, развернутый на AWS.
  7. Реализовал веб-чат интерфейс (HTML/JavaScript) для взаимодействия рекрутера с системой.
  8. Проводил еженедельные синхронизации с командой и заказчиком.
  9. Участвовал в код-ревью, поддерживал техническую документацию и соблюдение лучших практик.
Технологии и инструменты
AWS, FastAPI, Gradio, langchain, PostgreSQL, Python, langgraph, Pinecone, Hugging Face Transformers, Claude Sonnet, Mistral
Период работы/продолжительность
Март 2024 г. - Январь 2025 г.
Автоматизированная Проверка Качества с использованием Computer Vision
Описание задачи/проекта

Разработал и внедрил систему визуального контроля на базе искусственного интеллекта для обнаружения дефектов в производственных деталях в реальном времени. Использовал модели компьютерного зрения на основе глубокого обучения для точного выявления царапин, вмятин, перекосов и поверхностных аномалий. Конвейер обрабатывал высококачественные изображения с камер производственной линии, применял методы предобработки и модели обнаружения аномалий, а затем предоставлял мгновенную классификацию «годен/брак» через API. Повысил точность обнаружения дефектов за счёт снижения количества пропущенных случаев и сократил объём ручной инспекции на 60%.

Позиция на проекте
ML Engineer
Ответственность
  1. Разработал модели компьютерного зрения с использованием PyTorch для обнаружения аномалий и дефектов.
  2. Реализовал этапы предобработки для повышения устойчивости моделей.
  3. Создал полнофункциональный backend на FastAPI для загрузки изображений, инференса моделей и предоставления API.
  4. Дообучил EfficientNet-B2 и YOLOv5/YOLOv8 на датасетах производственных дефектов.
  5. Контейнеризировал систему с помощью Docker и развернул на AWS EC2 с поддержкой GPU.
  6. Открыл возможности системы через защищённый API, развернутый на AWS.
  7. Настроил CI/CD-пайплайны с использованием GitHub Actions для автоматического тестирования и деплоя.
  8. Проводил регулярные демонстрации для клиента.
  9. Применил адаптеры LoRA к Vision Transformer для захвата пространственных аномалий.
Технологии и инструменты
AWS, FastAPI, OpenCV, PostgreSQL, Python, PyTorch, Gemini API, Fine-tuning
Период работы/продолжительность
Июнь 2023 г. - Февраль 2024 г.
LLM Fine-tuning & NLP Research Платформа
Описание задачи/проекта

Разработана исследовательская платформа для тонкой настройки больших языковых моделей с использованием передовых методологий PEFT. Проект включал адаптацию предобученных моделей для конкретных доменов и языков, реализацию методов инженерии промптов и создание системы оценки качества генерации. Платформа поддерживала эксперименты с различными архитектурами LLM, включая Llama и Mistral, и использовала подходы к рассуждению для повышения качества ответов.

Позиция на проекте
ML Engineer
Ответственность
  1. Реализовал конвейер тонкой настройки с использованием методологий LoRa, QLoRa и P-tuning для эффективной адаптации LLM.
  2. Разработал систему prompt engineering с динамической оптимизацией запросов для различных задач.
  3. Создал фреймворк для обучения в контексте с поддержкой few-shot и zero-shot сценариев.
  4. Реализовал механизмы рассуждений для улучшения логических возможностей модели.
  5. Интегрировал нескольких поставщиков LLM: Gemini, Mistral, Llama для сравнительного анализа.
  6. Построил конвейер оценки для автоматической проверки качества дообученных моделей.
  7. Развернул готовый к промышленной эксплуатации inference API на GCP с авто-масштабированием.
Технологии и инструменты
FastAPI, GCP, Kubernetes, llama, PostgreSQL, Python, PyTorch, transformers, Weights & Biases, Gemini API, Mistral API, LoRa/QLoRa
Период работы/продолжительность
Май 2022 г. - Июнь 2023 г.

Образование

Среднее
Название учебного заведения/курса
in Computer Science
Аналогичные специалисты
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста