Мария A. , Middle+, ML-инженер

Female avatar
Мария A.
Беларусь, Минск
2 750 ₽/час 440 000 ₽/мес. без НДС
    ML-инженер
  • Middle+
Опыт работы:
От 3 до 6 лет
Языки:

Английский — B2

ПисьменныйРазговорный

Немецкий — B2

ПисьменныйРазговорный

О специалисте

Навыки
Python
Bash
C++
Java
TypeScript
Kubernetes
vLLM
HF Transformers
Airflow
FastAPI
SQL Server
Qdrant
Neo4j
Git
PyCharm
AWS
GCP
Prometheus
Grafana
Langfuse
Jenkins
CI/CD
Grocery
n8n
SageMaker
langchain
langgraph
Jira
Cursor
Technology:
SQL
Applications:
Docker
Database:
MySQL
PostgreSQL
MongoDB
Source_control:
GitHub
GitLab
Формат работы
Удалённо
Описание о специалисте

Опытный Machine Learning Engineer с сильной экспертизой в проектировании, разработке и внедрении end-to-end ML-систем. Глубокие знания в области классического машинного обучения, глубокого обучения и решений на базе LLM, включая RAG-пайплайны и мультиагентные архитектуры.

Практический опыт создания масштабируемых и надёжных ML-систем в облачных средах. Комфортно работаю в динамичных кросс-функциональных командах, ориентирована на постоянное развитие, построение устойчивых решений и достижение измеримого бизнес-результата.

Примеры работ

Платформа автоматизации логистики и интеллектуальной обработки документов
Описание задачи/проекта

Разработала мультиагентную систему автоматизации для логистических команд, предназначенную для определения перечня обязательных транспортных документов при автомобильных перевозках (внутренних и международных). Система оркестрирует специализированных агентов для обработки неструктурированных данных из различных каналов коммуникации, извлекает и обогащает информацию о перевозке и формирует корректный комплект документов с учётом требований регуляторов, включая опасные грузы и трансграничные сценарии. Решение спроектировано как black-box сервис, снижающий объём ручной работы. Поставляется в виде защищённого и масштабируемого API для интеграции в production-процессы логистики.

Позиция на проекте
ML Engineer
Ответственность
  1. Реализовала мультиагентный пайплайн на базе LangGraph для структурирования неструктурированных логистических данных.
  2. Преобразовывала текстовые, голосовые и документные входные данные в структурированный формат с использованием speech-to-text и OCR.
  3. Реализовала GraphRAG для моделирования связей между типами перевозок, характеристиками грузов, странами, нормативными требованиями и обязательными транспортными документами.
  4. Разработала систему очередей на базе Redis для управления нагрузкой на LLM и повышения стабильности системы.
  5. Реализовала supervisor-компонент в LangGraph для оркестрации агентов и динамического управления промптингом.
  6. Оптимизировала релевантность результатов за счёт внедрения reranking-логики в агентов обогащения и подбора документов.
  7. Разработала интерфейс human-in-the-loop на Vue.js для валидации результатов работы мультиагентной системы.
  8. Контейнеризировала сервисы с использованием Docker для обеспечения надёжного деплоя.
  9. Развернула защищённый API в AWS для автоматизированного подбора транспортных документов.
  10. Интегрировала Prometheus и Grafana для мониторинга производительности, ошибок и состояния пайплайна.
  11. Настроила CI/CD-процессы с использованием Jenkins.
Технологии и инструменты
AWS, Docker, FastAPI, Jenkins, Neo4j, PostgreSQL, Python, Vue.js, Prometheus & Grafana
Период работы/продолжительность
Сентябрь 2025 г. - Апрель 2026 г.
Платформа интеллектуального ранжирования и персонализации поиска
Описание задачи/проекта

Разработала ML-платформу ранжирования товаров в поисковой выдаче на основе пользовательских взаимодействий и поведенческих сигналов. Решение направлено на повышение релевантности поиска, рост CTR и конверсии за счёт моделирования пользовательского намерения и оптимизации порядка отображения товаров в рамках каждой поисковой сессии. Система обрабатывает сессионные и товарные признаки, использует implicit feedback (просмотры, клики, добавления в корзину, покупки) и реализует Learning-to-Rank подход для построения персонализированной выдачи. Архитектура включает витрины данных, автоматизированное переобучение через Airflow, сервис инференса с API в AWS и контроль качества модели по NDCG с регулярным мониторингом деградации.

Позиция на проекте
ML Engineer
Ответственность
  1. Подготовила витрину данных для задачи Learning-to-Rank с группировкой по search_number — уникальному идентификатору поискового запроса
  2. Выполнила временное разбиение данных без утечки будущих событий.
  3. Спроектировала feature engineering пайплайн: пользовательские, товарные, категориальные, позиционные и query-признаки, а также поведенческие агрегаты.
  4. Обработала implicit feedback; исследовала бинаризацию таргета и negative sampling при 95% дисбалансе.
  5. Обучила модель Learning-to-Rank (LightGBM LGBMRanker, LambdaRank) с группировкой по сессиям.
  6. Настроила hyperparameter tuning через Optuna с контролем переобучения.
  7. Унифицировала расчёт NDCG для корректной оценки качества на train/val/test.
  8. Провела диагностику temporal drift и cold-start товаров на test.
  9. Провела сравнение с бейзлайнами (Top Popular, Personalized Popular) и оценила прирост бизнес-метрик (CTR, конверсия).
  10. Автоматизировала подготовку витрин данных, регулярное переобучение модели и пересчёт метрик качества с использованием Airflow, реализовав отдельные DAG-и для обучения и валидации.
  11. Развернула сервис инференса в AWS и реализовала защищённый API для интеграции модели в поисковую систему.
  12. Подготовила бизнес-интерпретацию результатов и A/B-гипотезы для продуктовой команды.
Технологии и инструменты
AWS, Docker, FastAPI, GitLab, Lightgbm, Optuna, PostgreSQL, Python, S3, Scikit-learn, XGBoost, Airflow
Период работы/продолжительность
Апрель 2024 г. - Август 2025 г.
AI-система поддержки клиентов и интеллектуальной работы с базой знаний
Описание задачи/проекта

Разработала AI-систему поддержки клиентов для обработки большого объёма сложных неструктурированных запросов с задержкой менее секунды. Реализовала архитектуру Retrieval-Augmented Generation (RAG) с гибридным семантическим и лексическим поиском, минимизировав использование LLM-инференса для обеспечения низкой латентности и оптимизации затрат. Спроектировала полностью асинхронный backend с событийной архитектурой, способный обрабатывать 100+ конкурентных запросов на одно CPU-ядро. Внедрила контур непрерывного обучения с обновлением базы знаний без остановки сервиса (zero-downtime) на основе обратной связи операторов и модераторов.

Позиция на проекте
Machine Learning Engineer / AI Engineer
Ответственность
  1. Спроектировала и реализовала RAG-пайплайн для обработки неструктурированных обращений пользователей.
  2. Реализовала preprocessing-логику для повышения устойчивости моделей.
  3. Использовала анализ тональности и интонации для адаптивной нормализации пользовательских запросов.
  4. Реализовала гибридный retrieval (BM25 + векторный поиск) с динамической адаптацией к типу запроса.
  5. Оптимизировала FAISS (IndexFlatIP / IndexFlatL2, IndexIVFFlat) с настройкой параметров nlist и nprobe.
  6. Применяла parameter-efficient fine-tuning (QLoRA) для адаптации embedding- и generation-моделей к доменной терминологии и стилю поддержки при минимальных вычислительных затратах.
  7. Разработала полностью асинхронный FastAPI-backend с событийной моделью обработки.
  8. Внедрила feedback loop с участием операторов для постоянного улучшения качества ответов.
  9. Реализовала лёгкое A/B-тестирование для сравнения и оптимизации стратегий retrieval.
  10. Контейнеризировала сервисы (Docker, Docker Compose) и настроила CI/CD-процессы с использованием Jenkins.
Технологии и инструменты
Docker, Git, Jenkins, langchain, PostgreSQL, Python, FAISS, RAG, QLoRA
Период работы/продолжительность
Январь 2023 г. - Март 2024 г.
Платформа моделирования и прогнозирования трендов в социальных сетях
Описание задачи/проекта

Спроектировала и разработала production-ready платформу анализа и прогнозирования трендов в социальных медиа на основе масштабных текстовых временных рядов. Система объединяет тематическое моделирование, семантические эмбеддинги и модели прогнозирования временных рядов для предсказания популярности тем и динамики пользовательской вовлечённости. Решение обеспечило раннее выявление emerging trends, сравнительную оценку моделей прогнозирования и более обоснованные решения в области контентной и аудиторийной стратегии.

Позиция на проекте
Machine Learning Engineer / AI Engineer
Ответственность
  1. Реализовала ingestion-пайплайны с валидацией схем данных и idempotent-обработкой.
  2. Построила workflow тематического моделирования с использованием LDA.
  3. Разработала пайплайны семантических эмбеддингов (Word2Vec, FastText, BERT, RoBERTa) для кластеризации и анализа сходства.
  4. Спроектировала гибридные семантические представления, объединяющие распределения тем и плотные эмбеддинги, для повышения интерпретируемости трендов.
  5. Реализовала модели прогнозирования динамики тем и вовлечённости (ARIMA, Holt–Winters, LSTM, Transformer-подходы).
  6. Внедрила rolling-window backtesting и benchmarking моделей с использованием MAE и RMSE в условиях нестационарности.
  7. Настроила observability производительности и потребления ресурсов (Prometheus, Grafana).
  8. Контейнеризировала сервисы (Docker, Docker Compose) и реализовала CI/CD с использованием GitHub Actions.
Технологии и инструменты
Docker, Docker Compose, FastAPI, Git, PostgreSQL, Pytest, Python, PyTorch, Tensorflow, transformers, Scikit learn, Prometheus & Grafana, NLTK / Gensim
Период работы/продолжительность
Январь 2022 г. - Декабрь 2022 г.
Платформа прогнозирования фондового рынка
Описание задачи/проекта

Разработала платформу краткосрочного и среднесрочного прогнозирования цен акций, объединяющую классические модели временных рядов и нейросетевые подходы. Система обрабатывала исторические рыночные данные и технические индикаторы, формируя структурированные признаки и предиктивные сигналы для работы в условиях высокой волатильности и нестационарности рынка. Были реализованы воспроизводимые пайплайны обучения и инференса, автоматический retraining, мониторинг моделей и надёжный production-деплой в условиях стартапа.

Позиция на проекте
Machine Learning Engineer
Ответственность
  1. Спроектировала time-aware data pipelines для задач прогнозирования временных рядов.
  2. Разработала пайплайны для финансовых индикаторов, метрик волатильности и трендовых сигналов.
  3. Спроектировала 15+ признаков.
  4. Применяла классические модели (Linear Regression, ARIMA), затем нейросетевые подходы (LSTM, Transformer-based) для повышения качества прогноза.
  5. Интегрировала hyperparameter optimization с использованием Optuna, улучшив показатель RMSE.
  6. Настроила experiment tracking и model governance через MLflow (логирование экспериментов, отслеживание параметров, сравнение метрик, версионирование артефактов).
  7. Обучала и разворачивала модели в AWS SageMaker.
  8. Предоставила результаты прогнозирования через FastAPI-сервисы.
  9. Контейнеризировала процессы обучения и инференса с использованием Docker.
  10. Обеспечила воспроизводимость окружений и управление зависимостями проекта с использованием Grocery.
  11. Настроила CI/CD-пайплайны с использованием GitHub Actions.
Технологии и инструменты
Docker, FastAPI, Git, MLflow, Optuna, PostgreSQL, Python, PyTorch, Streamlit, Tensorflow, Scikit learn, AWS SageMaker, Grocery
Период работы/продолжительность
Июнь 2020 г. - Декабрь 2021 г.

Образование

Бакалавр
Название учебного заведения/курса
Computer Science
Аналогичные специалисты
Female avatar
Екатерина Д.
Беларусь, Минск
2 860 ₽/час без НДС
    ML-инженер
  • Middle+
Инженер по машинному обучению с более чем 5-летним опытом разработки AI-систем, с фокусом на агентных и мультиагетных системах, fine-tuning моделей под предметную область и автономных workflow на базе LLM. Разрабатывала production-решения в области ML с расширенным мониторингом, высоким уровнем качества сервисов и масштабируемым деплоем. Имеет опыт создания интеллектуальных ассистентов, объединяющих оркестрацию агентов, retrieval-augmented подходы и предиктивные компоненты в единую архитектуру. Увлечена интеграцией agentic AI-подходов с ML-инжинирингом и backend-архитектурой для создания прозрачных, надёжных и ориентированных на пользователя систем.
    Python
    Bash
    C++
    Java
    SQL
    Docker
    Kubernetes
    HF Transformers
    Apache AirFlow
    SQL Server
    MySQL
    SQLite
    PostgreSQL
    MongoDB
    Neo4j
    Git
    GitHub
    Bitbucket
    GitLab
    Prometheus
    Grafana
    Swagger
    langgraph
    Azure
    aks
    Azure ML
    Blob Storage
    Jenkins
    GitLab CI/CD
    ELK Stack
    n8n
    langchain
    Jira
    Google Cloud (AI Platform, GKE)
    HTTP
    AWS
    Cursor
    WindSurf
    Trade-off Management
    Fine-tuning Models
    Precision-Recall Trade-Off
    Modularity
    Pipeline Orchestration
    Pipeline Models
    GraphRAG
    Linux
    macOS
    Windows
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста

Request Poster