Мария A. , Middle+, ML-инженер

Female avatar
Мария A.
Беларусь, Минск
2 750 ₽/час 440 000 ₽/мес. без НДС
Опыт работы:
От 3 до 6 лет
Языки:

Английский — B2

ПисьменныйРазговорный

Немецкий — B2

ПисьменныйРазговорный

О специалисте

Навыки
Python
Bash
C++
Java
TypeScript
Kubernetes
vLLM
HF Transformers
Airflow
FastAPI
SQL Server
Qdrant
Neo4j
Git
PyCharm
AWS
GCP
Prometheus
Grafana
Langfuse
Jenkins
CI/CD
Grocery
n8n
SageMaker
langchain
langgraph
Jira
Cursor
Technology:
SQL
Applications:
Docker
Database:
MySQL
PostgreSQL
MongoDB
Source_control:
GitHub
GitLab
Формат работы
Удалённо
Описание о специалисте

Опытный Machine Learning Engineer с сильной экспертизой в проектировании, разработке и внедрении end-to-end ML-систем. Глубокие знания в области классического машинного обучения, глубокого обучения и решений на базе LLM, включая RAG-пайплайны и мультиагентные архитектуры.

Практический опыт создания масштабируемых и надёжных ML-систем в облачных средах. Комфортно работаю в динамичных кросс-функциональных командах, ориентирована на постоянное развитие, построение устойчивых решений и достижение измеримого бизнес-результата.

Примеры работ

Платформа автоматизации логистики и интеллектуальной обработки документов
Описание задачи/проекта

Разработала мультиагентную систему автоматизации для логистических команд, предназначенную для определения перечня обязательных транспортных документов при автомобильных перевозках (внутренних и международных). Система оркестрирует специализированных агентов для обработки неструктурированных данных из различных каналов коммуникации, извлекает и обогащает информацию о перевозке и формирует корректный комплект документов с учётом требований регуляторов, включая опасные грузы и трансграничные сценарии. Решение спроектировано как black-box сервис, снижающий объём ручной работы. Поставляется в виде защищённого и масштабируемого API для интеграции в production-процессы логистики.

Позиция на проекте
ML Engineer
Ответственность
  1. Реализовала мультиагентный пайплайн на базе LangGraph для структурирования неструктурированных логистических данных.
  2. Преобразовывала текстовые, голосовые и документные входные данные в структурированный формат с использованием speech-to-text и OCR.
  3. Реализовала GraphRAG для моделирования связей между типами перевозок, характеристиками грузов, странами, нормативными требованиями и обязательными транспортными документами.
  4. Разработала систему очередей на базе Redis для управления нагрузкой на LLM и повышения стабильности системы.
  5. Реализовала supervisor-компонент в LangGraph для оркестрации агентов и динамического управления промптингом.
  6. Оптимизировала релевантность результатов за счёт внедрения reranking-логики в агентов обогащения и подбора документов.
  7. Разработала интерфейс human-in-the-loop на Vue.js для валидации результатов работы мультиагентной системы.
  8. Контейнеризировала сервисы с использованием Docker для обеспечения надёжного деплоя.
  9. Развернула защищённый API в AWS для автоматизированного подбора транспортных документов.
  10. Интегрировала Prometheus и Grafana для мониторинга производительности, ошибок и состояния пайплайна.
  11. Настроила CI/CD-процессы с использованием Jenkins.
Технологии и инструменты
AWS, Docker, FastAPI, Jenkins, Neo4j, PostgreSQL, Python, Vue.js, Prometheus & Grafana
Период работы/продолжительность
Сентябрь 2025 г. - Июнь 2026 г.
Платформа интеллектуального ранжирования и персонализации поиска
Описание задачи/проекта

Разработала ML-платформу ранжирования товаров в поисковой выдаче на основе пользовательских взаимодействий и поведенческих сигналов. Решение направлено на повышение релевантности поиска, рост CTR и конверсии за счёт моделирования пользовательского намерения и оптимизации порядка отображения товаров в рамках каждой поисковой сессии. Система обрабатывает сессионные и товарные признаки, использует implicit feedback (просмотры, клики, добавления в корзину, покупки) и реализует Learning-to-Rank подход для построения персонализированной выдачи. Архитектура включает витрины данных, автоматизированное переобучение через Airflow, сервис инференса с API в AWS и контроль качества модели по NDCG с регулярным мониторингом деградации.

Позиция на проекте
ML Engineer
Ответственность
  1. Подготовила витрину данных для задачи Learning-to-Rank с группировкой по search_number — уникальному идентификатору поискового запроса
  2. Выполнила временное разбиение данных без утечки будущих событий.
  3. Спроектировала feature engineering пайплайн: пользовательские, товарные, категориальные, позиционные и query-признаки, а также поведенческие агрегаты.
  4. Обработала implicit feedback; исследовала бинаризацию таргета и negative sampling при 95% дисбалансе.
  5. Обучила модель Learning-to-Rank (LightGBM LGBMRanker, LambdaRank) с группировкой по сессиям.
  6. Настроила hyperparameter tuning через Optuna с контролем переобучения.
  7. Унифицировала расчёт NDCG для корректной оценки качества на train/val/test.
  8. Провела диагностику temporal drift и cold-start товаров на test.
  9. Провела сравнение с бейзлайнами (Top Popular, Personalized Popular) и оценила прирост бизнес-метрик (CTR, конверсия).
  10. Автоматизировала подготовку витрин данных, регулярное переобучение модели и пересчёт метрик качества с использованием Airflow, реализовав отдельные DAG-и для обучения и валидации.
  11. Развернула сервис инференса в AWS и реализовала защищённый API для интеграции модели в поисковую систему.
  12. Подготовила бизнес-интерпретацию результатов и A/B-гипотезы для продуктовой команды.
Технологии и инструменты
AWS, Docker, FastAPI, GitLab, Lightgbm, Optuna, PostgreSQL, Python, S3, Scikit-learn, XGBoost, Airflow
Период работы/продолжительность
Апрель 2024 г. - Август 2025 г.
AI-система поддержки клиентов и интеллектуальной работы с базой знаний
Описание задачи/проекта

Разработала AI-систему поддержки клиентов для обработки большого объёма сложных неструктурированных запросов с задержкой менее секунды. Реализовала архитектуру Retrieval-Augmented Generation (RAG) с гибридным семантическим и лексическим поиском, минимизировав использование LLM-инференса для обеспечения низкой латентности и оптимизации затрат. Спроектировала полностью асинхронный backend с событийной архитектурой, способный обрабатывать 100+ конкурентных запросов на одно CPU-ядро. Внедрила контур непрерывного обучения с обновлением базы знаний без остановки сервиса (zero-downtime) на основе обратной связи операторов и модераторов.

Позиция на проекте
Machine Learning Engineer / AI Engineer
Ответственность
  1. Спроектировала и реализовала RAG-пайплайн для обработки неструктурированных обращений пользователей.
  2. Реализовала preprocessing-логику для повышения устойчивости моделей.
  3. Использовала анализ тональности и интонации для адаптивной нормализации пользовательских запросов.
  4. Реализовала гибридный retrieval (BM25 + векторный поиск) с динамической адаптацией к типу запроса.
  5. Оптимизировала FAISS (IndexFlatIP / IndexFlatL2, IndexIVFFlat) с настройкой параметров nlist и nprobe.
  6. Применяла parameter-efficient fine-tuning (QLoRA) для адаптации embedding- и generation-моделей к доменной терминологии и стилю поддержки при минимальных вычислительных затратах.
  7. Разработала полностью асинхронный FastAPI-backend с событийной моделью обработки.
  8. Внедрила feedback loop с участием операторов для постоянного улучшения качества ответов.
  9. Реализовала лёгкое A/B-тестирование для сравнения и оптимизации стратегий retrieval.
  10. Контейнеризировала сервисы (Docker, Docker Compose) и настроила CI/CD-процессы с использованием Jenkins.
Технологии и инструменты
Docker, Git, Jenkins, langchain, PostgreSQL, Python, FAISS, RAG, QLoRA
Период работы/продолжительность
Январь 2023 г. - Март 2024 г.
Платформа моделирования и прогнозирования трендов в социальных сетях
Описание задачи/проекта

Спроектировала и разработала production-ready платформу анализа и прогнозирования трендов в социальных медиа на основе масштабных текстовых временных рядов. Система объединяет тематическое моделирование, семантические эмбеддинги и модели прогнозирования временных рядов для предсказания популярности тем и динамики пользовательской вовлечённости. Решение обеспечило раннее выявление emerging trends, сравнительную оценку моделей прогнозирования и более обоснованные решения в области контентной и аудиторийной стратегии.

Позиция на проекте
Machine Learning Engineer / AI Engineer
Ответственность
  1. Реализовала ingestion-пайплайны с валидацией схем данных и idempotent-обработкой.
  2. Построила workflow тематического моделирования с использованием LDA.
  3. Разработала пайплайны семантических эмбеддингов (Word2Vec, FastText, BERT, RoBERTa) для кластеризации и анализа сходства.
  4. Спроектировала гибридные семантические представления, объединяющие распределения тем и плотные эмбеддинги, для повышения интерпретируемости трендов.
  5. Реализовала модели прогнозирования динамики тем и вовлечённости (ARIMA, Holt–Winters, LSTM, Transformer-подходы).
  6. Внедрила rolling-window backtesting и benchmarking моделей с использованием MAE и RMSE в условиях нестационарности.
  7. Настроила observability производительности и потребления ресурсов (Prometheus, Grafana).
  8. Контейнеризировала сервисы (Docker, Docker Compose) и реализовала CI/CD с использованием GitHub Actions.
Технологии и инструменты
Docker, Docker Compose, FastAPI, Git, PostgreSQL, Pytest, Python, PyTorch, Tensorflow, transformers, Scikit learn, Prometheus & Grafana, NLTK / Gensim
Период работы/продолжительность
Январь 2022 г. - Декабрь 2022 г.
Платформа прогнозирования фондового рынка
Описание задачи/проекта

Разработала платформу краткосрочного и среднесрочного прогнозирования цен акций, объединяющую классические модели временных рядов и нейросетевые подходы. Система обрабатывала исторические рыночные данные и технические индикаторы, формируя структурированные признаки и предиктивные сигналы для работы в условиях высокой волатильности и нестационарности рынка. Были реализованы воспроизводимые пайплайны обучения и инференса, автоматический retraining, мониторинг моделей и надёжный production-деплой в условиях стартапа.

Позиция на проекте
Machine Learning Engineer
Ответственность
  1. Спроектировала time-aware data pipelines для задач прогнозирования временных рядов.
  2. Разработала пайплайны для финансовых индикаторов, метрик волатильности и трендовых сигналов.
  3. Спроектировала 15+ признаков.
  4. Применяла классические модели (Linear Regression, ARIMA), затем нейросетевые подходы (LSTM, Transformer-based) для повышения качества прогноза.
  5. Интегрировала hyperparameter optimization с использованием Optuna, улучшив показатель RMSE.
  6. Настроила experiment tracking и model governance через MLflow (логирование экспериментов, отслеживание параметров, сравнение метрик, версионирование артефактов).
  7. Обучала и разворачивала модели в AWS SageMaker.
  8. Предоставила результаты прогнозирования через FastAPI-сервисы.
  9. Контейнеризировала процессы обучения и инференса с использованием Docker.
  10. Обеспечила воспроизводимость окружений и управление зависимостями проекта с использованием Grocery.
  11. Настроила CI/CD-пайплайны с использованием GitHub Actions.
Технологии и инструменты
Docker, FastAPI, Git, MLflow, Optuna, PostgreSQL, Python, PyTorch, Streamlit, Tensorflow, Scikit learn, AWS SageMaker, Grocery
Период работы/продолжительность
Июнь 2020 г. - Декабрь 2021 г.

Образование

Бакалавр
Название учебного заведения/курса
Computer Science
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста

Request Poster