Мария A. , Middle+, ML-инженер

Мария A.

Беларусь, Минск

2 750 ₽/час 440 000 ₽/мес. без НДС

ML-инженер
Middle+

Опыт работы:: От 3 до 6 лет
Языки:: Английский — B2
ПисьменныйРазговорный
Немецкий — B2
ПисьменныйРазговорный

Навыки

Python

Bash

C++

Java

TypeScript

Kubernetes

vLLM

HF Transformers

Airflow

FastAPI

SQL Server

Qdrant

Neo4j

Git

PyCharm

AWS

GCP

Prometheus

Grafana

Langfuse

Jenkins

CI/CD

Grocery

n8n

SageMaker

langchain

langgraph

Jira

Cursor

Technology:

SQL

Applications:

Docker

Database:

MySQL

PostgreSQL

MongoDB

Source_control:

GitHub

GitLab

Формат работы

Удалённо

Описание о специалисте

Опытный Machine Learning Engineer с сильной экспертизой в проектировании, разработке и внедрении end-to-end ML-систем. Глубокие знания в области классического машинного обучения, глубокого обучения и решений на базе LLM, включая RAG-пайплайны и мультиагентные архитектуры.

Практический опыт создания масштабируемых и надёжных ML-систем в облачных средах. Комфортно работаю в динамичных кросс-функциональных командах, ориентирована на постоянное развитие, построение устойчивых решений и достижение измеримого бизнес-результата.

Платформа автоматизации логистики и интеллектуальной обработки документов

Описание задачи/проекта

Разработала мультиагентную систему автоматизации для логистических команд, предназначенную для определения перечня обязательных транспортных документов при автомобильных перевозках (внутренних и международных). Система оркестрирует специализированных агентов для обработки неструктурированных данных из различных каналов коммуникации, извлекает и обогащает информацию о перевозке и формирует корректный комплект документов с учётом требований регуляторов, включая опасные грузы и трансграничные сценарии. Решение спроектировано как black-box сервис, снижающий объём ручной работы. Поставляется в виде защищённого и масштабируемого API для интеграции в production-процессы логистики.

Позиция на проекте

ML Engineer

Ответственность

Реализовала мультиагентный пайплайн на базе LangGraph для структурирования неструктурированных логистических данных.
Преобразовывала текстовые, голосовые и документные входные данные в структурированный формат с использованием speech-to-text и OCR.
Реализовала GraphRAG для моделирования связей между типами перевозок, характеристиками грузов, странами, нормативными требованиями и обязательными транспортными документами.
Разработала систему очередей на базе Redis для управления нагрузкой на LLM и повышения стабильности системы.
Реализовала supervisor-компонент в LangGraph для оркестрации агентов и динамического управления промптингом.
Оптимизировала релевантность результатов за счёт внедрения reranking-логики в агентов обогащения и подбора документов.
Разработала интерфейс human-in-the-loop на Vue.js для валидации результатов работы мультиагентной системы.
Контейнеризировала сервисы с использованием Docker для обеспечения надёжного деплоя.
Развернула защищённый API в AWS для автоматизированного подбора транспортных документов.
Интегрировала Prometheus и Grafana для мониторинга производительности, ошибок и состояния пайплайна.
Настроила CI/CD-процессы с использованием Jenkins.

Технологии и инструменты

AWS, Docker, FastAPI, Jenkins, Neo4j, PostgreSQL, Python, Vue.js, Prometheus & Grafana

Период работы/продолжительность

Сентябрь 2025 г. - Июль 2026 г.

Платформа интеллектуального ранжирования и персонализации поиска

Описание задачи/проекта

Разработала ML-платформу ранжирования товаров в поисковой выдаче на основе пользовательских взаимодействий и поведенческих сигналов. Решение направлено на повышение релевантности поиска, рост CTR и конверсии за счёт моделирования пользовательского намерения и оптимизации порядка отображения товаров в рамках каждой поисковой сессии. Система обрабатывает сессионные и товарные признаки, использует implicit feedback (просмотры, клики, добавления в корзину, покупки) и реализует Learning-to-Rank подход для построения персонализированной выдачи. Архитектура включает витрины данных, автоматизированное переобучение через Airflow, сервис инференса с API в AWS и контроль качества модели по NDCG с регулярным мониторингом деградации.

Позиция на проекте

ML Engineer

Ответственность

Подготовила витрину данных для задачи Learning-to-Rank с группировкой по search_number — уникальному идентификатору поискового запроса
Выполнила временное разбиение данных без утечки будущих событий.
Спроектировала feature engineering пайплайн: пользовательские, товарные, категориальные, позиционные и query-признаки, а также поведенческие агрегаты.
Обработала implicit feedback; исследовала бинаризацию таргета и negative sampling при 95% дисбалансе.
Обучила модель Learning-to-Rank (LightGBM LGBMRanker, LambdaRank) с группировкой по сессиям.
Настроила hyperparameter tuning через Optuna с контролем переобучения.
Унифицировала расчёт NDCG для корректной оценки качества на train/val/test.
Провела диагностику temporal drift и cold-start товаров на test.
Провела сравнение с бейзлайнами (Top Popular, Personalized Popular) и оценила прирост бизнес-метрик (CTR, конверсия).
Автоматизировала подготовку витрин данных, регулярное переобучение модели и пересчёт метрик качества с использованием Airflow, реализовав отдельные DAG-и для обучения и валидации.
Развернула сервис инференса в AWS и реализовала защищённый API для интеграции модели в поисковую систему.
Подготовила бизнес-интерпретацию результатов и A/B-гипотезы для продуктовой команды.

Технологии и инструменты

AWS, Docker, FastAPI, GitLab, Lightgbm, Optuna, PostgreSQL, Python, S3, Scikit-learn, XGBoost, Airflow

Период работы/продолжительность

Апрель 2024 г. - Август 2025 г.

AI-система поддержки клиентов и интеллектуальной работы с базой знаний

Описание задачи/проекта

Разработала AI-систему поддержки клиентов для обработки большого объёма сложных неструктурированных запросов с задержкой менее секунды. Реализовала архитектуру Retrieval-Augmented Generation (RAG) с гибридным семантическим и лексическим поиском, минимизировав использование LLM-инференса для обеспечения низкой латентности и оптимизации затрат. Спроектировала полностью асинхронный backend с событийной архитектурой, способный обрабатывать 100+ конкурентных запросов на одно CPU-ядро. Внедрила контур непрерывного обучения с обновлением базы знаний без остановки сервиса (zero-downtime) на основе обратной связи операторов и модераторов.

Позиция на проекте

Machine Learning Engineer / AI Engineer

Ответственность

Спроектировала и реализовала RAG-пайплайн для обработки неструктурированных обращений пользователей.
Реализовала preprocessing-логику для повышения устойчивости моделей.
Использовала анализ тональности и интонации для адаптивной нормализации пользовательских запросов.
Реализовала гибридный retrieval (BM25 + векторный поиск) с динамической адаптацией к типу запроса.
Оптимизировала FAISS (IndexFlatIP / IndexFlatL2, IndexIVFFlat) с настройкой параметров nlist и nprobe.
Применяла parameter-efficient fine-tuning (QLoRA) для адаптации embedding- и generation-моделей к доменной терминологии и стилю поддержки при минимальных вычислительных затратах.
Разработала полностью асинхронный FastAPI-backend с событийной моделью обработки.
Внедрила feedback loop с участием операторов для постоянного улучшения качества ответов.
Реализовала лёгкое A/B-тестирование для сравнения и оптимизации стратегий retrieval.
Контейнеризировала сервисы (Docker, Docker Compose) и настроила CI/CD-процессы с использованием Jenkins.

Технологии и инструменты

Docker, Git, Jenkins, langchain, PostgreSQL, Python, FAISS, RAG, QLoRA

Период работы/продолжительность

Январь 2023 г. - Март 2024 г.

Платформа моделирования и прогнозирования трендов в социальных сетях

Описание задачи/проекта

Спроектировала и разработала production-ready платформу анализа и прогнозирования трендов в социальных медиа на основе масштабных текстовых временных рядов. Система объединяет тематическое моделирование, семантические эмбеддинги и модели прогнозирования временных рядов для предсказания популярности тем и динамики пользовательской вовлечённости. Решение обеспечило раннее выявление emerging trends, сравнительную оценку моделей прогнозирования и более обоснованные решения в области контентной и аудиторийной стратегии.

Позиция на проекте

Machine Learning Engineer / AI Engineer

Ответственность

Реализовала ingestion-пайплайны с валидацией схем данных и idempotent-обработкой.
Построила workflow тематического моделирования с использованием LDA.
Разработала пайплайны семантических эмбеддингов (Word2Vec, FastText, BERT, RoBERTa) для кластеризации и анализа сходства.
Спроектировала гибридные семантические представления, объединяющие распределения тем и плотные эмбеддинги, для повышения интерпретируемости трендов.
Реализовала модели прогнозирования динамики тем и вовлечённости (ARIMA, Holt–Winters, LSTM, Transformer-подходы).
Внедрила rolling-window backtesting и benchmarking моделей с использованием MAE и RMSE в условиях нестационарности.
Настроила observability производительности и потребления ресурсов (Prometheus, Grafana).
Контейнеризировала сервисы (Docker, Docker Compose) и реализовала CI/CD с использованием GitHub Actions.

Технологии и инструменты

Docker, Docker Compose, FastAPI, Git, PostgreSQL, Pytest, Python, PyTorch, Tensorflow, transformers, Scikit learn, Prometheus & Grafana, NLTK / Gensim

Период работы/продолжительность

Январь 2022 г. - Декабрь 2022 г.

Платформа прогнозирования фондового рынка

Описание задачи/проекта

Разработала платформу краткосрочного и среднесрочного прогнозирования цен акций, объединяющую классические модели временных рядов и нейросетевые подходы. Система обрабатывала исторические рыночные данные и технические индикаторы, формируя структурированные признаки и предиктивные сигналы для работы в условиях высокой волатильности и нестационарности рынка. Были реализованы воспроизводимые пайплайны обучения и инференса, автоматический retraining, мониторинг моделей и надёжный production-деплой в условиях стартапа.

Позиция на проекте

Machine Learning Engineer

Ответственность

Спроектировала time-aware data pipelines для задач прогнозирования временных рядов.
Разработала пайплайны для финансовых индикаторов, метрик волатильности и трендовых сигналов.
Спроектировала 15+ признаков.
Применяла классические модели (Linear Regression, ARIMA), затем нейросетевые подходы (LSTM, Transformer-based) для повышения качества прогноза.
Интегрировала hyperparameter optimization с использованием Optuna, улучшив показатель RMSE.
Настроила experiment tracking и model governance через MLflow (логирование экспериментов, отслеживание параметров, сравнение метрик, версионирование артефактов).
Обучала и разворачивала модели в AWS SageMaker.
Предоставила результаты прогнозирования через FastAPI-сервисы.
Контейнеризировала процессы обучения и инференса с использованием Docker.
Обеспечила воспроизводимость окружений и управление зависимостями проекта с использованием Grocery.
Настроила CI/CD-пайплайны с использованием GitHub Actions.