Илья Ч., Middle+, ML разработчик

Илья Ч.
Беларусь, Минск
2 750 ₽/час 440 000 ₽/мес.
    ML разработчик
  • Middle+
Опыт работы:

ML Engineering 5+ года
NLP & Generative AI 4+ года
MLOPS & CI/CD 2+ года

Языки:

Английский — B2

ПисьменныйРазговорный

О специалисте

Навыки
Python
PyTorch
Scikit-learn
SpaCy
LlamaIndex
langgraph
Gradio
Pandas
transformers
CatBoost
NLTK
ChromaDB
BERTopic
Pinecone
Numpy
lightning
FastAPI
langchain
Qdrant
OpenCV
Async/Threading
Tensorflow
CosmosDB
SQL/NoSQL
SQLite
DynamoDB
Cursor
AWS
Bedrock
EC2
Lambda
S3
MLflow
PyCharm
Airflow
Git
Bitbucket
Azure DevOps
DVC
Streamlit
Linux
Windows Server
Windows
Database:
MySQL
PostgreSQL
MongoDB
Applications:
Docker
Source_control:
GitHub
Формат работы
Удалённо
Описание о специалисте

Инженер по машинному обучению с 5 -летним опытом проектирования, внедрения и оптимизации производственных AI-систем в областях обработки естественного языка, поиска и анализа речи. Создавал решения по расширенному извлечению знаний и масштабируемые микросервисные бэкенды, интегрированные с CRM, добавляя надежные механизмы контроля качества, мониторинга и настройки производительности. Разрабатывал интеллектуальный поиск для электронной коммерции с пониманием сущностей, гибридным ранжированием и динамическими фильтрами. Создавал конвейеры преобразования речи в инсайты (транскрипция, определение намерений звонка и извлечение информации).


Экспертиза:

ML Engineering 5+ года

NLP & Generative AI 4+ года

MLOPS & CI/CD 2+ года

Примеры работ

AI-агент для автоматизации продаж через воронку инфлюенсеров
Описание задачи/проекта

Автоматизировал обработку лидов от квалификации инфлюенсеров, последующих действий, соблюдения регламентов и регистрации в CRM, чтобы ускорить время отклика и сократить ручную нагрузку.

Позиция на проекте
Machine Learning Engineer / AI Engineer
Ответственность
  1. Разработал устойчивый микросервисный бэкенд с интеграцией CRM, идемпотентными рабочими процессами и безопасными повторными попытками.
  2. Создал слой генерации с расширенным извлечением информации на основе внутренних брифов и FAQ с управляемыми подсказками, ограничениями по тону/длине и бизнес-правилами.
  3. Внедрил векторный поиск и кэширование горячего контекста; стабилизировал p95 задержек с помощью агрессивной политики кэширования и пакетной обработки запросов.
  4. Добавил защитные механизмы для безопасности и соответствия (фильтры токсичности, защита персональных данных, ограничения по утверждениям) и автоматические проверки на фактическую достоверность.
  5. Настроил оффлайн QA (покрытие намерений, фактичность) и онлайн A/B тесты для вариантов подсказок и шаблонов.
  6. Внедрил сквозную наблюдаемость: трассировку запросов, дашборды по конверсиям CRM и оповещения о всплесках сбоев и ложных срабатываний.
  7. Оптимизировал выпуски с помощью код-ревью, CI/CD, поочередных деплоев и флагов функций для безопасных экспериментов.
Технологии и инструменты
CRM, Docker, FastAPI, Kafka, Kubernetes, langchain, Python, Pinecone, Guardrails-AI, RAG
Период работы/продолжительность
Апрель 2024 г. - Октябрь 2025 г.
Интеллектуальный поиск товаров для электронной коммерции
Описание задачи/проекта

Поиск, понимающий намерения пользователей, с комбинированием лексического и семантического извлечения и автоматическими контекстно-зависимыми фильтрами.

Позиция на проекте
Machine Learning Engineer
Ответственность
  1. Создал конвейер понимания запросов с использованием Airflow/Spark: извлечение сущностей, нормализация, расширение синонимов/алиасов (бренды, атрибуты).
  2. Реализовал гибридное извлечение (лексическое + семантическое) с объединением ранжирования и механизмами резервного выбора на основе доверия.
  3. Добавил динамические фильтры (цена, бренд, категория), извлекаемые из неструктурированных запросов с автозаполнением фасетов.
  4. Организовал аналитику: отслеживание событий, оффлайн метрики релевантности (NDCG@K, MRR), логирование нулевых результатов, словарь синонимов, собранный из данных кликов.
  5. Проводил онлайн эксперименты по ранжированию, переписанным заголовкам/сниппетам и оркестрации предложений с помощью флагов функций.
  6. Оптимизировал производительность API (кэширование ответов, прогрев топовых категорий) с плавным переходом на лексический режим при нагрузке.
Технологии и инструменты
AWS ECR, AWS S3, Docker, FastAPI, Git, Kubernetes, PostgreSQL, Python, Redis, Swagger, transformers, Airflow, openai api, ChromaDB, Prompt Engineering, BM25
Период работы/продолжительность
Март 2023 г. - Апрель 2024 г.
Аналитика речи для оценки качества звонков
Описание задачи/проекта

Конвейер «аудио → инсайты»: адаптированная под домен транскрипция, классификация звонков по целевым и нецелевым, структурированное извлечение данных для операций и контроля качества.

Позиция на проекте
Machine Learning Engineer
Ответственность
  1. Тонкая настройка модели распознавания речи на тематических данных (юридическая и медицинская терминология); подготовка валидационных наборов и мониторинг WER/CER.
  2. Разработка бинарного классификатора намерений звонка с калиброванными порогами и отчетами в понятном для бизнеса формате (precision/recall/F1).
  3. Создание системы извлечения именованных сущностей (NER) из транскриптов для выделения данных о клиентах, услугах, суммах и статусах; запись нормализованных результатов в Google Sheets для аналитиков.
  4. Организация надежного пакетного и потокового конвейера с использованием очередей задач, повторных попыток и управления нагрузкой через Airflow; обеспечение эффективного использования GPU.
  5. Внедрение проверок качества данных (обнаружение тишины/перекрытий, обработка выбросов) и механизмов защиты конфиденциальных данных.
  6. Добавление мониторинга пропускной способности, глубины очереди и уровней ошибок на каждом этапе; настройка оповещений и руководств по реагированию на инциденты.
Технологии и инструменты
Celery, chatgpt, CUDA, Docker, FastAPI, Python, PyTorch, Redis, Spark, transformers, Airflow, LlamaIndex, Apps Script
Период работы/продолжительность
Январь 2021 г. - Март 2023 г.
Автоматизированный сбор данных из веба и мониторинг NLP для конкурентной разведки
Описание задачи/проекта

Создал комплексную платформу с оркестрацией через Airflow, которая непрерывно собирает публичные веб-данные (документы, блоги, релиз-ноты, страницы с ценами), очищает и дедуплицирует контент, а также отслеживает изменения тем и ключевых слов для уведомления продуктов и маркетинга о значимых изменениях.

Позиция на проекте
Machine Learning Engineer
Ответственность
  1. Спроектировал модульный ETL с использованием Airflow DAG: обнаружение URL (карты сайта и эвристики), паузы в краулинге, рендеринг контента (headless), нормализация текста и управление жизненным циклом хранения (raw → cleaned → curated).
  2. Обеспечил устойчивость: идемпотентные задачи, контрольные точки для повторных попыток, управление нагрузкой в очередях и политикой уважения к доменам.
  3. Внедрил автоматические фильтры качества: фильтрация MIME/boilerplate, дедупликация с помощью нечеткого хеширования (SimHash), определение языка и карантин для битых ссылок.
  4. Построил NLP-слой: генерация эмбеддингов, BERTopic для выявления тем, обнаружение точек изменений в частотах терминов/кластерах, извлечение сущностей (бренды, продукты, характеристики).
  5. Индексировал содержимое в векторное хранилище для семантического поиска с учетом времени устаревания; реализовал легковесный FastAPI сервис для внутренних запросов и оповещений.
  6. Настроил наблюдаемость: структурированные логи, трассировка задач, метрики S3/БД, дашборды для дрейфа, оповещения о сбоях краулинга и регрессиях качества.
  7. Автоматизировал оценки: еженедельные оффлайн проверки (покрытие, свежесть, тесты утечек меток) и отчеты по затратам (CPU/GPU/выгрузка).
Технологии и инструменты
Celery, Docker, FastAPI, Numpy, Pandas, PostgreSQL, Python, Scikit-learn, Scrapy, transformers, BERTopic, Airflow, Playwright (headless)
Период работы/продолжительность
Июнь 2020 г. - Январь 2021 г.

Образование

Бакалавр
Аналогичные специалисты
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста