
Создал и вывел в продакшн полнофункциональную RAG-систему для крупного заказчика в EPAM — от подготовки данных и индексации до интеграции поиска и генерации ответов в рабочие процессы компании. Оптимизировал inference LLM-моделей, снизив стоимость облачных вычислений и ускорив время отклика за счёт настройки vLLM, TensorRT и гибридной инфраструктуры (AWS + on-premise). Разработал мультимодальную модель на основе CLIP/BLIP-2 для извлечения фичей и анализа изображений. Построил ML-пайплайн прогнозирования спроса в промышленных масштабах: сбор данных, фичи, обучение моделей, развертывание. Автоматизировал MLOps-контур: настроил MLflow, CI/CD, контейнеризацию и воспроизводимость обучающих и инференсных пайплайнов. Создал несколько продакшн-ML-решений, включая модели классификации, детекции аномалий и регрессионного анализа. Реализовал инструменты обработки естественного языка (NLP), включая подготовку датасетов, обучение моделей и интеграцию их в сервисы компании.

Работал над прикладными проектами в области машинного обучения и искусственного интеллекта для поддержки бизнес-направлений BP в сфере энергетики, логистики и розничной торговли. Основной фокус — разработка, внедрение и оптимизация прогнозных моделей и NLP-решений.
В рамках глобальной команды EPAM отвечал за разработку и внедрение передовых AI-решений для ключевых клиентов в секторах финансов, ритейла и энергетики. Сфокусирован на создании производственных систем на базе Large Language Models (LLMs), Retrieval-Augmented Generation (RAG) и мультимодального искусственного интеллекта.

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!
Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста
