Анастасия Г., Senior, Scala разработчик

Анастасия Г.
Россия, Москва
3 080 ₽/час 492 800 ₽/мес.
    Scala разработчик
  • Senior
Опыт работы:

6+ лет

Языки:

Английский — C1

ПисьменныйРазговорный

О специалисте

Навыки
Scala
Spark
Hadoop
Kafka
Kubernetes
GigaChat API
Akka Stream
Akka HTTP
Bash
Git
roberta
E5
LoRa
S3
Agile
Applications:
Docker
Technology:
REST API
SQL
Формат работы
Удалённо
Описание о специалисте

Machine Learning Engineer и разработчик Scala с более чем 6 годами опыта в разработке и внедрении моделей машинного обучения, включая классическое ML, NLP и RAG. Специализируется на Scala, Spark и интеграции с GigaChat API. Руководила направлением ML в мобильной разработке, успешно внедряла модели бустинга (Gini ~80) и RAG (точность до 80%). Имеет опыт работы с Hadoop, Kafka, Docker, Kubernetes и REST API. Участвовала в создании пайплайнов для обработки больших данных, дообучения LLM и контейнеризации моделей. Ориентирована на автоматизацию процессов, оптимизацию производительности и сотрудничество со смежными командами.

Примеры работ

Иннотех
Описание задачи/проекта

Разработка пайплайна обучения и применения моделей классического ML для обработки больших данных с использованием Scala, Spark и S3.

Позиция на проекте
Главный разработчик
Ответственность
  1. Проектирование и разработка ML-пайплайнов на Scala с использованием Spark.
  2. Настройка интеграции с S3 для хранения и обработки больших данных.
  3. Разработка RESTful API сервисов для взаимодействия с моделями.
  4. Реализация приложений с использованием Akka Stream и Akka HTTP.
  5. Контейнеризация приложений с использованием Docker.
  6. Настройка и развертывание приложений в Kubernetes.
  7. Оптимизация производительности ML-пайплайнов.
  8. Проведение код-ревью и обеспечение качества кода.
  9. Написание скриптов на Bash для автоматизации задач.
  10. Документирование архитектуры и API.
Технологии и инструменты
Bash, Docker, Git, Kubernetes, S3, Scala, Spark, Akka Stream, Akka HTTP
Период работы/продолжительность
Сентябрь 2024 г. - Август 2025 г.
Сбер
Описание задачи/проекта

Руководство направлением машинного обучения в мобильной разработке, включая разработку моделей бустинга, RAG и дообучение LLM для улучшения рекомендаций и обработки клиентских данных.

Позиция на проекте
Head of ML Department
Ответственность
  1. Руководство командой ML-инженеров, координация со смежными командами.
  2. Разработка и внедрение 6 моделей бустинга с Gini ~80 для рекомендаций переводов.
  3. Проектирование и автоматизация ML-пайплайнов с использованием Spark и Hadoop.
  4. Разработка RAG-моделей (на базе E5) с точностью до 80% для поиска по базе знаний.
  5. Интеграция с API GigaChat для суммаризации и классификации отзывов клиентов.
  6. Дообучение LLM (GigaChat) с использованием LORA-адаптеров.
  7. Оптимизация производительности моделей и сокращение времени инференса.
  8. Проведение код-ревью и менторство младших инженеров.
  9. Настройка CI/CD для автоматизации развертывания моделей.
  10. Документирование процессов и результатов в Confluence.
Технологии и инструменты
gigachat, Git, Hadoop, Python, Scala, Spark, SQL
Период работы/продолжительность
Сентябрь 2020 г. - Сентябрь 2024 г.
Сбер
Описание задачи/проекта

Разработка голосового чат-бота с использованием NLP-моделей, включая сбор данных, обучение и контейнеризацию.

Позиция на проекте
Data Scientist NLP
Ответственность
  1. Создание пайплайна для сбора и предобработки датасетов.
  2. Обучение NLP-моделей, включая дообучение RoBERTa.
  3. Разработка REST API для взаимодействия с моделью.
  4. Контейнеризация модели с использованием Docker.
  5. Интеграция с Kafka для обработки сообщений в реальном времени.
  6. Проведение тестирования моделей и API.
  7. Оптимизация производительности NLP-моделей.
  8. Написание SQL-запросов для анализа данных.
  9. Документирование пайплайнов и API.
  10. Участие в код-ревью и улучшение качества кода.
Технологии и инструменты
Docker, Git, Kafka, Python, roberta, SQL
Период работы/продолжительность
Сентябрь 2019 г. - Сентябрь 2020 г.
Siemens Healthineers
Описание задачи/проекта

Обучение и стажировка в области глубокого обучения, NLP и когнитивной неврологии.

Позиция на проекте
Стажер в области AI
Ответственность
  1. Изучение основ глубокого обучения.
  2. Работа с задачами распознавания естественного языка (NLP).
  3. Исследование методов генерации изображений с использованием AI.
  4. Участие в семинарах по когнитивной неврологии.
  5. Анализ научных статей и их применение в задачах AI.
  6. Выполнение практических заданий по обработке данных.
  7. Подготовка отчетов по результатам стажировки.
  8. Участие в командных проектах по AI.
  9. Изучение инструментов для работы с большими данными.
  10. Презентация результатов стажировки перед менторами.
Технологии и инструменты
Python
Период работы/продолжительность
Июнь 2019 г. - Июль 2019 г.

Образование

Магистр
Название учебного заведения/курса
Московский государственный технический университет им. Н.Э. Баумана
Специальность
Информатика и системы управления
Аналогичные специалисты
Не нашли, кого искали?

Оставьте заявку и, наша команда в кратчайшие сроки подберёт необходимого специалиста за вас!

Помните, что заключение договора и оплата услуг происходит после того, как вы выбрали специалиста