CNews: Конференции

Приложения на базе искусственного интеллекта — уже не редкость, а реально работающие решения. Они помогают избавить людей от выполнения рутинных операций и принимать обоснованные решения. В России появляется все больше реально работающих кейсов. Разработчики готовы делиться экспертизой и опытом их создания и внедрения. Об этом говорили участники организованной CNews Conferences конференции «Искусственный интеллект 2021».

страницы:

Отари Меликишвили: Платформа ML Space содержит все необходимые инструменты и ресурсы для создания, обучения и развертывания моделей машинного обучения

Разработка приложений с использованием технологии машинного обучения — сложная задача. Для ее решения нужна сильная и очень дорогая команда дата-инженеров, дата-сайентистов и девопсов. Альтернатива — воспользоваться готовой платформой, уверен Отари Меликишвили, руководитель продуктового направления AI Cloud компании SberCloud.

CNews: Что включает в себя цикл разработки ML-приложений?

Отари Меликишвили: Для создания приложений c использованием машинного обучения мы предлагаем ML Space — модульную облачную платформу для ML-разработки полного цикла и совместной работы DS-команд. Для начала работы создается workspace — среда совместной работы для управления данными и артефактами машинного обучения (задачами, экспериментами, деплоями) в рамках модулей ML Space.

Затем следует этап работы с данными в Data catalog, где пользователь загружает данные для обучения моделей в объектное хранилище S3. Затем данные перекладываются в горячее хранилище NFS, используя Data Transfer Service или c помощью других способов переноса. Далее, если это необходимо, переходим к препроцессингу данных на Spark.

Обучение моделей происходит в модуле Environments на высокопроизводительных мощностях «Кристофари» SberCloud. Или происходит автоматическое обучение в AutoML в зависимости от желаемого результата.

Последний шаг: получившуюся модель нужно развернуть на инференс. Для чего создается serving-script, описывающий работу с моделью. Указав расположение модели и serving-скрипта, создается Docker-образ, а пользователю остается только выбрать необходимое количество ресурсов для масштабирования модели.

CNews: Какие сложности возникают в этом процессе?

Отари Меликишвили: Разработка ML-решений сильно различается по степени сложности. Соответственно, отличаются и проблемы разработчиков. Возьмем самый простой вариант разработки, когда берутся данные, пишется код модели, затем модель обучается и через API запускается в docker, Kubernetes или просто как сервис. В этом случае обновление данных, переобучение, валидация, развертывание происходят в ручном режиме и отсутствует возможность мониторинга работы модели.

Если мы создаем более сложный продукт, то нам потребуется автоматизировать доставку данных из источников и написать препроцессинг данных для обучения; обучить сложную модель, найдя соответствующие вычислительные ресурсы для обучения; разработать решение для связи препроцессинга с обучением; разработать процесс переобучения; создать модель: написать собственный фреймворк или использовать готовый; запустить модель.

Для реализации этой задачи нужна сильная и очень дорогая команда дата-инженеров, дата-сайентистов и девопсов. Процесс же разработки такого решения занимает очень много времени.

CNews: Как подобные проблемы решаются в SberCloud?

Отари Меликишвили: Именно для решения подобных проблем мы создали ML Space. Платформа содержит все необходимые инструменты и ресурсы для создания, обучения и развертывания моделей машинного обучения — от быстрого подключения к источникам данных до автоматического развертывания обученных моделей на динамически масштабируемых высокопроизводительных мощностях cуперкомпьютера «Кристофари».

ML Space включает несколько модулей. Во-первых, это Data catalog — совместная работа с артефактами ML. Набор сервисов для трансфера, хранения, анализа, управления доступом и жизненным циклом данных и артефактов машинного обучения (дата-сетов, моделей, Docker-контейнеров и др.). Во-вторых, Environments — препроцессинг данных с помощью кластера Spark, а также обучение моделей в рамках привычных Jupyter Notebook или JupyterLab. На сервисе есть все необходимые утилиты для мониторинга загрузки ресурсов, моделей и эксперимент-менеджмента. В-третьих, Deployments — тестирование, развертывание (деплой) и мониторинг подготовленных моделей машинного и глубокого обучения на высокопроизводительной инфраструктуре. Для автоматического построения модели в платформе есть модуль AutoML, созданный на основе open source технологии LAMA от Лаборатории Искусственного интеллекта Сбера.

С помощью ML Space можно радикально ускорить и, соответственно, снизить стоимость разработки сложных решений, требующих привлечения больших и дорогих DS-команд. Компании, которым требуются несложные ML-решения и не имеющим экспертизы в data-science, с помощью ML Space могут создать такие решения самостоятельно.

страницы:

Как создать и внедрить полезное умное приложение