BI Consult
  • Перейти на QlikSense
  • Перейти на QlikView
  • Перейти на Tableau
  • Перейти на Power BI
  • Контакты
  • +7 812 334-08-01
    +7 499 608-13-06
  • EN
  • Отправить сообщение
  • Главная
  • Продукты Business-Qlik
    • Дистрибуция
    • Розничная торговля
    • Производство
    • Операторы связи
    • Страхование
    • Банки
    • Лизинг
    • Логистика
    • Нефтегазовый сектор
    • Медицина
    • Сеть ресторанов
    • Энергетика
    • Фрод-менеджмент
    • E-Commerce
    • Фармацевтика
    • Построение хранилища данных
    • Создание Data Lake
    • Цифровая трансформация
    • Управление по KPI
    • Финансы
    • Продажи
    • Склад
    • HR
    • Маркетинг
    • Внутренний аудит
    • Категорийный менеджмент
    • S&OP и прогнозная аналитика
    • Геоаналитика
    • Цепочки поставок (SCM)
    • Process Mining
    • Сквозная аналитика
  • Платформы
    • Qlik Sense
    • QlikView
    • Tableau
    • Microsoft Power BI
    • Геоаналитика Qlik GeoAnalytics
    • Qlik NPrinting - рассылка отчетности QlikView/Qlik Sense
    • KliqPlanning Suite - бюджетирование в QlikView
    • ATK BiView-1C Коннектор (для Qlik/Tableau/PowerBI)
    • QlikView/Qlik Sense SAP Коннектор
    • QlikView R-Коннектор
    • Qlik Web Connectors - коннектор Google, Facebook, Twitter
    • Vizlib Qlik Sense extentions (библиотека экстеншнов)
    • Библиотека extention для Qlik
    • Qlik Alerting
    • Qlik Data Integration Platform - создание Data Lake
    • Qlik Data Catalog решение для Data Governance
    • ATK BiView документация
  • Услуги
    • Консалтинг
    • Пилотный проект
    • План обучения и сертификации
    • Подготовка специалистов по Qlik
    • Бесплатное обучение Qlik
    • Сертификация Qlik
    • Поддержка
    • Технические задания
    • Сбор требований для проекта внедрения BI-системы
    • Аудит приложений Qlik и Tableau
    • Разработка BI Стратегии
    • Styleguide для BI-системы
    • Как выбрать BI-систему
  • Курсы
    • Учебный курс по Qlik Sense
    • Учебный курс по Tableau
    • Учебный курс по Microsoft Power BI
    • Учебный курс Информационная грамотность (Data Literacy)
    • Учебный курс Современная архитектура хранилища данных
    • Учебный курс для бизнес-аналитиков
    • Учебный курс по NPrinting
    • Учебный курс по BigQuery
    • Учебный курс по Azure Databricks
    • Учебный курс по DWH
    • Учебный курс по Data Governance
    • Учебный курс по Data Science (ML, AI)
    • Учебный курс администратора Qlik Sense
  • Компания
    • Руководство
    • Новости
    • Клиенты
    • Карьера
    • Скачать
    • Контакты

Услуги

  • Консалтинг
    • Продуктивный и согласованный анализ закупок, продаж и маркетинговых активностей в Fashion-Retail
    • Тренинг «S&OP для производственно-торговых компаний»
    • Проект внедрения Qlik
  • План обучения и сертификации
    • Учебные курсы Qlik
    • Учебные курсы Tableau
    • Учебные курсы Microsoft PowerBI
  • Бесплатное обучение
  • Сертификация Qlik
  • Пилотный проект
  • Сопровождение и поддержка
  • Технические задания
  • Сбор требований для проекта внедрения BI-системы
  • Аудит приложений QlikView / Qlik Sense / Tableau
  • Разработка BI Стратегии
    • Становясь Data-Driven организацией: скрытые возможности и проблемы
  • Styleguide для BI-системы
  • Как выбрать подходящую современную BI-систему

Отраслевые решения

  • Дистрибуция
    • Business-Qlik Дистрибуция
  • Розничная торговля
    • Business-Qlik Розничная торговля
    • Business-Qlik Розничная торговля: DIY
    • Business-Qlik Розничная торговля: Fashion
    • Business-Qlik для сетей аптек
    • BusinessPack для Tableau: POS - Point of Sales Perfomance
  • Производство
    • Business-Qlik Производство
  • Операторы связи
  • Банки
    • Business-Qlik for Banking на базе QlikView/Qlik Sense
    • Бизнес-аналитика в банке
  • Страхование
  • Фармацевтика
    • Business-Qlik Фармацевтика
  • Нефтегазовый сектор
  • Лизинг
  • Логистика
  • Медицина
  • Сеть ресторанов
  • Энергетика
  • E-Commerce
  • Анализ мошенничеств (фрод-менеджмент)

Функциональные решения

  • Управление по KPI
    • Самоуправляемая компания
  • Финансы
    • Бюджетирование
    • Консолидация финансовой отчетности
    • Панель управления, KPI для CFO
    • Рабочий капитал
    • Финансовая отчетность по МСФО
    • Платежный календарь / прогнозный ДДС
  • Продажи
    • Анализ данных из CRM
    • Планирование
  • Склад
  • Категорийный менеджмент
  • HR
  • Маркетинг
  • Внутренний аудит
  • Построение хранилища данных
  • Геоаналитика, аналитика на географической карте
  • Цепочка поставок (SCM)
  • S&OP и прогнозная аналитика
    • Прогнозная аналитика
    • Прогноз спроса на основании данных о вторичных продажах
  • Разработка стратегии цифровой трансформации
  • Сквозная аналитика
  • Process Mining
Главная » Курсы » Учебный курс Современная архитектура хранилища данных

MLOps: подробное руководство для начинающих

MLOps, AIOps, DataOps, ModelOps и даже DLOps. Эти модные словечки попадают в вашу ленту новостей? В любом случае пришло время войти в курс последних новостей о бизнес-практиках, основанных на искусственном интеллекте. Управление эксплуатацией моделей машинного обучения (MLOps) – это способ избавиться от боли в шее в процессе разработки и упростить доставку программного обеспечения на основе машинного обучения, не говоря уже о том, чтобы облегчить жизнь каждому члену команды.

Давайте проверим, как вы разбираетесь в использовании основных терминов

DLOps – это не ИТ-операции для глубокого обучения. Хотя люди продолжают искать эту аббревиатуру в Google, она вообще не имеет ничего общего с MLOps. Далее, термин AIOps, введенный Gartner в 2017 году, относится к применению когнитивных вычислений ИИ и машинного обучения для оптимизации ИТ-операций. И, наконец, DataOps и ModelOps служат для управления наборами данных и моделями и являются частью общей тройной бесконечной цепочки MLOps Данные-Модель-Код.

Хотя на первый взгляд MLOps кажется принципом машинного обучения и DevOps, он все же имеет свои особенности, которые необходимо усвоить. Мы подготовили эту статью, чтобы предоставить вам подробный обзор практик MLOps, и разработали список действенных шагов по их внедрению в любой команде.

 

 

 

 

MLOps: возможности и риски

Согласно данным Forbes, к 2025 году рынок решений MLOps достигнет 4 миллиардов долларов. Неудивительно, что аналитика на базе данных, меняет ландшафт всех рыночных вертикалей. Иллюстрацией этого может служить сельское хозяйство: стоимость ИИ на сельскохозяйственном рынке США, прогнозируемая на 2025 год, составит 2629 миллионов, что почти в три раза больше, чем было в 2020 году.

Чтобы проиллюстрировать эту точку зрения, вспомним два важных обоснования успеха машинного обучения – это способность решать проблемы восприятия и множественные параметры. Модели машинного обучения могут обеспечивать множество функций, а именно рекомендации, классификацию, прогнозирование, создание контента, ответы на вопросы, автоматизацию, обнаружение мошенничества и аномалий, и извлечение информации.

MLOps предназначен для управления всеми этими задачами. Однако у него также есть свои ограничения, которые мы рекомендуем учитывать при производстве моделей ML:

  • Качество данных. Чем лучше ваши данные, тем лучше модель может помочь решить бизнес-проблему.
  • Распад модели. Реальные данные меняются с течением времени, и нужно управлять этим на лету.
  • Местоположение данных. Модели, которые предварительно обучены на различных демографических данных пользователя, не могут работать соответственно при переходе на другие рынки.

 

 

Между тем, MLOps особенно полезен при экспериментировании с моделями, использующими итеративный подход. MLOps готов пройти столько итераций, сколько потребуется, поскольку ML является экспериментальным. Это помогает найти правильный набор параметров и создать воспроизводимые модели. Любое изменение версий данных, гиперпараметров и версий кода приводит к новым версиям развертываемой модели, которые обеспечивают экспериментирование.

 

Жизненный цикл рабочего процесса машинного обучения

Каждый проект машинного обучения направлен на построение статистической модели из данных с применением алгоритма машинного обучения. Следовательно, данные и модель машинного обучения представляют собой два разных артефакта для разработки программного обеспечения в части разработки кода. В целом жизненный цикл машинного обучения состоит из трех элементов:

  • Инженерия данных: предоставление и обучение наборов данных для алгоритмов машинного обучения. Включает в себя прием данных, исследование, проверку, очистку, маркировку и разделение (на набор данных для обучения, проверки и тестирования).
  • Проектирование модели: подготовка окончательной модели. Включает в себя обучение модели, оценку, тестирование и упаковку.
  • Развертывание модели: интеграция обученной модели в бизнес-приложение. Включает обслуживание модели, мониторинг производительности и ведение журнала производительности.

 

 

 

Объяснение MLOps: когда данные и модель встречаются с кодом

Поскольку ML вводит два дополнительных элемента в жизненный цикл разработки программного обеспечения, все становится сложнее, чем при использовании DevOps для любой разработки программного обеспечения. Хотя MLOps все еще стремится к контролю версий, модульному и интеграционному тестированию, а также к непрерывной доставке пакета, он привносит некоторые новые отличия по сравнению с DevOps:

 

  • Непрерывная интеграция (CI) применяется к тестированию и проверке данных, схем и моделей, а не только к коду и компонентам.
  • Непрерывное развертывание (CD) относится ко всей системе, которая предназначена для развертывания другой услуги, предоставляемой машинным обучением, но не к отдельному программному обеспечению или услуге.
  • Непрерывное обучение (CT) уникально для моделей машинного обучения и означает обслуживание и переподготовку моделей.

 

Уровень каждого этапа автоматизации проектирования данных, проектирования моделей и развертывания определяет общую зрелость MLOps. В идеале конвейер CI и CD должен быть автоматизирован для определения зрелой системы MLOps. Итак, существует три уровня MLOps, разделенных на категории и основанных на уровне автоматизации процессов:

 

  • Уровень 0 MLOps: процесс создания и развертывания модели ML выполняется полностью вручную. Этого достаточно для моделей, которые редко меняются или обучаются.
  • Уровень 1 MLOps: непрерывное обучение модели путем автоматизации конвейера машинного обучения, хорошо подходит для моделей, основанных на новых данных, но не для новых идей машинного обучения.
  • Уровень 2 MLOps: автоматизация CI/CD позволяет работать с новыми идеями проектирования функций, архитектуры модели и гиперпараметров.

 

В отличие от DevOps, повторное использование модели – это совсем другая история, поскольку для него требуются манипуляции с данными и сценариями, в отличие от повторного использования программного обеспечения. Поскольку модель со временем распадается, возникает необходимость в ее переобучении. В общем, управление версиями данных и моделей – это «управление версиями кода» в MLOps, требующее больше усилий по сравнению с DevOps.

 

Выгоды и затраты

Чтобы продумать гибридный подход MLOps для команды, которая его реализует, необходимо оценить возможные результаты. Так, мы разработали обобщенный список плюсов и минусов, который может применяться не ко всем сценариям.

 

Плюсы MLOps:

  • Автоматическое обновление нескольких конвейеров, что потрясающе, поскольку речь идет не о простой задаче с одним файлом кода
  • Масштабируемость и управление моделями машинного обучения – в зависимости от объема, тысячи моделей могут находиться под контролем
  • CI и CD организованы для обслуживания моделей машинного обучения (в зависимости от уровня зрелости MLOps)
  • Состояние и управление моделью ML – упрощенное управление моделью после развертывания
  • Полезный метод для людей, процессов и технологий, позволяющий оптимизировать разработку продуктов машинного обучения.

 

Мы предполагаем, что любой команде может потребоваться некоторое время, чтобы адаптироваться к MLOps и разработать ее методы работы. Поэтому мы предлагаем список возможных «камней преткновения», которые следует предвидеть:

 

Затраты на MLOps:

  • Разработка: более частые манипуляции с параметрами, функциями и моделями, нелинейный экспериментальный подход по сравнению с DevOps
  • Тестирование: включает проверку данных и модели, тестирование качества модели.
  • Производство и мониторинг: MLOps нуждается в постоянном мониторинге и проверке точности
  • Мониторинг памяти: мониторинг использования памяти при выполнении прогнозов
  • Мониторинг производительности модели: переобучение моделей применяется со временем, поскольку данные могут изменяться, и это может повлиять на результаты
  • Мониторинг инфраструктуры: постоянный сбор и анализ соответствующих данных
  • Команда: потратьте время и усилия на то, чтобы специалисты по обработке данных и инженеры приняли вашу систему

 

 

 

Начало работы с MLOps: практические шаги

MLOps требует некоторых знаний о данных и высокой дисциплины в организации, которая решает ее внедрить.

 

 

 

 

В результате каждая компания должна разработать свой собственный набор практик для адаптации MLOps к своей разработке и автоматизации ИИ. Мы надеемся, что упомянутые руководящие принципы помогут вам плавно внедрить эту философию в вашей команде.

 

Статья изначально была размещена в блоге SciF

 

 

Узнать стоимость решенияЗапросить видео презентацию

Запросить видео презентацию Запросить доступ к демо стенду online

Задать вопрос

loading...

Решения

Анализировать ФинансыУвеличивайте ПродажиОптимальный Склад и ЛогистикаМаркетинговые Метрики

Клиенты

  • CBRE является ведущей компанией на мировом рынке, предоставляющей полный спектр услуг в области недвижимости и инвестиций.

    Модули:

    • Анализ клиентов и сотрудников
    • Анализ конъюктуры рынка
    • Анализ воронки продаж
  • СТД Петрович

    Инструментарий для руководства компании; анализ продаж по направлениям и разрезам; анализ складской деятельности; анализ уровня товарного запаса в сравнении с нормативами; анализ логистической деятельности; категорийный менеджмент; анализ эффективности работы с клиентом/ассортиментом; анализ эффективности работы с новыми позициями.

  • Модуль Экономика ТМ Системы бизнес-анализа на базе платформы QlikView предназначен для расшифровки информации о продажах, расходах и прибыли товарного ассортимента ООО «Комус» в разрезе от общего к частному (по товарным рынкам, категориям, отварным матрицам, ассортиментным группам, артикулам в разрезах каналов, регионов, признаков за различные временные периоды и предоставления возможности по анализу этих данных с использованием графических и табличных представлений. 

  • Nokia Siemens Networks
    Создание комплекса бизнес-анализа, позволяющего автоматически по расписанию получать показатели работы сети и качества сервисов групп абонентов CS/PS сервисов, выполнять различные виды сегментации, отслеживать пороговые значения и отправлять уведомления; Реализация отображения на географической карте осуществляется при помощи 2-х инструментов: QlikView и Tableau (геоаналитика).
  • Решения
    • Дистрибуция
    • Розничная торговля
    • Производство
    • Операторы связи
    • Банки
    • Страхование
    • Фармацевтика
    • Лизинг
    • Логистика
    • Медицина
    • Нефтегазовый сектор
    • Сеть ресторанов
  • Продукты
    • Qlik Sense
    • QlikView
    • Tableau
    • Microsoft Power BI
    • ATK BiView-1C Коннектор (для Qlik/Tableau/PowerBI)
    • Vizlib Qlik Sense extentions (библиотека экстеншнов)
    • NPrinting
    • Геоаналитика Qlik GeoAnalytics
    • KliqPlanning Suite
    • Qlik WebConnectors
    • QlikView R Коннектор
    • QlikView/Qlik Sense SAP Коннектор
    • Alteryx
    • Qlik Data Catalog
    • Документация ATK BiView
  • Услуги
    • Консалтинг
    • Пилотный проект
    • Поддержка
    • План обучения и сертификации Qlik
    • Бесплатное обучение
    • Учебные курсы
    • Сертификация Qlik
    • Аудит приложений
  • Курсы
    • Учебный курс по Qlik Sense
    • Учебный курс по Tableau
    • Учебный курс по Microsoft Power BI
    • Учебный курс Современная архитектура хранилища данных
    • Учебный курс Информационная грамотность
    • Учебный курс для бизнес-аналитиков
    • Учебный курс по NPrinting
    • Учебный курс по Azure Databricks
    • Учебный курс по Google BigQuery
  • Компания
    • О нас
    • Руководство
    • Новости
    • Клиенты
    • Скачать
    • Контакты
  • Функциональные решения
    • Продажи
    • Финансы
    • Склад
    • HR
    • S&OP и прогнозная аналитика
    • Внутренний аудит
    • Геоаналитика
    • Категорийный менеджмент
    • Построение хранилища данных
    • Система управления KPI и BSC
    • Управление цепочками поставок
    • Маркетинг
    • Цифровая трансформация
    • Сквозная аналитика
    • Process Mining
QlikView Partner
LinkedInYouTubeVkontakteFacebook
ООО "Би Ай Консалт",
ИНН: 7811437757,
ОГРН: 1097847154184
199178, Россия,
Санкт-Петербург,
6-ая линия В.О., Д. 63, 4 этаж
Тел: +7 (812) 334-08-01
Тел: +7 (499) 608-13-06
E-mail: info@biconsult.ru