Мы рады сообщить, что Amazon SageMaker Canvas теперь предлагает более быстрый и удобный способ создания моделей машинного обучения для прогнозирования временных рядов. SageMaker Canvas — это визуальный сервис «укажи и щелкни», который позволяет бизнес-аналитикам создавать точные модели машинного обучения (ML) без необходимости какого-либо опыта машинного обучения или написания единой строки кода.
SageMaker Canvas поддерживает ряд вариантов использования, включая прогнозирование временных рядов, используемое для управления запасами в розничной торговле, планирования спроса в производстве, планирования рабочей силы и гостей в сфере путешествий и гостиничного бизнеса, прогнозирования доходов в финансах и многих других критически важных бизнес-решений, где очень важно точные прогнозы важны. Например, прогнозирование временных рядов позволяет ритейлерам прогнозировать будущий спрос на продажи и планировать уровни запасов, логистику и маркетинговые кампании. Модели прогнозирования временных рядов в SageMaker Canvas используют передовые технологии для объединения статистических алгоритмов и алгоритмов машинного обучения и позволяют получать высокоточные прогнозы.
В этом посте мы описываем усовершенствования возможностей прогнозирования SageMaker Canvas и помогаем вам использовать его пользовательский интерфейс (UI) и API-интерфейсы AutoML для прогнозирования временных рядов. Хотя пользовательский интерфейс SageMaker Canvas предлагает визуальный интерфейс без кода, API-интерфейсы позволяют разработчикам взаимодействовать с этими функциями программно. Доступ к обоим можно получить из консоли SageMaker.
Улучшения в прогнозировании
С сегодняшним запуском SageMaker Canvas обновил свои возможности прогнозирования с помощью AutoML, обеспечивая до 50 процентов более высокую производительность построения моделей и до 45 процентов более быстрые прогнозы в среднем по сравнению с предыдущими версиями для различных наборов контрольных данных. Это сокращает среднюю продолжительность обучения модели со 186 до 73 минут, а среднее время прогнозирования с 33 до 18 минут для типичного пакета из 750 временных рядов с размером данных до 100 МБ. Теперь пользователи также могут программно получать доступ к функциям построения моделей и прогнозирования через API-интерфейсы Amazon SageMaker Autopilot, которые включают в себя отчеты об объяснении моделей и производительности.
Раньше введение дополнительных данных требовало переобучения всей модели, что занимало много времени и приводило к задержкам в работе. Теперь в SageMaker Canvas вы можете добавлять последние данные для создания будущих прогнозов без повторного обучения всей модели. Просто введите дополнительные данные в свою модель, чтобы использовать последние данные для будущих прогнозов. Отказ от переобучения ускоряет процесс прогнозирования, позволяя вам быстрее применять полученные результаты в своих бизнес-процессах.
Благодаря тому, что SageMaker Canvas теперь использует AutoML для прогнозирования, вы можете использовать функции построения моделей и прогнозирования с помощью API-интерфейсов SageMaker Autopilot, обеспечивая согласованность пользовательского интерфейса и API. Например, вы можете начать с построения моделей в пользовательском интерфейсе, а затем переключиться на использование API для создания прогнозов. Этот обновленный подход к моделированию также повышает прозрачность модели несколькими способами:
- Пользователи могут получить доступ к отчету об объяснении, который предлагает более четкое представление о факторах, влияющих на прогнозы. Это ценно для групп управления рисками, обеспечения соответствия требованиям и внешних регуляторов. В отчете поясняется, как атрибуты набора данных влияют на прогнозы конкретных временных рядов. В нем работают оценки воздействия для измерения относительного эффекта каждого атрибута, указывая, усиливают ли они или уменьшают прогнозируемые значения.
- Теперь вы можете получить доступ к обученным моделям и развернуть их в SageMaker Inference или предпочитаемой вами инфраструктуре для прогнозирования.
- Доступен отчет о производительности, который дает более глубокое представление об оптимальных моделях, выбранных AutoML для конкретных временных рядов, и гиперпараметрах, используемых во время обучения.
Создавайте прогнозы временных рядов с помощью пользовательского интерфейса SageMaker Canvas.
Пользовательский интерфейс SageMaker Canvas позволяет легко интегрировать источники данных из облака или локально, легко объединять наборы данных, обучать точные модели и делать прогнозы на основе новых данных — и все это без программирования. Давайте рассмотрим создание прогноза временных рядов с помощью этого пользовательского интерфейса.
Сначала вы импортируете данные в SageMaker Canvas из различных источников, в том числе из локальных файлов с вашего компьютера, корзин Amazon Simple Storage Service (Amazon S3), Amazon Athena, Snowflake и более 40 других источников данных. После импорта данных вы можете изучить и визуализировать их, чтобы получить дополнительную информацию, например, с помощью диаграмм рассеяния или гистограмм. Когда вы будете готовы создать модель, вы сможете сделать это всего несколькими щелчками мыши после настройки необходимых параметров, таких как выбор целевого столбца для прогнозирования и указание количества дней в будущем, которое вы хотите спрогнозировать. На следующих снимках экрана показан пример визуализации прогнозирования спроса на продукцию на основе исторических данных о еженедельном спросе на конкретные продукты в разных местах магазинов:
На следующем изображении показаны еженедельные прогнозы для конкретного продукта в разных магазинах:
Подробное руководство по использованию пользовательского интерфейса SageMaker Canvas для прогнозирования можно найти в этой публикации в блоге.
Если вам нужен автоматизированный рабочий процесс или прямая интеграция модели ML в приложения, наши функции прогнозирования доступны через API. В следующем разделе мы предоставляем пример решения, в котором подробно описывается, как использовать наши API для автоматического прогнозирования.
Создание прогноза временных рядов с помощью API
Давайте углубимся в то, как использовать API для обучения модели и создания прогнозов. Для этой демонстрации рассмотрим ситуацию, когда компании необходимо спрогнозировать уровень запасов продукции в различных магазинах, чтобы удовлетворить покупательский спрос. На высоком уровне взаимодействие API разбивается на следующие этапы:
- Подготовьте набор данных.
- Создайте задание автопилота SageMaker.
- Оцените работу автопилота:
- Изучите показатели точности модели и результаты ретроспективного тестирования.
- Изучите отчет об объяснимости модели.
- Сгенерируйте прогнозы из модели:
- Используйте конечную точку вывода в реальном времени, созданную в рамках задания автопилота; или
- Используйте задание пакетного преобразования.
Пример блокнота Amazon SageMaker Studio, демонстрирующий прогнозирование с помощью API
Мы предоставили образец блокнота SageMaker Studio на GitHub чтобы ускорить выход на рынок, когда ваш бизнес предпочитает организовывать прогнозирование с помощью программных API. Блокнот предлагает образец синтетического набора данных, доступный через общедоступную корзину S3. Блокнот проведет вас через все шаги, описанные на изображении рабочего процесса, упомянутом выше. Несмотря на то, что записная книжка предоставляет базовую структуру, вы можете адаптировать пример кода в соответствии со своим конкретным вариантом использования. Это включает в себя его изменение в соответствии с вашей уникальной схемой данных, временным разрешением, горизонтом прогнозирования и другими необходимыми параметрами для достижения желаемых результатов.
Заключение
SageMaker Canvas демократизирует прогнозирование временных рядов, предлагая удобный интерфейс без кода, который позволяет бизнес-аналитикам создавать высокоточные модели машинного обучения. Благодаря сегодняшним обновлениям AutoML он обеспечивает до 50 процентов более быстрое построение моделей, до 45 процентов более быстрое прогнозирование, а также предоставляет доступ к API как для построения модели, так и для функций прогнозирования, повышая ее прозрачность и согласованность. Уникальная способность SageMaker Canvas беспрепятственно обрабатывать дополнительные данные без повторного обучения обеспечивает быструю адаптацию к постоянно меняющимся требованиям бизнеса.
Независимо от того, предпочитаете ли вы интуитивно понятный пользовательский интерфейс или универсальные API, SageMaker Canvas упрощает интеграцию данных, обучение моделей и прогнозирование, что делает его ключевым инструментом для принятия решений на основе данных и инноваций в различных отраслях.
Чтобы узнать больше, просмотрите документацию или изучите блокнот доступен в нашем репозитории GitHub. Информация о ценах на прогнозирование временных рядов с использованием SageMaker Canvas доступна на странице цен на SageMaker Canvas, а цены на обучение SageMaker и формирование выводов при использовании API-интерфейсов SageMaker Autopilot см. на странице цен на SageMaker.
Эти возможности доступны во всех регионах AWS, где SageMaker Canvas и SageMaker Autopilot общедоступны. Дополнительную информацию о доступности регионов см. в разделе Сервисы AWS по регионам.
Об авторах
Нирмал Кумар является старшим менеджером по продукту сервиса Amazon SageMaker. Стремясь расширить доступ к искусственному интеллекту и машинному обучению, он руководит разработкой решений машинного обучения без кода и с низким уровнем кода. Помимо работы он любит путешествовать и читать научно-популярную литературу.
Чарльз Лафлин — главный специалист по архитектуре решений AI/ML, работающий в сервисной команде Amazon SageMaker в AWS. Он помогает формировать дорожную карту обслуживания и ежедневно сотрудничает с различными клиентами AWS, чтобы помочь преобразовать их бизнес с помощью передовых технологий AWS и передового опыта. Чарльз имеет степень магистра в области управления цепочками поставок и степень доктора философии. в науке о данных.
Ридхим Растоги Инженер по разработке программного обеспечения, работающий в сервисной команде Amazon SageMaker в AWS. Он увлечен созданием масштабируемых распределенных систем, уделяя особое внимание решению реальных проблем с помощью искусственного интеллекта и машинного обучения. В свободное время он любит разгадывать головоломки, читать художественную литературу и исследовать окрестности.
Ахмед Раафат — главный архитектор решений в AWS, имеет 20-летний опыт работы на местах и 5-летний опыт работы в экосистеме AWS. Он специализируется на решениях AI/ML. Его обширный опыт охватывает различные отрасли промышленности, что делает его надежным консультантом для многочисленных корпоративных клиентов, облегчая им беспрепятственную навигацию и ускоряя переход к облаку.
Джон Ошоди — старший архитектор решений в Amazon Web Services в Лондоне, Великобритания. Он специализируется на данных и аналитике и является техническим консультантом для многочисленных корпоративных клиентов AWS, поддерживая и ускоряя их переход к облаку. Вне работы он любит путешествовать по новым местам и знакомиться с новыми культурами вместе со своей семьей.