Это сообщение клиента, написанное совместно сотрудниками ICL и AWS.
ICL — это многонациональная производственная и горнодобывающая корпорация, базирующаяся в Израиле, которая производит продукцию на основе уникальных полезных ископаемых и удовлетворяет основные потребности человечества, в первую очередь на трех рынках: сельское хозяйство, продукты питания и инженерные материалы. На их горнодобывающих объектах используется промышленное оборудование, за которым необходимо следить, поскольку отказы оборудования могут привести к потере доходов или даже к экологическому ущербу. Из-за чрезвычайно суровых условий (низкие и высокие температуры, вибрация, соленая вода, пыль) прикрепить к этим горнодобывающим машинам датчики для дистанционного мониторинга затруднительно. Таким образом, большинство машин постоянно контролируются вручную или визуально работниками на месте. Эти рабочие часто проверяют изображения с камер, чтобы следить за состоянием машины. Хотя этот подход работал в прошлом, он не масштабируется и требует относительно высоких затрат.
Чтобы решить эту бизнес-задачу, ICL решила разработать собственные возможности использования машинного обучения (ML) для компьютерного зрения (CV) для автоматического мониторинга своих горнодобывающих машин. В традиционной горнодобывающей компании наличие внутренних ресурсов с навыками анализа данных, CV или машинного обучения было ограничено.
В этом посте мы обсуждаем следующее:
- Как компания ICL разработала собственные возможности для создания и обслуживания CV-решений, позволяющих осуществлять автоматический мониторинг горнодобывающего оборудования для повышения эффективности и сокращения отходов.
- Глубокое погружение в решение для сортировщиков горнодобывающей промышленности, разработанное при поддержке программы AWS Prototyping.
Используя подход, описанный в этой публикации, компания ICL смогла разработать платформу для AWS с использованием Amazon SageMaker для создания других сценариев использования на основе изображения, полученного примерно с 30 камер, с возможностью масштабирования до тысяч таких камер на своих производственных площадках.
Создание собственных возможностей с помощью прототипирования AWS
Для создания и поддержки решений машинного обучения для критически важных бизнес-задач требуется достаточно квалифицированный персонал. Аутсорсинг такой деятельности часто невозможен, поскольку внутренние ноу-хау в отношении бизнес-процессов необходимо сочетать с разработкой технических решений. Поэтому компания ICL обратилась к AWS за поддержкой в создании решения CV для мониторинга горнодобывающего оборудования и приобретения необходимых навыков.
AWS Prototyping — это инвестиционная программа, в рамках которой AWS объединяет специалистов в команды разработчиков клиентов для создания критически важных сценариев использования. В ходе такого взаимодействия команда разработчиков клиентов получает доступ к базовым технологиям AWS, одновременно создавая сценарий использования в течение 3–6 недель и получая практическую помощь. Помимо соответствующего варианта использования, все потребности заказчика — это 3–7 разработчиков, которые могут потратить более 80% своего рабочего времени на создание вышеупомянутого варианта использования. В течение этого времени специалисты AWS полностью закрепляются за командой заказчика и сотрудничают с ней удаленно или на месте.
Вариант использования ICL в области компьютерного зрения
Для создания прототипа компания ICL выбрала вариант использования для мониторинга своих систем проверки горнодобывающей промышленности. Сортировщик — это большая промышленная горнодобывающая машина, в которой перерабатываются минералы, растворенные в воде. Вода течет по нескольким полосам от верхней части машины к нижней. Приток контролируется по каждой из полос в отдельности. Когда приток выходит за пределы полосы, это называется переливом, что указывает на то, что машина перегружена. Переполняющиеся притоки – это полезные ископаемые, которые не перерабатываются грохотом и теряются. Этого необходимо избежать, регулируя приток. Без решения ML переполнение должно контролироваться людьми, и потенциально может потребоваться время, прежде чем переполнение будет обнаружено и обработано.
На следующих изображениях показаны входные и выходные данные моделей CV. Необработанное изображение с камеры (слева) обрабатывается с использованием модели семантической сегментации (в центре) для обнаружения различных полос движения. Затем модель (справа) оценивает покрытие (белый) и переполнение (красный).
Хотя работа по созданию прототипа была сосредоточена на одном типе машин, общий подход к использованию камер и автоматической обработке их изображений при использовании CV применим к более широкому спектру горнодобывающего оборудования. Это позволяет ICL экстраполировать ноу-хау, полученные в ходе создания прототипов, на другие места, типы камер и машин, а также поддерживать модели ML, не требуя поддержки со стороны какой-либо третьей стороны.
В ходе взаимодействия специалисты AWS и команда разработчиков ICL встречались каждый день и шаг за шагом совместно разрабатывали решение. Ученые, работающие с данными ICL, будут либо работать независимо над поставленными перед ними задачами, либо получать практическую поддержку в парном программировании от специалистов AWS ML. Такой подход гарантирует, что ученые, работающие с данными ICL, не только приобретут опыт систематической разработки моделей машинного обучения с помощью SageMaker, но и встроят эти модели в приложения, а также автоматизируют весь жизненный цикл таких моделей, включая автоматическое переобучение или мониторинг моделей. После 4 недель этого сотрудничества ICL смогла запустить эту модель в производство, не требуя дальнейшей поддержки, в течение 8 недель, и с тех пор создала модели для других вариантов использования. Технический подход к этому взаимодействию описан в следующем разделе.
Мониторинг скринеров горнодобывающей промышленности с использованием моделей CV с помощью SageMaker
SageMaker — это полностью управляемая платформа, охватывающая полный жизненный цикл модели машинного обучения: она предоставляет услуги и функции, которые поддерживают команды, работающие над моделями машинного обучения, от маркировки данных в Amazon SageMaker Ground Truth до обучения и оптимизации модели, а также размещения моделей машинного обучения. для производственного использования. Перед взаимодействием компания ICL установила камеры и получила изображения, как показано на предыдущих изображениях (крайнее левое изображение), и сохранила их в корзине Amazon Simple Storage Service (Amazon S3). Прежде чем модели можно будет обучать, необходимо сгенерировать обучающие данные. Совместная команда ICL-AWS решила эту проблему в три этапа:
- Пометьте данные, используя задание маркировки семантической сегментации в SageMaker Ground Truth, как показано на следующем изображении.
- Предварительно обработайте помеченные изображения, используя методы увеличения изображений, чтобы увеличить количество выборок данных.
- Разделите помеченные изображения на обучающие, тестовые и проверочные наборы, чтобы производительность и точность модели можно было адекватно измерить в процессе обучения.
Для достижения масштаба производства рабочих нагрузок ML автоматизация этих шагов имеет решающее значение для поддержания качества входных данных для обучения. Таким образом, всякий раз, когда новые изображения маркируются с помощью SageMaker Ground Truth, этапы предварительной обработки и разделения выполняются автоматически, а полученные наборы данных сохраняются в Amazon S3, как показано на следующей диаграмме — рабочий процесс обучения модели. Аналогично, рабочий процесс развертывания модели использует ресурсы из SageMaker для автоматического обновления конечных точек всякий раз, когда доступна обновленная модель.
ICL использует несколько подходов для внедрения моделей ML в производство. Некоторые используют свою текущую платформу искусственного интеллекта под названием KNIME, которая позволяет им быстро внедрять в производство модели, разработанные в среде разработки, путем индустриализации их в продукты. Было проанализировано несколько комбинаций использования сервисов KNIME и AWS; предыдущая архитектура была наиболее подходящей для среды ICL.
Встроенный алгоритм семантической сегментации SageMaker используется для обучения моделей сегментации областей сетки скрининга. Выбрав этот встроенный алгоритм вместо самостоятельно созданного контейнера, ICL не придется иметь дело с недифференцированной тяжелой работой по поддержанию сверточной нейронной сети (CNN), имея при этом возможность использовать такую CNN для своего варианта использования. После экспериментов с различными конфигурациями и параметрами ICL использовала алгоритм полностью сверточной сети (FCN) с Сеть синтаксического анализа сцены пирамиды (PSPNet) для обучения модели. Это позволило ICL завершить построение модели в течение 1 недели после создания прототипа.
После обучения модели ее необходимо развернуть, чтобы ее можно было использовать для скринингового мониторинга. В соответствии с обучением модели этот процесс полностью автоматизирован и организован с помощью AWS Step Functions и AWS Lambda. После успешного развертывания модели на конечной точке SageMaker размеры входящих изображений с камер изменяются в соответствии с входным форматом модели, а затем передаются в конечную точку для прогнозирования с использованием функций Lambda. Результаты прогнозирования семантической сегментации, а также обнаружения переполнения затем сохраняются в Amazon DynamoDB и Amazon S3 для последующего анализа. Если обнаружено переполнение, можно использовать функции Amazon Simple Notification Service (Amazon SNS) или Lambda для автоматического уменьшения переполнения и управления соответствующими полосами на затронутом устройстве досмотра. Следующая диаграмма иллюстрирует эту архитектуру.
Заключение
В этом посте описывается, как ICL, израильская горнодобывающая компания, разработала собственный подход к компьютерному зрению для автоматического мониторинга горнодобывающего оборудования с помощью камер. Сначала мы показали, как решить такую проблему с организационной точки зрения, ориентированной на реализацию, а затем подробно рассмотрели, как модель была построена с использованием AWS. Хотя задача мониторинга может быть уникальной для ICL, общий подход к созданию прототипа совместно со специалистами AWS может быть применен к аналогичным задачам, особенно для организаций, которые не обладают необходимыми знаниями AWS.
Если вы хотите узнать, как создать прототип вашего варианта использования в промышленном масштабе, обратитесь к своей команде по работе с клиентами AWS, чтобы обсудить участие в создании прототипа.
Об авторах
Маркус Бестехорн возглавляет группы разработки и прототипирования клиентов в Германии, Австрии, Швейцарии и Израиле для AWS. Он имеет степень доктора компьютерных наук и специализируется на создании сложных решений машинного обучения и Интернета вещей.
Дэвид Абекасис возглавляет команду по обработке данных в ICL Group и стремится обучать других анализу данных и машинному обучению, одновременно помогая решать бизнес-задачи. Он имеет степень магистра наук о данных и степень MBA. Ему посчастливилось исследовать данные пространственных и временных рядов в области точного земледелия.
Ион Клеопас — старший архитектор прототипов машинного обучения со степенью магистра в области науки о данных и больших данных. Он помогает клиентам AWS создавать инновационные решения AI/ML, предоставляя возможность своим техническим командам работать с технологиями AWS посредством совместной разработки прототипов для сложных сценариев использования машинного обучения, прокладывая им путь к производству.
Мирон Перель — главный менеджер по развитию бизнеса в области машинного обучения в Amazon Web Services. Мирон консультирует компании, занимающиеся генеративным искусственным интеллектом, при создании моделей следующего поколения.