Это гостевой пост Марио Намтао Шианти Ларчера, руководителя отдела компьютерного зрения в Enel.
Энель, которая начиналась как национальная электроэнергетическая компания Италии, сегодня является многонациональной компанией, представленной в 32 странах, и первым в мире частным сетевым оператором с 74 миллионами пользователей. Он также признан первым игроком на рынке возобновляемых источников энергии с установленной мощностью 55,4 ГВт. В последние годы компания вложила значительные средства в сектор машинного обучения (ML), разработав сильные внутренние ноу-хау, которые позволили им реализовать очень амбициозные проекты, такие как автоматический мониторинг своей 2,3 миллиона километров распределительной сети.
Каждый год Enel проверяет свою распределительную сеть с помощью вертолетов, автомобилей или других средств; делает миллионы фотографий; и реконструирует трехмерное изображение своей сети, которая облако точек 3D-реконструкция сети, полученная с использованием технологии LiDAR.
Изучение этих данных имеет решающее значение для мониторинга состояния электросети, выявления аномалий в инфраструктуре и обновления баз данных установленных активов, а также позволяет детально контролировать инфраструктуру вплоть до материала и состояния самого маленького изолятора, установленного на данном столбе. Учитывая объем данных (более 40 миллионов изображений в год только в Италии), количество элементов, которые необходимо идентифицировать, и их специфику, полностью ручной анализ является очень дорогостоящим, как с точки зрения времени, так и денег, и подвержен ошибкам. К счастью, благодаря огромным достижениям в области компьютерного зрения и глубокого обучения, а также зрелости и демократизации этих технологий можно частично или даже полностью автоматизировать этот дорогостоящий процесс.
Конечно, задача остается очень сложной и, как и все современные приложения ИИ, требует вычислительной мощности и способности эффективно обрабатывать большие объемы данных.
Enel построила собственную платформу машинного обучения (внутренне называемую фабрикой машинного обучения) на основе Amazon SageMaker, и эта платформа зарекомендовала себя как стандартное решение Enel для создания и обучения моделей для различных вариантов использования в различных цифровых центрах (бизнес-подразделениях) с десятками проектов машинного обучения, разрабатываемых на Amazon SageMaker Training. Обработка Amazon SageMakerи другие сервисы AWS, такие как AWS Step Functions.
Enel собирает изображения и данные из двух разных источников:
- Инспекции воздушной сети:
- Облака точек лидара – Их преимущество заключается в том, что они представляют собой чрезвычайно точную и геолокализованную трехмерную реконструкцию инфраструктуры, и поэтому очень полезны для расчета расстояний или проведения измерений с точностью, недостижимой при анализе двумерных изображений.
- Изображения с высоким разрешением – Эти изображения инфраструктуры делаются с разницей в несколько секунд. Это позволяет обнаруживать элементы и аномалии, которые слишком малы, чтобы их можно было идентифицировать в облаке точек.
- Спутниковые снимки – Хотя они могут быть более доступными, чем проверка линий электропередач (некоторые из них доступны бесплатно или за отдельную плату), их разрешение и качество часто не соответствуют изображениям, сделанным непосредственно Enel. Характеристики этих изображений делают их полезными для определенных задач, таких как оценка плотности леса и макрокатегории или поиск зданий.
В этом посте мы подробно обсудим, как Enel использует эти три источника, и поделимся тем, как Enel автоматизирует управление крупномасштабной оценкой энергосистемы и процесс обнаружения аномалий с помощью SageMaker.
Анализ фотографий с высоким разрешением для выявления активов и аномалий
Как и другие неструктурированные данные, собранные во время проверок, сделанные фотографии хранятся в Amazon Simple Storage Service (Amazon S3). Некоторые из них помечены вручную с целью обучения различных моделей глубокого обучения для различных задач компьютерного зрения.
Концептуально конвейер обработки и логического вывода включает иерархический подход с несколькими этапами: сначала идентифицируются области интереса на изображении, затем они обрезаются, в них идентифицируются активы и, наконец, они классифицируются в соответствии с материалом или наличием на них аномалий. Поскольку один и тот же полюс часто появляется более чем на одном изображении, необходимо также иметь возможность группировать его изображения, чтобы избежать дублирования. Эта операция называется повторная идентификация.
Для всех этих задач Enel использует инфраструктуру PyTorch и новейшие архитектуры для классификации изображений и обнаружения объектов, такие как EfficientNet/EfficientDet или другие для семантической сегментации определенных аномалий, таких как утечки масла на трансформаторах. Для задачи повторной идентификации, если они не могут сделать это геометрически из-за отсутствия параметров камеры, они используют SimCLRИспользуются основанные на самоконтроле методы или архитектуры на основе Transformer. Было бы невозможно обучить все эти модели, не имея доступа к большому количеству инстансов, оснащенных высокопроизводительными графическими процессорами, поэтому все модели обучались параллельно с использованием учебных заданий Amazon SageMaker с инстансами машинного обучения с ускорением на графическом процессоре. Вывод имеет ту же структуру и управляется конечным автоматом Step Functions, который управляет несколькими заданиями обработки и обучения SageMaker, которые, несмотря на название, можно использовать как в обучении, так и в выводе.
Ниже приведена высокоуровневая архитектура конвейера машинного обучения с его основными этапами.
На этой диаграмме показана упрощенная архитектура конвейера вывода изображений ODIN, который извлекает и анализирует области интереса (например, электрические столбы) из изображений наборов данных. Далее конвейер углубляется в ROI, извлекая и анализируя электрические элементы (трансформаторы, изоляторы и т. д.). После окончательной обработки компонентов (ROI и элементов) начинается процесс повторной идентификации: изображения и полюса на карте сети сопоставляются на основе 3D-метаданных. Это позволяет группировать области интереса, относящиеся к одному и тому же полюсу. После этого аномалии дорабатываются и формируются отчеты.
Извлечение точных измерений с использованием облаков точек LiDAR
Фотографии с высоким разрешением очень полезны, но поскольку они двумерные, по ним невозможно извлечь точные измерения. Облака точек LiDAR приходят на помощь здесь, потому что они являются трехмерными и имеют положение каждой точки в облаке с соответствующей ошибкой менее нескольких сантиметров.
Однако во многих случаях необработанное облако точек бесполезно, потому что вы мало что можете с ним сделать, если не знаете, представляет ли набор точек дерево, линию электропередач или дом. По этой причине Enel использует KPConv, алгоритм семантической сегментации облака точек, для присвоения класса каждой точке. После того, как облако классифицировано, можно выяснить, находится ли растительность слишком близко к линии электропередач, а не измерять наклон столбов. Благодаря гибкости сервисов SageMaker пайплайн этого решения мало чем отличается от уже описанного, с той лишь разницей, что и в этом случае для инференса необходимо использовать инстансы GPU.
Ниже приведены некоторые примеры изображений облаков точек.
Глядя на энергосистему из космоса: картографирование растительности для предотвращения перебоев в подаче электроэнергии
Осмотр энергосистемы с помощью вертолетов и других средств, как правило, очень дорог и не может проводиться слишком часто. С другой стороны, наличие системы для мониторинга тенденций вегетации в короткие промежутки времени чрезвычайно полезно для оптимизации одного из самых дорогостоящих процессов распределителя энергии: обрезки деревьев. Вот почему Enel также включила в свое решение анализ спутниковых изображений, по которым с помощью многозадачного подхода определяется, где присутствует растительность, ее плотность и типы растений, разделенные на макроклассы.
Для этого варианта использования, поэкспериментировав с разными разрешениями, Enel пришла к выводу, что бесплатное Сентинел 2 изображения Программа «Коперник» имела наилучшее соотношение «затраты-выгода». В дополнение к растительности Enel также использует спутниковые снимки для идентификации зданий, что является полезной информацией, позволяющей понять, есть ли несоответствия между их наличием и тем, где Enel поставляет электроэнергию, и, следовательно, какие-либо нерегулярные соединения или проблемы в базах данных. Для последнего варианта использования разрешения Sentinel 2, где один пиксель соответствует площади 10 квадратных метров, недостаточно, поэтому покупаются платные изображения с разрешением 50 квадратных сантиметров. Это решение также не сильно отличается от предыдущих с точки зрения используемых сервисов и потоков.
Ниже приведена аэрофотосъемка с идентификацией активов (столб и изоляторы).
Анжела Итальяно, директор по науке о данных в ENEL Grid, говорит:
«В Enel мы используем модели компьютерного зрения для проверки нашей распределительной сети путем реконструкции 3D-изображений нашей сети с использованием десятков миллионов высококачественных изображений и облаков точек LiDAR. Для обучения этих моделей машинного обучения требуется доступ к большому количеству экземпляров, оснащенных высокопроизводительными графическими процессорами, и способность эффективно обрабатывать большие объемы данных. С помощью Amazon SageMaker мы можем быстро обучать все наши модели параллельно без необходимости управлять инфраструктурой, поскольку обучение Amazon SageMaker масштабирует вычислительные ресурсы вверх и вниз по мере необходимости. С помощью Amazon SageMaker мы можем создавать трехмерные изображения наших систем, отслеживать аномалии и эффективно обслуживать более 60 миллионов клиентов».
Заключение
В этом посте мы увидели, как ведущий игрок в мире энергетики, такой как Enel, использовал модели компьютерного зрения и задания по обучению и обработке SageMaker для решения одной из основных проблем тех, кому приходится управлять инфраструктурой такого колоссального размера, отслеживать установленные активы и выявлять аномалии и источники опасности для линии электропередач, такие как растительность слишком близко к ней.
Узнайте больше о связанных функциях SageMaker.
Об авторах
Марио Намтао Шианти Ларчер является руководителем отдела компьютерного зрения в Enel. У него есть опыт работы в области математики, статистики и глубокие познания в области машинного обучения и компьютерного зрения. Он возглавляет команду из более чем десяти специалистов. Роль Марио заключается во внедрении передовых решений, которые эффективно используют возможности искусственного интеллекта и компьютерного зрения для использования обширных ресурсов данных Enel. Помимо своей профессиональной деятельности, он питает личную страсть как к традиционному искусству, так и к искусству, созданному искусственным интеллектом.
Кристиан Гаваццени является старшим архитектором решений в Amazon Web Services. Он имеет более чем 20-летний опыт работы предпродажным консультантом, специализирующимся на управлении данными, инфраструктуре и безопасности. В свободное время он любит играть в гольф с друзьями и путешествовать за границу, забронировав билеты только на самолете и на машине.
Джузеппе Анджело Порчелли является главным специалистом по машинному обучению, архитектором решений для Amazon Web Services. Имея опыт разработки программного обеспечения в области машинного обучения в течение нескольких лет, он работает с клиентами любого размера, чтобы глубоко понять их бизнес и технические потребности и разработать решения для искусственного интеллекта и машинного обучения, которые наилучшим образом используют облако AWS и стек машинного обучения Amazon. Он работал над проектами в различных областях, включая MLOps, Computer Vision, NLP, а также с широким набором сервисов AWS. В свободное время Джузеппе любит играть в футбол.