Грызуны, такие как крысы и мыши, связаны с рядом рисков для здоровья и, как известно, являются переносчиками более 35 болезней. Выявление регионов с высокой активностью грызунов может помочь местным властям и организациям по борьбе с вредителями спланировать эффективное вмешательство и уничтожить грызунов.
В этом посте мы покажем, как отслеживать и визуализировать популяцию грызунов с помощью геопространственных возможностей Amazon SageMaker. Затем мы визуализируем воздействие заражения грызунами на растительность и водоемы. Наконец, мы сопоставляем и визуализируем количество зарегистрированных случаев оспы обезьян с наблюдениями за грызунами в регионе. Amazon SageMaker упрощает специалистам по обработке данных и инженерам по машинному обучению (МО) создание, обучение и развертывание моделей с использованием геопространственных данных. Инструмент упрощает доступ к источникам геопространственных данных, запускает специально созданные операции обработки, применяет предварительно обученные модели машинного обучения и использует встроенные инструменты визуализации быстрее и в нужном масштабе.
Блокнот
Сначала мы используем записную книжку Amazon SageMaker Studio с геопространственным изображением, выполнив действия, описанные в разделе Начало работы с геопространственными возможностями Amazon SageMaker.
Доступ к данным
Геопространственное изображение поставляется с предустановленными геопространственными возможностями SageMaker, которые упрощают обогащение данных для геопространственного анализа и машинного обучения. Для нашего поста мы используем спутниковые снимки Sentinel-2 и активность грызунов и набор данных по обезьяньей оспес из открытых источников открытые данные Нью-Йорка.
Во-первых, мы используем активность грызунов и извлекаем широту и долготу наблюдений и осмотров грызунов. Затем мы дополняем эту информацию о местоположении удобочитаемыми уличными адресами. Мы создаем задание векторного обогащения (VEJ) в блокноте SageMaker Studio для выполнения операции обратного геокодирования, чтобы можно было преобразовать географические координаты (широту, долготу) в удобочитаемые адреса с помощью Amazon Location Service. Мы создаем VEJ следующим образом:
Визуализация активности грызунов в регионе
Теперь мы можем использовать геопространственные возможности SageMaker для визуализации наблюдений за грызунами. После завершения VEJ мы экспортируем результат задания в корзину Amazon S3.
Когда экспорт будет завершен, вы увидите выходной CSV-файл в своей корзине Amazon Simple Storage Service (Amazon S3), который состоит из ваших входных данных (координаты долготы и широты) вместе с дополнительными столбцами: номер адреса, страна, ярлык, муниципалитет, район, почтовый индекс и регион этого местоположения, добавленные в конце.
Из выходного файла, сгенерированного VEJ, мы можем использовать геопространственные возможности SageMaker для наложения вывода на базовую карту и обеспечения многоуровневой визуализации для облегчения совместной работы. Геопространственные возможности SageMaker обеспечивают встроенный инструментарий визуализации на основе Номер-студио Foursquare, который по умолчанию работает из записной книжки SageMaker с помощью SDK для геопространственных карт SageMaker. Ниже мы можем визуализировать наблюдения грызунов, а также получить удобочитаемые адреса для каждой из точек данных. Информация об адресах каждой из точек наблюдения за грызунами может быть полезна для инспекции и лечения грызунов.
Анализ последствий заражения грызунами растительности и водоемов.
Чтобы проанализировать влияние заражения грызунами на растительность и водоемы, нам необходимо классифицировать каждое место как растительность, воду и голую землю. Давайте посмотрим, как мы можем использовать эти геопространственные возможности для выполнения этого анализа.
Новые геопространственные возможности в SageMaker упрощают доступ к геопространственным данным, таким как Sentinel-2 и Landsat 8. Встроенный доступ к наборам геопространственных данных экономит недели усилий, которые в противном случае были бы потрачены на сбор и обработку данных от различных поставщиков данных и поставщиков. Кроме того, эти геопространственные возможности предлагают предварительно обученную модель сегментации земельного покрова (LULC) для идентификации физического материала, такого как растительность, вода и голая земля, на поверхности земли.
Мы используем эту модель LULC ML для анализа воздействия популяции грызунов на растительность и водоемы.
В следующем фрагменте кода мы сначала определяем координаты области интереса (aoi_coords
) Нью-Йорка. Затем мы создаем задание по наблюдению за Землей (EOJ) и выбираем операцию LULC. SageMaker загружает и предварительно обрабатывает данные спутниковых изображений для EOJ. Затем SageMaker автоматически запускает вывод модели для EOJ. Время выполнения EOJ будет варьироваться от нескольких минут до часов в зависимости от количества обработанных изображений. Вы можете следить за состоянием EOJ, используя get_earth_observation_job
функцию и визуализировать ввод и вывод EOJ на карте.
Чтобы визуализировать популяцию грызунов по отношению к растительности, мы накладываем популяцию грызунов и данные наблюдений на прогнозы модели сегментации земного покрова. Эта визуализация может помочь нам найти популяцию грызунов и проанализировать ее на растительности и водоемах.
Визуализация случаев оспы обезьян и сопоставление с данными о грызунах
Чтобы визуализировать связь между случаями оспы обезьян и наблюдениями за грызунами, мы добавляем набор данных оспы обезьян и Файл geoJSON для границ района Нью-Йорка. См. следующий код:
В блокноте SageMaker Studio мы можем использовать инструмент визуализации на базе Foursquare для добавления слоев на карту и добавления диаграмм. Здесь мы добавили данные об обезьяньей оспе в виде диаграммы, чтобы показать количество случаев обезьяньей оспы в каждом из районов. Чтобы увидеть взаимосвязь между случаями оспы обезьян и наблюдениями за грызунами, мы добавили границы района в виде полигонального слоя и добавили слой тепловой карты, который представляет активность грызунов. Пограничный слой района окрашен в соответствии с диаграммой данных по оспе обезьян. Как мы видим, район Манхэттена демонстрирует высокую концентрацию наблюдений за грызунами и регистрирует наибольшее количество случаев оспы обезьян, за ним следует Бруклин.
Это подтверждается простым статистическим анализом расчета корреляции между концентрацией наблюдений за грызунами и случаями оспы обезьян в каждом районе. Расчет дал значение r 0,714, что подразумевает положительную корреляцию.
Заключение
В этом посте мы продемонстрировали, как вы можете использовать геопространственные возможности SageMaker для получения подробных адресов наблюдений грызунов и визуализации воздействия грызунов на растительность и водоемы. Это может помочь местным властям и организациям по борьбе с вредителями эффективно планировать мероприятия и уничтожать грызунов. Мы также сопоставили наблюдения грызунов со случаями оспы обезьян в этом районе с помощью встроенного инструмента визуализации. Используя векторное обогащение и EOJ вместе со встроенными инструментами визуализации, геопространственные возможности SageMaker устраняют проблемы обработки крупномасштабных наборов геопространственных данных, обучения моделей и логических выводов, а также обеспечивают возможность быстрого изучения прогнозов и геопространственных данных на интерактивной карте с использованием ускоренной 3D-графики и встроенных инструментов визуализации.
Вы можете начать работу с геопространственными возможностями SageMaker двумя способами:
Дополнительные сведения см. на страницах геопространственных возможностей Amazon SageMaker и Начало работы с геопространственными возможностями Amazon SageMaker. Также посетите наш репозиторий GitHubв котором есть несколько примеров записных книжек о геопространственных возможностях SageMaker.
Об авторах
Кролик Кошик является архитектором решений в AWS. Он увлечен созданием решений AI/ML и помогает клиентам внедрять инновации на платформе AWS. Вне работы он любит пешие прогулки, скалолазание и плавание.
Кларисса Вигаль — старший технический менеджер по работе с клиентами в AWS, который помогает клиентам ускорить переход к облачным технологиям. Вне работы Кларисса любит путешествовать, ходить в походы и читать научно-фантастические триллеры.
Веда Раман является старшим специалистом по разработке решений для машинного обучения из Мэриленда. Веда работает с клиентами, помогая им создавать эффективные, безопасные и масштабируемые приложения машинного обучения. Веда заинтересована в том, чтобы помочь клиентам использовать бессерверные технологии для машинного обучения.