Amazon Rekognition упрощает добавление анализа изображений и видео в ваши приложения. Он основан на той же проверенной, высокомасштабируемой технологии глубокого обучения, разработанной учеными Amazon в области компьютерного зрения для ежедневного анализа миллиардов изображений и видео. Для его использования не требуются знания машинного обучения (ML), и мы постоянно добавляем в сервис новые функции компьютерного зрения. Amazon Rekognition включает простой и удобный API, который позволяет быстро анализировать любые изображения или видеофайлы, хранящиеся в Amazon Simple Storage Service (Amazon S3).
Клиенты в таких отраслях, как рекламные и маркетинговые технологии, игры, средства массовой информации, розничная торговля и электронная коммерция, полагаются на изображения, загружаемые их конечными пользователями (пользовательский контент или пользовательский контент), как на важнейший компонент для повышения вовлеченности на их платформе. Они используют модерацию контента Amazon Rekognition для обнаружения нежелательного, нежелательного и оскорбительного контента, чтобы защитить репутацию своего бренда и создать безопасные сообщества пользователей.
В этом посте мы обсудим следующее:
- Модель модерации контента версии 7.0 и ее возможности
- Как Amazon Rekognition Bulk Analysis работает для модерации контента
- Как улучшить прогнозирование модерации контента с помощью массового анализа и выборочной модерации
Модель модерации контента версии 7.0 и ее возможности
В Amazon Rekognition Content Moderation версии 7.0 добавлено 26 новых меток модерации и расширена таксономия меток модерации с двухуровневой до трехуровневой категории меток. Эти новые ярлыки и расширенная таксономия позволяют клиентам определять детализированные концепции контента, который они хотят модерировать. Кроме того, обновленная модель предоставляет новую возможность идентифицировать два новых типа контента: анимированный и иллюстрированный. Это позволяет клиентам создавать детальные правила для включения или исключения таких типов контента из рабочего процесса модерации. Благодаря этим новым обновлениям клиенты могут более точно модерировать контент в соответствии со своей политикой в отношении контента.
Давайте рассмотрим пример обнаружения метки модерации для следующего изображения.
В следующей таблице показаны метки модерации, тип контента и оценки достоверности, возвращаемые в ответе API.
Ярлыки модерации | Уровень таксономии | Оценка уверенности |
Насилие | Л1 | 92,6% |
Сцены насилия | Л2 | 92,6% |
Взрывы и взрывы | Л3 | 92,6% |
Типы контента | Оценка уверенности |
Иллюстрированный | 93,9% |
Чтобы получить полную таксономию для модерации контента версии 7.0, посетите наше руководство для разработчиков.
Массовый анализ для модерации контента
Amazon Rekognition Content Moderation также обеспечивает пакетную модерацию изображений в дополнение к модерации в реальном времени с использованием Amazon Rekognition Bulk Analysis. Он позволяет асинхронно анализировать большие коллекции изображений для обнаружения нежелательного контента и получения информации о категориях модерации, назначенных изображениям. Это также устраняет необходимость в создании решения для пакетной модерации изображений для клиентов.
Доступ к функции массового анализа можно получить либо через консоль Amazon Rekognition, либо путем вызова API напрямую с помощью AWS CLI и AWS SDK. На консоли Amazon Rekognition вы можете загрузить изображения, которые хотите проанализировать, и получить результаты несколькими щелчками мыши. После завершения задания массового анализа вы сможете определить и просмотреть прогнозы по меткам модерации, такие как «Явная», «Неявная нагота интимных частей и поцелуи», «Насилие», «Наркотики и табак» и т. д. Вы также получаете оценку достоверности для каждой категории меток.
Создайте задание массового анализа в консоли Amazon Rekognition.
Выполните следующие шаги, чтобы попробовать массовый анализ Amazon Rekognition:
- В консоли Amazon Rekognition выберите Массовый анализ в панели навигации.
- Выбирать Начать массовый анализ.
- Введите имя задания и укажите изображения для анализа, указав местоположение корзины S3 или загрузив изображения со своего компьютера.
- При желании вы можете выбрать адаптер для анализа изображений с помощью специального адаптера, который вы обучили с помощью пользовательской модерации.
- Выбирать Начать анализ чтобы выполнить задание.
Когда процесс завершится, вы сможете увидеть результаты в консоли Amazon Rekognition. Кроме того, копия результатов анализа в формате JSON будет храниться в выходном месте Amazon S3.
Запрос API массового анализа Amazon Rekognition
В этом разделе мы покажем вам, как создать задание массового анализа для модерации изображений с использованием программных интерфейсов. Если ваши файлы изображений еще не находятся в корзине S3, загрузите их, чтобы обеспечить доступ Amazon Rekognition. Подобно созданию задания массового анализа в консоли Amazon Rekognition, при вызове API StartMediaAnalysisJob необходимо указать следующие параметры:
- Конфигурация операций – Это параметры конфигурации для создаваемого задания анализа мультимедиа:
- Минимальная уверенность – Минимальный уровень достоверности в допустимом диапазоне 0–100 для возврата меток модерации. Amazon Rekognition не возвращает метки с уровнем достоверности ниже указанного значения.
- Вход – Сюда входит следующее:
- S3Объект – Информация об объекте S3 для входного файла манифеста, включая сегмент и имя файла. Входной файл включает строки JSON для каждого изображения, хранящегося в корзине S3. например:
{"source-ref": "s3://MY-INPUT-BUCKET/1.jpg"}
- S3Объект – Информация об объекте S3 для входного файла манифеста, включая сегмент и имя файла. Входной файл включает строки JSON для каждого изображения, хранящегося в корзине S3. например:
- Выходная конфигурация – Сюда входит следующее:
- S3Ведро – Имя корзины S3 для выходных файлов.
- S3KeyПрефикс – Ключевой префикс для выходных файлов.
См. следующий код:
Вы можете вызвать тот же анализ мультимедиа, используя следующую команду AWS CLI:
Результаты API массового анализа Amazon Rekognition
Чтобы получить список заданий массового анализа, вы можете использовать ListMediaAnalysisJobs
. Ответ включает в себя всю информацию о входных и выходных файлах задания анализа, а также о статусе задания:
Вы также можете вызвать list-media-analysis-jobs
команда через AWS CLI:
Amazon Rekognition Bulk Analysis создает два выходных файла в выходной корзине. Первый файл manifest-summary.json
который включает статистику заданий массового анализа и список ошибок:
Второй файл results.json
, который включает одну строку JSON для каждого анализируемого изображения в следующем формате. Каждый результат включает категорию верхнего уровня (L1) обнаруженной метки и категорию второго уровня метки (L2) с оценкой достоверности от 1 до 100. Некоторые метки уровня таксономии 2 могут иметь метки уровня таксономии 3 (L3). Это позволяет иерархически классифицировать контент.
Вы можете использовать адаптеры пользовательской модерации позже для анализа изображений, просто выбрав пользовательский адаптер при создании нового задания массового анализа или через API, передав уникальный идентификатор адаптера пользовательского адаптера.
Краткое содержание
В этом посте мы представили обзор модерации контента версии 7.0, массового анализа для модерации контента, а также того, как улучшить прогнозы модерации контента с помощью массового анализа и выборочной модерации. Чтобы опробовать новые метки модерации и массовый анализ, войдите в свою учетную запись AWS и откройте консоль Amazon Rekognition для модерации изображений и массового анализа.
Об авторах
Мехди Хаги — старший архитектор решений в команде AWS WWCS, специализирующийся на искусственном интеллекте и машинном обучении на AWS. Он работает с корпоративными клиентами, помогая им мигрировать, модернизировать и оптимизировать рабочие нагрузки для облака AWS. В свободное время он любит готовить персидскую еду и мастерить электронику.
Шипра Канория является главным менеджером по продукту в AWS. Она с энтузиазмом помогает клиентам решать их самые сложные проблемы с помощью машинного обучения и искусственного интеллекта. Прежде чем присоединиться к AWS, Шипра более 4 лет проработала в Amazon Alexa, где запустила множество функций, связанных с производительностью, в голосовом помощнике Alexa.
Мария Хандоко — старший менеджер по продукту в AWS. Она фокусируется на том, чтобы помогать клиентам решать их бизнес-задачи с помощью машинного обучения и компьютерного зрения. В свободное время она любит ходить в походы, слушать подкасты и изучать разные кухни.