Улучшение модерации контента с помощью массового анализа Amazon Rekognition и выборочной модерации

Машинное обучение

Улучшение модерации контента с помощью массового анализа Amazon Rekognition и выборочной модерации | DeepTech

DEEPTECH

April 5, 2024

Amazon Rekognition упрощает добавление анализа изображений и видео в ваши приложения. Он основан на той же проверенной, высокомасштабируемой технологии глубокого обучения, разработанной учеными Amazon в области компьютерного зрения для ежедневного анализа миллиардов изображений и видео. Для его использования не требуются знания машинного обучения (ML), и мы постоянно добавляем в сервис новые функции компьютерного зрения. Amazon Rekognition включает простой и удобный API, который позволяет быстро анализировать любые изображения или видеофайлы, хранящиеся в Amazon Simple Storage Service (Amazon S3).

Клиенты в таких отраслях, как рекламные и маркетинговые технологии, игры, средства массовой информации, розничная торговля и электронная коммерция, полагаются на изображения, загружаемые их конечными пользователями (пользовательский контент или пользовательский контент), как на важнейший компонент для повышения вовлеченности на их платформе. Они используют модерацию контента Amazon Rekognition для обнаружения нежелательного, нежелательного и оскорбительного контента, чтобы защитить репутацию своего бренда и создать безопасные сообщества пользователей.

В этом посте мы обсудим следующее:

Модель модерации контента версии 7.0 и ее возможности
Как Amazon Rekognition Bulk Analysis работает для модерации контента
Как улучшить прогнозирование модерации контента с помощью массового анализа и выборочной модерации

Модель модерации контента версии 7.0 и ее возможности

В Amazon Rekognition Content Moderation версии 7.0 добавлено 26 новых меток модерации и расширена таксономия меток модерации с двухуровневой до трехуровневой категории меток. Эти новые ярлыки и расширенная таксономия позволяют клиентам определять детализированные концепции контента, который они хотят модерировать. Кроме того, обновленная модель предоставляет новую возможность идентифицировать два новых типа контента: анимированный и иллюстрированный. Это позволяет клиентам создавать детальные правила для включения или исключения таких типов контента из рабочего процесса модерации. Благодаря этим новым обновлениям клиенты могут более точно модерировать контент в соответствии со своей политикой в отношении контента.

Давайте рассмотрим пример обнаружения метки модерации для следующего изображения.

В следующей таблице показаны метки модерации, тип контента и оценки достоверности, возвращаемые в ответе API.

Ярлыки модерации	Уровень таксономии	Оценка уверенности
Насилие	Л1	92,6%
Сцены насилия	Л2	92,6%
Взрывы и взрывы	Л3	92,6%

Типы контента	Оценка уверенности
Иллюстрированный	93,9%

Чтобы получить полную таксономию для модерации контента версии 7.0, посетите наше руководство для разработчиков.

Массовый анализ для модерации контента

Amazon Rekognition Content Moderation также обеспечивает пакетную модерацию изображений в дополнение к модерации в реальном времени с использованием Amazon Rekognition Bulk Analysis. Он позволяет асинхронно анализировать большие коллекции изображений для обнаружения нежелательного контента и получения информации о категориях модерации, назначенных изображениям. Это также устраняет необходимость в создании решения для пакетной модерации изображений для клиентов.

Доступ к функции массового анализа можно получить либо через консоль Amazon Rekognition, либо путем вызова API напрямую с помощью AWS CLI и AWS SDK. На консоли Amazon Rekognition вы можете загрузить изображения, которые хотите проанализировать, и получить результаты несколькими щелчками мыши. После завершения задания массового анализа вы сможете определить и просмотреть прогнозы по меткам модерации, такие как «Явная», «Неявная нагота интимных частей и поцелуи», «Насилие», «Наркотики и табак» и т. д. Вы также получаете оценку достоверности для каждой категории меток.

Создайте задание массового анализа в консоли Amazon Rekognition.

Выполните следующие шаги, чтобы попробовать массовый анализ Amazon Rekognition:

В консоли Amazon Rekognition выберите Массовый анализ в панели навигации.
Выбирать Начать массовый анализ.
Введите имя задания и укажите изображения для анализа, указав местоположение корзины S3 или загрузив изображения со своего компьютера.
При желании вы можете выбрать адаптер для анализа изображений с помощью специального адаптера, который вы обучили с помощью пользовательской модерации.
Выбирать Начать анализ чтобы выполнить задание.

Когда процесс завершится, вы сможете увидеть результаты в консоли Amazon Rekognition. Кроме того, копия результатов анализа в формате JSON будет храниться в выходном месте Amazon S3.

Запрос API массового анализа Amazon Rekognition

В этом разделе мы покажем вам, как создать задание массового анализа для модерации изображений с использованием программных интерфейсов. Если ваши файлы изображений еще не находятся в корзине S3, загрузите их, чтобы обеспечить доступ Amazon Rekognition. Подобно созданию задания массового анализа в консоли Amazon Rekognition, при вызове API StartMediaAnalysisJob необходимо указать следующие параметры:

Конфигурация операций – Это параметры конфигурации для создаваемого задания анализа мультимедиа:
- Минимальная уверенность – Минимальный уровень достоверности в допустимом диапазоне 0–100 для возврата меток модерации. Amazon Rekognition не возвращает метки с уровнем достоверности ниже указанного значения.
Вход – Сюда входит следующее:
- S3Объект – Информация об объекте S3 для входного файла манифеста, включая сегмент и имя файла. Входной файл включает строки JSON для каждого изображения, хранящегося в корзине S3. например: {"source-ref": "s3://MY-INPUT-BUCKET/1.jpg"}
Выходная конфигурация – Сюда входит следующее:
- S3Ведро – Имя корзины S3 для выходных файлов.
- S3KeyПрефикс – Ключевой префикс для выходных файлов.

См. следующий код:

import boto3
import os
import datetime
import time
import json
import uuid

region = boto3.session.Session().region_name
s3=boto3.client('s3')
rekognition_client=boto3.client('rekognition', region_name=region)

min_confidence = 50
input_bucket = "MY-INPUT-BUCKET"

input_file = "input_file.jsonl"
output_bucket = "MY-OUTPUT-BUCKET"
key_prefix = "moderation-results"
job_name = "bulk-analysis-demo"

job_start_response = rekognition_client.start_media_analysis_job(
    OperationsConfig={"DetectModerationLabels": {"MinConfidence": min_confidence}},
    JobName = job_name,
    Input={"S3Object": {"Bucket": input_bucket, "Name": input_file}},
    OutputConfig={"S3Bucket": output_bucket, "S3KeyPrefix": key_prefix},
)

job_id = job_start_response("JobId")
max_tries = 60
while max_tries > 0:
    max_tries -= 1
    job = rekognition_client.get_media_analysis_job(JobId=job_id)
    job_status = job("Status")
    if job_status in ("SUCCEEDED", "FAILED"):
        print(f"Job {job_name} is {job_status}.")
        if job_status == "SUCCEEDED":
            print(
                f"Bulk Analysis output file copied to:\n"
                f"\tBucket: {job('Results')('S3Object')('Bucket')}\n"
                f"\tObject: {job('Results')('S3Object')('Name')}."
            )
        break
    else:
        print(f"Waiting for {job_name}. Current status is {job_status}.")
    time.sleep(10)

Вы можете вызвать тот же анализ мультимедиа, используя следующую команду AWS CLI:

aws rekognition start-media-analysis-job \
--operations-config "DetectModerationLabels={MinConfidence="50"}" \
--input "S3Object={Bucket=input_bucket,Name=input_file.jsonl}" \
--output-config "S3Bucket=output_bucket,S3KeyPrefix=moderation-results"

Результаты API массового анализа Amazon Rekognition

Чтобы получить список заданий массового анализа, вы можете использовать ListMediaAnalysisJobs. Ответ включает в себя всю информацию о входных и выходных файлах задания анализа, а также о статусе задания:

# get the latest 10 media analysis jobs
moderation_job_list = rekognition_client.list_media_analysis_jobs(MaxResults=10, NextToken="")
for job_result in moderation_job_list("MediaAnalysisJobs"):
 print(f'JobId: {job_result("JobId")} ,Status: {job_result("Status")},\n\
Summary: {job_result("ManifestSummary")("S3Object")("Name")}, \n\
Result: {job_result("Results")("S3Object")("Name")}\n')

Вы также можете вызвать list-media-analysis-jobs команда через AWS CLI:

aws rekognition list-media-analysis-jobs --max-results 10

Amazon Rekognition Bulk Analysis создает два выходных файла в выходной корзине. Первый файл manifest-summary.jsonкоторый включает статистику заданий массового анализа и список ошибок:

{
    "version": "1.0",
    "statistics": {
      "total-json-lines": 2,
      "valid-json-lines": 2,
      "invalid-json-lines": 0
    },
    "errors": ()
 }

Второй файл results.json, который включает одну строку JSON для каждого анализируемого изображения в следующем формате. Каждый результат включает категорию верхнего уровня (L1) обнаруженной метки и категорию второго уровня метки (L2) с оценкой достоверности от 1 до 100. Некоторые метки уровня таксономии 2 могут иметь метки уровня таксономии 3 (L3). Это позволяет иерархически классифицировать контент.

{
  "source-ref": "s3://MY-INPUT-BUCKET/1.jpg",
    "detect-moderation-labels": {
    "ModerationLabels": (
      {
        "ParentName": "Products",
        "TaxonomyLevel": 3,
        "Confidence": 91.9385,
        "Name": "Pills"
      },
      {
        "ParentName": "Drugs & Tobacco",
        "TaxonomyLevel": 2,
        "Confidence": 91.9385,
        "Name": "Products"
      },
      {
        "ParentName": "",
        "TaxonomyLevel": 1,
        "Confidence": 91.9385,
        "Name": "Drugs & Tobacco"
      }
    ),
    "ModerationModelVersion": "7.0",
    "ContentTypes": (
      
    )
  }
}

Улучшение прогнозирования модели модерации контента с помощью массового анализа и выборочной модерации.

Вы можете повысить точность базовой модели модерации контента с помощью функции пользовательской модерации. С помощью пользовательской модерации вы можете обучить адаптер пользовательской модерации, загружая свои изображения и комментируя эти изображения. Адаптеры — это модульные компоненты, которые могут расширить и улучшить возможности модели глубокого обучения Amazon Rekognition. Чтобы легко комментировать изображения, вы можете просто проверить прогнозы вашего задания по массовому анализу для обучения специального адаптера. Чтобы проверить результаты прогноза, выполните следующие действия:

В консоли Amazon Rekognition выберите Массовый анализ в панели навигации.
Выберите задание массового анализа, затем выберите Проверьте прогнозы.

На Проверить прогноз На странице вы можете увидеть все изображения, оцененные в этом задании, и прогнозируемые метки.

Выберите метку каждого изображения как присутствующую (флажок), чтобы подтвердить истинность положительного результата; или пометить как несуществующую (метка X), чтобы сделать недействительной каждую назначенную метку (т. е. предсказание метки является ложным срабатыванием).
Если изображению не назначена соответствующая метка (т. е. «Ложно-отрицательный»), вы также можете выбрать и присвоить изображению правильные метки.

На основании вашей проверки ложноположительные и ложноотрицательные результаты будут обновлены в статистике проверки. Вы можете использовать эти проверки для обучения адаптера пользовательской модерации, который позволяет повысить точность прогнозов модерации контента.

В качестве предварительного условия для обучения пользовательского адаптера модерации необходимо проверить не менее 20 ложных срабатываний или 50 ложных отрицательных результатов для каждой метки модерации, которую вы хотите улучшить. После того как вы подтвердите 20 ложноположительных или 50 ложноотрицательных результатов, вы сможете выбрать Обучение адаптера.

Вы можете использовать адаптеры пользовательской модерации позже для анализа изображений, просто выбрав пользовательский адаптер при создании нового задания массового анализа или через API, передав уникальный идентификатор адаптера пользовательского адаптера.

Краткое содержание

В этом посте мы представили обзор модерации контента версии 7.0, массового анализа для модерации контента, а также того, как улучшить прогнозы модерации контента с помощью массового анализа и выборочной модерации. Чтобы опробовать новые метки модерации и массовый анализ, войдите в свою учетную запись AWS и откройте консоль Amazon Rekognition для модерации изображений и массового анализа.

Об авторах

Мехди Хаги — старший архитектор решений в команде AWS WWCS, специализирующийся на искусственном интеллекте и машинном обучении на AWS. Он работает с корпоративными клиентами, помогая им мигрировать, модернизировать и оптимизировать рабочие нагрузки для облака AWS. В свободное время он любит готовить персидскую еду и мастерить электронику.

Шипра Канория является главным менеджером по продукту в AWS. Она с энтузиазмом помогает клиентам решать их самые сложные проблемы с помощью машинного обучения и искусственного интеллекта. Прежде чем присоединиться к AWS, Шипра более 4 лет проработала в Amazon Alexa, где запустила множество функций, связанных с производительностью, в голосовом помощнике Alexa.

Мария Хандоко — старший менеджер по продукту в AWS. Она фокусируется на том, чтобы помогать клиентам решать их бизнес-задачи с помощью машинного обучения и компьютерного зрения. В свободное время она любит ходить в походы, слушать подкасты и изучать разные кухни.