Введение: что такое Argmax в машинном обучении?
В прикладном машинном обучении вы можете встретить Argmax как математическую функцию. При описании алгоритмов в исследовательских работах вы можете встретить такие термины, как «argmax» или «argmax». Реализация вашего алгоритма также может включать использование функции argmax.
Читайте также: Что такое встраивание слов?
Возможно, вы не знакомы с функцией argmax и вам интересно, что это такое и как она работает.
- Используя Argmax, вы можете определить, какой аргумент дает наибольшее значение целевой функции.
- В машинном обучении argmax обычно используется для поиска класса с наибольшей прогнозируемой вероятностью.
- На практике функция argmax() NumPy предпочтительнее реализации argmax вручную. Библиотека NumPy также является предпочтительной частью вашего проекта.
Читайте также: Лучшие наборы данных и инструменты для текстовых аннотаций для компьютерного зрения, на которые стоит обратить внимание в 2022 году.
Что такое Аргмакс?
Функция argmax — это математическая функция. Обычно это применяется к функциям, принимающим аргументы. Например, для функции g(), принимающей аргумент x, операция argmax этой функции будет следующей:
argmax возвращает аргумент или аргументы (arg) целевой функции, которые возвращают максимальное значение (max) из целевой функции.
Source: YouTube
Например, если g(x) рассчитывается как квадрат значения x, а x ограничено целыми числами от 1 до 5:
- г(1) = 1^2 = 1
- г(2) = 2^2 = 4
- г(3) = 3^2 = 9
- г(4) = 4^2 = 16
- г(5) = 5^2 = 25
Мы можем интуитивно видеть, что argmax для функции г(х) это 5.
То есть число (5) функции g(x), которое дает наибольшее значение, равно 25. Argmax — это сокращение для указания этого параметра абстрактным способом без необходимости знать, каково его значение в конкретном случае.
Обратите внимание, что это не Макс() значений, возвращаемых функцией. Это будет 25.
Это также не max() аргументов, хотя в этом случае argmax и max аргументов одинаковы, например, 5. argmax() для 5 обусловлен тем, что g возвращает наибольшее значение (25), когда 5 равно 5. при условии, а не потому, что 5 — самый большой аргумент.
Обычно «аргументмакс» пишется двумя отдельными словами, например «аргумент макс.«. Например:
Функция arg max также часто используется как операция без скобок, заключающих целевую функцию. Таким образом, операция часто записывается и используется в исследовательской работе или учебнике. Например:
Вы также можете использовать argmin или «arg min», чтобы найти аргументы целевой функции, которые приводят к минимальному значению целевой функции.
В этом упражнении важны значения вероятности.
Читайте также: Как правильно маркировать изображения для ИИ: 5 основных проблем и amp; Лучшие практики.
Как Argmax используется в машинном обучении?
В математике и машинном обучении широко используется функция argmax. Тем не менее вам может потребоваться реализовать argmax самостоятельно в некоторых случаях, когда argmax используется в прикладном машинном обучении.
Применяя машинное обучение, вы, скорее всего, столкнетесь с необходимостью использовать argmax, чтобы найти индекс массива, который дает наибольшее значение. Напомним, что массив — это список или вектор чисел.
Модель многоклассовой классификации прогнозирует вектор вероятностей (или вероятностно-подобных значений) с одной вероятностью для каждой метки класса. Вероятности представляют собой вероятность того, что образец принадлежит каждой метке класса.
Прогнозируемые вероятности сгруппированы таким образом, что прогнозируемые вероятности с индексом 0 принадлежат первому классу, прогнозируемые вероятности с индексом 1 принадлежат второму классу и т.д. Часто необходимо сделать прогноз одной метки класса для задачи классификации нескольких классов на основе набора прогнозируемых вероятностей.
Чаще всего его описывают и реализуют с помощью функции argmax и значений argmax, которая преобразует вектор прогнозируемых вероятностей в метку класса.
Давайте конкретизируем это на примере.
Рассмотрим задачу многоклассовой классификации с тремя классами: «красный“, “синий,” и “зеленый». Метки классов сопоставляются с целочисленными значениями для моделирования следующим образом:
Целочисленные значения меток каждого класса сопоставляются с индексом трехэлементного вектора, который может быть предсказан с помощью модели, определяющей вероятность того, что пример принадлежит каждому классу.
Предположим, что модель сделала один прогноз для входной выборки и спрогнозировала следующий вектор вероятностей в числовых значениях в формате массива или массиве индексов: пожалуйста, не используйте огромный массив.
Мы видим, что пример имеет 40-процентную вероятность принадлежности к красному цвету, 50-процентную вероятность принадлежности к синему и 10-процентную вероятность принадлежности к зеленому.
Мы можем применить функцию argmax к вектору вероятностей. Вектор — это функция, выходные данные функции — вероятности, а входные данные функции — индекс элемента вектора или индекс массива.
Мы можем интуитивно видеть, что в этом случае argmax вектора предсказанных вероятностей (yhat) равен 1, поскольку вероятность в индексе массива 1 является наибольшим значением.
Обратите внимание, что это не max() вероятностей, который будет равен 0,5. Также обратите внимание, что это не максимальное значение аргументов, которое равно 2. Вместо этого это аргумент, который дает максимальное значение, например 1, что дает 0,5.
Затем мы можем сопоставить это целочисленное значение обратно с меткой класса, которая будет выглядеть так: «синий».
- arg max yhat = «синий»
Читайте также: Как повысить культуру программирования в командах?
Заключение:
- Argmax определяет лучший аргумент целевой функции, который дает максимальное значение.
- В машинном обучении Argmax обычно используется для поиска класса с наибольшей прогнозируемой вероятностью.
- Argmax можно реализовать вручную, но на практике предпочтительнее использовать функцию argmax() NumPy.
- Сообщество разработчиков, которым нравится работать с argmax.
- Требуется дополнительное чтение по следующим темам.
- функция стоимости
- доменная функция
- экспоненциальная функция
- функция определения
- функция обучения с подкреплением
- функциональные выходы
- Синтаксис функции
- значения функций
- непрерывная действительная функция
- общие функции сокращения
- обработка изображений нейронной сетью
- предсказание нейронной сети
- обычная операция сокращения
- математическая операция