Я провел последние восемь лет, работая с ИИ, изучая все тонкости создания и применения ИИ-решений в бизнесе. Совершив бесчисленное количество ошибок, я создал свой собственный метод построения и применения технологии.
Это было прекрасно до осени 2022 года, когда был выпущен ChatGPT, который внезапно повысил полезность и внедрение генеративного ИИ. Для моего консалтингового бизнеса TodAI это означало множество новых проектов, связанных с генеративным ИИ, и много знаний. После нескольких проектов я определил места, где генеративные модели явно отличаются от других ИИ при их применении в бизнесе. Одни маленькие, а другие очень значительные.
Как эти новые модели генеративного ИИ меняют правила игры для прикладного ИИ?
Терминология
Изменения легче обсуждать, если мы различаем генеративный ИИ и прогнозирующий ИИ.
Генеративный ИИ относится к большим предварительно обученным моделям, которые выводят тексты, изображения или звуки из пользовательских подсказок. Результат (потенциально) уникален и имитирует контент, созданный человеком. Он основан на подсказке и данных, используемых для обучения большой предварительно обученной модели. Модели генерации текста, такие как GPT OpenAI или Bard Google, также известны как большие языковые модели (LLM).
Прогнозирующий ИИ включает модели, которые выводят одну или несколько меток (прогноз или классификация) или числа (регрессия или временные ряды). Оно включает:
● Строительные блоки изображения: классификация изображений, обнаружение объектов и сегментация изображений.
● Строительные блоки в виде таблиц: предсказание, регрессия и прогноз.
● Стандартные блоки текста: классификация текста, распознавание именованных сущностей и анализ намерений.
Альтернативное и более точное название прогнозирующего ИИ в академическом смысле — дискриминационный ИИ. Тем не менее, я использую «прогностический», так как он может лучше подойти большинству людей.
Генеративный ИИ также может предсказывать
Генеративный ИИ (такой как GPT) также можно использовать для решения задач прогнозирования. ChatGPT может научиться классифицировать тексты с помощью нескольких примеров (обучение с несколькими выстрелами) или вообще без примеров (обучение с нулевым выстрелом). Функциональность может быть такой же, но есть техническая разница. Генеративный ИИ не требует, чтобы вы обучали алгоритм, который создает модель, которую затем можно классифицировать. Вместо этого генеративная модель получает примеры как часть подсказки.
Преимущество использования генеративных моделей для задач прогнозирования заключается в том, что их можно реализовать немедленно. Однако есть и минусы, такие как:
● невозможно рассчитать ожидаемую производительность с помощью (например, показателей точности)
● генеративная модель может предоставлять выходные данные, не входящие в список предоставленных меток.
● каждый запрос на вывод может повлиять на будущий вывод
● генеративные модели, как правило, «забывают» исходные примеры, поскольку у них есть ограничение на количество подсказок, которые они могут запомнить.
Узнать, насколько хорошо работает решение ИИ, сложнее и требует больше времени.
Хорошее эмпирическое правило заключается в том, что если вы не можете добиться приемлемой точности вашей модели в течение 24 часов работы, у вас либо неправильные данные, либо неправильный масштаб.
Например, модель, предсказывающая цены на жилье с точностью 50 % после 24 часов работы по моделированию, никогда не будет иметь точность более 60 % или 65 %, независимо от того, какой умный алгоритм или тонкую настройку вы применяете. Если 60 % недостаточно для вашего бизнес-кейса, вам нужно получить больше, другие или более качественные данные или изменить сферу деятельности.
Соблюдение правила 24-х часов означает, что решения ИИ, которые никогда не будут работать, обнаруживаются на ранней стадии, очищаются или переопределяются. Правило 24-х часов спасло меня от бесчисленных досадных неудач, и оно работает, поскольку точность является отличным показателем (хотя и не равным) ожидаемой ценности для бизнеса.
Но это правило больше не помогает в генеративном ИИ, поскольку во время разработки нет измерений точности. Например, если ваш бизнес-кейс заключается в создании электронных писем о продажах для группы торговых представителей, вы не можете измерить «точность» вывода. Бизнес-результаты, которых вы пытаетесь достичь, могут заключаться в более быстром общении с клиентами (благодаря скорости написания) или увеличении продаж (благодаря более качественным электронным письмам). Эти результаты трудно измерить во время разработки. Скорость письма, в частности, сложно измерить, так как результат должен проверяться и редактироваться торговым представителем, а для проверки этой скорости требуется участие торгового представителя.
Генеративный ИИ требует более тесного сотрудничества экспертов в предметной области
Результатом этой задачи является то, что эксперты в предметной области должны быть тесно вовлечены в процесс разработки, чтобы помочь скорректировать результат и измерить влияние на бизнес-результат, которого вы пытаетесь достичь. Дни, когда вы могли полагаться только на обучение и тонкую настройку специалиста по данным, пока удовлетворительное решение не будет готово, прошли.
Выбор вариантов использования должен основываться на простоте тестирования.
Полезное руководство Деллуайта по генеративному ИИ предполагает, что варианты использования генеративного ИИ должны основываться на усилиях, необходимых для проверки вывода, и усилиях, которые потребовались бы человеку для создания того же контента.