Введение: новое определение искусства с помощью генеративного искусственного интеллекта
Новое определение искусства с помощью генеративного искусственного интеллекта. Когда фотография только зародилась, она не считалась формой искусства. Несмотря на то, что оно было быстро принято широкой публикой, оно воспринималось как механистический способ запечатлеть моменты из жизни. Это был вопрос технических способностей, а не искусства.
Читайте также: Иллюстратор на основе искусственного интеллекта рисует изображения с текстовыми подписями.
Несмотря на это, это изменило наши отношения с искусством, каким мы его знали. В результате это освободило художников от бремени точного воспроизведения реальности. Искусство позволило им свободно передвигаться в огромном скрытом пространстве, которое предлагает искусство. Возможно, им было бы уместно сосредоточиться на абстракции, на идеях живописи, чтобы передать чувства, которые фотографии не могут передать. Можно было нарушать правила и находить смысл в вопросах, существующих только внутри нас, нарушая правила и исследуя пределы возможного.
В результате фотография демократизировала доступ к картинам, позволив делать снимки реальности за считанные минуты, а не дни. В то же время это умаляло красоту рукотворных картин, по крайней мере, с точки зрения художника. Но технология всегда находит выход. Почти все сейчас согласны с цитатой «фотография – это искусство».
Читайте также: Искусственный интеллект и редактирование изображений.
Настало время искусственному интеллекту разрушить сферу визуального искусства. Искусственный интеллект также подтолкнет художников к переосмыслению своих отношений с искусством. Вместо того, чтобы конкурировать с этим, все дело в том, чтобы принять его. Вместе творчество и возможности искусственного интеллекта создадут совершенно новую форму искусства, которую мы раньше не видели.
Трансформация: от чтения искусства к его созданию.
До бума глубокого обучения в начале 2010-х годов компьютерное зрение было основной отраслью машинного обучения. Хотя язык взял верх, системы искусственного интеллекта продолжают совершенствовать свое восприятие мира.
Source: YouTube | WIRED
Генерированное искусство продвинулось за последнее десятилетие с помощью генеративных моделей, таких как GAN (генеративно-состязательные сети). В результате эти сети могут создавать изображения, напоминающие изображения в наборах данных, на которых они обучались. Художники и исследователи поняли, что могут использовать GAN для создания новых изображений. Тем не менее, им не удалось найти способ обусловить конечный результат моделей после улучшения архитектуры в попытке открыть новые формы искусства, генерируемого ИИ.
В 2021 году OpenAI представила свою модель CLIP, представляющую собой нейронную сеть, обученную на 400 миллионах пар изображение/текст.
В зависимости от изображения CLIP может выбрать текстовое описание, которое лучше всего описывает изображение. Выпустив веса, OpenAI предоставила художникам часть головоломки, которую им вскоре предстоит решить.
Исследователи Райан Мердок и Кэтрин Кроусон поняли, что могут использовать CLIP в качестве «рулевого колеса», которое будет направлять генеративные сети для создания изображений на основе заданных текстовых описаний.
Читайте также: Цифровая живопись, созданная искусственным интеллектом, от начала до конца
Он мог заставить модель найти изображение, которое лучше всего представляло бы визуальное значение короткого предложения, введя это короткое предложение в модель.
Объединив VQ-GAN — более мощную генеративную архитектуру, опубликованную в 2020 году и использующую свертки и преобразователи, — с CLIP, Кроусон опирался на работу Мердока. В отличие от модели BigGAN+CLIP, эта модель создает изображения с текстурой, почти осязаемой конкретностью.
Комбинация моделей GAN и CLIP была разработана Мердоком и Кроусоном как способ добраться до DALL*E (превосходного мультимодального ИИ для преобразования текста в изображение, исходный код которого OpenAI отказался открыть). Но как бы они ни старались, им не удалось сравниться с поразительной точностью результатов DALL*E.
VQGAN+CLIP нашел свое художественное состояние на полпути между неоригинальными результатами автономных генеративных сетей и буквальным сочетанием текста и изображения из DALL*E.
Читайте также: Кроссворды, созданные ИИ
Сообщество ИИ осознало, что это возможно, как только научилось это делать. Так родилась «новая арт-сцена». Было проведено экспериментирование с несколькими архитектурами GAN, а также с вариациями существующих. Прошло совсем немного времени, прежде чем люди поняли, что подсказка (так как они относятся к текстовому описанию) оказывает прямое влияние на конечный результат. Модель «понимает», чего вы пытаетесь достичь, исходя из того, что вы в нее пишете.
Люди начали создавать стили для своего художественного поколения, аналогично демонстрируя быстрые инженерные навыки.
Преимущество CLIP заключается в нулевой настройке, что является одним из его ключевых преимуществ. В результате ему не нужно видеть примеры пар текст-изображение, которые кто-то хочет обработать. Вы можете написать предложение и получить удивительно точные результаты.
Благодаря безупречному мастерству, быстрому проектированию и неограниченным возможностям VQGAN+CLIP, созданные искусственным интеллектом художественные инструменты заполонили Интернет. Особенно популярным примером является Dream, приложение для веб-браузера от Wombo, которое позволяет пользователям создавать бесконечное количество изображений из текстовых описаний.
Читайте также: Прогнозирование поиска с помощью ИИ для онлайн-словарей
Изображения CLIP можно рассматривать как отражение того, как он «видит» мир и как он «думает», что язык представляет наш визуальный мир. Результатом, без сомнения, является искусство.
Будущее искусства
Художники и фотографы теперь живут и работают вместе, создавая искусство, которое заставляет нас задуматься о красоте того и другого.
Читайте также: Умные кухни с искусственным интеллектом
Мы чувствуем, когда нас окружает искусство, независимо от его формы. Здесь также есть много места для новых элементов искусства, которые заставят нас испытать новые ощущения. Генеративное искусство искусственного интеллекта заполнит часть этого пространства. Они немного вытеснят уже существующие формы искусства в сторону новых творческих границ. Например, DALL*E или VQGAN+CLIP продолжат развиваться в весьма сложные художественные движки.