Новая модель Gemini от Google Deepmind выглядит потрясающе, но может сигнализировать о пике ажиотажа вокруг искусственного интеллекта

Нейронные сети

Новая модель Gemini от Google Deepmind выглядит потрясающе, но может сигнализировать о пике ажиотажа вокруг искусственного интеллекта | DeepTech

DEEPTECH

December 6, 2023

Новая модель Gemini от Google Deepmind выглядит потрясающе, но может сигнализировать о пике ажиотажа вокруг искусственного интеллекта
| DeepTech

«Эта модель изначально более эффективна», — сказал MIT Technology Review Сундар Пичаи, генеральный директор Google и ее материнской компании Alphabet. «Это платформа. ИИ — это глубокий сдвиг в платформе, больший, чем в Интернете или мобильных устройствах. И поэтому для нас это большой шаг».

Это большой шаг для Google, но не обязательно гигантский скачок вперед для отрасли в целом. Google DeepMind утверждает, что Gemini превосходит GPT-4 по 30 из 32 стандартных показателей производительности. И все же грань между ними тонка. DeepMind объединил лучшие текущие возможности ИИ в один мощный пакет. Судя по демо-версиям, многие вещи он делает очень хорошо, но мало вещей, которых мы раньше не видели. Несмотря на всю шумиху вокруг следующего большого проекта, Gemini может стать признаком того, что мы достигли пика ажиотажа вокруг ИИ. По крайней мере на данный момент.

Чираг Шах, профессор Вашингтонского университета, специализирующийся на онлайн-поиске, сравнивает запуск с выпуском Apple нового iPhone каждый год. «Может быть, сейчас мы просто подошли к другому порогу, и это не впечатляет нас так сильно, потому что мы только что видели так много», – говорит он.

Как и GPT-4, Gemini является мультимодальным, то есть он обучен обрабатывать несколько видов ввода: текст, изображения, аудио. Он может комбинировать эти разные форматы, чтобы отвечать на вопросы обо всем: от домашних дел до математики в колледже и экономики.

Вчера в демонстрации для журналистов Google продемонстрировал способность Gemini делать скриншот существующей диаграммы, анализировать сотни страниц исследований с новыми данными, а затем обновлять диаграмму этой новой информацией. В другом примере Близнецам показывают фотографии готовящегося на сковороде омлета и спрашивают (с помощью речи, а не текста), готов ли омлет. «Оно не готово, потому что яйца еще жидкие», — отвечает он.

Однако большинству людей придется подождать полного опыта. Выпущенная сегодня версия представляет собой серверную часть Bard, текстового поискового чат-бота Google, который, по словам компании, предоставит ему более продвинутые возможности рассуждения, планирования и понимания. Полный выпуск Gemini будет перенесен в ближайшие месяцы. Новый Bard с поддержкой Gemini изначально будет доступен на английском языке в более чем 170 странах, не включая ЕС и Великобританию. Это позволит компании «взаимодействовать» с местными регулирующими органами, говорит Сисси Сяо, вице-президент Google, отвечающий за Bard.

Gemini также выпускается в трех размерах: Ultra, Pro и Nano. Ultra — полнофункциональная версия; Pro и Nano предназначены для приложений, работающих с более ограниченными вычислительными ресурсами. Nano предназначен для работы на таких устройствах, как новые телефоны Google Pixel. Разработчики и предприятия смогут получить доступ к Gemini Pro начиная с 13 декабря. Gemini Ultra, самая мощная модель, будет доступна «в начале следующего года» после «обширных проверок доверия и безопасности», сообщили журналистам руководители Google во время пресс-конференции.

«Я думаю об этом как о эпохе моделей Близнецов», — сказал нам Пичаи. «Вот как Google DeepMind собирается строить и добиваться прогресса в области искусственного интеллекта. Так что это всегда будет представлять собой границу нашего прогресса в области технологий искусственного интеллекта».

LEAVE A REPLY Cancel reply