Представляем три новых экземпляра Amazon EC2 на базе графического процессора NVIDIA

Машинное обучение

Представляем три новых экземпляра Amazon EC2 на базе графического процессора NVIDIA | DeepTech

DEEPTECH

November 28, 2023

Портфолио ускоренных вычислений Amazon Elastic Compute Cloud (Amazon EC2) предлагает широчайший выбор ускорителей для поддержки рабочих нагрузок искусственного интеллекта (ИИ), машинного обучения (ML), графики и высокопроизводительных вычислений (HPC). Мы рады объявить о расширении этого портфеля тремя новыми инстансами с новейшими графическими процессорами NVIDIA: инстансами Amazon EC2 P5e с графическими процессорами NVIDIA H200, инстансами Amazon EC2 G6 с графическими процессорами NVIDIA L4 и инстансами Amazon EC2 G6e с графическими процессорами NVIDIA L40S. Все три экземпляра будут доступны в 2024 году, и мы с нетерпением ждем возможности увидеть, что вы сможете с ними сделать.

AWS и NVIDIA сотрудничают более 13 лет и стали пионерами крупномасштабных, высокопроизводительных и экономичных решений на базе графических процессоров для разработчиков и предприятий по всему спектру. Мы объединили мощные графические процессоры NVIDIA с дифференцированными технологиями AWS, такими как система AWS Nitro, сеть Elastic Fabric Adaptor (EFA) v2 со скоростью 3200 Гбит/с, пропускную способность в сотни ГБ/с с Amazon FSx для Lustre и эксамасштабные вычисления с Amazon EC2 UltraClusters, чтобы предоставить наиболее производительную инфраструктуру для искусственного интеллекта и машинного обучения, графики и высокопроизводительных вычислений. В сочетании с другими управляемыми сервисами, такими как Amazon Bedrock, Amazon SageMaker и Amazon Elastic Kubernetes Service (Amazon EKS), эти инстансы предоставляют разработчикам лучшую в отрасли платформу для создания и развертывания генеративных приложений искусственного интеллекта, HPC и графических приложений.

Высокопроизводительные и экономичные экземпляры на базе графических процессоров для рабочих нагрузок искусственного интеллекта, высокопроизводительных вычислений и графики.

Для обеспечения разработки, обучения и вывода крупнейших языковых моделей (LLM) инстансы EC2 P5e будут оснащены новейшими графическими процессорами NVIDIA H200, которые предлагают 141 ГБ графической памяти HBM3e, что в 1,7 раза больше и в 1,4 раза быстрее, чем графические процессоры H100. . Такое увеличение памяти графического процессора вместе с сетью EFA до 3200 Гбит/с, обеспечиваемой системой AWS Nitro, позволит вам продолжать создавать, обучать и развертывать свои передовые модели на AWS.

Экземпляры EC2 G6e с графическими процессорами NVIDIA L40S созданы для того, чтобы предоставить разработчикам широкодоступную возможность обучения и вывода общедоступных LLM, а также поддерживать растущее внедрение моделей малого языка (SLM). Они также оптимальны для приложений цифровых двойников, использующих NVIDIA Omniverse для описания и моделирования 3D-инструментов и приложений, а также для создания виртуальных миров и расширенных рабочих процессов для промышленной цифровизации.

Инстансы EC2 G6 с графическими процессорами NVIDIA L4 обеспечат недорогое и энергоэффективное решение для развертывания моделей машинного обучения для обработки естественного языка, языкового перевода, анализа видео и изображений, распознавания речи и персонализации, а также графических рабочих нагрузок, таких как создание и рендеринг графики кинематографического качества в реальном времени и потоковая передача игр.

об авторе

Четан Капур является директором по управлению продуктами портфеля ускоренных вычислений Amazon EC2.

об авторе

LEAVE A REPLY Cancel reply