Amazon EC2 推出 P5en 實例,搭載 NVIDIA H200 Tensor Core GPU 和第四代 Intel Xeon Scalable 處理器,提供高達 3200 Gbps 的網路頻寬,延遲改善 35%,記憶體頻寬提升 50%,並支持 PCIe Gen5,顯著提升機器學習訓練與推論、高性能計算、生成式 AI 和模擬應用性能,現已在美國東、西部和亞太區 (東京) 等地區可用,支持按需與儲蓄計劃購買選項。
文章重點
【實例規格】
- 【硬體配置】P5en 實例搭載 NVIDIA H200 Tensor Core GPU 和自定義的第四代 Intel Xeon Scalable 處理器。
- 【處理器性能】全核心 turbo 頻率為 3.2 GHz(最大核心 turbo 頻率為 3.8 GHz)。
- 【網路能力】使用第三代 Elastic Fabric Adapter (EFAv3) 提供高達 3200 Gbps 的網路頻寬,比之前的模型延遲改善了 35%。
【效能增強】
- 【記憶體與吞吐量】新處理器提供 50% 更高的記憶體頻寬,透過 PCIe Gen5 在 CPU 和 GPU 之間的吞吐量最多提高四倍。
- 【應用場景】顯著提升機器學習(ML)訓練和推論工作負載,以及高性能計算(HPC)應用的效能。
【實例大小和功能】
- 【p5en.48xlarge 配置】
- 192 個虛擬 CPU
- 2048 GiB 記憶體
- 8 個 NVIDIA H200 GPU
- 3200 Gbps 網路頻寬
- 900 GB/s GPU 對等頻寬
- 8 TB 實例存儲
- 100 Gbps EBS 頻寬
【使用案例】
- 【適用範圍】P5en 實例適用於深度學習、生成式人工智慧、實時數據處理,以及在製藥和天氣預報等領域的模擬。
【可用性】
- 【地區支持】這些實例在美國東部(俄亥俄州)、美國西部(俄勒岡州)、亞太區(東京)和美國東部(亞特蘭大)本地區域提供。
- 【購買選項】可通過 ML、按需和儲蓄計劃購買。
【入門指南】
- 【操作步驟】用戶可以通過 Amazon EC2 控制台預留 EC2 Capacity Blocks,並使用 AWS 深度學習 AMI(DLAMI)來構建可擴展的 ML 應用。