오늘부터 Amazon Elastic Compute Cloud(Amazon EC2) P6-B300 인스턴스를 AWS GovCloud(미국 동부) 리전에서 사용할 수 있습니다. P6-B300 인스턴스는 2.1TB의 고대역폭 GPU 메모리를 갖춘 8개의 NVIDIA Blackwell Ultra GPU, 6.4Tbps EFA 네트워킹, 300Gbps 전용 ENA 처리량 및 4TB의 시스템 메모리를 제공합니다.
P6-B300 인스턴스는 P6-B200 인스턴스와 비교하여 2배의 네트워킹 대역폭, 1.5배의 GPU 메모리 크기 및 1.5배의 GPU TFLOPS(FP4 기준, 스파시티(sparsity) 미적용)를 제공하므로, 정교한 기술을 사용하여 수조 개의 파라미터를 가진 대규모 파운데이션 모델(FM) 및 대규모 언어 모델(LLM)을 훈련하고 배포하는 데 매우 적합합니다. 더 높은 네트워킹 성능과 더 커진 메모리는 AI 워크로드에 대해 더 빠른 훈련 시간과 더 많은 토큰 처리량을 지원합니다.
P6-B300 인스턴스는 현재 미국 서부(오레곤) 및 AWS GovCloud(미국 동부) 리전에서 p6-b300.48xlarge 크기로 제공됩니다. P6-B300 인스턴스에 대해 자세히 알아보려면 Amazon EC2 P6 인스턴스 페이지를 방문하세요.