Amazon Elastic Container Service(Amazon ECS) Managed Instances가 이제 AWS Trainium 및 AWS Inferentia를 지원합니다. 이들은 광범위한 생성형 AI 워크로드의 훈련 및 추론 과정에서 확장 가능한 성능과 비용 효율성을 제공하도록 설계된 전용 AI 가속기입니다. Amazon ECS Managed Instances는 인프라 관리 부담을 제거하는 동시에 Amazon EC2의 모든 기능을 활용할 수 있도록 설계된 완전 관리형 컴퓨팅 옵션입니다. 인프라 운영을 AWS에 맡김으로써 ECS Managed Instances는 성능을 향상하고 총 소유 비용(TCO)을 절감하는 동시에 워크로드를 신속하게 시작하고 확장할 수 있도록 돕습니다.
ECS Managed Instances를 사용하면 원하는 애플리케이션 성능과 필요한 단순함을 동시에 얻을 수 있습니다. 이제 ECS Managed Instances 용량 공급자(Capacity Provider)를 생성하고 Inferentia2, Trainium1, Trainium2를 포함하여 원하는 가속 인스턴스 유형을 선택한 다음, 태스크 정의(Task Definition)의 ResourceRequirement 섹션에 NEURON_CORE=all 구성을 추가하면 됩니다. 이렇게 하면 Amazon ECS가 지정된 인스턴스를 실행하고 인스턴스당 하나의 태스크를 배치하며, 최적의 성능을 위해 가속기의 모든 리소스를 워크로드에 자동으로 할당합니다.
ECS Managed Instances를 시작하려면 AWS 콘솔, Amazon ECS MCP 서버 또는 선호하는 코드형 인프라(IaC) 도구를 사용하여 새 Amazon ECS 클러스터나 기존 클러스터에서 해당 기능을 활성화하십시오. 비용은 일반 Amazon EC2 요금 외에 프로비저닝된 컴퓨팅 관리 비용이 추가로 청구됩니다. ECS Managed Instances에 대해 자세히 알아보려면 기능 페이지, 설명서 및 AWS 뉴스 출시 블로그를 방문하세요.