OpenAI GPT OSS 및 NVIDIA Nemotron 모델, AWS GovCloud(미국) 리전 내 Amazon Bedrock 지원 시작

Amazon Bedrock이 이제 OpenAI의 오픈 웨이트(open-weight) GPT OSS 모델(120B 및 20B)과 NVIDIA Nemotron(Nano 9B v2, Nano 12B v2, Nano 30B, Super 120B) 모델을 지원합니다. 이를 통해 다양하고 고성능인 파운데이션 모델을 활용하여 생성형 AI 애플리케이션을 구축하고 확장할 수 있는 역량이 더욱 강화되었습니다. 단일 통합 API를 통해 OpenAI 및 NVIDIA의 최신 모델을 다른 주요 AI 모델과 함께 유연하게 활용할 수 있으며, 애플리케이션 코드를 수정하지 않고도 각 특정 사용 사례에 가장 적합한 모델을 선택할 수 있습니다.

OpenAI GPT OSS 모델은 오픈 웨이트 아키텍처를 통해 강력한 언어 이해 및 생성 기능을 제공하며, 기업이 투명성과 유연성을 바탕으로 정교한 AI 애플리케이션을 구축할 수 있도록 지원합니다. NVIDIA Nemotron 모델은 소형 언어 모델(SLM)과 대형 언어 모델(LLM) 기능을 모두 제공하여 높은 컴퓨팅 효율성과 정확성을 실현하며, 개발자는 이를 통해 특화된 에이전트형(agentic) AI 시스템을 구축할 수 있습니다. 이 모델들은 가중치(weights), 데이터 세트, 레시피가 모두 공개된 완전 개방형 모델로, 개발자와 기업에게 투명성과 신뢰를 제공합니다.

이러한 모델들은 Amazon Bedrock에서 대규모 머신러닝 모델 서빙을 위해 새롭게 도입된 분산 추론 엔진인 Mantle을 기반으로 구동됩니다. Mantle은 Amazon Bedrock에 새로운 모델을 온보딩하는 과정을 간소화 및 가속화하며, 정교한 서비스 품질(QoS) 제어를 통해 고성능의 안정적인 서버리스 추론을 제공합니다. 또한 자동화된 용량 관리 및 통합 풀을 통해 더 높은 기본 고객 할당량(quota)을 지원하며, 별도의 설정 없이도 OpenAI API 사양과 즉시 호환됩니다. AWS GovCloud(미국) 리전의 Amazon Bedrock에서 OpenAI GPT OSS 및 NVIDIA Nemotron 모델을 사용함으로써, AWS의 엔터프라이즈급 보안, 원활한 확장성, 비용 최적화 기능을 규정에 맞게 누리며 혁신을 가속화할 수 있습니다.