Amazon Bedrock Guardrails, 에이전트 기반(Agentic) AI 워크플로우를 위한 새로운 API 출시

Amazon Bedrock Guardrails에서 이제 InvokeGuardrailChecks API를 제공합니다. 이 API는 별도의 가드레일 리소스를 생성할 필요 없이, 에이전트 기반 AI 애플리케이션의 어느 단계에서나 개별 안전 장치를 적용할 수 있는 새로운 '리소스리스(resourceless)' API입니다. 이 API는 에이전트 루프의 각 단계에서 실행할 안전 장치를 요청별로 정밀하게 제어할 수 있도록 지원하며, 수치화된 심각도와 신뢰도 점수를 반환합니다. 이를 통해 사용자는 특정 요구 사항에 따라 차단, 통과, 재시도 또는 로깅과 같은 맞춤형 임계값과 액션을 구현할 수 있습니다.

에이전트 기반 AI 애플리케이션은 작업 계획, 도구 호출, 출력 처리 및 재반복 등 일련의 루프를 통해 작동하며, 단일 요청에 대해 수십 개의 단계를 수행하기도 합니다. 각 단계마다 위험 프로필(risk profile)이 다르기 때문에 획일적인 가드레일을 적용해서는 확장이 어렵습니다. InvokeGuardrailChecks API는 추적할 가드레일 ID나 관리할 버전 없이 '탐지 전용(detect-only)' 모드로 작동하여 이 문제를 해결합니다. 각 요청마다 실행할 안전 장치를 직접 지정할 수 있어, 워크플로우 변화에 따라 검사 항목을 추가, 삭제 또는 조정하기가 매우 간편합니다.

이 API는 콘텐츠 필터(혐오, 폭력, 성적, 모욕 및 부적절한 행위 등 다양한 카테고리의 유해 콘텐츠 탐지), 프롬프트 공격 탐지(탈옥, 프롬프트 인젝션, 프롬프트 유출을 각각 독립적인 검사항목으로 식별), 민감 정보 필터(지원되는 PII 엔티티 유형 탐지)를 지원합니다. 특히 프롬프트 공격 탐지는 별도의 안전 장치로 제공되므로, 지원되는 각 공격 벡터를 독립적으로 호출할 수 있는 세밀함을 갖췄습니다.

InvokeGuardrailChecks API는 현재 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오레곤), 유럽(런던), 유럽(스톡홀름), 아시아 태평양(도쿄), 아시아 태평양(시드니) 등의 AWS 리전에서 사용할 수 있습니다.

더 자세한 내용은 Amazon Bedrock Guardrails 기술 문서를 참조하세요.