목록으로

Programming Notes

시맨틱 검색 및 문장 유사도 측정을 위한 all-MiniLM-L12-v2, 이제 Amazon SageMaker JumpStart에서 이용 가능

오늘 AWS는 Amazon SageMaker JumpStart에서 all-MiniLM-L12-v2를 사용할 수 있게 되었음을 발표하며, AWS 고객이 활용할 수 있는 모델 포트폴리오를 확장했습니다. Sentence Transformers에서 제공하는 이 모델은 문장과 단락을 384차원의 밀집 벡터 공간(dense vector space)으로 매핑하여, 고객이 AWS 인프라 위에서 고품질의 시맨틱 검색, 텍스트 클러스터링 및 문장 유사도 애플리케이션을 구축할 수 있도록 지원합니다.

all-MiniLM-L12-v2는 의미적 맥락을 파악하여 문장과 짧은 단락을 밀집 벡터 표현으로 인코딩하는 데 탁월하며, 정보 검색, 시맨틱 검색 시스템, 문서 클러스터링, 중복 감지 및 의역 식별(paraphrase identification) 등에 이상적입니다. 또한 컴팩트한 아키텍처를 통해 강력한 임베딩 품질을 유지하면서도 빠른 추론 속도를 제공하므로, 대규모의 효율적인 텍스트 표현이 필요한 실제 운영 환경의 워크로드에 매우 적합합니다.

고객은 SageMaker JumpStart를 통해 클릭 몇 번만으로 특정 AI 유즈케이스에 맞춰 이 모델을 배포할 수 있습니다. 모델을 시작하려면 SageMaker Studio의 Models 섹션으로 이동하거나, SageMaker Python SDK를 사용하여 AWS 계정에 모델을 배포하십시오. SageMaker JumpStart에서 파운데이션 모델을 배포하고 사용하는 방법에 대한 자세한 내용은 Amazon SageMaker JumpStart 문서를 참조하세요.