목록으로

Programming Notes

Paraphrase-multilingual-MiniLM-L12-v2, Table Transformer Detection 및 Bielik-11B-v3.0-Instruct 모델 Amazon SageMaker JumpStart 출시

오늘 AWS는 Amazon SageMaker JumpStart에서 paraphrase-multilingual-MiniLM-L12-v2, Microsoft Table Transformer Detection 및 Bielik-11B-v3.0-Instruct를 사용할 수 있게 되었다고 발표했습니다.

Paraphrase-multilingual-MiniLM-L12-v2는 Sentence Transformers에서 제공하는 경량 의미론적 유사성 모델로, 50개 이상의 언어에 걸쳐 문장과 단락을 384차원 고밀도 벡터 공간으로 매핑합니다. 이 모델은 언어 내 및 언어 간의 의미상 유사한 콘텐츠를 찾는 데 적합하며, 별도의 언어별 설정 없이도 교차 언어 의미 검색, 다국어 문서 클러스터링, 문장 유사도 점수 측정에 이상적입니다.

Microsoft Table Transformer Detection은 PubTables-1M 데이터셋으로 학습된 DETR 기반 객체 탐지 모델로, PDF 및 스캔 이미지와 같은 비정형 문서에서 표(table)를 탐지하기 위해 특수 제작되었습니다. 연구 논문, 재무 보고서 및 기타 다양한 문서 유형에서 대규모로 표 콘텐츠를 안정적으로 찾아낼 수 있어, 문서 디지털화 파이프라인 및 자동화된 데이터 추출 워크플로우에 매우 적합합니다.

Bielik-11B-v3.0-Instruct는 SpeakLeash와 ACK Cyfronet AGH가 개발한 110억 개의 파라미터를 가진 생성형 언어 모델입니다. 폴란드어를 중심으로 32개 유럽 언어에 걸친 다국어 코퍼스로 학습되었습니다. 이 모델은 폴란드어 및 유럽 언어 대화, STEM 및 수학적 추론, 논리 및 도구 사용 작업, 그리고 유럽 언어에 대한 깊은 언어적 이해가 필요한 기업용 애플리케이션에서 탁월한 성능을 발휘합니다.

SageMaker JumpStart를 통해 고객은 단 몇 번의 클릭만으로 이러한 모델을 배포하여 각자의 특정 AI 사용 사례를 해결할 수 있습니다. 모델을 사용해 보려면 SageMaker Studio의 Models 섹션으로 이동하거나, SageMaker Python SDK를 사용하여 AWS 계정에 모델을 배포하십시오. SageMaker JumpStart에서 파운데이션 모델을 배포하고 사용하는 방법에 대한 자세한 내용은 Amazon SageMaker JumpStart 문서를 참조하세요.