목록으로

Programming Notes

Amazon SageMaker AI에서 P-EAGLE로 추측 디코딩 병렬화하기

이 포스팅에서는 Amazon SageMaker AI 내에서 P-EAGLE을 직접 사용하는 방법을 단계별로 안내합니다. SageMaker JumpStart 카탈로그에서 호환 가능한 모델을 선택하고, 병렬 드래프팅(parallel drafting) 사양을 구성하며, 생성형 AI 애플리케이션의 속도를 높이기 위해 최적화된 실시간 SageMaker AI 엔드포인트를 배포하는 방법을 살펴보겠습니다.