목록으로

Programming Notes

비용 최적화된 문서 처리를 위한 Amazon Nova 2 Lite와 Claude의 결합 활용하기

이 포스팅에서는 Amazon Nova 2 Lite와 Anthropic의 Claude Sonnet 4.6을 결합하여 대규모 스캔 문서를 효율적으로 디지털화하는 솔루션을 소개합니다.

저희는 스캔된 졸업 앨범 페이지를 디지털화하기 위해 Amazon Bedrock 위에 2단계 모델 파이프라인을 구축했습니다. 먼저 Amazon Nova 2 Lite는 단 한 번의 호출로 네이티브 멀티모달 추출을 수행합니다. 이 단계에서 사진 감지, 좌표를 포함한 이름 추출, 그리고 페이지 수준의 메타데이터 반환 작업을 처리합니다. 이어서 Claude Sonnet 4.6이 공간 추론(spatial reasoning)을 수행하여 페이지 레이아웃을 기반으로 이름과 얼굴을 매칭합니다.