목록으로

Programming Notes

세상을 임베딩하기: 대규모 검색이 가능한 항공 이미지 구현을 위한 멀티모달 AI

이 게시물에서는 문제 정의부터 Amazon Bedrock 및 Amazon OpenSearch Serverless 기반의 아키텍처, 그리고 OpenStreetMap 실측 데이터(ground truth)를 바탕으로 구축한 평가 방법론을 자세히 살펴봅니다. 또한 임베딩 모델, 퓨전(fusion) 전략, 캡셔닝 및 검색 방법을 비교한 네 가지 실험 내용과 유사한 시스템을 구축할 때 적용할 수 있는 실무 가이드를 공유합니다.

여러분은 지리 공간 시맨틱 검색(geospatial semantic search)의 성능을 실질적으로 개선하는 설계 선택 요소가 무엇인지 배우게 될 것입니다. 특히, Amazon Nova 멀티모달 임베딩(Amazon Nova Multimodal Embeddings)이 이번 평가의 두 벤치마크 쿼리 모두에서 왜 가장 높은 F1 점수를 기록했는지에 대해서도 다룹니다. 본 문서에서 설명하는 연구 결과는 이후 검색 가능한 이미지 서비스인 Vexcel Intelligence로 발전했습니다.