목록으로

Programming Notes

Amazon ElastiCache, 벡터 및 전체 텍스트를 활용한 실시간 하이브리드 검색 지원 시작

Amazon ElastiCache에서 이제 별도의 검색 서비스 없이도 단일 쿼리 내에서 벡터 유사도와 전체 텍스트 검색을 결합한 실시간 하이브리드 검색을 지원합니다. 이를 통해 애플리케이션은 시맨틱(semantic) 의미와 정확한 키워드 매칭을 결합하여, 사용자의 의도와 정확한 용어를 모두 포착함으로써 각각의 방식만 사용할 때보다 더욱 관련성 높은 결과를 제공할 수 있습니다. 고객은 ElastiCache를 사용하여 Amazon Bedrock, Amazon SageMaker, Anthropic, OpenAI와 같은 주요 제공업체의 수십억 개의 임베딩을 대상으로 마이크로초(microseconds) 단위의 낮은 지연 시간과 최대 99%의 재현율(recall)로 전체 텍스트 및 벡터 유사도 검색을 결합할 수 있습니다.

ElastiCache는 쓰기 작업이 완료되는 즉시 데이터를 검색할 수 있도록 하므로, 애플리케이션은 항상 최신 상태의 벡터와 텍스트를 검색할 수 있습니다. 개발자는 하이브리드 검색을 사용하여 AI 에이전트 메모리 및 RAG(검색 증강 생성) 시스템을 구축할 수 있으며, 정확한 용어와 의미를 바탕으로 관련 컨텍스트를 검색함으로써 토큰 비용을 절감하는 동시에 생성형 AI의 응답 품질을 향상할 수 있습니다. 이커머스 및 스트리밍 플랫폼은 하이브리드 검색을 활용해 사용자가 정확한 제품명이나 설명, 또는 두 가지 모두를 사용하여 검색할 때 관련성 높은 결과를 노출할 수 있습니다. Valkey용 ElastiCache는 AWS의 주요 벡터 데이터베이스 중 95% 이상의 재현율에서 가장 낮은 지연 시간과 가장 높은 처리량, 그리고 최상의 가성비를 제공합니다.

하이브리드 검색은 모든 상용 AWS 리전, AWS GovCloud(미국) 리전 및 중국 리전에서 Valkey용 ElastiCache 버전 9.0 이상을 실행하는 노드 기반 클러스터에 대해 추가 비용 없이 이용 가능합니다. Valkey는 Redis의 가장 허용적인 오픈 소스이자 벤더 중립적인 대안이며 ElastiCache에서 권장하는 엔진입니다. 시작하려면 AWS 관리 콘솔, AWS SDK 또는 AWS CLI를 사용하여 새로운 Valkey 9.0 이상 클러스터를 생성하거나 기존 클러스터를 업그레이드하세요. 자세한 내용은 이 블로그를 읽어보고 ElastiCache 설명서를 참조하시기 바랍니다.