Amazon SageMaker Unified Studio가 이제 AWS Glue Data Quality를 기반으로 데이터 품질 규칙 작성 및 평가 기능을 지원합니다. 데이터 엔지니어, 분석가 및 데이터 과학자는 카탈로그 테이블에 저장된 데이터(data at rest)와 비주얼 ETL 작업 내에서 이동 중인 데이터(data in transit) 모두에 대해 SageMaker Unified Studio 내에서 직접 데이터 품질 규칙을 정의하고, 규칙 세트 평가를 실행하며, 결과를 확인할 수 있습니다. 이를 통해 품질이 낮은 데이터가 데이터 레이크에 유입되거나 다운스트림 분석 및 머신러닝 워크로드에 영향을 미치기 전에 데이터 품질 문제를 사전에 포착할 수 있습니다.
이번 출시로 AWS Glue Data Quality에서 사용되는 것과 동일한 데이터 품질 정의 언어(DQDL)를 사용하여 규칙을 작성하고, 두 가지 워크플로에 걸쳐 SageMaker Unified Studio에서 직접 평가를 실행할 수 있습니다. 저장된 데이터의 경우, 카탈로그 자산의 전용 '데이터 품질(Data Quality)' 탭에서 규칙 작성, 온디맨드 또는 예약된 평가, 그리고 규칙별 상세 통과/실패 결과를 제공합니다. 이동 중인 데이터의 경우, 모든 비주얼 ETL 작업에 '데이터 품질 평가(Evaluate Data Quality)' 변환을 추가하고 실행 세부 정보의 일부로 데이터 품질 결과를 검토할 수 있습니다. 완전성, 유일성, 최신성, 정확성 및 기타 데이터 품질 차원을 점검하는 규칙 세트를 생성할 수 있습니다.
이 기능은 Amazon SageMaker Unified Studio가 제공되는 모든 AWS 리전에서 사용할 수 있으며, AWS IAM Identity Center 기반 및 IAM 기반 도메인 모두에서 지원됩니다. 자세한 내용은 Amazon SageMaker Unified Studio 문서를 참조하세요.