정의
AI Hub(에이아이 허브)란 대한민국 과학기술정보통신부 산하 국가정보화사업본부(전국정보화진흥원)에서 운영하는 인공지능(AI) 학습용 데이터·모델·도구 등을 통합 제공하는 온라인 플랫폼이다. 인공지능 연구·개발·산업에 활용할 수 있는 다양한 데이터셋과 AI 서비스·솔루션을 중앙 집중식으로 제공함으로써 데이터 접근성을 높이고 AI 생태계 활성화를 목표로 한다.
개요
- 설립·운영기관: 과학기술정보통신부와 국가정보화사업본부(전국정보화진흥원)·한국정보통신기술진흥센터 등.
- 출시 시점: 2020년 7월(정식 서비스 개시).
- 주요 목적:
- AI 학습·연구에 필요한 고품질 데이터셋을 공공·민간에 개방.
- 데이터 표준화·품질 관리 체계 구축.
- AI 스타트업·중소기업·연구기관의 데이터 활용 지원.
- 제공 내용: 이미지·음성·텍스트·영상·표형 데이터 등 1,000여 개 분야의 데이터셋, AI 모델(예: 자연어 처리, 객체 인식 등), 학습·평가용 도구, API 및 클라우드 연동 서비스.
- 이용 방식: 회원가입 후 무료·유료(프리미엄) 옵션으로 데이터 다운로드 및 API 호출이 가능하며, 일부 데이터는 저작권·개인정보 보호를 위해 이용 제한이 적용된다.
어원/유래
- AI: “Artificial Intelligence”(인공지능)의 약어.
- Hub: ‘중심지’, ‘허브’라는 뜻으로, 다양한 자원·정보가 집중·연결되는 장소를 의미한다.
- 따라서 “AI Hub”는 ‘인공지능 관련 자원이 집중된 플랫폼’이라는 의미를 갖는다.
특징
-
다양한 분야·형태의 데이터 제공
- 의료·교육·교통·환경·문화·제조 등 30여 개 산업·사회 분야.
- 이미지·음성·자연어·시계열·표형 등 다중 모달 데이터.
-
품질·표준 관리
- 데이터 라벨링·정제·검증 과정을 거쳐 고품질 데이터셋을 제공.
- 국가표준 메타데이터 스키마(K-Data Standard) 적용.
-
오픈 라이선스와 제한 라이선스 병행
- 대부분 데이터는 ‘CC BY‑NC‑4.0’ 등 오픈 라이선스로 제공되지만, 개인정보가 포함된 데이터는 별도 이용 약관 적용.
-
AI 모델·툴킷 제공
- 사전 학습된 모델(예: 한국어 BERT, 객체 검출 YOLO 등)과 학습·평가 파이프라인을 다운로드 가능.
-
클라우드 연동·API 서비스
- 주요 클라우드(Naver Cloud, AWS, Azure 등)와 연동된 API를 통해 실시간 데이터 조회·활용이 가능.
-
지원 프로그램
- 데이터 활용 교육·워크숍, 해커톤, 스타트업 지원 프로그램 등을 운영하여 사용자 역량 강화에 기여.
관련 항목
- 과학기술정보통신부
- 국가정보화사업본부(전국정보화진흥원)
- AI Open Dataset (오픈AI, 구글 AI 등 해외 유사 플랫폼)
- 한국형 인공지능 데이터 정책
- AI·데이터 융합 스타트업 지원 사업
※ 본 문서는 2024년까지 공개된 공식 자료와 정부 발표를 기반으로 작성되었으며, 이후 변경·추가된 내용은 반영되지 않을 수 있다.