딥러닝(Deep Learning)
정의
딥러닝은 인공신경망(Artificial Neural Network)을 기반으로 한 기계학습(머신러닝)의 한 분야로, 다층 구조의 신경망을 이용해 데이터로부터 고차원적인 특징(feature)을 자동으로 학습한다. 인간의 뇌가 정보를 처리하는 방식에 영감을 받아 설계되었으며, 입력 데이터를 여러 단계의 추상화 과정을 거쳐 최종적인 예측이나 분류를 수행한다.
주요 원리
- 다층 퍼셉트론(Multi‑Layer Perceptron, MLP) – 입력층, 은닉층(보통 여러 개), 출력층으로 구성된 완전 연결 신경망.
- 컨볼루션 신경망(Convolutional Neural Network, CNN) – 이미지나 시계열 데이터의 공간적·시간적 패턴을 추출하기 위해 합성곱 연산과 풀링(pooling) 계층을 사용한다.
- 순환 신경망(Recurrent Neural Network, RNN) 및 변형(LSTM, GRU) – 시퀀스 데이터(텍스트, 음성 등)의 순차적 의존성을 모델링한다.
- 전이 학습(Transfer Learning) – 대규모 데이터셋에서 사전 학습된 모델을 다른 과제에 재사용함으로써 학습 효율을 높인다.
- 역전파(Back‑Propagation)와 최적화 – 손실 함수(loss function)를 미분해 가중치를 업데이트하는 알고리즘이며, Adam, RMSprop 등 다양한 최적화 기법이 적용된다.
역사
- 1940~1950년대: 퍼셉트론(Perceptron) 등 초기 신경망 모델 제안.
- 1980년대: 다층 퍼셉트론과 역전파 알고리즘이 제시되면서 신경망 연구가 활성화.
- 2006년: 제프리 힌턴(Geoffrey Hinton)과 동료들이 제한 볼츠만 머신(Restricted Boltzmann Machine)과 딥 빌리프 네트워크(Deep Belief Network) 개념을 도입, “딥러닝”이라는 용어가 본격적으로 사용되기 시작.
- 2012년: AlexNet이 이미지 분류 대회인 ILSVRC(Imagenet Large Scale Visual Recognition Challenge)에서 우수한 성적을 거두며 딥러닝의 실용성을 전 세계에 알렸다. 이후 자연어 처리(NLP), 음성 인식, 자율주행 등 다양한 분야에 급속히 확산되었다.
주요 응용 분야
- 영상·영상처리: 객체 검출, 얼굴 인식, 의료 영상 분석, 자동 이미지 캡셔닝 등.
- 자연어 처리: 기계 번역, 감정 분석, 질문‑응답 시스템, 대규모 언어 모델(예: GPT, BERT).
- 음성·오디오: 음성 인식, 스피커 식별, 음악 생성.
- 제어·로보틱스: 자율주행 차량, 드론 경로 계획, 로봇 매니퓰레이션.
- 추천·예측: 온라인 광고, 개인화 추천 시스템, 금융 시장 예측.
한계와 연구 동향
딥러닝은 대규모 라벨링된 데이터와 높은 연산 자원을 필요로 하며, 학습 결과의 해석 가능성(interpretability)과 안전성 문제가 제기되고 있다. 현재는 경량화 모델(MobileNet, EfficientNet) 개발, 지속 학습(Continual Learning), 생성적 적대 신경망(Generative Adversarial Networks, GAN) 등을 통한 데이터 증강, 그리고 퍼포먼스와 효율성을 동시에 추구하는 뉴럴 아키텍처 탐색(NAS, Neural Architecture Search) 등이 활발히 연구되고 있다.
머신러닝(Machine Learning)
정의
머신러닝은 컴퓨터가 명시적인 프로그래밍 없이 데이터를 통해 학습하고, 그 학습 결과를 바탕으로 새로운 입력에 대한 예측·판단을 수행하도록 하는 인공지능(AI) 분야이다. 학습 알고리즘은 주어진 데이터의 통계적 패턴을 찾아 모델 파라미터를 조정함으로써, 일반화(generalization) 능력을 갖춘 함수를 생성한다.
분류
-
지도 학습(Supervised Learning)
- 분류(Classification): 입력을 미리 정의된 카테고리 중 하나로 할당한다. 예) 스팸 메일 판별, 이미지 라벨링.
- 회귀(Regression): 연속적인 수치를 예측한다. 예) 주가 예측, 온도 추정.
-
비지도 학습(Unsupervised Learning)
- 군집화(Clustering): 데이터들을 유사성에 따라 그룹화한다. 예) 고객 세분화, 이미지 압축.
- 차원 축소(Dimensionality Reduction): 고차원 데이터를 저차원으로 변환한다. 예) PCA, t‑SNE.
-
준지도 학습(Semi‑Supervised Learning)
- 라벨이 부착된 데이터와 라벨이 없는 데이터를 동시에 활용한다. 라벨이 적은 상황에서 성능 향상을 목표로 한다.
-
강화 학습(Reinforcement Learning)
- 에이전트가 환경과 상호작용하며 보상(reward)을 최대화하도록 정책(policy)을 학습한다. 예) 게임 AI, 로봇 제어.
핵심 알고리즘
- 선형·논리 회귀(Linear/Logistic Regression)
- 결정 트리(Decision Tree)와 랜덤 포레스트(Random Forest)
- 지원 벡터 머신(Support Vector Machine, SVM)
- k‑최근접 이웃(k‑Nearest Neighbors, k‑NN)
- 베이즈 모델(Naïve Bayes, Bayesian Networks)
- 클러스터링(k‑means, DBSCAN)
- 신경망(Neural Networks) – 머신러닝의 하위 분야이며, 딥러닝은 다층 신경망을 의미한다.
학습 과정
- 데이터 전처리: 결측치 처리, 정규화/표준화, 특성 엔지니어링(feature engineering).
- 모델 선택: 문제 유형과 데이터 특성에 맞는 알고리즘 선택.
- 훈련(Training): 손실 함수(loss) 최소화를 위한 최적화 기법 적용.
- 검증(Validation): 교차 검증(cross‑validation) 등을 통해 과적합(overfitting) 여부 평가.
- 테스트(Test): 보지 않은 데이터에 대한 최종 성능 측정.
역사
- 1950년대: 아서 사뮤얼(Arthur Samuel)이 체스와 체크러스(보드 게임)에서 “머신러닝” 용어를 최초 사용.
- 1960~1970년대: 퍼셉트론과 히어라키컬 클러스터링 등 초기 모델 개발.
- 1980년대: 통계적 학습 이론이 정립되면서 SVM, 결정 트리 등 강력한 알고리즘 등장.
- 1990년대: 베이지안 네트워크와 앙상블 방법(부스팅, 배깅)이 주목받았다.
- 2000년대 이후: 빅데이터와 고성능 컴퓨팅 환경의 확대와 함께 머신러닝이 실무에 광범위하게 적용되었으며, 딥러닝의 부상으로 신경망 기반 접근법이 크게 성장했다.
주요 응용 분야
- 비즈니스·마케팅: 고객 이탈 예측, 맞춤형 광고, 수요 예측.
- 의료: 질병 진단 보조, 약물 설계, 환자 위험도 평가.
- 제조·품질 관리: 결함 탐지, 예측 유지보수.
- 보안: 이상 탐지, 침입 방지 시스템.
- 사회·공공: 교통 흐름 예측, 재난 위험 분석, 정책 시뮬레이션.
한계와 현재 연구 동향
머신러닝 모델은 데이터 편향(bias), 과적합, 설명 가능성 등의 문제에 민감하다. 최근 연구는 공정성(Fairness)과 프라이버시 보호(예: 연합 학습, 차등 개인정보 보호)를 강조하고 있으며, 자동화된 머신러닝(AutoML)을 통해 비전문가도 모델을 손쉽게 구축할 수 있도록 하는 방향으로 발전하고 있다. 또한, 딥러닝과 전통적 머신러닝 기법을 결합한 하이브리드 모델이 복합적인 실제 문제 해결에 활용되고 있다.