정의
감정 분석(情感分析, sentiment analysis)은 자연어 처리(NLP)의 한 분야로, 텍스트 데이터에 내포된 감정적 의미(긍정, 부정, 중립 등)를 자동으로 식별하고 정량화하는 기술 및 방법을 말한다. 주로 의견, 리뷰, 소셜 미디어 게시물 등에서 사용자의 주관적 표현을 분석하여 감정의 방향성과 세기를 파악한다.
개요
감정 분석은 2000년대 초반 컴퓨터 과학과 언어학 분야에서 “opinion mining”이라는 용어와 함께 등장했으며, 이후 다양한 학술 연구와 상업적 도구에 적용되어 왔다. 초기 연구는 사전 기반(lexicon‑based) 접근법에 의존했으며, 이후 통계적 머신러닝, 심층학습(딥러닝) 모델이 도입되면서 정확도와 적용 범위가 확대되었다. 주요 응용 분야에는 마케팅·브랜드 모니터링, 고객 서비스 자동화, 정치·사회 여론 조사, 여론 분석, 금융 시장 예측 등이 있다.
어원/유래
‘감정’은 한자어 “情感”을 한글로 음역·의미전환한 것으로, ‘감정(情)’은 ‘정서·마음’·‘감(感)’은 ‘느끼다’를 의미한다. ‘분석’은 ‘분리·해석’의 의미를 갖는다. 전체 용어는 영어 “sentiment analysis”를 직역·번역한 형태이며, 2000년대 초반부터 학술 논문과 기술 문서에서 널리 쓰이기 시작하였다. 정확히 언제, 누가 처음 번역했는지는 확인되지 않는다.
특징
- 극성 분류: 텍스트를 긍정·부정·중립 등으로 구분한다.
- 정밀도·재현율: 사전 기반 방식은 해석이 직관적이나 도메인 의존도가 높고, 기계학습·딥러닝 방식은 대량 데이터 학습을 통해 일반화 능력이 뛰어나지만 학습 비용이 크다.
- 다중 언어·다중 도메인: 언어별·문화별 감정 표현 차이와 전문 분야(의료, 법률 등) 특수 어휘 처리 필요성이 존재한다.
- 감정 강도(스코어링): 단순 이진/다중 클래스 분류 외에 감정의 세기를 연속값(예: -1~+1)으로 나타내는 경우가 있다.
- 주제·측면 기반 분석(Aspect‑based Sentiment Analysis): 전체 문장이 아닌 특정 속성(예: “배터리 수명”, “서비스”)에 대한 감정을 별도로 평가한다.
관련 항목
- 자연어 처리(NLP)
- 텍스트 마이닝
- 머신러닝·딥러닝
- 감성 사전(Emotion Lexicon)
- 의견 마이닝(Opinion Mining)
- 감정 인식(Emotion Recognition)
- 감정 컴퓨팅(Emotion Computing)
이 항목은 객관적인 자료에 근거하여 작성되었으며, 확인되지 않은 추정 내용은 포함하지 않았다.