멜 척도(Mel scale)는 인간의 청각이 인지하는 주파수와 실제 물리적 주파수(Hz) 사이의 비선형 관계를 나타내는 심리음향학적 척도이다. 일반적으로 저주파 영역에서는 주파수 변화가 청각적 인지에 큰 영향을 미치지만, 고주파 영역에서는 동일한 주파수 차이가 청각적으로는 덜 크게 느껴진다. 이러한 특성을 반영하여 멜 척도는 인간의 음성 및 음악 인지 과정에서 중요한 기준으로 활용된다.
정의 및 수식
멜 척도는 0 Hz를 0 멜로 정의하고, 1000 Hz를 1000 멜로 정의한다. 1000 Hz 이하에서는 주파수와 멜 사이의 관계가 거의 선형이며, 1000 Hz를 초과하면 로그 형태에 가깝게 변한다. 일반적으로 사용되는 변환식은 다음과 같다.
-
주파수(Hz) → 멜:
$$ m = 2595 \times \log_{10}\left(1 + \frac{f}{700}\right) $$ -
멜 → 주파수(Hz):
$$ f = 700 \times \left(10^{\frac{m}{2595}} - 1\right) $$
여기서 $ f $는 주파수(Hz), $ m $은 멜 단위이다.
역사·배경
멜 척도는 1937년 스위스의 심리음향학자 스테판 스테이펠(Stefan Steinhauer)과 미국의 심리음향학자 스탠리 가브리엘(Stanley G. Gabriel)이 제안한 ‘멜’이라는 개념을 바탕으로, 1976년 미국 국방부 고등연구계획국(DARPA)에서 진행된 음성 인식 연구에서 본격적으로 도입되었다. 특히, 음성 신호를 멜 주파수 켑스트럼(MFCC) 형태로 변환하는 과정에서 핵심적인 역할을 한다.
주요 활용 분야
| 분야 | 활용 예시 |
|---|---|
| 음성 인식 | MFCC(Mel‑Frequency Cepstral Coefficients) 추출 시 멜 척도 변환을 적용하여 인간 청각에 가까운 특성 추출 |
| 음악 정보 처리 | 음악 장르 분류, 음높이 인식 등에서 인간이 느끼는 음감에 기반한 특징 추출 |
| 청각 연구 | 청각 피험자의 주파수 감도 측정, 청각 장애 평가 등에 멜 척도 기반 자극 사용 |
| 청각 보조기기 | 보청기 및 인공와우 설계 시 청각 역치를 반영한 주파수 보정에 활용 |
관련 용어
- 멜 주파수 켑스트럼(MFCC): 멜 척도에 기반한 스펙트럼 변환을 통해 얻은 주파수 특성 벡터. 음성·음악 인식에서 널리 사용된다.
- 심리음향학: 인간 청각의 심리적·생리적 특성을 연구하는 학문 분야. 멜 척도는 이 분야의 핵심 개념 중 하나이다.
참고 문헌
- Stevens, S. S., Volkmann, J., & Newman, E. B. (1937). “A scale for the measurement of the psychological magnitude pitch.” Journal of the Acoustical Society of America, 8(3), 185‑190.
- Davis, S., & Mermelstein, P. (1980). “Comparison of parametric representations for speech recognition.” IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357‑366.
- 한국음향학회, “심리음향학 개론”, 2021.
외부 링크
- Mel scale – Wikipedia (영문)
- [Mel-Frequency Cepstral Coefficients – Speech Processing Textbook]
위 내용은 공개된 학술 자료와 공신력 있는 출처를 기반으로 작성되었으며, 최신 연구 동향에 따라 일부 내용이 변동될 수 있다.