스펙트로그램(Spectrogram)은 소리나 파동을 시각화하여 파악하기 위한 도구로, 파형(waveform)과 스펙트럼(spectrum)의 특징이 조합되어 있다.
x축은 시간을, y축은 주파수를 의미하며, y축이 높아질수록 고주파를 의미한다.
또한 색상은 특정 시간과 주파수에서 에너지 크기를 의미하며 색상이 밝아질수록 더 큰 에너지를 의미한다.
즉 소리가 작을 때는 검은색 혹은 푸른색을 띄며, 소리가 커질수록 붉은색 혹은 흰색으로 올라간다.
스펙토그램 보는 법
아래 이미지는 바흐 / G 선상의 아리아 곡의 스펙트럼을 시각화한 이미지이다.
여기서 위에서 말했던 y축의 아래 부분인 저음부분에서 특징을 찾을 수 있다.
이는 이 곡에서 저음을 연주하는 더블 베이스가 피치카토 기법을 사용해 연주한 부분이다.
이렇게 저음 부분에서 소리가 나는 것을 스펙토그램으로 확인할 수 있다.
스펙토그램의 종류
스펙토그램에는 여러 종류가 존재하는데, 이 중 가장 대중적인 3가지 종류에 대해 알아보겠다.
1. 선형 스펙토그램
선형 스펙토그램은 주파수를 선형적으로 표시하며, 저주파와 고주파가 같은 간격으로 표시된다.
장점으로는 성분들을 균일하게 관찰할 수 있다.
하지만 인간의 청각은 저주파에 민감하기 때문에 고주파 영역의 정보가 덜 강조될 수 있다.
2. 로그 스펙토그램
로그 스펙토그램은 선형 스펙토그램의 진폭을 로그 스케일로 변환한 방식이다.
주파수를 로그 스케일로 표현하기 때문에 저주파 영역을 더 세밀하고 고주파 영역은 넓게 표현하기 때문에 인간의 청각 특성에 더 가깝게 주파수를 표시한다.
고주파에 변형을 가했기 때문에 고주파 성분의 세부적인 변화를 알아보긴 힘들 수 있다.
이 로그 스펙토그램은 인간에게 더 맞춰져 있기 때문에 소리를 분석하는 등의 활동에 자주 사용된다.
3. 멜(Mel) 스펙토그램
멜 스펙토그램은 보다 인간이 소리를 인지하는 것에 맞춰진 방식이다.
로그 스펙토그램과 달리 선형 스펙토그램 진폭의 주파수를 변경하지 않고 그래도 처리한다.
이 방식은 저주파 대역에 더 세밀한 분석을 할 수 있게하고, 고주파 대역에서는 간격을 넓게 표현한다.
주파수 영역을 균등하게 나눈 대신, 사람의 귀가 더 민감하게 감지하는 저주파수를 더 자세하게 분석할 수 있다.
* 로그와 멜의 차이점
로그 스펙토그램은 주파수를 선형적으로 유지하면서 진폭에 대해 로그 변환을 적용한 것이며,
멜 스펙토그램은 주파수를 멜 스케일로 변환하여 인간 청각의 특성에 맞춰 저주파에 더 높은 해상도를 제공한다.
차이점
선형 방식
로그 방식
멜 방식
'사운드' 카테고리의 다른 글
스펙토그램을 활용한 자동차 엔진의 배기음 분석 (2) | 2024.12.11 |
---|---|
가상 오디오 믹서 Voicemeeter 소개 (3) | 2024.11.07 |
MUTANT 소개 및 사용 방법 (0) | 2024.07.11 |
Synth Sound 개인 공부 노트 (0) | 2024.07.09 |
BPM (0) | 2024.04.14 |