본문 바로가기

사운드

스펙토그램 분석 방법

스펙트로그램(Spectrogram)은 소리나 파동을 시각화하여 파악하기 위한 도구로, 파형(waveform)과 스펙트럼(spectrum)의 특징이 조합되어 있다.

x축은 시간을, y축은 주파수를 의미하며, y축이 높아질수록 고주파를 의미한다.

 

또한 색상은 특정 시간과 주파수에서 에너지 크기를 의미하며 색상이 밝아질수록 더 큰 에너지를 의미한다.

즉 소리가 작을 때는 검은색 혹은 푸른색을 띄며, 소리가 커질수록 붉은색 혹은 흰색으로 올라간다.


스펙토그램 보는 법

아래 이미지는 바흐 / G 선상의 아리아 곡의 스펙트럼을 시각화한 이미지이다.

 

여기서 위에서 말했던 y축의 아래 부분인 저음부분에서 특징을 찾을 수 있다.

이는 이 곡에서 저음을 연주하는 더블 베이스가 피치카토 기법을 사용해 연주한 부분이다.

이렇게 저음 부분에서 소리가 나는 것을 스펙토그램으로 확인할 수 있다.


스펙토그램의 종류

스펙토그램에는 여러 종류가 존재하는데, 이 중 가장 대중적인 3가지 종류에 대해 알아보겠다.

 

1. 선형 스펙토그램

선형 스펙토그램은 주파수를 선형적으로 표시하며, 저주파와 고주파가 같은 간격으로 표시된다.

장점으로는 성분들을 균일하게 관찰할 수 있다.

하지만 인간의 청각은 저주파에 민감하기 때문에 고주파 영역의 정보가 덜 강조될 수 있다.


2. 로그 스펙토그램

로그 스펙토그램은 선형 스펙토그램의 진폭을 로그 스케일로 변환한 방식이다.

 

주파수를 로그 스케일로 표현하기 때문에 저주파 영역을 더 세밀하고 고주파 영역은 넓게 표현하기 때문에 인간의 청각 특성에 더 가깝게 주파수를 표시한다.

 

고주파에 변형을 가했기 때문에 고주파 성분의 세부적인 변화를 알아보긴 힘들 수 있다.

 

이 로그 스펙토그램은 인간에게 더 맞춰져 있기 때문에 소리를 분석하는 등의 활동에 자주 사용된다.


3. 멜(Mel) 스펙토그램

멜 스펙토그램은 보다 인간이 소리를 인지하는 것에 맞춰진 방식이다.

 

로그 스펙토그램과 달리 선형 스펙토그램 진폭의 주파수를 변경하지 않고 그래도 처리한다.

 

이 방식은 저주파 대역에 더 세밀한 분석을 할 수 있게하고, 고주파 대역에서는 간격을 넓게 표현한다.

주파수 영역을 균등하게 나눈 대신, 사람의 귀가 더  민감하게 감지하는 저주파수를 더 자세하게 분석할 수 있다.


* 로그와 멜의 차이점

로그 스펙토그램은 주파수를 선형적으로 유지하면서 진폭에 대해 로그 변환을 적용한 것이며,

멜 스펙토그램은 주파수를 멜 스케일로 변환하여 인간 청각의 특성에 맞춰 저주파에 더 높은 해상도를 제공한다.


차이점

선형 방식

로그 방식

멜 방식

 

'사운드' 카테고리의 다른 글

스펙토그램을 활용한 자동차 엔진의 배기음 분석  (2) 2024.12.11
가상 오디오 믹서 Voicemeeter 소개  (3) 2024.11.07
MUTANT 소개 및 사용 방법  (0) 2024.07.11
Synth Sound 개인 공부 노트  (0) 2024.07.09
BPM  (0) 2024.04.14