사운드

스펙토그램 분석 방법

ColdDesert078 2024. 10. 11. 03:15

스펙트로그램(Spectrogram)은 소리나 파동을 시각화하여 파악하기 위한 도구로, 파형(waveform)과 스펙트럼(spectrum)의 특징이 조합되어 있다.

x축은 시간을, y축은 주파수를 의미하며, y축이 높아질수록 고주파를 의미한다.

 

또한 색상은 특정 시간과 주파수에서 에너지 크기를 의미하며 색상이 밝아질수록 더 큰 에너지를 의미한다.

즉 소리가 작을 때는 검은색 혹은 푸른색을 띄며, 소리가 커질수록 붉은색 혹은 흰색으로 올라간다.


스펙토그램 보는 법

아래 이미지는 바흐 / G 선상의 아리아 곡의 스펙트럼을 시각화한 이미지이다.

 

여기서 위에서 말했던 y축의 아래 부분인 저음부분에서 특징을 찾을 수 있다.

이는 이 곡에서 저음을 연주하는 더블 베이스가 피치카토 기법을 사용해 연주한 부분이다.

이렇게 저음 부분에서 소리가 나는 것을 스펙토그램으로 확인할 수 있다.


스펙토그램의 종류

스펙토그램에는 여러 종류가 존재하는데, 이 중 가장 대중적인 3가지 종류에 대해 알아보겠다.

 

1. 선형 스펙토그램

선형 스펙토그램은 주파수를 선형적으로 표시하며, 저주파와 고주파가 같은 간격으로 표시된다.

장점으로는 성분들을 균일하게 관찰할 수 있다.

하지만 인간의 청각은 저주파에 민감하기 때문에 고주파 영역의 정보가 덜 강조될 수 있다.


2. 로그 스펙토그램

로그 스펙토그램은 선형 스펙토그램의 진폭을 로그 스케일로 변환한 방식이다.

 

주파수를 로그 스케일로 표현하기 때문에 저주파 영역을 더 세밀하고 고주파 영역은 넓게 표현하기 때문에 인간의 청각 특성에 더 가깝게 주파수를 표시한다.

 

고주파에 변형을 가했기 때문에 고주파 성분의 세부적인 변화를 알아보긴 힘들 수 있다.

 

이 로그 스펙토그램은 인간에게 더 맞춰져 있기 때문에 소리를 분석하는 등의 활동에 자주 사용된다.


3. 멜(Mel) 스펙토그램

멜 스펙토그램은 보다 인간이 소리를 인지하는 것에 맞춰진 방식이다.

 

로그 스펙토그램과 달리 선형 스펙토그램 진폭의 주파수를 변경하지 않고 그래도 처리한다.

 

이 방식은 저주파 대역에 더 세밀한 분석을 할 수 있게하고, 고주파 대역에서는 간격을 넓게 표현한다.

주파수 영역을 균등하게 나눈 대신, 사람의 귀가 더  민감하게 감지하는 저주파수를 더 자세하게 분석할 수 있다.


* 로그와 멜의 차이점

로그 스펙토그램은 주파수를 선형적으로 유지하면서 진폭에 대해 로그 변환을 적용한 것이며,

멜 스펙토그램은 주파수를 멜 스케일로 변환하여 인간 청각의 특성에 맞춰 저주파에 더 높은 해상도를 제공한다.


차이점

선형 방식

로그 방식

멜 방식