사운드의 개념과 디지털 변환 방법에 관하여
사운드의 개념과 디지털 변환 방법에 관하여 알아보도록 하겠습니다. 사운드는 물체가 진동하여 만들어집니다. 진동이 발생할 때 그 주위의 공기압에 변화가 생기고 공기압의 변화가 파형의 형태로 우리 귀에 전달됩니다. 우리가 보통 사운드를 처리한다는 것은 이러한 파형을 가공하고 편집하는 것을 의미합니다. 이러한 사운드의 파형은 일정한 시간 간격마다 동일한 모양으로 반복되는데, 동일한 부분을 사이클이라고 하고 한 사이클이 걸리는 시간을 주기라고 합니다. 음파는 자연적으로 생성되기 때문에 완전히 균일한 주기를 갖고 있지는 않습니다. 그러나 어느 정도 주기적인 소리가 그렇지 않은 소리보다는 음악적으로 들립니다. 또한 사운드는 음의 높낮이와 관련이 있는 주파수, 음의 크기와 관련이 있는 진폭, 각 음의 특성인 음색의 세 가지 요소로 구성됩니다. 사운드의 요소들을 각각 자세하게 설명하자면 먼저 주파수는 초당 사운드 파형의 반복 횟수를 의미하며 주기와 역수 값의 관계가 있으며 소리의 높낮이를 결정합니다. 즉, 주파수가 크면 고음이고 작으면 저음이 됩니다. 이때 측정 단위로는 헤르츠가 사용되며 이것은 초당 진동 횟수를 의미합니다. 일반적으로 사람이 낼 수 있는 주파수대는 약 100헤르츠에서 6기가헤르츠입니다. 또한 가청 주파수대는 약 20헤르츠에서 20기가헤르츠 사이이고, 사람의 청각은 1기가헤르츠에서 6기가헤르츠 사이에서 가장 민감합니다. 사람의 가청 주파수대를 오디오라고 구분하며, 오디오를 처리하는 것이 사운드를 처리하는 것이라 생각하는 사람도 존재합니다. 다음으로 진폭에 관해서 설명하자면 사운드 파형의 기준선에서 최고점까지의 거리를 의미하며, 소리의 크기와 관련이 있습니다. 소리의 크기는 에너지로 측정하지 않고 음압의 변화로 나타냅니다. 이 음압을 표현하는 단위로 bar라는 것이 있는데, 사람의 귀는 아주 작은 음압의 차이라도 민감하게 감지할 수 있기 때문에 bar의 백만분의 1인 ubar를 사용합니다. 또한 사람의 귀가 음파를 소리로 감지할 수 있는 최대는 200bar입니다. 그러나 사람의 청각은 음압에 비례해서 소리의 크기를 느끼지 못합니다. 즉, 소리의 크기가 1에서 2로 변했을 때와 2에서 4로 변했을 때 동일한 소리 크기의 변화가 있는 것으로 느낀다는 것을 의미합니다. 이처럼 소리에 대한 감각은 변화의 차이와 관계있는 것이 아니라 변화의 비율에 따라 정해집니다. 이때 변화의 비율을 로그 비라고 합니다. 따라서 소리의 크기를 표시할 때는 소리의 크기에 로그값을 취한 벨로 표시합니다. 그리고 실제 사용 시에는 벨값을 10배 한 데시벨을 주로 사용합니다. 사람이 가장 편하게 들을 수 있는 소리의 범위는 0데시벨에서 90데시벨 사이입니다. 우리가 일상생활에서 들을 수 있는 소리와 음의 크기와의 관계는 먼저 0데시벨은 최저 가청음, 20데시벨은 조용한 거실에서 들리는 소리, 40데시벨은 나직한 대화 소리, 60데시벨은 일상적인 대화 소리, 80데시벨은 일반적인 공장에서의 소음이나 번잡한 거리에서의 소음, 100데시벨은 지하철에서의 소음, 120데시벨은 공항 활주로에서 들리는 소리, 140데시벨은 청취하기에 고통스러운 소리, 160데시벨은 가까운 곳에서 들리는 제트기의 소리라고 보시면 됩니다. 다음으로 음색은 같은 음의 높이와 크기를 가져도 악기마다 고유한 소리의 특징이 있습니다. 이러한 특징을 음색하는데 악기에는 각 악기마다 고유의 주파수가 있습니다. 그런데 이 기본파는 각 악기마다의 특성인 울림통에서 진동하며, 기본파 외에 그 악기의 기본파 정수배에 해당하는 고조파라는 것을 생성하게 됩니다. 그리고 이러한 기본파와 고조파가 합성되어, 그 악기의 고유한 소리가 생성됩니다. 또한 일상적인 사운드는 아날로그 형태입니다. 그래서 이것을 컴퓨터로 처리하기 위해서는 디지털의 형태로 변환되어야 합니다. 이러한 작업은 ADC 장치에서 이루어지는데, 여기서 표본화와 양자화 과정을 거쳐서 디지털 형태로 출력이 됩니다. 그리고 이렇게 디지털 형태로 바뀐 소리를 실세계에서 듣기 위해서는 반대의 과정인 DAC를 거쳐서 아날로그 형태로 바뀌어야 합니다. 사운드의 디지털 변환 과정을 자세하게 설명하자면 먼저 표본화란 아날로그 파형을 디지털 형태로 변환하기 위해 표본을 취하는 것을 말합니다. 사운드의 표본화율은 1초 동안에 취한 표본 수를 말하며, 단위로는 주파수 단위와 같은 헤르츠를 사용합니다. 이러한 표본화율이 높을수록 원음에 가까운 음으로 디지털화되지만 데이터 양이 증가하게 됩니다. 또한 표본화를 많이 할수록 원음을 잘 표현할 수 있으나 데이터 저장을 위한 메모리 용량을 많이 차지하게 되고, 표본화를 작게 하면 메모리 용량은 작아지지만 원음을 그대로 반영하지 못하게 됩니다. 따라서 원음을 재생하기 위한 최소한의 표본화율을 알아야 하는데, 이는 1920년대 후반 나이키스트에 의해 발표된 나이키스트 정리를 통해 알 수 있습니다. 이어서 표본화율이 아날로그 파형을 어느 정도 자주 디지털화할 것인지를 의미한다면, 양자화는 그 값을 얼마나 자세하게 표현할 것인가와 관련이 있습니다. 표본화된 각 점에서의 값을 표현하기 위해서는 그 값을 어느 정도의 정밀도로 표현할지를 결정해야 합니다. 이렇게 표본화와 양자화를 거친 후 그것을 실제 디지털 정보로 표현해야 합니다. 이러한 과정을 부호화라고 말합니다. 사운드 파일은 파일의 크기가 크기 때문에 부호화하는 과정에서 일반적으로 압축하여 저장하게 됩니다. 지금까지 사운드의 개념과 디지털 변환 방법에 관하여 알아봤습니다.