본문 바로가기

Feature

고해상도 음원, DSD,FLAC,MQA의 차이는?

DATE. 2017.07.12.

“Hi-Resolution Audio 음원”. DSD, FLAC, MQA 등의 차이는?

“고해상도(Hi-Resolution)음원”이라고 한단어로 부르고 있지만, 사실은 다양한 포맷이 존재하고 있다. 파일의 형식이 바뀌면 소리의 정보량 나아가서는 음질이 바뀌게 되며, 파일 크기도 달라지기 때문에 사용하고자 하는 재생 기기 / 소프트웨어에서 해당 포맷을 대응하고 있는지 여부에 따라 포맷 선택도 중요하다.

고해상도 포맷은 여러가지 가 있지만

샘플링 레이트는

디지털 음원은 그 대부분이 “리니어 PCM” 이것은 소리의 파형 (아날로그 신호)를 일정한 주기로 수치화 (샘플링)한 데이터이다. 이 주기를 “샘플링”고 말한다. 샘플링을 44,100 분의 1 초마다 실시하면 “44.1kHz” 96,000 분의 1 초이면 “96kHz” 192,000 분의 1 초이면 “192kHz”…… 수치가 높을수록 샘플링 할때의 사이클이 짧고 더 많은 정보를 담고 있다는 의미이다. 즉,이 수치를 보면 “시간에 얼마나 촘촘하게 소리를 측정했는지”를 알 수있다. 당연히 더 촘촘할수록 데이터도 많고 음질도 좋다.

비트 수는

리니어 PCM 생성을 위한 아날로그 신호를 디지털 신호로 변환 (AD 변환) 할 때 신호의 진폭을 몇 단계로 표현 하는지를 나타내는 값을 말한다. 값이 클수록 소리의 진폭을 섬세하게 포착하여 원래의 아나로그 소리의 파형에 접근 할 수 있는 만큼 해상도가 높은 치밀한 사운드를 재생 할 수있다.

양자화 비트 수의 많음은, 그대로 데이터의 해상도에 직결된다. 예를 들어, 양자화 비트 수가 1 (1bit)의 경우 표현의 폭은 “0 또는 1」의 2 단계가되지만, 2bit는”00 “과”01 “,”10 “과”11 “의 4 단계 를 표현할 수있다. 마찬가지로, 4bit이면 16 단계, 8bit이면 256 단계 16 비트는 65,536 단계, 그리고 24 비트는 16,777,216 단계입니다 이렇게 비트가 높을 수록 더욱 세밀한 표현이 가능하게된다.

소리를 파형 데이터로 볼때 최대 / 최소 음의 비율 “다이내믹 레인지”는 비트 수로 결정된다. 인간의 청각이 들을 수 있는 다이나믹 레인지는 120dB 정도되는데, 양자화 비트 수가 16bit의 경우 96dB의 결과, 24bit는 144dB, 32bit라면 192dB에 도달하기 위해 (1bit 늘어날 때마다 6dB 증가) 고해상도 음원이라면 미세한 소리에서 강력한 소리까지 여유있게 넣을 수 있다는 의미가 된다.

원래의 파형 데이터, 세로축이 샘플링레이트 가로축이 비트수
원래의 파형 데이터, 세로축이 샘플링레이트 가로축이 비트수
샘플링 레이트가 높은 (가로축이 미세) 정도, 비트 수가 큰 (세로 축이 미세)만큼 정보량이 풍부한 "고해상"소리가 된다
샘플링 레이트가 높은 (가로축이 미세) 정도, 비트 수가 큰 (세로 축이 미세)만큼 정보량이 풍부한 “고해상”소리가 된다

 

 

“고해상도”의 정의

DSD를 제외하고 고해상도 음원은 앞서 말씀드린 샘플링 레이트 및 양자화 비트 수로 구별된다.보통 “CD 스펙보다 ‘라는 표현이 사용되는데, 그것은 CD의 샘플링 레이트 (44.1kHz)와 양자화 비트 (16bit)을 기준으로한다는 뜻이다.

그렇기 때문에 일반적으로 고해상도 오디오 음원은 “샘플링 속도와 양자화 비트 중 하나가 CD의 스펙보다 높음.”이라는 의미로 사용된다.

보다 구체적으로 각 제조사들이 각 제품에 붙이는 고해상도 음원이라는 의미는 “음원의 고해상도 여부”를 결정하는 엄격한 통일 기준이 없어 FLAC 및 WAV 등 형식만으로 고해상도 여부 결정되는 것은 아니다. 데이터 량이 오디오 CD 이상일 것, 특히 양자화 비트 수가 24bit 이상인 것을 요구하고 있기 때문에하면 “샘플링 속도가 44.1kHz 이상하고 양자화 비트 수가 24bit 이상 ‘의 음원이 고해상도 라고 생각해 좋은 것 같다. 물론 음질이 어쩌고 저쩌고하는 청 감상의 기준이 아니기 때문에, 고해상도의 조건을 충족 고음질 것은 아니라는 점에 유의 해두고 싶다.

 

비압축 또는 무손실 압축

리니어 PCM 샘플링 된 데이터 자체에서 변환 처리를하지 않는 한 이론적으로는 열화하지 않는다. 그러나 한번 만들어진 데이터의 효율적인 저장은 고려되어 있지 않기 때문에, 샘플링 레이트와 양자화 비트 수를 늘릴수록 파일 크기가 커진다. MP3 등 압축 음원에 몇MB정도의 곡이 고해상도에서는 수십MB 혹은 수백MB가 되는 이유는 바로 이것이다.

그래서 사용되는 것이 “무손실 압축”코덱. 리니어 PCM을 부합화 (어떤 규칙에 따라 데이터 정렬 / 저장 패턴을 정돈 처리)하여 데이터를 압축하는 것이 목적이다. 재생시 실시간으로 원래의 리니어 PCM으로 변환되어 이론상 음질의 열화가 발생하지 않는다. “FLAC”이며 “ALAC”가 대표적인 존재로, 리니어 PCM을 약 60% 정도의 데이터 크기로 줄일 수 있다. 부합화 할 때 원래의 정보를 완전히 남겨놓기 때문엥 이론적으로 음질 열화하지 않는 것이 특징이다.

한편 ‘손실 압축’의 코덱은 데이터 크기가 원래의 10%정도가 될 정도로 높은 압축률있는 반면 부합화 할 때 가청대역 이외의 소리 (인간의 귀가 감지 할 수 없다고되어 하는 높은 주파수 대역)를 제거하게된다. 고해상도의 장점이라고 할 수 리얼한 음장, 깊이 있는 표현은 가청 대역 외의 소리의 존재가 크게 영향을주고 있다고 생각할 수 있기 때문에 손실 압축 코덱으로 처리 된 소리는 고해상도로 분류되지 않는다라고 생각되는게 아직까지는 지배적이다.

 

PCM 또는 DSD

이제까지 PCM을 전제로 한 고해상도의 정의를 봐 왔지만, “DSD (Direct Stream Digial) ‘도 고해상도 음원의 일종으로 인식되고있다. 일반적으로 제조사들은 DSD도 DSD 2.8MHz / 5.6MHz의 재생에 대응하는 제품을 고해상도 기기로 인정한다.

PCM과 DSD는 소리의 재현 방법이 완전히 다르다. DSD는 항상 1bit의 진폭 (1bit는 “0”또는 “1”로 표현되는)에서 시간축 방향만을 세분화하여 기록한다.

반면, PCM의 경우 비트 수를 늘림으로써 해상도를 높여 동적 범위를 확장 할 수 있지만, 다른 한편으로는 양자화 노이즈 (실제 진폭 값을 올리거나 잘라낼때의 오차에서 발생하는 왜곡) 가 발생 해 버린다. DSD는 1bit 고정하여 양자화 노이즈가 발생하지 않는 상태를 만들어 샘플링 속도를 크게 끌어 올릴 것으로 정보량을 확보하는 셈이다.

DSD는 "0 또는 1'라는 1bit의 진폭에서 시간축 방향 정보의 소밀 소리 정보를 기록한다.
DSD는 “0 또는 1’라는 1bit의 진폭에서 시간축 방향 정보의 소밀 소리 정보를 기록한다.

주요 고해상도 포맷

FLAC

분류 : PCM
압축 : 유 (무손실)
확장자 : .flac

고해상도 음원을 대표하는 존재가 ‘FLAC (플랙) “이다. 오픈 소스 (소스 코드가 공개되어 자유롭게 개량 / 재배포 할 수있는 소프트웨어)의 무손실 코덱이며, 로열티가 발생하지 않는 것이 인기의 이유 중 하나이지만, 소스 코드를 읽으면 제대로 비손실 압축이 행해지고 있는 것을 확인할 수있다. 이러한 안정감도 보급을 도왔다고 생각된다.

비 압축 리니어 PCM 소스로 작성 (인코딩)하는 경우가 많으며, 소스에 비해 60 % 전후의 파일 크기로 압축 할 수있다. 해당 기기 / 소프트도 많다. 현재 iOS는 뒤쳐지고있다 (일부 응용 프로그램 측에서 지원 된)하지만, 고해상도 대응을 노래하는 기기라면 거의 확실하게 지원되고있다. 어떤 형식을 선택하는지 잘 모르는 경우에는 FLAC을 선택해 두면 먼저 실패는 없을 것이다.

ALAC(Apple Lossless Audio Codec)

분류 : PCM
압축 : 유 (무손실)
확장자 : .m4a, .mov, .alac

Apple이 AirTunes를 사용하여 오디오 무손실 전송을 실현했을 때 등장했다. 처음에는 독자 기술 이었지만 나중에 오픈 소스 화되어 현재는 FLAC에 이어 무손실 코덱으로 보급되고있다.

등장의 배경처럼 Apple 제품에서 지원되며 iTunes를 이용하여 파일을 인코딩 할 수 있다. 그러나 Apple 제품은 고해상도 재생을 고려하지 않은 디자인 때문에 iOS 기기에서 고해상도 품질의 ALAC 파일을 재생해도 CD 수준까지 다운 샘플링 된것이다.

지난 몇 년 동안 ALAC를 지원하는 오디오 기기도 많아 졌고, 일부 고해상도 음원사이트에서도 취급되고 있지만, FLAC 쪽이 더 소프트 / 하드웨어 면에서 지원되는 것이 많다.  FLAC에 비해 음질상의 이점 없다 (모두 결국 같은 리니어 PCM 데이터로 복원된다) 때문에 Apple 제품으로 통일 한 사용자 이외는 적극적으로 선택하는 이유는 없을 것이다.

WAV

분류 : PCM
압축 없음 확장자 : .wav

리니어 PCM의 컨테이너 형식 (다양한 종류의 데이터를 저장할 수 있으며 음악 용도의 경우 코덱의 선택이 가능)로 보급하고 있으며, 고해상도 음원 사이트에서도 많이 서비스 되고 있다. 리니어 PCM은 압축을 위한 파일 크기는 늘어나지만 디코딩 처리가 필요 없기 때문에 음질의 관점에서 굳이 WAV를 선택하는 사람도 적지 않게 존재한다.

디지털 오디오 기기 / 소프트웨어의 대부분에서 재생할 수 있지만, 아티스트 및 앨범 이미지 등의 태그 / 메타 데이터보기는별로 기대할 수 없다. 데이터를 저장하는 것은 가능하지만, 그 형식이 공식적으로 정의되어 있지 않기 때문에 볼수 있는 환경도 있지만, 그렇지 않은 경우도 있다.  Roon 같은 메타 데이터를 참고로 관련 아티스트 등의 정보를 검색하는 응용 프로그램을 사용하는 경우, WAV보다 FLAC 나 ALAC 쪽이 편리 성은 높다.

샘플링 레이트가 352.8kHz (44.1KHz의 8 배) 또는 384KHz (48kHz의 8 배),  비트 수가 24bit 이상의 리니어 PCM은 특히 “DXD”(Digital eXtreme Definition)로 불린다. 원래는 SACD의 제작을 목적으로 한 형식이지만 (DSD가 편집에는 맞지 않기 때문에) 현재는 전송 형식으로도 활용되고있다.

DSD

분류 : 1bit
압축 : 유 (무손실)
확장자 : .dff, .dsf

지난 몇 년 동안 지원 하드웨어 / 소프트웨어가 늘어나 고해상도 음원 사이트에서의 서비스도  순조롭게 성장하고있는 형식이다. 매우 짧은 시간에 디지털 신호를 온 오프하고 (1bit), 정보의 밀도로 오디오 신호를 표현한다. 1bit이므로 신호는 0과 1 밖에없고, 정보의 양을 늘리려면 온 – 오프 시간 단위를 더 짧게하는 것으로 대응하기 위해 그 주파수의 크기가 정보량에 직결된다. 즉, 2.8MHz에서 5.6MHz, 5.6MHz보다 11.2MHz 쪽이 정보량은 많다.

DSD는 PCM과 근본적으로 기록 원리가 다르기 때문에 볼륨을 바꾸는 등의 파형 데이터에 대한 처리 수 없다. 따라서 녹음에서 편집까지의 공정은 PCM로 진행 궁극적으로 사용자의 귀에 도달 음원을 생성하는 처리 (마스터)에서 아날로그에 다시 DSD로 녹음이라는 공정으로 제작 된 음원이 대부분이다. 녹음에서 모두 DSD에서 행하는 “DSD 녹음 “의 음원도 존재하지만, 그 수는 많지 않다.

DSD 재생 방식은 ‘기본’과 ‘PCM 변환’으로 구분된다. 전자는 DSD 데이터를 그대로 재생하지만 DSD 대응 칩 (하드웨어)가 필요하다. 후자는 DSD 데이터를 PCM으로 변환하여 출력하기위한 데이터로는 WAV와 거의 같게된다. 미묘한 차이지만 기본 재생 및 PCM 변환에서는 소리의 뉘앙스가 달라지기 때문에 기본 재생에 집착하는 사용자가 많다.

또한 DSD를 USB를 통해 네이티브 재생하는 경우, “완전 네이티브 ‘와’DoP”(DSD over PCM) 중 하나를 선택하게된다. 전자는 문자 그대로 변환하지 않지만, 후자는 DSD 신호를 PCM으로 변환해 출력하는 것으로, 본래는 DSD 신호를 취급 할 수없는 USB로의 재생을 가능하게하고있다.

MQA

분류 : PCM
압축 : 유 확장자 : 불특정

WAV에 비해 몇 분의 1 정도로 작은 용량하면서도 스튜디오 마스터 클래스의 품질을 실현할 수 있다고한다. “MQA”(Master Quality Authenticated)는 다른 고해상도 용 파일 포맷과 다른 특징을 가진다. 인간의 귀는 식별하기 어려운 고역 정보를 가청 대역 내에 포함 ‘뮤직 종이 접기’라는 기술은 높은 압축률과 소용량 화를 실현하고있다.

아날로그 파형을 디지털화 할 때 필터는 순간적인 소리의 파형 노망 · 스며를 야기 ‘공명’의 원인이되지만, MQA에서 울리는 10 분의 1 정도까지 억제 필터를 사용한다. 그 결과 10 마이크로 세컨드 단위의 높은 시간 정밀도를 실현, 정위감 · 음장감을 더 정확하게 재현 할 수 있다고한다.

MQA의 인코딩 처리는 44.1kHz에서 768kHz까지의 리니어 PCM 음원에 정할 수, FLAC 나 ALAC, WAV 등 기존의 파일 형식 (컨테이너 형식)에 저장 가능하다. 전용 디코더가 탑재 된 기기를 이용하면 “종이 접기를 열고”수 본래의 퀄리티를 발휘한다. 비 기기를 이용해도 재생할 수 있지만, 그 경우는 “종이 접기를 열 수 없습니다”때문에 MQA의 고유 정보를 포함하지 않는 일반 PCM 재생된다.

MQA는 e-onkyo music 다운로드 전달하고있다. 스트리밍 형 배달도 통신량을 억제하고 사용할 수 있다는 장점이 있으며, 해외에서는 음악 배달 “TIDAL”가 96kHz / 24bit의 고음질 MQA 스트리밍 “TIDAL Masters ‘을 전개하고있다.

 

 그럼, 현재는 FLAC이 가장 유력한 대안인가

고해상도 포맷은 딱 잘라 말하면 ,「PCM계 또는 DSD “PCM 계이면”무손실 압축 “또는”압축 “을 선택하는 상황이 계속되어왔다. 재생 기기 측의 사정이나 소리의 취향도 있겠지만, 데이터 압축 효과 (파일 용량)와 음질의 균형에서 보면 “무손실”이 합리적인 존재 다.

특히 소스 코드가 공개 된 로열티가 발생하지 않고, 이미 많은 고해상도 대응 오디오 기기에서 지원되는 차기 iOS (iOS 11)는 시스템 레벨에서 지원되는 등 스마트 폰에서도 이용할 수있는 FLAC는 앞으로도 고해상도 형식의 중심적 존재 인 것이다.

돌아 보면 새로운 MQA의 등장이나 스트리밍 서비스의 보급 등 변화의 조짐도 있지만, 오디오 포맷은 매력적인 콘텐츠가 있어야만 한다.
무엇보다 음반사 / 음원제공 서비스 회사의 고해상도에 대한 적극적인 대처를 기대해 볼만하다.

 


ADD COMMENT

Welle 로그인로그인이 필요합니다.