dev.Log

A-law와 μ-law(뮤로우)의 차이점 정리 본문

인공지능

A-law와 μ-law(뮤로우)의 차이점 정리

초코푸딩 2025. 12. 26. 14:27

― 전화 음성에서 왜 두 가지 PCM 포맷이 존재할까?

전화 음성이나 VoIP, STT 서버를 다루다 보면
A-law, μ-law (Mu-law)라는 용어를 한 번쯤은 반드시 만나게 된다.

둘 다 G.711 표준 기반의 음성 컴팬딩(companding) 방식이지만,
지역·음질 특성·노이즈 처리 방식에서 분명한 차이가 있다.

이번 글에서는
A-law와 μ-law의 차이,
그리고 STT·서버 개발 시 주의점까지 정리해본다.


1. 왜 A-law / μ-law가 필요할까?

전화 음성은 대역폭이 매우 제한적이다.

  • 원본 음성: 보통 16bit Linear PCM
  • 전화망 요구사항: 8bit / 64kbps

하지만 단순히 비트를 줄이면 음질이 급격히 나빠진다.
여기서 등장한 개념이 바로 컴팬딩(Companding) 이다.

Companding = Compress + Expand
작은 소리는 정밀하게,
큰 소리는 거칠게 표현하는 비선형 압축 방식

인간의 청각 특성을 이용해
인지 음질은 유지하면서 데이터 크기를 줄이는 방식이다.


2. A-law와 μ-law란?

구분설명
A-law ITU-T 표준, 유럽·한국·국제 전화망
μ-law (Mu-law) 북미·일본 중심 표준

둘 다 G.711에 포함되지만,
압축 곡선과 음질 특성이 다르다.


3. 핵심 차이 비교

항목A-lawμ-law (Mu-law)
사용 지역 유럽, 한국, 국제 미국, 일본
표준 명칭 G.711 A-law G.711 μ-law
비트 수 8-bit 8-bit
압축 강도 완만함 더 강함
작은 소리 표현 보통 매우 정밀
잡음 내성 좋음 상대적으로 약함
Dynamic Range ~13 bits ~14 bits
음질 성향 안정적 민감, 디테일 우수

4. 음질 관점에서의 차이

🔹 μ-law

  • 작은 음성(속삭임, 약한 발음)에 매우 민감
  • 조용한 환경에서는 더 선명
  • 대신 노이즈도 같이 증폭

🔹 A-law

  • 0 근처는 선형, 이후 로그 압축
  • 잡음 억제에 유리
  • 전화 품질이 불안정한 환경에서 안정적

“깔끔함” vs “안정성”의 차이라고 보면 된다.


5. 수식 차이 (개념적)

  • μ-law
    • 로그 곡선이 가파름
    • 작은 입력 신호를 크게 확장
  • A-law
    • 저레벨 구간에서 선형 + 로그 혼합
    • 왜곡과 노이즈 억제에 유리

실제 구현에서는
수식보다 디코딩 포맷 일치 여부가 훨씬 중요하다.


6. STT / 서버 개발에서 중요한 포인트 

 포맷을 잘못 해석하면?

  • 음성이 찢어짐
  • 볼륨이 이상하게 커지거나 작아짐
  • STT 인식률 급락

특히 RTP / SIP 연동 시 Payload Type을 반드시 확인해야 한다.

 
RTP Payload Type 0 → PCMU (μ-law) 8 → PCMA (A-law)

STT 엔진 입력 포맷과 완벽히 일치해야 정상 동작한다.


7. 실무에서 언제 뭘 쓰나?

 A-law를 쓰는 경우

  • 국내 통신사 연동
  • 공공·금융 시스템
  • 전화 품질이 들쑥날쑥한 환경

μ-law를 쓰는 경우

  • 미국 기반 서비스
  • Twilio, Asterisk 기본 설정
  • 조용한 환경에서의 음성 인식

8. 한 문장 요약

μ-law는 작은 소리를 더 잘 살리는 대신 민감하고,
A-law는 잡음과 왜곡에 강한 안정형 컴팬딩 방식이다.

'인공지능' 카테고리의 다른 글

Baseline / Ablation, 그리고 라벨링 이야기  (0) 2025.12.29
FP16과 BF16의 차이  (0) 2025.12.29
실시간 STT  (0) 2025.12.23
CTC vs RNN-T vs Attention Seq2Seq  (1) 2025.12.23
DVC?  (0) 2025.12.23
Comments