dev.Log
A-law와 μ-law(뮤로우)의 차이점 정리 본문
― 전화 음성에서 왜 두 가지 PCM 포맷이 존재할까?
전화 음성이나 VoIP, STT 서버를 다루다 보면
A-law, μ-law (Mu-law)라는 용어를 한 번쯤은 반드시 만나게 된다.
둘 다 G.711 표준 기반의 음성 컴팬딩(companding) 방식이지만,
지역·음질 특성·노이즈 처리 방식에서 분명한 차이가 있다.
이번 글에서는
A-law와 μ-law의 차이,
그리고 STT·서버 개발 시 주의점까지 정리해본다.
1. 왜 A-law / μ-law가 필요할까?
전화 음성은 대역폭이 매우 제한적이다.
- 원본 음성: 보통 16bit Linear PCM
- 전화망 요구사항: 8bit / 64kbps
하지만 단순히 비트를 줄이면 음질이 급격히 나빠진다.
여기서 등장한 개념이 바로 컴팬딩(Companding) 이다.
Companding = Compress + Expand
작은 소리는 정밀하게,
큰 소리는 거칠게 표현하는 비선형 압축 방식
인간의 청각 특성을 이용해
인지 음질은 유지하면서 데이터 크기를 줄이는 방식이다.
2. A-law와 μ-law란?
구분설명
| A-law | ITU-T 표준, 유럽·한국·국제 전화망 |
| μ-law (Mu-law) | 북미·일본 중심 표준 |
둘 다 G.711에 포함되지만,
압축 곡선과 음질 특성이 다르다.
3. 핵심 차이 비교
항목A-lawμ-law (Mu-law)
| 사용 지역 | 유럽, 한국, 국제 | 미국, 일본 |
| 표준 명칭 | G.711 A-law | G.711 μ-law |
| 비트 수 | 8-bit | 8-bit |
| 압축 강도 | 완만함 | 더 강함 |
| 작은 소리 표현 | 보통 | 매우 정밀 |
| 잡음 내성 | 좋음 | 상대적으로 약함 |
| Dynamic Range | ~13 bits | ~14 bits |
| 음질 성향 | 안정적 | 민감, 디테일 우수 |
4. 음질 관점에서의 차이
🔹 μ-law
- 작은 음성(속삭임, 약한 발음)에 매우 민감
- 조용한 환경에서는 더 선명
- 대신 노이즈도 같이 증폭됨
🔹 A-law
- 0 근처는 선형, 이후 로그 압축
- 잡음 억제에 유리
- 전화 품질이 불안정한 환경에서 안정적
“깔끔함” vs “안정성”의 차이라고 보면 된다.
5. 수식 차이 (개념적)
- μ-law
- 로그 곡선이 가파름
- 작은 입력 신호를 크게 확장
- A-law
- 저레벨 구간에서 선형 + 로그 혼합
- 왜곡과 노이즈 억제에 유리
실제 구현에서는
수식보다 디코딩 포맷 일치 여부가 훨씬 중요하다.
6. STT / 서버 개발에서 중요한 포인트
포맷을 잘못 해석하면?
- 음성이 찢어짐
- 볼륨이 이상하게 커지거나 작아짐
- STT 인식률 급락
특히 RTP / SIP 연동 시 Payload Type을 반드시 확인해야 한다.
RTP Payload Type 0 → PCMU (μ-law) 8 → PCMA (A-law)
STT 엔진 입력 포맷과 완벽히 일치해야 정상 동작한다.
7. 실무에서 언제 뭘 쓰나?
A-law를 쓰는 경우
- 국내 통신사 연동
- 공공·금융 시스템
- 전화 품질이 들쑥날쑥한 환경
μ-law를 쓰는 경우
- 미국 기반 서비스
- Twilio, Asterisk 기본 설정
- 조용한 환경에서의 음성 인식
8. 한 문장 요약
μ-law는 작은 소리를 더 잘 살리는 대신 민감하고,
A-law는 잡음과 왜곡에 강한 안정형 컴팬딩 방식이다.
'인공지능' 카테고리의 다른 글
| Baseline / Ablation, 그리고 라벨링 이야기 (0) | 2025.12.29 |
|---|---|
| FP16과 BF16의 차이 (0) | 2025.12.29 |
| 실시간 STT (0) | 2025.12.23 |
| CTC vs RNN-T vs Attention Seq2Seq (1) | 2025.12.23 |
| DVC? (0) | 2025.12.23 |
Comments