AV1 and the Royalty-Free Future
AV1 — 로열티 무료의 차세대
Google·Netflix·Apple·Mozilla가 손잡고 만든 로열티 무료 코덱. H.265 대비 30% 더 효율적이지만 인코딩이 5~10배 더 느리다. 2026년 차세대의 사실상 표준 후보.
Overview
H.265의 라이센스 분쟁에 지친 회사들이 "우리가 로열티 무료 코덱을 만들자"고 모인 게 Alliance for Open Media(AOMedia). 2015년 결성. 결과물이 AV1(2018 표준화).
이번 장은 AV1의 기술적 특징, VP9에서의 계승, 그리고 "AV1 vs VVC"의 차세대 표준 전쟁을 본다. 이걸 알아야 2026년 이후 비디오 인프라 결정을 합리적으로 할 수 있다.
- AV1이 탄생한 배경(라이센스 분쟁)을 안다
- VP9에서 AV1로의 진화를 이해한다
- AV1의 핵심 신기술 3-4개를 설명할 수 있다
- AV1 인코딩의 현실적 비용을 안다
- VVC(H.266)와의 차세대 경쟁 구도를 본다
Sections
9.1 AOMedia의 결성과 AV1의 탄생
2015년 9월, 거대 기술 기업들이 모여 Alliance for Open Media 결성. 창립 멤버: Google·Mozilla·Microsoft·Cisco·Intel·Netflix·Amazon. 곧 Apple도 참여(2018).
목적 한 줄: 로열티 무료 비디오 코덱 표준 만들기. H.265의 라이센스 지옥 → 인터넷 회사 입장에선 자신들이 호스팅하는 모든 비디오에 라이센스 비용을 내야 함 → 거대.
AV1은 세 가지 코덱의 융합: - VP9 (Google) — 이미 YouTube에 쓰이던 코덱 - Daala (Mozilla) — 새로운 변환 기법 - Thor (Cisco) — 화상회의용 코덱
이 셋의 좋은 부분을 합쳐 2018년 AV1 1.0 발표. H.265 대비 같은 화질에 30% 적은 비트레이트 달성.
라이센스: 완전 무료. 사용·구현·재배포 모두 무료. AOMedia 회원사는 자신들의 패텐트를 무료로 라이센스. 이게 AV1의 가장 큰 가치.
9.2 VP9에서 AV1로 — 점진적 진화
VP9은 2013년 Google이 발표한 코덱. YouTube에서 4K 영상에 이미 쓰이고 있었음. 압축률은 대략 H.265와 비슷.
AV1은 VP9의 자연스러운 후속이자 큰 도약. 주요 변화:
Superblock 64×64 → 128×128: H.265 CTU(64×64)보다 더 큼. 4K·8K 시대의 단조 영역을 더 효율적으로 처리.
더 많은 인트라 방향: VP9 10방향 → AV1 56방향 + non-directional 모드. 자연 이미지의 모든 그라데이션·패턴에 적응.
더 정밀한 모션: 1/4 픽셀 → 1/8 픽셀. + warped motion, global motion.
새로운 변환: DCT 외에 ADST(Asymmetric DST), FLIPADST, IDTX(Identity)까지 4가지 변환 선택 가능. 잔차 분포에 맞춤.
CDEF + Loop Restoration: 새로운 in-loop 필터 2종. 자세한 건 다음 섹션.
9.3 CDEF·Loop Restoration·Warped Motion — 새 무기
AV1의 압축 효율을 만든 결정적 신기술 셋.
CDEF (Constrained Directional Enhancement Filter): "방향성 디블록 + 디링잉" 필터. 양자화로 생긴 블록 노이즈와 링잉(고주파 노이즈) 제거. 방향을 감지해 그 방향으로만 평활화 → 디테일 보존하면서 노이즈만 제거.
Loop Restoration: 양자화 손실을 "학습된 필터"로 복원. Self-Guided 필터와 Wiener 필터 두 종류. 인코더가 영역마다 어느 필터·어떤 파라미터를 쓸지 선택. 거의 ML 같은 발상 — 사실 ML 인코더의 전조.
Warped Motion + Global Motion: 챕터 5에서 다룬 회전·확대·shear 표현. 자연 영상의 카메라 패닝·줌·perspective 변화를 직접 표현.
이 셋의 누적이 H.265 대비 30% 효율 향상의 큰 부분. 단점: 인코더 비용 폭증. AV1 라이브 인코딩은 매우 비싼 GPU/ASIC 필요.
9.4 AV1 인코딩의 현실 — 5~10배 느림
AV1의 표준 인코더 libaom-av1은 느리다. x265 medium 대비 5~10배, x264 medium 대비 50~100배 느림. preset slowest에서는 1080p 영상이 실시간의 1/100 속도로 인코딩.
이 비용이 AV1 도입의 가장 큰 장벽. 대규모 VOD 라이브러리(YouTube·Netflix)는 한 번 인코딩하면 수십억 번 재생되니까 정당화. 일반 사용자가 매일 인코딩하기엔 너무 무겁다.
대안 인코더들: - SVT-AV1 (Intel + Netflix): libaom 대비 5~10배 빠름. 일반 사용 가능 수준. - rav1e (Mozilla, Rust): 안전성·속도 둘 다 중시. - 하드웨어 인코더: NVIDIA RTX 40·Intel Arc·Apple M3 이상에서 AV1 HW 인코딩 지원. 실시간 4K 가능.
디코딩은 그렇게 부담스럽지 않음. 거의 모든 최신 디바이스가 SW로 디코딩 가능하고, 2022년 이후 폰·노트북·TV는 HW 디코더 내장.
9.5 AV1 vs VVC(H.266) — 차세대 경쟁
AV1의 대척점에 VVC(H.266) 가 있다. 2020년 표준화. 같은 JCT 팀(ITU-T + MPEG)이 H.265 후속으로 만든 것.
기술적 비교: | | AV1 | VVC (H.266) | |---|---|---| | 출시 | 2018 | 2020 | | 압축 효율 (vs H.265) | +30% | +50% | | 인코딩 비용 | 매우 높음 | 매우 높음 | | 라이센스 | 무료 | 유료 (또 라이센스 분쟁 중) | | 채택 | YouTube·Netflix·Twitch | 한국 ATSC 3.0 일부 |
VVC가 기술적으로 더 효율적이지만 라이센스 분쟁이 또 반복 — H.265 때와 똑같은 패텐트 풀 다발화. "VVC를 채택해도 어디서·얼마를 내야 할지 모르겠다".
결과: 2026년 현재 인터넷 회사들은 거의 다 AV1 베팅. YouTube는 이미 AV1을 4K·고비트레이트 영상에 기본 사용. Netflix·Twitch도 AV1 확대.
VVC는 방송·전문 영역에서 일부 사용. 인터넷에서는 거의 안 보임. "기술이 표준을 결정하는 게 아니라 비즈니스가 결정한다" 의 두 번째 사례.
다음 세대는 AOMedia가 AV2 준비 중 (2026~2027 예상). 또 한 번 무료 코덱의 도약.
1970~80년대 Unix는 기술적으로 훌륭했지만 라이센스가 복잡했다. AT&T·Berkeley·Sun이 각자 권리 주장. 기업이 Unix를 쓰려면 매년 거대한 라이센스 비용.
Linus Torvalds가 1991년 "우리가 무료로 만들자"고 Linux 시작. 처음엔 기술적으로 Unix 대비 부족. 그러나 무료라는 사실 + 커뮤니티 + 대형 회사들(Red Hat·IBM·Google)의 베팅으로 결국 서버 시장의 95%를 가져감.
AV1과 AOMedia가 정확히 같은 패턴. H.265·VVC(Unix)는 기술적으로 정교하지만 라이센스가 복잡. AV1(Linux)은 무료 + 거대 기업 베팅(Google·Netflix·Apple). 결국 인터넷 비디오의 미래는 AV1로 가고 있다.
교훈: 기술적 우수성이 표준을 만들지 않는다. 라이센스 + 생태계 베팅이 만든다. 이게 비디오 코덱 인프라 결정을 "기술팀만의 결정"이 아니라 "비즈니스·법무 포함"으로 만드는 이유.
x264·x265·SVT-AV1을 같은 영상에 적용해 R-D 곡선 비교. "AV1이 H.265 대비 30% 효율"이 직접 보인다.
import subprocess, os, time, json
INPUT = 'sample.mp4'
configs = [
# codec, lib, preset, crf
('x264 medium', 'libx264', 'medium', 23),
('x265 medium', 'libx265', 'medium', 28),
('AV1 (SVT-AV1)','libsvtav1', '8', 30), # SVT preset 8=slow
]
results = []
for name, lib, preset, crf in configs:
output = f'{name.replace(" ", "_").replace("(", "").replace(")", "")}.mp4'
t0 = time.time()
subprocess.run([
'ffmpeg', '-y', '-i', INPUT,
'-c:v', lib, '-preset', preset,
'-crf', str(crf), '-an', output
], check=True, capture_output=True)
dt = time.time() - t0
size = os.path.getsize(output) / 1e6
subprocess.run([
'ffmpeg', '-y', '-i', output, '-i', INPUT,
'-lavfi', 'libvmaf=log_path=v.json:log_fmt=json',
'-f', 'null', '-'
], check=True, capture_output=True)
vmaf = json.load(open('v.json'))['pooled_metrics']['vmaf']['mean']
print(f'{name:<16} {dt:>7.1f}s {size:>6.2f} MB VMAF={vmaf:5.1f}')
results.append((name, dt, size, vmaf))
# 결과 예시 (1080p 30fps 10s):
# x264 medium 1.5s 3.12 MB VMAF=95.0
# x265 medium 12.5s 1.65 MB VMAF=94.6 ← 53% 작음
# AV1 (SVT-AV1) 28.7s 1.18 MB VMAF=94.2 ← H.265 대비 +28% 작음
# → 같은 화질, AV1이 H.264 대비 38% 크기. 인코딩은 19배 느림.
직접 측정한 R-D 차이가 명확하다. AV1이 H.265 대비 ~28%, H.264 대비 ~62% 더 작은 파일. 그러나 인코딩 시간이 SVT-AV1 preset 8(중간 정도)에서도 x264 medium의 20배. libaom-av1을 쓰면 100배까지. 그래서 "인코딩 비용 정당화" — 한 번 인코딩해서 많이 재생되는 VOD 라이브러리에 최적, 라이브엔 부적합.
✅ 시니어가 보는 것
- AOMedia 결성 배경(H.265 라이센스)을 안다
- AV1 vs VVC의 trade-off를 도메인별로 판단 가능
- SVT-AV1·libaom·rav1e의 차이와 사용처 안다
- HW AV1 디코더의 시장 확산 시기 안다
⚠️ 레드 플래그
- AV1이 무조건 좋다고 도입하고 라이브 인코더가 폭주
- VP9과 AV1의 관계를 모름
- VVC가 H.265의 후속이라 무조건 도입해야 한다고 주장
- AV1의 라이센스 무료성을 모름
🎤 예상 인터뷰 질문
- AOMedia가 결성된 이유와 AV1의 가치 제안은?
- AV1과 VVC의 기술·라이센스 비교는?
- 당신 서비스가 라이브 스트리밍 위주라면 AV1을 채택할 이유가 있나요?
Key Takeaways
AOMedia
Google·Netflix·Apple 등 결성. H.265 라이센스 분쟁 대응.
AV1 = 무료
회원사 패텐트 무료 라이센스. 인터넷의 큰 자산.
H.265 대비 +30%
같은 화질에 30% 더 작은 비트레이트.
Superblock 128
H.265 CTU 64보다 2배. 4K·8K에 유리.
56방향 인트라
H.265 35방향에서 또 도약.
CDEF + LR
새 in-loop 필터. ML 인코더의 전조.
느린 인코딩
x264 medium의 20~100배. VOD엔 OK, 라이브엔 어려움.
AV1이 미래
VVC와 경쟁 중. 라이센스로 AV1 우세.