📚 SYLLABUS
World-Action Models
월드-액션 모델
비디오로 미래를 상상하고 그 상상에서 행동을 이끌어내는 WAM(World-Action Model)의 등장 배경부터 최신 시스템까지 체계적으로 학습합니다. VLA와의 차이, 세 가지 설계 차원, 실전 모델(DreamZero·Fast-WAM 등), 그리고 WAM+VLA 하이브리드 미래 전망까지 초보자도 이해할 수 있는 깊이로 다룹니다.
BEGINNER PYTHON 10 CHAPTERS
CH 01
🤖 The Robot Foundation Model Challenge
로봇 파운데이션 모델의 도전
왜 언어를 이해하는 로봇을 만들기 어려운지, 그리고 VLA·WAM이라는 두 접근법이 어떻게 등장했는지 파악한다.
CH 02
🌍 World Models — How AI Imagines the Future
세계 모형 — AI가 상상하는 법
세계 모형(World Model)이 무엇이고, 왜 로봇 AI에서 강력한 사전학습 신호가 되는지 이해한다.
CH 03
🎬 Video Foundation Models — Wan, Cosmos, DiT
비디오 파운데이션 모델 — Wan, Cosmos, DiT
DiT 기반 비디오 생성 모델이 어떻게 동작하는지, 왜 이들이 WAM의 강력한 백본이 되는지 이해한다.
CH 04
🗣️ VLA Models — From Language to Direct Action
VLA 모델 — 언어에서 행동으로 직접 연결
VLA 모델의 구조와 한계를 이해하고, 언어-행동 그라운딩 갭이 왜 WAM 패러다임을 촉발했는지 파악한다.
CH 05
💡 WAM Core Idea — Video First
WAM 핵심 아이디어 — 비디오가 먼저다
WAM이 VLA와 어떻게 다른 방식으로 그라운딩 갭을 줄이려 하는지, 핵심 가설과 세 가지 설계 차원을 파악한다.
CH 06
🔮 Paradigm — What to Predict?
첫 번째 차원 — 무엇을 예측할 것인가
역동역학·공동 예측·표현 전용, 세 가지 WAM 패러다임의 동작 원리와 트레이드오프를 이해한다.
CH 07
🎮 Action Integration — How to Feed Actions
두 번째 차원 — 행동을 어떻게 넣을 것인가
기본 토큰·이미지로서의 행동·잠재 행동, 세 가지 액션 통합 전략의 원리와 각각의 장단점을 이해한다.
CH 08
🏗️ Architecture — How to Compose Components
세 번째 차원 — 아키텍처를 어떻게 구성할 것인가
계층적·단일·MoT 아키텍처 패턴의 구조적 차이와 각각이 적합한 상황을 이해한다.
CH 09
🚀 Real WAM Systems — from UniPi to DreamZero
실전 WAM 시스템들 — UniPi부터 DreamZero까지
UniPi·GR-1·DreamZero·LingBot-VA·Fast-WAM 등 실제 WAM 시스템의 설계 선택과 성능을 구체적으로 이해한다.
CH 10
🌅 The Future — Hybrids, RFFM, and Open Questions
미래 전망 — 하이브리드 시대와 열린 질문들
WAM+VLA 하이브리드 수렴 가설, 로보틱스 퍼스트 파운데이션 모델, 그리고 이 분야의 핵심 미해결 질문들을 이해한다.