WELCOME — DIRECF.GITHUB.IO

direct fun, deep study

AI 시대를 살아가며 공부한 것들과 가끔의 사적인 단상. 좌측 카테고리에서 영역별로 글을 탐색할 수 있다.

최신 글

LATEST 3

Loop Engineering — 프레임워크에서 루프, 그리고 그래프로 (대표 논문 13편)

AutoGPT식 monolithic 에이전트 프레임워크에서 "에이전트는 결국 루프다"라는 harness 관점으로, 다시 LangGraph식 명시적 그래프 오케스트레이션으로 넘어가는 흐름을 대표 논문·에세이 13편으로 추적한다. ReAct·Reflexion·Voyager·Building Effective Agents·Tree of Thoughts·ReWOO·LLMCompiler·DSPy·LangGraph까지, framework→loop→graph 진화사로 2026 프로덕션 에이전트를 실제로 어떻게 짜는지 배운다.

10 chapters·JUL 23, 2026

COMPUTER VISION

에고-엑소 시점 일관성 — 두 시점을 하나로 잇는 연구의 흐름 (대표 논문 10편)

1인칭(ego)과 3인칭(exo) — 같은 사건의 두 시점을 '일관되게' 잇는 연구가 8년간 어떻게 깊어졌는지의 흐름과 insight를 10편으로 정리한다. 데이터셋이 아니라 방법론에 집중: 표현 정렬(Actor-Observer·Ego-Exo·AE2·BYOV·Rosetta Stone) → 객체 대응(ObjectRelator·O-MaMa·CCMP) → 시점 생성(Exo2Ego) → 추론 통합(View-GRPO). '일관성의 정의가 feature→시간→픽셀→생성→추론으로 점점 깊어진 역사'를 축으로, 각 전환의 필연을 논문 figure·개념 다이어그램과 함께 해부하는 연구자·면접 대비 advanced 10챕터.

10 chapters·JUL 23, 2026

실시간 VLM 비용 최적화 — 단계별 이벤트 탐지 논문 10편

끝없이 흐르는 비디오에서 특정 이벤트를 최소 비용으로 실시간 탐지하기 위한 파이프라인 단계별 비용 절감 핵심 논문 10편(2026.07 기준)을 해부한다. ①토큰 다이어트(TimeChat-Online·Dispider) → ②기억 관리(StreamingVLM·ReKV·LiveVLM·StreamMem·Flash-VStream) → ③트리거(VideoLLM-Online·StreamMind·StreamBridge)의 3단계로 정리하고, 직교 조합한 '2단 게이트 캐스케이드'로 종합. prefill·KV cache·attention sink 기초부터 쌓는 advanced 10챕터.

10 chapters·JUL 22, 2026

그 외 글

SWIPE →

COMPASS & Cross-Embodiment Mobility — 하나의 정책으로 모든 로봇을 움직이다

NVIDIA Physical AI Map — Omniverse·Cosmos·Isaac·GR00T 전체 지도

GR00T & NVIDIA Physical AI 2026 — GR00T는 데이터로 navigation과 manipulation을 다 먹는가

COMPUTER VISION

Ego-Exo 연구 — 크로스뷰 학습부터 논문 작성까지

COMPUTER SCIENCE

AI 엔지니어를 위한 백엔드 & Ops

AWS 기초 완전 정복 — S3·EC2·VPC·Lambda부터 실전 아키텍처까지

AWS 심화 완전 정복 — ECS·SageMaker·EventBridge·Kinesis부터 FinOps까지