WELCOME — DIRECF.GITHUB.IO
direct fun, deep study
AI 시대를 살아가며 공부한 것들과 가끔의 사적인 단상. 좌측 카테고리에서 영역별로 글을 탐색할 수 있다.
최신 글
MULTIMODAL AI
Frame Sampling for Multimodal AI
비디오 LLM의 진짜 병목은 모델 크기가 아니라 frame sampling이다. 2026 SOTA(AKS, BOLT, Frame-Voyager, Q-Frame, AdaRD-Key, FOCUS)와 상용 서비스(Gemini, Twelve Labs)의 갭, plug-and-play architecture로 SOTA를 갈아끼우는 운영 패턴.
COMPUTER VISION
DeepLabV3 & SqueezeSegV2: Semantic Segmentation
DeepLabV3의 ASPP와 SqueezeSegV2의 LiDAR range image — 2D/3D semantic segmentation 완전 정리. ECCV 2018·ICRA 2019.
COMPUTER VISION
PointPainting: Sequential Fusion of Lidar and Image Semantics
PointPainting — 2D semantic segmentation을 LiDAR point cloud에 투영하는 센서 융합. CVPR 2020.
그 외 글
COMPUTER VISION
PointRCNN: 3D Object Proposal Generation from Point Cloud
COMPUTER VISION
PointNet++: Deep Hierarchical Feature Learning
COMPUTER VISION
PointNet: Deep Learning on Point Sets for 3D
COMPUTER VISION
CNN Backbone Evolution: AlexNet → ResNet
ENGINEERING PHILOSOPHY
Engineering Philosophy in the AI Agent Era
COMPUTER SCIENCE
System Architecture & Network Protocols
✍️
DIARY
Smoothness