Recent
- Paper - Theory [SigLip 논문 리뷰] - Sigmoid Loss for Language Image Pre-Training
- Paper - Theory [Skip-DiT 논문 리뷰] - Accelerating Vision Diffusion Transformers with Skip Branches
- Anything else [취미 기록] - Chopin Ballade No.1 연주 영상 (아마추어; 악보 PDF)
- LLM project [다양한 한국어 LLM 벤치마크 평가 코드🍚] - 단 하나의 코드로 N개의 LLM 벤치마크 구현하기
- LLM project [Gukbap-LLM🍚] - 오픈소스 LLM으로 자체 데이터셋 생성해서 SOTA 달성하기
- Coding errors RuntimeError: Error(s) in loading state_dict for Model - [LoRA fine-tuning 코드 직접 제작 꿀팁(에러 해결)] -
- Paper - Theory [MoH 논문 리뷰] - MULTI-HEAD ATTENTION AS MIXTURE-OF-HEAD ATTENTION
- Paper - Theory [Dense Connector 논문 리뷰] - Dense Connector for MLLMs
- Paper - Theory [LLaVA-Video 논문 리뷰] - VIDEO INSTRUCTION TUNING WITH SYNTHETIC DATA
- Paper - Theory [LLaVA-OneVision 논문 리뷰] - LLaVA-OneVision: Easy Visual Task Transfer
- Paper - Theory [LLaVA-NeXT 논문 리뷰] - Improved Baselines with Visual Instruction Tuning
- Paper - Theory [LLaVA 논문 리뷰] - Visual Instruction Tuning