๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

AI/LLM project

[Gukbap-LMM๐Ÿš] - ์˜ค์ง ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹๋งŒ์œผ๋กœ ํ•œ๊ตญ์–ด ๊ธฐ๋ฐ˜ LMM ์ œ์ž‘ํ•˜๊ธฐ

๋ฐ˜์‘ํ˜•

Gukbap-LMM Series Models

Gukbap-LMM Training Codeโ˜€๏ธ

Training Code (github): https://github.com/Marker-Inc-Korea/KO-LMM-FFT

 

GitHub - Marker-Inc-Korea/KO-LMM-FFT: Korean Large MultiModal FFT Code

Korean Large MultiModal FFT Code. Contribute to Marker-Inc-Korea/KO-LMM-FFT development by creating an account on GitHub.

github.com


Introduction

์˜ค์ง ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹๋งŒ์œผ๋กœ ํ•ด์™ธ LMM์„ ํ•œ๊ตญ์–ด ๊ธฐ๋ฐ˜ LMM์œผ๋กœ ํŠœ๋‹ํ•˜๊ธฐ๐Ÿ”ฅ

์•ˆ๋…•ํ•˜์„ธ์š”! ์–ด๋Š๋ง 2025๋…„์ด ์ง€๋‚˜๊ณ  2์›”์ด ๋„˜์–ด์„œ ์˜ค๋žœ๋งŒ์— ์ธ์‚ฌ๋“œ๋ฆฝ๋‹ˆ๋‹ค!๐Ÿค—

์š”์ฆ˜์—๋Š” LLM๋ณด๋‹ค LMM์˜ ์ธ๊ธฐ๊ฐ€ ๋”๋”์šฑ ๋งŽ์•„์ง€๊ณ  ์žˆ๋Š” ๊ฒƒ ๊ฐ™๊ณ , ์ €๋„ Multi-Modal์— ๊ด€์‹ฌ์ด ์›Œ๋‚™ ๋งŽ์€์ง€๋ผ, ์ตœ๊ทผ์— ๋…ผ๋ฌธ๋ฆฌ๋ทฐ๋„ ๋งŽ์ดํ•˜๊ณ  ์—ฌ๋Ÿฌ ๋ชจ๋ธ๋“ค์„ follow-up์„ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค!

 

์ €ํฌ Markr.AI ํŒ€์˜ ์ตœ๊ทผ ์—ฐ๊ตฌ ๋ชฉ์ ์€ "ํ•ด์™ธ ๊ณ ์„ฑ๋Šฅ ์‚ฌ์ „ํ›ˆ๋ จ ๋ชจ๋ธ์˜ ํ•œ๊ตญ์–ดํ™”"์ž…๋‹ˆ๋‹ค. ํ•ด์™ธ ๊ฑฐ๋Œ€ ๊ธฐ์—…๋“ค์€ ์ˆ˜๋งŽ์€ GPU๋ฅผ ํ™œ์šฉํ•˜์—ฌ LMM์„ ๊ฐœ๋ฐœํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์— ๋”ฐ๋ผ ์ผ๋ถ€ ์˜คํ”ˆ์†Œ์Šค LMM ์ค‘์— ์˜์–ด ๋Šฅ๋ ฅ์œผ๋กœ GPT-4o๋ฅผ ๋›ฐ์–ด๋„˜์€ ์‚ฌ๋ก€๋“ค์ด ์žˆ์ง€๋งŒ, ๋Œ€๋ถ€๋ถ„ ํ•œ๊ตญ์–ด ๊ธ€ ์ƒ์„ฑ ๋Šฅ๋ ฅ์ด ๋งŽ์ด ๋–จ์–ด์กŒ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋Ÿฌ๋‹ค๋ณด๋‹ˆ, ํ•ด์™ธ LMM์„ baseline์œผ๋กœ ํ•˜์—ฌ ํ•œ๊ตญ์–ด LMM์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ด ๋ฌด์—‡์ผ๊นŒ?์— ๋Œ€ํ•œ ์งˆ๋ฌธ์ด ์ƒ๊ฒจ๋‚ฌ๊ณ  ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํ•œ๊ตญ์–ด LMM์„ ์ œ์ž‘ํ•ด๋ณด๊ธฐ๋กœ ํ•˜์˜€์Šต๋‹ˆ๋‹ค!๐Ÿ˜Ž๐Ÿ˜Ž

 

์—ฌ๊ธฐ์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•˜๊ฒŒ ๋ณธ ํฌ์ธํŠธ๋“ค์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  • ๋Œ€๋Ÿ‰์˜ ์ด๋ฏธ์ง€-ํ…์ŠคํŠธ๋กœ ๊ตฌ์„ฑ๋œ ๋‹ค๋Ÿ‰์˜ ๊ณ ํ’ˆ์งˆ ํ•œ๊ตญ์–ด ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ์…‹์„ ๋งŒ๋“ค์–ด๋‚ด๋Š”๊ฒŒ ๊ฐ€๋Šฅํ• ๊นŒ?
  • ๊ธฐ์กด LMM์˜ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ, ํ•œ๊ตญ์–ด VLM ๋ฒค์น˜๋งˆํฌ์—์„œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ด๋Œ์–ด ๋‚ผ ์ˆ˜ ์žˆ์„๊นŒ?

์ฒซ๋ฒˆ์งธ ํฌ์ธํŠธ์— ๋Œ€ํ•ด์„œ, ์ œ ์Šค์Šค๋กœ์˜ ๋‹ต์€ ์•„์‰ฝ๊ฒŒ๋„ '๋ถˆ๊ฐ€๋Šฅ'์ด์—ˆ์Šต๋‹ˆ๋‹ค. 

ํ•˜์ง€๋งŒ ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์—์„œ๋Š” LMM์„ ์ œ์ž‘ํ•˜๊ฑฐ๋‚˜ ํŠœ๋‹ํ•  ๋•Œ, image-text๊ฐ€ pairํ•œ ๋ฐ์ดํ„ฐ์…‹์„ ๋งŽ์ด ํ™œ์šฉํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์„ฑ์— ํฐ ๊ณ ๋ฏผ์ด ์ƒ๊ฒผ์Šต๋‹ˆ๋‹ค.๐Ÿค”๐Ÿค”

 

์—ฌ๊ธฐ์„œ ์ €๋Š” '๋งŒ์•ฝ ๊ธฐ์กด LMM์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•œ์ฑ„๋กœ ๋งํ•˜๋Š” ๋ฐฉ์‹(์–ธ์–ด)๋งŒ ๋ฐ”๊ฟ€ ์ˆ˜ ์žˆ๋‹ค๋ฉด, ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์…‹์„ ํ•™์Šตํ•˜์ง€ ์•Š์•„๋„ ๊ดœ์ฐฎ์ง€ ์•Š์„๊นŒ?'๋ผ๋Š” ์ƒ๊ฐ์„ ํ•˜๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์œ„์˜ ์•„์ด๋””์–ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ, ๊ธฐ์กด์— ์ž์ฒด์ ์œผ๋กœ ์ œ์ž‘ํ•œ ํ•œ๊ตญ์–ด ๋ฐ์ดํ„ฐ์…‹ 2k๋งŒ์œผ๋กœ ํ•ด์™ธ LMM์„ ํŠœ๋‹ํ•˜์—ฌ ํ•œ๊ตญ์–ด LMM์„ ์ œ์ž‘ํ•˜๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค!!๐Ÿ˜Ž

  • ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹ ์ œ์ž‘์— ๋Œ€ํ•œ ์ž์„ธํ•œ ์„ค๋ช…์€: [Gukbap-LLM] ํฌ์ŠคํŠธ๋ฅผ ํ™•์ธํ•ด์ฃผ์„ธ์š”!

๊ฒฐ๊ณผ์ ์œผ๋กœ, ํ•ด์™ธ ๋ฐ ๊ตญ๋‚ด VLM ๋ฒค์น˜๋งˆํฌ ๋Œ€๋ถ€๋ถ„์—์„œ ๊ธฐ์กด baseline์˜ image understanding ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ, ํ•œ๊ตญ์–ด ๊ธฐ๋ฐ˜์œผ๋กœ ๊ธ€์„ ์ƒ์„ฑํ•˜๋Š” ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” K-LLAVA-W์—์„œ ๋“œ๋ผ๋งˆํ‹ฑํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ด๋Œ์–ด๋‚ด์—ˆ์Šต๋‹ˆ๋‹ค!

 

๊ฒฐ๋ก ์ ์œผ๋กœ ์ €ํฌ๊ฐ€ ์–ป์€ ์ธ์‚ฌ์ดํŠธ๋Š” '์˜ค์ง ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹๋งŒ์œผ๋กœ ํ›ˆ๋ จํ•˜์—ฌ๋„, LMM์˜ ์ด๋ฏธ์ง€ ์ดํ•ด ๋Šฅ๋ ฅ์€ ์œ ์ง€ํ•œ์ฑ„ ํ•œ๊ตญ์–ด๋กœ ๋งํ•˜๋Š” ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค'๋ผ๋Š” ๊ฒƒ์ด์—ˆ์Šต๋‹ˆ๋‹ค.โœŒ๏ธโœŒ๏ธ

 

์ž์„ธํ•œ ๋ฐฉ๋ฒ•์€ ์•„๋ž˜ ์ฑ•ํ„ฐ์—์„œ ์†Œ๊ฐœํ•ด๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค!

*ํ•ด๋‹น ํ”„๋กœ์ ํŠธ๋Š” ๋ฏธ๋””์–ด๊ทธ๋ฃน์‚ฌ๋žŒ๊ณผ์ˆฒ๊ณผ AICA(๊ด‘์ฃผ์„ผํ„ฐ) ์ง€์›์„ ๋ฐ›์•„ Markr.AI ํŒ€์—์„œ ์—ฐ๊ตฌํ–ˆ์Šต๋‹ˆ๋‹ค


How to train the LMM?

Ovis2 ๊ตฌ์กฐ

์ €ํฌ์˜ ๋ชฉํ‘œ๋Š” 'ํ•ด์™ธ LMM์˜ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ, ํ•œ๊ตญ์–ด ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ LMM'์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ, ๊ธฐ์กด ํ•ด์™ธ ์˜คํ”ˆ์†Œ์Šค LMM ์ค‘ Ovis1.6-Gemma2-8B์™€ Ovis2-34B ๋ชจ๋ธ์„ baseline์œผ๋กœ ์žก์•„ ์—ฐ๊ตฌ๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค!

 

LMM์„ ํ›ˆ๋ จํ•  ๋•Œ, ์ €ํฌ๋Š” '์˜ค์ง ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹'๋งŒ ์ด์šฉํ•˜๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ์ด๊ธฐ ๋•Œ๋ฌธ์— visual-encoder ๋ถ€๋ถ„์„ freezeํ•˜๊ณ  ์˜ค์ง LLM ๋ถ€๋ถ„๋งŒ trainableํ•˜๊ฒŒ ํ›ˆ๋ จ์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค!

๋˜ํ•œ ์ด๋ฏธ์ง€๊ฐ€ ์—†๋”๋ผ๋„, instruction text์— <image> token์„ ์ถ”๊ฐ€ํ•˜์—ฌ ํ•™์Šตํ–ˆ๊ณ  ์ด๋ฏธ์ง€ ๋ถ€๋ถ„์—๋Š” zero๋กœ ๊ตฌ์„ฑ๋œ ๋ฒกํ„ฐ๋ฅผ ๋„ฃ์–ด์„œ ํ›ˆ๋ จ์ด ๋˜๋„๋ก ํ•˜์˜€์Šต๋‹ˆ๋‹ค!๐Ÿ˜Ž

(*์‹ค์ œ๋กœ <image> token์„ ๋นผ๊ณ  ํ›ˆ๋ จํ–ˆ์„ ๋–„, ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋ฐœ์ƒํ•˜๋Š” ๊ฒƒ์„ ๋‚ด๋ถ€์ ์œผ๋กœ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค!)

 

๋ชจ๋ธ์˜ ํ›ˆ๋ จ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋Š” Ovis ๋…ผ๋ฌธ์„ ํ† ๋Œ€๋กœ ์„ค์ •ํ•˜์—ฌ full-finetuning ์ „๋žต์œผ๋กœ Ovis ๋ชจ๋ธ์„ ํŠœ๋‹ํ•˜์˜€์Šต๋‹ˆ๋‹ค!

์ž์„ธํ•œ ๋ชจ๋ธ ํ›ˆ๋ จ ์ฝ”๋“œ์™€ ๊ตฌ์กฐ๋Š”, ๐Ÿ”ฅKO-LMM-FFT github๐Ÿ”ฅ์— ์ „๋ถ€ ๊ณต๊ฐœ๋ฅผ ํ–ˆ์Šต๋‹ˆ๋‹ค.๐Ÿค—

 

์œ„์— ์–ธ๊ธ‰๋œ ๋ฐฉ๋ฒ•์œผ๋กœ ํ›ˆ๋ จ๋œ ๐ŸšGukbap-LMM๐Ÿš์€ ํ•ด์™ธ LMM ๋ฒค์น˜๋งˆํฌ์—์„œ ์„ฑ๋Šฅ์ด ๊ฑฐ์˜ ์œ ์ง€๋  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ํ•œ๊ตญ์–ด LMM ๋ฒค์น˜๋งˆํฌ์—์„œ ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

 

๋ฒค์น˜๋งˆํฌ์— ๋Œ€ํ•œ ์ž์„ธํ•œ ๊ฒฐ๊ณผ๋Š” ๋‹ค์Œ ์ฑ•ํ„ฐ์—์„œ ์†Œ๊ฐœํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค!


VLM Evaluation

์ €ํฌ๊ฐ€ ๋งŒ๋“  Gukbap-LMM๋“ค์˜ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๊ธฐ ์œ„ํ•ด ์•„๋ž˜์˜ 2๊ฐ€์ง€ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

  • VLMEvalKit: ํ•ด์™ธ LMM ๋ฒค์น˜๋งˆํฌ ํ‰๊ฐ€์ฝ”๋“œ
  • NCSoft๊ฐ€ ์ œ๊ณตํ•œ ํ•œ๊ตญ์–ด LMM ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ: K-MMBench, K-MMStar, K-DTCBench, K-LLAVA-W
Model K-MMBench K-MMStar K-DTCBench K-LLAVA-W Average
Gukbap-Qwen2-34B-VL๐Ÿš 89.10 68.13 77.08 69.00 75.83
Gukbap-Gemma2-9B-VL๐Ÿš 80.16 54.20 52.92 63.83 62.78
Ovis2-34B 89.56 68.27 76.25 53.67 71.94
Ovis1.6-Gemma2-9B 52.46 50.40 47.08 55.67 51.40
VARCO-VISION-14B 87.16 58.13 85.42 51.17 70.47

*๋ฒค์น˜๋งˆํฌ ๊ตฌํ˜„ ์ฝ”๋“œ๋Š” KoVLMEval์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

*ํ•ด์™ธ LMM ๊ฒฐ๊ณผ๋Š” ๊ฐ ๋ชจ๋ธ์˜ huggingface repo๋ฅผ ํ™•์ธํ•ด์ฃผ์„ธ์š”!

 

์œ„ ์„ฑ๋Šฅํ‘œ๋Š” ํ•œ๊ตญ์–ด LMM ๋ฒค์น˜๋งˆํฌ์— ๋Œ€ํ•ด์„œ ๋‚ด๋ถ€์ ์œผ๋กœ ํ‰๊ฐ€ํ•œ ๊ฒฐ๊ณผ์ž…๋‹ˆ๋‹ค!

์•„์‰ฝ๊ฒŒ๋„ ๋ฐ์ดํ„ฐ์…‹ ํ‰๊ฐ€ ์ฝ”๋“œ์™€ ๊ด€๋ จํ•˜์—ฌ NCSoft๊ฐ€ ๊ณต๊ฐœํ•œ ์ •๋ณด๊ฐ€ ์—†์—ˆ๊ธฐ์—, ๋‚ด๋ถ€์ ์œผ๋กœ ์ฝ”๋“œ๋ฅผ ๊ตฌํ˜„ํ•˜์—ฌ ํ…Œ์ŠคํŠธ๋ฅผ ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

 

์ฒซ๋ฒˆ์งธ๋กœ, ํ•ด์™ธ ๊ณ ์„ฑ๋Šฅ ์‚ฌ์ „ ํ›ˆ๋ จ ๋ชจ๋ธ(baseline)์„ ๊ธฐ์ค€์œผ๋กœ Gukbap-VL(ours)์˜ ๊ฒฐ๊ณผ๋ฅผ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

  • 9B ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, ๋ชจ๋“  ๋ฒค์น˜๋งˆํฌ์—์„œ ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋จ.๐Ÿ˜Ž
  • 34B ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, ๋Œ€๋ถ€๋ถ„ ๋ฒค์น˜๋งˆํฌ์˜ ์„ฑ๋Šฅ์ด ๋น„์Šทํ•˜๊ฒŒ ์œ ์ง€๋˜์—ˆ๊ณ  K-LLAVA-W์—์„œ ๋“œ๋ผ๋งˆํ‹ฑํ•œ ํ–ฅ์ƒ์„ ๋ณด์ž„.๐Ÿ˜Ž

๋‘๋ฒˆ์งธ๋กœ, VARCO-Vision-14B๋ฅผ ๊ธฐ์ค€์œผ๋กœ Gukbap-VL(ours)์˜ ๊ฒฐ๊ณผ๋ฅผ ๋น„๊ตํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

  • ๋‘ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋น„๊ตํ–ˆ์„ ๋•Œ, Gukbap-VL ๋ชจ๋ธ์ด VARCO-Vision ๋ชจ๋ธ๋ณด๋‹ค image understanding๊ฐ€ ๋†’๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธํ•จ.
  • ํŠนํžˆ ํ•œ๊ตญ์–ด ๋‹ต๋ณ€ ์ƒ์„ฑ ๋Šฅ๋ ฅ ํ‰๊ฐ€์ธ K-LLAVA-W์—์„œ ์ฐจ์ด๊ฐ€ ๋งŽ์ด ๋ฐœ์ƒํ•˜๋Š”๋ฐ, ์ด๋Š” Gukbap-VL ๋ชจ๋ธ์˜ ํ•œ๊ตญ์–ด ์ƒ์„ฑ ๋Šฅ๋ ฅ๊ณผ ๋‹ต๋ณ€ ํ’ˆ์งˆ์ด ๋น„๊ต์  ๋›ฐ์–ด๋‚˜๋‹ค๋Š” ๊ฒƒ์„ ์‹œ์‚ฌํ•จ.๐Ÿ˜Ž

์ข…ํ•ฉ์ ์œผ๋กœ, ์ €ํฌ Gukbap-VL ๋ชจ๋ธ์€ ํ•œ๊ตญ์–ด VLM ๋ฒค์น˜๋งˆํฌ์—์„œ SOTA ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค!๐Ÿค—

๋˜ํ•œ VARCO-Vision -14B์˜ ํ…Œํฌ๋‹ˆ์ปฌ ํŽ˜์ดํผ๋ฅผ ๋ณด๋ฉด, ์ด๋ฏธ์ง€ ์ดํ•ด ๋Šฅ๋ ฅ์ด GPT-4o ์ˆ˜์ค€๊ณผ ๊ฑฐ์˜ ๋น„์Šทํ•˜๋‹ค๊ณ  ๋ณด์—ฌ์ง€๋Š”๋ฐ, ์ด๋ฅผ ๊ทผ๊ฑฐ๋กœ ์ €ํฌ Gukbap-VL ๋ชจ๋ธ๋„ GPT-4o ์ˆ˜์ค€์— ๊ฑฐ์˜ ๋„๋‹ฌํ•œ ๊ฒƒ์œผ๋กœ ์ƒ๊ฐ์ด ๋“ญ๋‹ˆ๋‹ค.

 

Figure. ํ•œ๊ตญ์–ด ๋‹ต๋ณ€ ๋Šฅ๋ ฅ ํ–ฅ์ƒ ์˜ˆ์‹œ.

์‹ค์ œ๋กœ ์œ„์˜ ์˜ˆ์‹œ๋ฅผ ๋ณด๋ฉด, Ovis2-34B ๋ชจ๋ธ์˜ ํ•œ๊ตญ์–ด ๋‹ต๋ณ€ ๋Šฅ๋ ฅ์€ ๋งค์šฐ ๋ณด๊ธฐ๋„ ์–ด๋ ค์šธ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋ฐ˜๋ณต๋˜๋Š” ๋ฌธ์žฅ๋“ค์ด ๊ณ„์†ํ•ด์„œ ๋‚˜์˜ค๋Š” ๋ฌธ์ œ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด์—, ๐ŸšGukbap-Qwen2-34B-VL ๋ชจ๋ธ์€ ๋งค์šฐ ๊น”๋”ํ•˜๊ณ  ์ •๋ˆํ•œ ํ•œ๊ตญ์–ด ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ฒฐ๊ณผ์ ์œผ๋กœ, ์ €ํฌ์˜ ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋Š” 'ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹๋งŒ์œผ๋กœ' ํ•ด์™ธ ๊ณ ์„ฑ๋Šฅ ์‚ฌ์ „ ํ›ˆ๋ จ ๋ชจ๋ธ์˜ ์ด๋ฏธ์ง€ ์ดํ•ด ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ, ํ•œ๊ตญ์–ด ๋‹ต๋ณ€ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค๋Š” ์ '์„ ๋ช…ํ™•ํ•˜๊ฒŒ ์‹œ์‚ฌํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค!๐Ÿ”ฅ


์ด๋ ‡๊ฒŒ ์–ป์€ ์ธ์‚ฌ์ดํŠธ๊ฐ€, ๋Œ€๋Ÿ‰์˜ image-text ๋ฐ์ดํ„ฐ์…‹์ด ์•„๋‹ˆ๋”๋ผ๋„ ์ถฉ๋ถ„ํžˆ ํ•ด์™ธ LMM์„ ํ•œ๊ตญ์–ด LMM์œผ๋กœ ํŠœ๋‹ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค!โœŒ๏ธ

 

ํ•œ๊ฐ€์ง€ ์•„์‰ฌ์› ๋˜ ์ ์€, GPU ๋ถ€์กฑ์œผ๋กœ ์ธํ•ด context_length๋ฅผ 2048๊นŒ์ง€ ๋ฐ–์— ์„ค์ •ํ•˜์ง€ ๋ชปํ–ˆ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค..๐Ÿ˜ญ๐Ÿ˜ญ

๋งŒ์•ฝ ๋” ํ’๋ถ€ํ•œ ์ž์›์ด ์ƒ๊ธด๋‹ค๋ฉด, 8k ์ด์ƒ์˜ ํ•œ๊ตญ์–ด LMM๋„ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ•ด๋ณด๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค!

 

์•ž์œผ๋กœ๋„ ์ข‹์€ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•ด์„œ ๊ณ„์† ์—ด์‹ฌํžˆ ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค!

๊ธด ๊ธ€ ์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค ๐Ÿค— ๐Ÿค—


2025.02.24. kyujinpy ์ž‘์„ฑ.

- 2์›”์ด ๊ฐ€๊ธฐ์ „์— ๋ธ”๋กœ๊ทธ ํฌ์ŠคํŒ… ํ•˜๋‚˜ ์ž‘์„ฑํ•˜๊ธฐ ์„ฑ๊ณต! ใ…Žใ…Ž

๋ฐ˜์‘ํ˜•