Rescale ๋ฏธํŒ… ์˜ˆ์•ฝ

Snowflake Arctic: ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ AI๋ฅผ ์œ„ํ•œ ์ตœ์ฒจ๋‹จ LLM

์ธ๊ณต์ง€๋Šฅ

Snowflake Arctic: ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ AI๋ฅผ ์œ„ํ•œ ์ตœ์ฒจ๋‹จ LLM

mm
Snowflake Arctic: ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ AI๋ฅผ ์œ„ํ•œ ์ตœ์ฒจ๋‹จ LLM

์˜ค๋Š˜๋‚  ๊ธฐ์—…์—์„œ๋Š” LLM(๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์„ ํ™œ์šฉํ•˜์—ฌ ์ƒ์‚ฐ์„ฑ์„ ๋†’์ด๊ณ  ์ง€๋Šฅํ˜• ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์„ ์ ์  ๋” ๋ชจ์ƒ‰ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ LLM ์˜ต์…˜ ์ค‘ ๋‹ค์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ๋ถ„์„, ์ฝ”๋”ฉ ๋ฐ ์ž‘์—… ์ž๋™ํ™”์™€ ๊ฐ™์€ ์ „๋ฌธ์ ์ธ ๊ธฐ์—… ์š”๊ตฌ ์‚ฌํ•ญ์— ๋งž๊ฒŒ ๋งž์ถคํ™”๋˜์ง€ ์•Š์€ ์ผ๋ฐ˜ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ž…๋ ฅํ•˜๋‹ค ๋ˆˆ์†ก์ด ๋ถ๊ทน โ€“ ํ•ต์‹ฌ ๊ธฐ์—… ์‚ฌ์šฉ ์‚ฌ๋ก€์— ๋งž๊ฒŒ ์˜๋„์ ์œผ๋กœ ์„ค๊ณ„๋˜๊ณ  ์ตœ์ ํ™”๋œ ์ตœ์ฒจ๋‹จ LLM์ž…๋‹ˆ๋‹ค.

Snowflake์˜ AI ์—ฐ๊ตฌํŒ€์ด ๊ฐœ๋ฐœํ•œ Arctic์€ ํšจ์œจ์ ์ธ ํ•™์Šต, ๋น„์šฉ ํšจ์œจ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ๋…๋ณด์ ์ธ ์ˆ˜์ค€์˜ ๊ฐœ๋ฐฉ์„ฑ์„ ํ†ตํ•ด ๊ฐ€๋Šฅ์„ฑ์˜ ํ•œ๊ณ„๋ฅผ ๋„“ํ˜€์ค๋‹ˆ๋‹ค. ์ด ํ˜์‹ ์ ์ธ ๋ชจ๋ธ์€ ๊ธฐ์กด LLM๋ณด๋‹ค ํ›จ์”ฌ ๋‚ฎ์€ ์ปดํ“จํŒ… ์„ฑ๋Šฅ์„ ์š”๊ตฌํ•˜๋ฉด์„œ๋„ ์ฃผ์š” ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ ๋ฒค์น˜๋งˆํฌ์—์„œ ํƒ์›”ํ•œ ์„ฑ๊ณผ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. Arctic์ด ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ AI์˜ ํŒ๋„๋ฅผ ๋ฐ”๊พธ๋Š” ์š”์ธ์ด ๋ฌด์—‡์ธ์ง€ ์ž์„ธํžˆ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๊ธฐ์—… ์ธํ…”๋ฆฌ์ „์Šค ์žฌ์ •์˜ ๊ธฐ๋ณธ์ ์œผ๋กœ Arctic์€ ์ฝ”๋”ฉ, SQL ์ฟผ๋ฆฌ, ๋ณต์žกํ•œ ์ง€์นจ ๋”ฐ๋ฅด๊ธฐ, ๊ทผ๊ฑฐ ์žˆ๋Š” ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ ์ถœ๋ ฅ ์ƒ์„ฑ ๋“ฑ ๊ธฐ์—…์— ์ •๋ง๋กœ ์ค‘์š”ํ•œ ์ธก์ • ๊ธฐ์ค€์— ๋Œ€ํ•œ ํƒ์›”ํ•œ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•˜๋Š” ๋ฐ ์ค‘์ ์„ ๋‘๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. Snowflake๋Š” ์ด๋Ÿฌํ•œ ์ค‘์š”ํ•œ ๊ธฐ๋Šฅ์„ ์ƒˆ๋กœ์šด "์—”ํ„ฐํ”„๋ผ์ด์ฆˆ ์ธํ…”๋ฆฌ์ „์Šค" ๋ฉ”ํŠธ๋ฆญ.

๊ฒฐ๊ณผ๊ฐ€ ๋งํ•ด์ค๋‹ˆ๋‹ค. Arctic์€ ๊ต์œก์— ์ปดํ“จํŒ… ์˜ˆ์‚ฐ์„ ์ ˆ๋ฐ˜ ๋ฏธ๋งŒ์œผ๋กœ ์‚ฌ์šฉํ•˜๋ฉด์„œ ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ ์ธํ…”๋ฆฌ์ „์Šค ๋ฒค์น˜๋งˆํฌ์—์„œ LLAMA 7B ๋ฐ LLAMA 70B์™€ ๊ฐ™์€ ๋ชจ๋ธ์„ ์ถฉ์กฑํ•˜๊ฑฐ๋‚˜ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๋†€๋ž๊ฒŒ๋„, ํ™œ์šฉ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  LLAMA 17B๋ณด๋‹ค 70๋ฐฐ ์ ์€ ์ปดํ“จํŒ… ๋ฆฌ์†Œ์Šค, Arctic์€ ์ฝ”๋”ฉ(HumanEval+, MBPP+), SQL ์ƒ์„ฑ(Spider) ๋ฐ ๋ช…๋ น ๋”ฐ๋ฅด๊ธฐ(IFEval)์™€ ๊ฐ™์€ ํŠน์ˆ˜ ํ…Œ์ŠคํŠธ์—์„œ ํŒจ๋ฆฌํ‹ฐ๋ฅผ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ Arctic์˜ ์—ญ๋Ÿ‰์€ ๋‹จ์ˆœํžˆ ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ ๋ฒค์น˜๋งˆํฌ์—์„œ ๋†’์€ ์„ฑ๊ณผ๋ฅผ ๊ฑฐ๋‘๋Š” ๋ฐ ๊ทธ์น˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. DBRX์ฒ˜๋Ÿผ ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ๋†’์€ ์ปดํ“จํŒ… ์˜ˆ์‚ฐ์œผ๋กœ ํ•™์Šต๋œ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ, Arctic์€ ์ผ๋ฐ˜์ ์ธ ์–ธ์–ด ์ดํ•ด, ์ถ”๋ก , ๊ทธ๋ฆฌ๊ณ  ์ˆ˜ํ•™์  ์ ์„ฑ ์ „๋ฐ˜์— ๊ฑธ์ณ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ข…ํ•ฉ์ ์ธ ์—ญ๋Ÿ‰ ๋•๋ถ„์— Arctic์€ ๊ธฐ์—…์˜ ๋‹ค์–‘ํ•œ AI ์š”๊ตฌ ์‚ฌํ•ญ์„ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ํƒ์›”ํ•œ ์„ ํƒ์ž…๋‹ˆ๋‹ค.

ํ˜์‹ 

Dense-MoE ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ํŠธ๋žœ์Šคํฌ๋จธ Snowflake ํŒ€์€ ์–ด๋–ป๊ฒŒ ์ด์ฒ˜๋Ÿผ ๋†€๋ž๋„๋ก ๊ฐ•๋ ฅํ•˜๋ฉด์„œ๋„ ํšจ์œจ์ ์ธ LLM์„ ๊ตฌ์ถ•ํ–ˆ์„๊นŒ์š”? ์ •๋‹ต์€ Arctic์˜ ์ตœ์ฒจ๋‹จ Dense Mixture-of-Experts(MoE) ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ํŠธ๋žœ์Šคํฌ๋จธ ์•„ํ‚คํ…์ฒ˜์— ์žˆ์Šต๋‹ˆ๋‹ค.

๊ธฐ์กด์˜ ๋ฐ€๋„๊ฐ€ ๋†’์€ ๋ณ€์••๊ธฐ ๋ชจ๋ธ์€ ํฌ๊ธฐ๊ฐ€ ์ปค์ง์— ๋”ฐ๋ผ ํ›ˆ๋ จ ๋น„์šฉ์ด ์ ์  ๋” ๋งŽ์ด ๋“ค๊ณ  ๊ณ„์‚ฐ ์š”๊ตฌ ์‚ฌํ•ญ๋„ ์„ ํ˜•์ ์œผ๋กœ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. MoE ์„ค๊ณ„๋Š” ์—ฌ๋Ÿฌ ๋ณ‘๋ ฌ ํ”ผ๋“œํฌ์›Œ๋“œ ๋„คํŠธ์›Œํฌ(์ „๋ฌธ๊ฐ€)๋ฅผ ํ™œ์šฉํ•˜๊ณ  ๊ฐ ์ž…๋ ฅ ํ† ํฐ์— ๋Œ€ํ•œ ํ•˜์œ„ ์ง‘ํ•ฉ๋งŒ ํ™œ์„ฑํ™”ํ•˜์—ฌ ์ด๋ฅผ ๋ฐฉ์ง€ํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ๋‹จ์ˆœํžˆ MoE ์•„ํ‚คํ…์ฒ˜๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋Š” ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. Arctic์€ Dense์™€ MoE ๊ตฌ์„ฑ ์š”์†Œ์˜ ์žฅ์ ์„ ๋…์ฐฝ์ ์œผ๋กœ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค. 10์–ต ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง„ Dense Transformer ์ธ์ฝ”๋”์™€ 128๊ฐœ์˜ Expert Residual MoE ๋‹ค์ธต ํผ์…‰ํŠธ๋ก (MLP) ๊ณ„์ธต์„ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์ด Dense-MoE ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ชจ๋ธ์€ ์ด 480์–ต ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์ง€๋งŒ, Top-17 ๊ฒŒ์ดํŒ…์„ ์‚ฌ์šฉํ•˜๋ฉด ํ•ญ์ƒ ํ™œ์„ฑํ™”๋˜๋Š” ๋งค๊ฐœ๋ณ€์ˆ˜๋Š” 2์–ต ๊ฐœ๋ฟ์ž…๋‹ˆ๋‹ค.

๊ทธ ์˜๋ฏธ๋Š” ์‹ฌ์˜คํ•ฉ๋‹ˆ๋‹ค. Arctic์€ ์ „๋ก€ ์—†๋Š” ๋ชจ๋ธ ํ’ˆ์งˆ๊ณผ ์šฉ๋Ÿ‰์„ ๋‹ฌ์„ฑํ•˜๋Š” ๋™์‹œ์— ํ›ˆ๋ จ ๋ฐ ์ถ”๋ก  ์ค‘์— ๋†€๋ผ์šด ์ปดํ“จํŒ… ํšจ์œจ์„ฑ์„ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด Arctic์€ ์ถ”๋ก  ์ค‘์— DBRX์™€ ๊ฐ™์€ ๋ชจ๋ธ๋ณด๋‹ค ํ™œ์„ฑ ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ 50% ์ ์Šต๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋Š” ์ด์•ผ๊ธฐ์˜ ์ผ๋ถ€์ผ ๋ฟ์ž…๋‹ˆ๋‹ค. Arctic์˜ ํƒ์›”ํ•œ ์„ฑ๊ณผ๋Š” Snowflake ์—ฐ๊ตฌํŒ€์ด ๊ฐœ๋ฐœํ•œ ์—ฌ๋Ÿฌ ์„ ๊ตฌ์ ์ธ ๊ธฐ์ˆ ๊ณผ ํ†ต์ฐฐ๋ ฅ์˜ ์ •์ ์— ์žˆ์Šต๋‹ˆ๋‹ค.

  1. ๊ธฐ์—… ์ค‘์‹ฌ ๊ต์œก ๋ฐ์ดํ„ฐ ์ปค๋ฆฌํ˜๋Ÿผ: ๊ด‘๋ฒ”์œ„ํ•œ ์‹คํ—˜์„ ํ†ตํ•ด ํŒ€์€ ์ƒ์‹์  ์ถ”๋ก ๊ณผ ๊ฐ™์€ ์ผ๋ฐ˜์ ์ธ ๊ธฐ์ˆ ์€ ์กฐ๊ธฐ์— ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด ์ข‹์ง€๋งŒ, ์ฝ”๋”ฉ์ด๋‚˜ SQL๊ณผ ๊ฐ™์€ ๋” ๋ณต์žกํ•œ ์ „๋ฌธ ๋ถ„์•ผ๋Š” ๊ต์œก ๊ณผ์ • ํ›„๋ฐ˜์— ์Šต๋“ํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€์žฅ ํšจ๊ณผ์ ์ด๋ผ๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค. Arctic์˜ ๋ฐ์ดํ„ฐ ์ปค๋ฆฌํ˜๋Ÿผ์€ ์ธ๊ฐ„์˜ ํ•™์Šต ๊ณผ์ •์„ ๋ชจ๋ฐฉํ•œ 3๋‹จ๊ณ„ ์ ‘๊ทผ ๋ฐฉ์‹์„ ๋”ฐ๋ฆ…๋‹ˆ๋‹ค.

์ฒซ ๋ฒˆ์งธ ํ…Œ๋ผํ† ํฐ์€ ๊ด‘๋ฒ”์œ„ํ•œ ์ผ๋ฐ˜ ๊ธฐ๋ฐ˜ ๊ตฌ์ถ•์— ์ค‘์ ์„ ๋‘ก๋‹ˆ๋‹ค. ๋‹ค์Œ 1.5๊ฐœ์˜ ํ…Œ๋ผํ† ํฐ์€ SQL, ์ฝ”๋”ฉ ์ž‘์—… ๋“ฑ์— ๋งž์ถฐ ์กฐ์ •๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ๊ธฐ์—… ์—ญ๋Ÿ‰์„ ๊ฐœ๋ฐœํ•˜๋Š” ๋ฐ ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰ ํ…Œ๋ผํ† ํฐ์€ ์ •์ œ๋œ ๋ฐ์ดํ„ฐ ์„ธํŠธ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ Arctic์˜ ์ „๋ฌธ ๋ถ„์•ผ๋ฅผ ๋”์šฑ ๊ตฌ์ฒดํ™”ํ•ฉ๋‹ˆ๋‹ค.

  1. ์ตœ์ ์˜ ์•„ํ‚คํ…์ฒ˜ ์„ ํƒ MoE๋Š” ์ปดํ“จํŒ…๋‹น ๋” ๋‚˜์€ ํ’ˆ์งˆ์„ ์•ฝ์†ํ•˜์ง€๋งŒ ์˜ฌ๋ฐ”๋ฅธ ๊ตฌ์„ฑ์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜์ง€๋งŒ ์ด์— ๋Œ€ํ•œ ์ดํ•ด๊ฐ€ ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. ์ž์„ธํ•œ ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด Snowflake๋Š” ํ’ˆ์งˆ ํšจ์œจ์„ฑ ๊ท ํ˜•์„ ํ‰๊ฐ€ํ•œ ํ›„ ๋ชจ๋“  ๊ณ„์ธต์—์„œ ์ƒ์œ„ 128๊ฐœ์˜ ๊ฒŒ์ดํŒ…์„ ๊ฐ–์ถ˜ 2๋ช…์˜ ์ „๋ฌธ๊ฐ€๋ฅผ ๊ณ ์šฉํ•˜๋Š” ์•„ํ‚คํ…์ฒ˜๋ฅผ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค.

์ „๋ฌธ๊ฐ€ ์ˆ˜๋ฅผ ๋Š˜๋ฆฌ๋ฉด ๋” ๋งŽ์€ ์กฐํ•ฉ์ด ์ œ๊ณต๋˜์–ด ๋ชจ๋ธ ์šฉ๋Ÿ‰์ด ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋กœ ์ธํ•ด ํ†ต์‹  ๋น„์šฉ๋„ ์ฆ๊ฐ€ํ•˜๋ฏ€๋กœ Snowflake๋Š” ์ตœ์ ์˜ ๊ท ํ˜•์œผ๋กœ Top-128 ๊ฒŒ์ดํŒ…์„ ํ†ตํ•ด ํ™œ์„ฑํ™”๋œ ์‹ ์ค‘ํ•˜๊ฒŒ ์„ค๊ณ„๋œ 2๋ช…์˜ "์ถ•์ ๋œ" ์ „๋ฌธ๊ฐ€๋ฅผ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค.

  1. ์‹œ์Šคํ…œ ๊ณต๋™ ์„ค๊ณ„ ๊ทธ๋Ÿฌ๋‚˜ ์ตœ์ ์˜ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋ผ๋„ ์‹œ์Šคํ…œ ๋ณ‘๋ชฉ ํ˜„์ƒ์œผ๋กœ ์ธํ•ด ์•ฝํ™”๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ Snowflake ํŒ€์€ ์—ฌ๊ธฐ์„œ๋„ ํ˜์‹ ์„ ์ด๋ฃจ์—ˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ๊ธฐ๋ณธ ๊ต์œก ๋ฐ ์ถ”๋ก  ์‹œ์Šคํ…œ๊ณผ ํ•จ๊ป˜ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ๊ณต๋™ ์„ค๊ณ„ํ–ˆ์Šต๋‹ˆ๋‹ค.

ํšจ์œจ์ ์ธ ํ•™์Šต์„ ์œ„ํ•ด, dense ๋ฐ MoE ๊ตฌ์„ฑ ์š”์†Œ๋Š” ํ†ต์‹  ๋ฐ ์—ฐ์‚ฐ์ด ์ค‘๋ณต๋˜๋„๋ก ๊ตฌ์กฐํ™”๋˜์–ด ์ƒ๋‹นํ•œ ํ†ต์‹  ์˜ค๋ฒ„ํ—ค๋“œ๋ฅผ ์ˆจ๊ฒผ์Šต๋‹ˆ๋‹ค. ์ถ”๋ก  ์ธก๋ฉด์—์„œ, ํŒ€์€ NVIDIA์˜ ํ˜์‹  ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜์—ฌ Arctic์˜ ๊ทœ๋ชจ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋งค์šฐ ํšจ์œจ์ ์ธ ๋ฐฐํฌ๋ฅผ ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค.

FP8 ์–‘์žํ™”์™€ ๊ฐ™์€ ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•˜๋ฉด ๋‹จ์ผ GPU ๋…ธ๋“œ์—์„œ ์ „์ฒด ๋ชจ๋ธ์„ ํ”ผํŒ…ํ•˜์—ฌ ๋Œ€ํ™”ํ˜• ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋” ํฐ ๋ฐฐ์น˜๋Š” Arctic์˜ ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ ๊ธฐ๋Šฅ์„ ์—ฌ๋Ÿฌ ๋…ธ๋“œ์— ๊ฑธ์ณ ํ™œ์šฉํ•˜๋ฉด์„œ๋„ 17B์˜ ์ปดํŒฉํŠธํ•œ ํ™œ์„ฑ ๋งค๊ฐœ๋ณ€์ˆ˜ ๋•๋ถ„์— ๋›ฐ์–ด๋‚œ ์ปดํ“จํŒ… ํšจ์œจ์„ฑ์„ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.

Apache 2.0 ๋ผ์ด์„ ์Šค๋ฅผ ํ†ตํ•ด Arctic์˜ ๊ฐ€์ค‘์น˜์™€ ์ฝ”๋“œ๋Š” ๊ฐœ์ธ, ์—ฐ๊ตฌ ๋˜๋Š” ์ƒ์—…์  ์šฉ๋„๋กœ ์ž์œ ๋กญ๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ Snowflake๋Š” ํ•œ ๊ฑธ์Œ ๋” ๋‚˜์•„๊ฐ€ Arctic์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ์ „์ฒด ๋ฐ์ดํ„ฐ ๋ ˆ์‹œํ”ผ, ๋ชจ๋ธ ๊ตฌํ˜„, ํŒ, ๊ทธ๋ฆฌ๊ณ  ์‹ฌ์ธต์ ์ธ ์—ฐ๊ตฌ ํ†ต์ฐฐ๋ ฅ์„ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.

"๋ถ๊ทน ์š”๋ฆฌ์ฑ…"๋Š” Arctic๊ณผ ๊ฐ™์€ ๋Œ€๊ทœ๋ชจ MoE ๋ชจ๋ธ ๊ตฌ์ถ• ๋ฐ ์ตœ์ ํ™”์˜ ๋ชจ๋“  ์ธก๋ฉด์„ ๋‹ค๋ฃจ๋Š” ํฌ๊ด„์ ์ธ ์ง€์‹ ๊ธฐ๋ฐ˜์ž…๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์†Œ์‹ฑ, ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„, ์‹œ์Šคํ…œ ๊ณต๋™ ์„ค๊ณ„, ์ตœ์ ํ™”๋œ ํ›ˆ๋ จ/์ถ”๋ก  ์ฒด๊ณ„ ๋“ฑ์— ๋Œ€ํ•œ ์ฃผ์š” ํ•™์Šต ๋‚ด์šฉ์„ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

์ตœ์ ์˜ ๋ฐ์ดํ„ฐ ์ปค๋ฆฌํ˜๋Ÿผ ์‹๋ณ„๋ถ€ํ„ฐ ์ปดํŒŒ์ผ๋Ÿฌ, ์Šค์ผ€์ค„๋Ÿฌ ๋ฐ ํ•˜๋“œ์›จ์–ด๋ฅผ ๊ณต๋™ ์ตœ์ ํ™”ํ•˜๋Š” ๋™์‹œ์— MoE ์„ค๊ณ„์— ์ด๋ฅด๊ธฐ๊นŒ์ง€ ์ด ๊ด‘๋ฒ”์œ„ํ•œ ์ง€์‹ ์ฒด๊ณ„๋Š” ์ด์ „์— ์—˜๋ฆฌํŠธ AI ์—ฐ๊ตฌ์†Œ์— ๊ตญํ•œ๋˜์—ˆ๋˜ ๊ธฐ์ˆ ์„ ๋ฏผ์ฃผํ™”ํ•ฉ๋‹ˆ๋‹ค. Arctic Cookbook์€ ํ•™์Šต ๊ณก์„ ์„ ๊ฐ€์†ํ™”ํ•˜๊ณ  ์ „ ์„ธ๊ณ„ ๊ธฐ์—…, ์—ฐ๊ตฌ์› ๋ฐ ๊ฐœ๋ฐœ์ž๊ฐ€ ๊ฑฐ์˜ ๋ชจ๋“  ์‚ฌ์šฉ ์‚ฌ๋ก€์— ๋งž๋Š” ๋น„์šฉ ํšจ์œจ์ ์ธ ๋งž์ถคํ˜• LLM์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

๋ถ๊ทน ์‹œ์ž‘ํ•˜๊ธฐ

Arctic ํ™œ์šฉ์— ๊ด€์‹ฌ์ด ์žˆ๋Š” ๊ธฐ์—…์„ ์œ„ํ•ด Snowflake๋Š” ๋น ๋ฅด๊ฒŒ ์‹œ์ž‘ํ•  ์ˆ˜ ์žˆ๋Š” ๋‹ค์–‘ํ•œ ๊ฒฝ๋กœ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์„œ๋ฒ„๋ฆฌ์Šค ์ถ”๋ก : Snowflake ๊ณ ๊ฐ์€ Snowflake์˜ ์™„์ „ ๊ด€๋ฆฌํ˜• AI ํ”Œ๋žซํผ์ธ Snowflake Cortex์—์„œ Arctic ๋ชจ๋ธ์„ ๋ฌด๋ฃŒ๋กœ ์ด์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Arctic์€ AWS, Microsoft Azure, NVIDIA ๋“ฑ ๋ชจ๋“  ์ฃผ์š” ๋ชจ๋ธ ์นดํƒˆ๋กœ๊ทธ์—์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ฒ˜์Œ๋ถ€ํ„ฐ ์‹œ์ž‘: ์˜คํ”ˆ ์†Œ์Šค ๋ชจ๋ธ ๊ฐ€์ค‘์น˜ ๋ฐ ๊ตฌํ˜„์„ ํ†ตํ•ด ๊ฐœ๋ฐœ์ž๋Š” Arctic์„ ์•ฑ ๋ฐ ์„œ๋น„์Šค์— ์ง์ ‘ ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Arctic ์ €์žฅ์†Œ๋Š” ์ฝ”๋“œ ์ƒ˜ํ”Œ, ๋ฐฐํฌ ํŠœํ† ๋ฆฌ์–ผ, ๋ฏธ์„ธ ์กฐ์ • ๋ฐฉ๋ฒ• ๋“ฑ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์‚ฌ์šฉ์ž ์ •์˜ ๋ชจ๋ธ ๊ตฌ์ถ•: Arctic Cookbook์˜ ํฌ๊ด„์ ์ธ ๊ฐ€์ด๋“œ ๋•๋ถ„์— ๊ฐœ๋ฐœ์ž๋Š” Arctic ๊ฐœ๋ฐœ์—์„œ ์–ป์€ ์ง€์‹์„ ํ™œ์šฉํ•˜์—ฌ ๋ชจ๋“  ํŠน์ˆ˜ ์‚ฌ์šฉ ์‚ฌ๋ก€์— ์ตœ์ ํ™”๋œ ์‚ฌ์šฉ์ž ์ •์˜ MoE ๋ชจ๋ธ์„ ์ฒ˜์Œ๋ถ€ํ„ฐ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ฐœ๋ฐฉํ˜• ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ AI Arctic์˜ ์ƒˆ๋กœ์šด ์‹œ๋Œ€๋Š” ๋‹จ์ˆœํ•œ ๊ฐ•๋ ฅํ•œ ์–ธ์–ด ๋ชจ๋ธ ๊ทธ ์ด์ƒ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๊ธฐ์—…์„ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ๊ตฌ์ถ•๋œ ๊ฐœ๋ฐฉ์ ์ด๊ณ  ๋น„์šฉ ํšจ์œจ์ ์ด๋ฉฐ ์ „๋ฌธํ™”๋œ AI ๊ธฐ๋Šฅ์˜ ์ƒˆ๋กœ์šด ์‹œ๋Œ€๋ฅผ ์˜ˆ๊ณ ํ•ฉ๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ ๋ถ„์„ ๋ฐ ์ฝ”๋”ฉ ์ƒ์‚ฐ์„ฑ ํ˜์‹ ๋ถ€ํ„ฐ ์ž‘์—… ์ž๋™ํ™” ๋ฐ ๋”์šฑ ์Šค๋งˆํŠธํ•œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ตฌ์ถ•๊นŒ์ง€, Arctic์˜ ๊ธฐ์—… ์ค‘์‹ฌ DNA๋Š” ์ผ๋ฐ˜ LLM๋ณด๋‹ค ํƒ์›”ํ•œ ์„ ํƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋ชจ๋ธ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๊ทธ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ์ „์ฒด R&D ํ”„๋กœ์„ธ์Šค๋ฅผ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ•จ์œผ๋กœ์จ Snowflake๋Š” AI ์ƒํƒœ๊ณ„ ์ „๋ฐ˜์„ ๋ฐœ์ „์‹œํ‚ฌ ํ˜‘์—… ๋ฌธํ™”๋ฅผ ์กฐ์„ฑํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ธฐ์—…๋“ค์ด ์ƒ์„ฑ์  AI๋ฅผ ์ ์  ๋” ์ ๊ทน์ ์œผ๋กœ ๋„์ž…ํ•จ์— ๋”ฐ๋ผ, Arctic์€ ํ”„๋กœ๋•์…˜ ์›Œํฌ๋กœ๋“œ์™€ ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ ํ™˜๊ฒฝ์— ๊ฐ๊ด€์ ์œผ๋กœ ๋” ์šฐ์ˆ˜ํ•œ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•  ์ˆ˜ ์žˆ๋Š” ๊ณผ๊ฐํ•œ ์ฒญ์‚ฌ์ง„์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ์ตœ์ฒจ๋‹จ ์—ฐ๊ตฌ, ํƒ์›”ํ•œ ํšจ์œจ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ํ™•๊ณ ํ•œ ๊ฐœ๋ฐฉ์  ์ •์‹ ์ด ์–ด์šฐ๋Ÿฌ์ง„ Arctic์€ AI์˜ ํ˜์‹ ์ ์ธ ์ž ์žฌ๋ ฅ์„ ๋Œ€์ค‘ํ™”ํ•˜๋Š” ๋ฐ ์ƒˆ๋กœ์šด ๊ธฐ์ค€์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

Snowflake Arctic ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์ฝ”๋“œ ์˜ˆ์ œ๊ฐ€ ์žˆ๋Š” ์„น์…˜์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

๋ถ๊ทน ์ฒดํ—˜

์ด์ œ Arctic์ด ์ง„์ •์œผ๋กœ ํš๊ธฐ์ ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋Š” ์š”์†Œ๊ฐ€ ๋ฌด์—‡์ธ์ง€ ์‚ดํŽด๋ณด์•˜์œผ๋‹ˆ, ๊ฐœ๋ฐœ์ž์™€ ๋ฐ์ดํ„ฐ ๊ณผํ•™์ž๊ฐ€ ์ด ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ์„ ์–ด๋–ป๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์ž์„ธํžˆ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.
Arctic์€ ์‚ฌ์ „ ํ›ˆ๋ จ๋˜์–ด Hugging Face ๋ฐ ํŒŒํŠธ๋„ˆ AI ํ”Œ๋žซํผ๊ณผ ๊ฐ™์€ ์ฃผ์š” ๋ชจ๋ธ ํ—ˆ๋ธŒ๋ฅผ ํ†ตํ•ด ๋ฐฐํฌํ•  ์ค€๋น„๊ฐ€ ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํŠน์ • ์‚ฌ์šฉ ์‚ฌ๋ก€์— ๋งž๊ฒŒ ์‚ฌ์šฉ์ž ์ •์˜ํ•˜๊ณ  ๋ฏธ์„ธ ์กฐ์ •ํ•  ๋•Œ ์ง„์ •ํ•œ ํž˜์ด ๋“œ๋Ÿฌ๋‚ฉ๋‹ˆ๋‹ค.

Arctic์˜ Apache 2.0 ๋ผ์ด์„ ์Šค๋Š” ์•ฑ, ์„œ๋น„์Šค ๋˜๋Š” ๋งž์ถคํ˜• AI ์›Œํฌํ”Œ๋กœ์— ์ž์œ ๋กญ๊ฒŒ ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์‹œ์ž‘์„ ์œ„ํ•ด transforms ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋ช‡ ๊ฐ€์ง€ ์ฝ”๋“œ ์˜ˆ์ œ๋ฅผ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.
๋ถ๊ทน์„ ์ด์šฉํ•œ ๊ธฐ๋ณธ ์ถ”๋ก 

๋น ๋ฅธ ํ…์ŠคํŠธ ์ƒ์„ฑ ์‚ฌ์šฉ ์‚ฌ๋ก€๋ฅผ ์œ„ํ•ด Arctic์„ ๋กœ๋“œํ•˜๊ณ  ๊ธฐ๋ณธ ์ถ”๋ก ์„ ๋งค์šฐ ์‰ฝ๊ฒŒ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

from transformers import AutoTokenizer, AutoModelForCausalLM

# Load the tokenizer and model
tokenizer = AutoTokenizer.from_pretrained("Snowflake/snowflake-arctic-instruct")
model = AutoModelForCausalLM.from_pretrained("Snowflake/snowflake-arctic-instruct")

# Create a simple input and generate text
input_text = "Here is a basic question: What is the capital of France?"
input_ids = tokenizer.encode(input_text, return_tensors="pt")

# Generate response with Arctic
output = model.generate(input_ids, max_length=150, do_sample=True, top_k=50, top_p=0.95, num_return_sequences=1)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)

print(generated_text)

๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ถœ๋ ฅ๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

ํ”„๋ž‘์Šค์˜ ์ˆ˜๋„๋Š” ํŒŒ๋ฆฌ์ž…๋‹ˆ๋‹ค. ํŒŒ๋ฆฌ๋Š” ํ”„๋ž‘์Šค ์ตœ๋Œ€ ๋„์‹œ์ด์ž ๊ฒฝ์ œ, ์ •์น˜, ๋ฌธํ™”์˜ ์ค‘์‹ฌ์ง€์ž…๋‹ˆ๋‹ค. ์—ํŽ ํƒ‘, ๋ฃจ๋ธŒ๋ฅด ๋ฐ•๋ฌผ๊ด€, ๋…ธํŠธ๋ฅด๋‹ด ๋Œ€์„ฑ๋‹น ๋“ฑ ์œ ๋ช… ๋žœ๋“œ๋งˆํฌ๊ฐ€ ์žˆ๋Š” ๊ณณ์ž…๋‹ˆ๋‹ค.

๋ณด์‹œ๋‹ค์‹œํ”ผ Arctic์€ ์ฟผ๋ฆฌ๋ฅผ ์™„๋ฒฝํ•˜๊ฒŒ ์ดํ•ดํ•˜๊ณ  ๊ฐ•๋ ฅํ•œ ์–ธ์–ด ์ดํ•ด ๊ธฐ๋Šฅ์„ ํ™œ์šฉํ•˜์—ฌ ์ƒ์„ธํ•˜๊ณ  ๊ธฐ์ดˆ์ ์ธ ์‘๋‹ต์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ „๋ฌธ์ ์ธ ์ž‘์—…์„ ์œ„ํ•œ ๋ฏธ์„ธ ์กฐ์ •

Arctic์€ ๊ธฐ๋ณธ์ ์œผ๋กœ ์ธ์ƒ์ ์ด์ง€๋งŒ ํŠน์ˆ˜ํ•œ ์ž‘์—…์„ ์œ„ํ•ด ๋…์  ๋ฐ์ดํ„ฐ๋ฅผ ๋งž์ถคํ™”ํ•˜๊ณ  ๋ฏธ์„ธ ์กฐ์ •ํ•  ๋•Œ ์ง„์ •์œผ๋กœ ๋น›์„ ๋ฐœํ•ฉ๋‹ˆ๋‹ค. Snowflake๋Š” ๋‹ค์Œ์„ ํฌํ•จํ•˜๋Š” ๊ด‘๋ฒ”์œ„ํ•œ ๋ ˆ์‹œํ”ผ๋ฅผ ์ œ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ์‚ฌ์šฉ ์‚ฌ๋ก€์— ๋งž๋Š” ๊ณ ํ’ˆ์งˆ ๊ต์œก ๋ฐ์ดํ„ฐ ์„ ๋ณ„
  • ๋งž์ถคํ˜• ๋‹ค๋‹จ๊ณ„ ๊ต์œก ์ปค๋ฆฌํ˜๋Ÿผ ์‹ค์‹œ
  • ํšจ์œจ์ ์ธ LoRA, P-Tuning ๋˜๋Š” FactorizedFusion ๋ฏธ์„ธ ์กฐ์ • ์ ‘๊ทผ ๋ฐฉ์‹ ํ™œ์šฉ
  • ์•ˆ๋ชฉ ์žˆ๋Š” SQL, ์ฝ”๋”ฉ ๋˜๋Š” ๊ธฐํƒ€ ํ•ต์‹ฌ ๊ธฐ์—… ๊ธฐ์ˆ ์„ ์œ„ํ•œ ์ตœ์ ํ™”

๋‹ค์Œ์€ LoRA์™€ Snowflake์˜ ๋ ˆ์‹œํ”ผ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ž์‹ ์˜ ์ฝ”๋”ฉ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ Arctic์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์˜ ์˜ˆ์ž…๋‹ˆ๋‹ค.

from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import LoraConfig, get_peft_model, prepare_model_for_int8_training

# Load base Arctic model
tokenizer = AutoTokenizer.from_pretrained("Snowflake/snowflake-arctic-instruct")
model = AutoModelForCausalLM.from_pretrained("Snowflake/snowflake-arctic-instruct", load_in_8bit=True)

# Initialize LoRA configs
lora_config = LoraConfig(
r=8,
lora_alpha=16,
target_modules=["query_key_value"],
lora_dropout=0.05,
bias="none",
task_type="CAUSAL_LM"
)

# Prepare model for LoRA finetuning
model = prepare_model_for_int8_training(model)
model = get_peft_model(model, lora_config)

# Your coding datasets
data = load_coding_datasets()

# Fine-tune with Snowflake's recipes
train(model, data, ...)

์ด ์ฝ”๋“œ๋Š” Arctic์„ ์†์‰ฝ๊ฒŒ ๋กœ๋“œํ•˜๊ณ , ์ฝ”๋“œ ์ƒ์„ฑ์— ๋งž์ถฐ LoRA ๊ตฌ์„ฑ์„ ์ดˆ๊ธฐํ™”ํ•œ ๋‹ค์Œ, Snowflake์˜ ๊ฐ€์ด๋“œ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋…์ ์ ์ธ ์ฝ”๋”ฉ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ๋ชจ๋ธ์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

๋งž์ถคํ™”๋˜๊ณ  ์ •๋ฐ€ํ•˜๊ฒŒ ์กฐ์ •๋œ Arctic์€ ํ•ต์‹ฌ ๊ธฐ์—… ์›Œํฌํ”Œ๋กœ์šฐ์™€ ์ดํ•ด๊ด€๊ณ„์ž ์š”๊ตฌ ์‚ฌํ•ญ์— ๋Œ€ํ•ด ํƒ์›”ํ•œ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•˜๋„๋ก ์กฐ์ •๋œ ํ”„๋ผ์ด๋น— ๊ฐ•๊ตญ์ด ๋ฉ๋‹ˆ๋‹ค.

๋ถ๊ทน์˜ ๊ธ‰์†ํ•œ ํ˜์‹  ์ฃผ๊ธฐ

Arctic์˜ ๊ฐ€์žฅ ์ธ์ƒ์ ์ธ ์ธก๋ฉด ์ค‘ ํ•˜๋‚˜๋Š” Snowflake์˜ AI ์—ฐ๊ตฌํŒ€์ด ์ด ์ตœ์ฒจ๋‹จ ๋ชจ๋ธ์„ ๊ตฌ์ƒํ•˜๊ณ  ๊ฐœ๋ฐœํ•˜์—ฌ ์„ธ์ƒ์— ๊ณต๊ฐœํ•˜๋Š” ๋†€๋ผ์šด ์†๋„์ž…๋‹ˆ๋‹ค. Arctic ํ”„๋กœ์ ํŠธ๋Š” ์‹œ์ž‘๋ถ€ํ„ฐ ์˜คํ”ˆ์†Œ์Šค ๊ณต๊ฐœ๊นŒ์ง€ 3๊ฐœ์›”๋„ ์ฑ„ ๊ฑธ๋ฆฌ์ง€ ์•Š์•˜์œผ๋ฉฐ, ์œ ์‚ฌํ•œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋Š” ๋ฐ ์ผ๋ฐ˜์ ์œผ๋กœ ํ•„์š”ํ•œ ์ปดํ“จํŒ… ์˜ˆ์‚ฐ์˜ ์•ฝ 8๋ถ„์˜ 1๋งŒ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

์ตœ์ฒจ๋‹จ AI ์—ฐ๊ตฌ๋ฅผ ์‹ ์†ํ•˜๊ฒŒ ๋ฐ˜๋ณตํ•˜๊ณ , ํ˜์‹ ํ•˜๊ณ , ์ œํ’ˆํ™”ํ•˜๋Š” ์ด๋Ÿฌํ•œ ๋Šฅ๋ ฅ์€ ์ •๋ง ๋†€๋ž์Šต๋‹ˆ๋‹ค. ์ด๋Š” Snowflake์˜ ์‹ฌ์ธต์ ์ธ ๊ธฐ์ˆ  ์—ญ๋Ÿ‰์„ ๋ณด์—ฌ์ฃผ๋Š” ๋™์‹œ์—, ๊ธฐ์—…์ด ๊ธฐ์—… ํ™˜๊ฒฝ์— ์ตœ์ ํ™”๋œ ํ˜์‹ ์ ์ธ AI ์—ญ๋Ÿ‰ ๊ฐœ๋ฐœ์˜ ํ•œ๊ณ„๋ฅผ ๋Š์ž„์—†์ด ๋›ฐ์–ด๋„˜์„ ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

Arctic ๊ณ„์—ด ๋ฐ ์ž„๋ฒ ๋”ฉ

Arctic์€ ๊ธฐ์—… LLM ๋ถ„์•ผ์—์„œ Snowflake์˜ ์•ผ์‹ฌ ์ฐฌ ๊ณ„ํš์˜ ์‹œ์ž‘์ผ ๋ฟ์ž…๋‹ˆ๋‹ค. Snowflake๋Š” ์ด๋ฏธ ๋‹ค์–‘ํ•œ ํฌ๊ธฐ ํ”„๋กœํ•„์—์„œ ๊ฒ€์ƒ‰ ์„ฑ๋Šฅ์— ์ตœ์ ํ™”๋œ ์—…๊ณ„ ์ตœ๊ณ ์˜ ํ…์ŠคํŠธ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์ธ Snowflake Arctic Embed ์ œํ’ˆ๊ตฐ์„ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.

์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด Arctic Embed ๋ชจ๋ธ์€ ์กด๊ฒฝ๋ฐ›๋Š” MTEB(ํ…์ŠคํŠธ ๊ฒ€์ƒ‰) ๋ฒค์น˜๋งˆํฌ์—์„œ ์ตœ์ฒจ๋‹จ ๊ฒ€์ƒ‰ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•˜์—ฌ ์ฃผ์š” ๊ธฐ์ˆ  ๋Œ€๊ธฐ์—…์˜ ๋น„๊ณต๊ฐœ ์ œํ’ˆ์„ ํฌํ•จํ•œ ๋‹ค๋ฅธ ์ฃผ์š” ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ๋ณด๋‹ค ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚ฉ๋‹ˆ๋‹ค.

[Arctic Embed ๋ชจ๋ธ์— ๋Œ€ํ•œ MTEB ๊ฒ€์ƒ‰ ๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ฃผ๋Š” ์ด๋ฏธ์ง€ ์‚ฝ์ž…]

์ด๋Ÿฌํ•œ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ Arctic LLM์„ ๋ณด์™„ํ•˜๋ฉฐ ๊ธฐ์—…์ด ํ†ตํ•ฉ ์˜คํ”ˆ ์†Œ์Šค ์Šคํƒ์—์„œ ๊ฐ•๋ ฅํ•œ ์งˆ๋ฌธ ๋‹ต๋ณ€ ๋ฐ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ ์†”๋ฃจ์…˜์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ด์ค๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ Snowflake์˜ ๋กœ๋“œ๋งต์€ Arctic๊ณผ ์ž„๋ฒ ๋”ฉ์—๋งŒ ๊ตญํ•œ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. Snowflake์˜ AI ์—ฐ๊ตฌ์›๋“ค์€ ๋‹ค์ค‘ ๋ชจ๋“œ ์ž‘์—…, ์Œ์„ฑ, ๋น„๋””์˜ค ๋ฐ ๋” ๋งŽ์€ ์ตœ์ฒจ๋‹จ ๊ธฐ๋Šฅ์— ๋งž์ถฐ ์„ค๊ณ„๋œ ์ƒˆ๋กœ์šด ๋ชจ๋ธ์„ ํ†ตํ•ด Arctic ์ œํ’ˆ๊ตฐ์„ ํ™•์žฅํ•˜๊ธฐ ์œ„ํ•ด ๋…ธ๋ ฅํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ด ๋ชจ๋“  ๊ฒƒ์€ ์ „๋ฌธ์„ฑ, ํšจ์œจ์„ฑ, ๊ฐœ๋ฐฉ์„ฑ์ด๋ผ๋Š” ๋™์ผํ•œ ์›์น™์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ฐœ๋ฐฉํ˜• AI ์ƒํƒœ๊ณ„๋ฅผ ์œ„ํ•œ ํŒŒํŠธ๋„ˆ์‹ญ Snowflake๋Š” ๊ฐœ๋ฐฉํ˜• ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ๊ธ‰ AI์˜ ์ž ์žฌ๋ ฅ์„ ์ตœ๋Œ€ํ•œ ์‹คํ˜„ํ•˜๋ ค๋ฉด AI ์ปค๋ฎค๋‹ˆํ‹ฐ ์ „๋ฐ˜์— ๊ฑธ์ณ ํ’๋ถ€ํ•œ ํŒŒํŠธ๋„ˆ์‹ญ ์ƒํƒœ๊ณ„๋ฅผ ์œก์„ฑํ•ด์•ผ ํ•œ๋‹ค๋Š” ์ ์„ ์ดํ•ดํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. Arctic ๋ฆด๋ฆฌ์Šค์—์„œ๋Š” ์ด๋ฏธ ์ฃผ์š” ํ”Œ๋žซํผ ๋ฐ ์ œ๊ณต์—…์ฒด์™€์˜ ํ˜‘๋ ฅ์ด ํ™œ๋ฐœํ•ด์กŒ์Šต๋‹ˆ๋‹ค.

NVIDIA๋Š” TensorRT, Triton ๋“ฑ์„ ํฌํ•จํ•œ NVIDIA์˜ ์ตœ์ฒจ๋‹จ AI ์ถ”๋ก  ์Šคํƒ์„ ํ™œ์šฉํ•˜์—ฌ Arctic์„ ํšจ์œจ์ ์œผ๋กœ ๋ฐฐํฌํ•˜๊ธฐ ์œ„ํ•ด Snowflake์™€ ๊ธด๋ฐ€ํžˆ ํ˜‘๋ ฅํ•ด ์™”์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ธฐ์—…์€ Arctic์„ ๋Œ€๊ทœ๋ชจ๋กœ ๋น„์šฉ ํšจ์œจ์ ์œผ๋กœ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์„ ๋„์ ์ธ ์˜คํ”ˆ ์†Œ์Šค ๋ชจ๋ธ ํ—ˆ๋ธŒ์ธ Hugging Face๋Š” Arctic์„ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์™€ ๋ชจ๋ธ ์ €์žฅ์†Œ์— ๋„์ž…ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด Arctic์„ ๊ธฐ์กด Hugging Face ๊ธฐ๋ฐ˜ AI ์›Œํฌํ”Œ๋กœ์šฐ ๋ฐ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ์›ํ™œํ•˜๊ฒŒ ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Replicate, SageMaker ๋“ฑ๊ณผ ๊ฐ™์€ ํ”Œ๋žซํผ์€ ํ˜ธ์ŠคํŒ…๋œ ๋ฐ๋ชจ, API ๋ฐ Arctic์— ๋Œ€ํ•œ ์›ํ™œํ•œ ํ†ตํ•ฉ ๊ฒฝ๋กœ๋ฅผ ์ œ๊ณตํ•˜๊ธฐ ์œ„ํ•ด ์‹ ์†ํ•˜๊ฒŒ ์ด๋™ํ•˜์—ฌ ์ฑ„ํƒ์„ ๊ฐ€์†ํ™”ํ–ˆ์Šต๋‹ˆ๋‹ค.

์˜คํ”ˆ์†Œ์Šค๋Š” Arctic ๊ฐœ๋ฐœ์˜ ์›๋™๋ ฅ์ด์—ˆ์œผ๋ฉฐ, ๊ฐœ๋ฐฉํ˜• ์ƒํƒœ๊ณ„๋Š” Arctic์˜ ์ง„ํ™”์— ์žˆ์–ด ํ•ต์‹ฌ์ ์ธ ์—ญํ• ์„ ํ•ด์™”์Šต๋‹ˆ๋‹ค. Snowflake๋Š” ์ „ ์„ธ๊ณ„ ์—ฐ๊ตฌ์ž, ๊ฐœ๋ฐœ์ž, ํŒŒํŠธ๋„ˆ ๋ฐ ๊ธฐ์—…๊ณผ์˜ ํ’๋ถ€ํ•œ ํ˜‘์—…์„ ์ด‰์ง„ํ•˜์—ฌ ๊ฐœ๋ฐฉ์ ์ด๊ณ  ํŠนํ™”๋œ AI ๋ชจ๋ธ์„ ํ†ตํ•ด ๊ฐ€๋Šฅ์„ฑ์˜ ํ•œ๊ณ„๋ฅผ ๋„“ํžˆ๋Š” ๋ฐ ์ „๋…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ €๋Š” ์ง€๋‚œ 50๋…„ ๋™์•ˆ ๊ธฐ๊ณ„ ํ•™์Šต๊ณผ ๋”ฅ ๋Ÿฌ๋‹์˜ ๋งคํ˜น์ ์ธ ์„ธ๊ณ„์— ๋ชฐ๋‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ €์˜ ์—ด์ •๊ณผ ์ „๋ฌธ โ€‹โ€‹์ง€์‹์€ ํŠนํžˆ AI/ML์— ์ค‘์ ์„ ๋‘” XNUMX๊ฐœ ์ด์ƒ์˜ ๋‹ค์–‘ํ•œ ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด๋ง ํ”„๋กœ์ ํŠธ์— ๊ธฐ์—ฌํ•˜๋„๋ก ์ด๋Œ์—ˆ์Šต๋‹ˆ๋‹ค. ๋‚˜์˜ ๊ณ„์†๋˜๋Š” ํ˜ธ๊ธฐ์‹ฌ์€ ๋˜ํ•œ ๋‚ด๊ฐ€ ๋” ํƒ๊ตฌํ•˜๊ณ  ์‹ถ์€ ๋ถ„์•ผ์ธ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋กœ ๋‚˜๋ฅผ ์ด๋Œ์—ˆ์Šต๋‹ˆ๋‹ค.