์ธ๊ณต์ง๋ฅ
75% ์ํ์ : AI ๋ชจ๋ธ์ด ํ์ฌ ๋ฐฉ์์ผ๋ก ์ต๊ณ ์ฑ๋ฅ์ ๋๋ฌํ์๊น?

์ธ๋ฅ ๊ทธ๋ฆฌ๊ณ OpenAI ๋ ํ์ฌ ๋ชจ๋ ์ดํ ๊ฐ๊ฒฉ์ผ๋ก ์ต์ฒจ๋จ AI ๋ชจ๋ธ์ ๊ณต๊ฐํ๋๋ฐ, ๋ ํ์ฌ ๋ชจ๋ ์ ๊ณ ์ฝ๋ฉ ๋ฒค์น๋งํฌ์์ ๊ฑฐ์ ๋์ผํ 74-75%์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. ์ด๋ ํ์ฌ AI ์ํคํ ์ฒ์ ์ ์ฌ์ ์ธ ์ฑ๋ฅ ํ๊ณ๋ฅผ ์์ฌํ๋ ๋์์ ๋ฐฐํฌ ๋ฐ ๊ตฌํ์ ๋ํ ์ ๊ทผ ๋ฐฉ์์ด ํฌ๊ฒ ๋ค๋ฅด๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
๊ฑฐ์ ๋์์ ์ถ์๋ ์ด ์ ํ์ ํ์ฌ ๊ต์ก ๋ฐฉ๋ฒ์ผ๋ก๋ AI ๊ฐ๋ฐ์ด ์ ์ ์ ๋๋ฌํ๋์ง์ ๋ํ ๊ทผ๋ณธ์ ์ธ ์๋ฌธ์ ์ ๊ธฐํฉ๋๋ค. ํ์ง๋ง ๊ฐ ํ์ฌ๊ฐ ์ ์ธ๊ณ ์ฌ์ฉ์์ ๊ฐ๋ฐ์์๊ฒ ์ด๋ฌํ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ ๋ฐฉ๋ฒ์ ๋ํด์๋ ์๊ฒฌ์ด ํฌ๊ฒ ์๊ฐ๋ฆฌ๊ณ ์์ต๋๋ค.
๊ธฐ์ ์ ์ด์ ํ์ ๋ํ ๋ฒค์น๋งํฌ ์ตํฉ ํฌ์ธํธ
ํด๋ก๋ ์คํธ์ค 4.1Anthropic์์ 5์ 74.5์ผ์ ์ถ์ํ ์ ์ ๊ณ ํ์ค ์ฝ๋ฉ ๋ฒค์น๋งํฌ์ธ SWE-bench Verified์์ XNUMX%๋ฅผ ๊ธฐ๋กํ์ต๋๋ค. OpenAI์ GPT-57์ 74.9์ผ์ ๋ฐํ๋ ์ด ์ ํ์ ๋์ผํ ํ ์คํธ์์ XNUMX%๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. ์ด๋ ๋ ํ์ฌ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ์์ ํ์์๋ ๋ถ๊ตฌํ๊ณ ํ์ฌ ์ํคํ ์ฒ๋ฅผ ๋น์ทํ ํ๊ณ๊น์ง ๋์ด์ฌ๋ ธ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ฃผ๋ ํต๊ณ์ ๋์ ์ ๋๋ค.
๋ชจ๋ธ ๊ฐ์ 0.4% ์ฐจ์ด๋ ์ด๋ฌํ ๋ฒค์น๋งํฌ์ ๋ํ ํต๊ณ์ ๋ ธ์ด์ฆ ๋ฒ์ ๋ด์ ์์ต๋๋ค.
๊ทธ๋ฌ๋ ๊ฑด์ถ์ ์ ๊ทผ ๋ฐฉ์์ ์๋นํ ๋ค์ํฉ๋๋ค. OpenAI๊ฐ GPT-5๋ฅผ ๊ตฌ์ถํ์ต๋๋ค. ์ง๋ฅํ ๋ผ์ฐํ ์ ๊ฐ์ถ ๋ค์ค ๋ชจ๋ธ ์์คํ ์ผ๋ก, ์ฟผ๋ฆฌ๋ ๊ฐ๋จํ ์์ ์ ๊ฒฝ์ฐ ์ ์ํ๊ฒ ๋์ํ๋ ์์คํ ์ผ๋ก, ๋ณต์กํ ๋ฌธ์ ์ ๊ฒฝ์ฐ ์ถ๋ก ๋ชจ๋ธ๋ก, ๋๋ ์ปดํจํ ํ๊ณ์ ๋๋ฌํ๋ฉด ๋ฏธ๋ ๋ฒ์ ์ผ๋ก ์ ๋ฌ๋ฉ๋๋ค. Anthropic์ Opus 4.1์์ ๋จ์ผ ๋ชจ๋ธ ์ ๊ทผ ๋ฐฉ์์ ์ ์งํ๋ฉฐ, ํนํ๋ ์ต์ ํ๋ณด๋ค ์ผ๊ด์ฑ์ ์ฐ์ ์ํ์ต๋๋ค.

์ถ์ฒ: Anthropic
์ ํต ์ ๋ต์ ๊ฒฝ์ ์ฒ ํ์ ๋๋ฌ๋ธ๋ค
OpenAI๋ ๋ฌด๋ฃ ํฐ์ด ์ฌ์ฉ์๋ฅผ ํฌํจํ ๋ชจ๋ ChatGPT ์ฌ์ฉ์์๊ฒ GPT-5๋ฅผ ์ฆ์ ์ ๊ณตํ์ฌ ์ฃผ๊ฐ ํ์ฑ ์ฌ์ฉ์ ์ฝ 700์ต ๋ช ์ ๋ฌด๋ฃ๋ก ํ๋ณดํ์ต๋๋ค. Microsoft๋ GitHub Copilot, Visual Studio Code, M365 Copilot ๋ฐ Azure ํ๋ซํผ์ ์ด ๋ชจ๋ธ์ ๋์์ ํตํฉํ์ต๋๋ค.
Anthropic์ ๋ณด๋ค ์ ํต์ ์ธ ์ ๊ทผ ์ ํ์ ์ ์งํ๋ฉฐ ์ ๊ณตํฉ๋๋ค. Opus 4.1 ์ ๋ฃ Claude ์ฌ์ฉ์์๊ฒ ์ ๊ณต๊ฐ๋ฐ์๋ฅผ ์ํ Claude Code์ API ์ก์ธ์ค๋ฅผ ํตํด ์ ๊ณต๋ฉ๋๋ค. ์ด ํ์ฌ๋ ์ ํต๋ง ํ์ฅ๋ณด๋ค๋ ์์ ์ ์ด๊ณ ์ผ๊ด๋ ์ฑ๋ฅ์ ํ์๋ก ํ๋ ๊ฐ๋ฐ์์ ๊ธฐ์ ์ ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ๋ฐ ์ค์ ์ ๋๊ณ ์๋ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.
GPT-5์ ๊ฐ๊ฒฉ ์ฑ ์ ์ ๊ณต๊ฒฉ์ ์ด๋ฉฐ, ๊ฐ๋ฐ์๋ค์ ๊ฒฝ์์ ์ฒด๊ฐ ๊ฐ๊ฒฉ ์ฑ ์ ์ ๋ต์ ์กฐ์ ํ๋๋ก ์๋ ฅ์ ๊ฐํ ์ ์๋ ์ ๋ฆฌํ ๋น์ฉ ๋ ์ฉ๋ ๋น์จ์ ์ง์ ํฉ๋๋ค.
์ธํ๋ผ ์์๋ก ์ฐ์ ๊ฒฝ์ ์ฌํธ
์ปดํจํ ์๊ตฌ ์ฌํญ์ ์ต์ฒจ๋จ AI ๊ฐ๋ฐ์ ์์ฒญ๋ ๊ท๋ชจ๋ฅผ ๋ณด์ฌ์ค๋๋ค. OpenAI๋ ๋ค์๊ณผ ๊ฐ์ ๋ด์ฉ์ ์ ์งํ๋ค๊ณ ํฉ๋๋ค. Oracle๊ณผ ์ฐ๊ฐ 30์ต ๋ฌ๋ฌ ๊ท๋ชจ์ ์ฉ๋ ๊ณ์ฝ ์ฒด๊ฒฐNVIDIA H5 GPU๋ฅผ ์ฌ์ฉํ์ฌ Microsoft Azure์์ GPT-200๋ฅผ ํ๋ จํ์ต๋๋ค. ๋ฉํ๋ 72๋ ์๋ง AI ์ธํ๋ผ์ 2025์ต ๋ฌ๋ฌ๋ฅผ ์ง์ถํ ๊ณํ์ด๋ผ๊ณ ๋ฐํํ์ต๋๋ค.
๋ ํ์ฌ ๋ชจ๋ ์ค์ ์ ์ฉ ๋ถ์ผ์์ ์์ ๋ฒค์น๋งํฌ๋ฅผ ๋์ด ์๋นํ ๊ฐ์ ์ ๋ณด๊ณ ํฉ๋๋ค. OpenAI๋ ์น ๊ฒ์์ ํ์ฑํํ์ ๋ GPT-5๊ฐ "GPT-45o๋ณด๋ค ์ฝ 4% ๋ ์ ์ ์ค๋ฅ"๋ฅผ ๋ณด์ธ๋ค๊ณ ๋ฐํ์ผ๋ฉฐ, ์ฌ๊ณ ๋ชจ๋๋ ํ ํฐ์ 3~50% ๋ ์ ๊ฒ ์ฌ์ฉํ๋ฉด์๋ O80 ๋ชจ๋ธ๊ณผ ์ ์ฌํ ๊ฒฐ๊ณผ๋ฅผ ๋ฌ์ฑํ์ฌ ์๋นํ ํจ์จ์ฑ ํฅ์์ ์ด๋ฃจ์์ต๋๋ค.
GitHub ๋ณด๊ณ ์ Opus 4.1์ด ํ์๋ฉ๋๋ค OpenAI ๊ฐ๋ฐ์ ๋ฌธ์์ ๋ฐ๋ฅด๋ฉด, ์ธ๊ธฐ ์๋ AI ์ฝ๋ฉ ์ด์์คํดํธ์ธ Cursor๋ GPT-5๋ฅผ "๋งค์ฐ ์ง๋ฅ์ ์ด๊ณ ์กฐ์ข ํ๊ธฐ ์ฌ์ด" ๊ฒ์ผ๋ก ์ค๋ช ํ๊ณ ์์ผ๋ฉฐ, "๋ค์ค ํ์ผ ์ฝ๋ ๋ฆฌํฉํ ๋ง์์ ๋์ ๋๋ ์ฑ๋ฅ ํฅ์"์ ๋ณด์์ต๋๋ค.

์ถ์ฒ: OpenAI
๊ธฐ์ ์ ํ๊ณ๋ ์์ผ๋ก์ ํจ๋ฌ๋ค์ ์ ํ์ ์์ฌํ๋ค
์ฌ๋ฌ ํ์ฌ ๊ฐ์ ์ ์ฌํ ์ฑ๊ณผ ์งํ๊ฐ ์๋ ด๋๋ ํ์์ ํ์ฌ์ ๊ต์ก ํจ๋ฌ๋ค์์ด ํ๊ณ์ ๋ค๋ค๋ฅด๊ณ ์์์ ์์ฌํฉ๋๋ค. 74~75%์ ์ ํ๋๋ฅผ ๊ฐ์ง ์ฌ๋ฌ ๋ชจ๋ธ์ด ์ฝ๋ฉ ๋ฒค์น๋งํฌ ๋ค์ ์ฃผ์ ๊ฐ์ ์ฌํญ์๋ ์ ์ง์ ์ธ ํ์ฅ๋ณด๋ค๋ ๊ทผ๋ณธ์ ์ธ ํ์ ์ด ํ์ํ ์ ์์์ ์์ฌํฉ๋๋ค.
OpenAI์ ๋ณต์กํ ๋ผ์ฐํ ์์คํ ๊ณผ์ ๊ตฌ์กฐ์ ๊ท ํ Anthropic์ ํตํฉ์ ์ ๊ทผ ๋ฐฉ์ ๋ช ํํ ์น์๊ฐ ์๋ ๋ค์ํ ์ฒ ํ์ ๋ฐ์ํฉ๋๋ค. GPT-5์ ๋ค์ค ๋ชจ๋ธ ์์คํ ์ ์ ์ฐ์ฑ์ ์ ๊ณตํ์ง๋ง ์ ์ฌ์ ์ธ ์คํจ ์ง์ ์ ์ผ๊ธฐํ๋ ๋ฐ๋ฉด, Claude์ ์ผ๊ด์ฑ์ ์์ ์ฑ์ ์ํด ํนํ๋ ์ฑ๋ฅ์ ํฌ์ํ ์ ์์ต๋๋ค.
์ต์ฒจ๋จ AI ์ญ๋์ ๋ฏผ์ฃผํ(2๋ ์ ๋ง ํด๋ ์ฐ๊ฐ ์์ฒ ๋ฌ๋ฌ์ ๋ฌํ๋ ๊ธฐ๋ฅ๋ค์ ์ด์ ๋ฌด๋ฃ๋ก ์ด์ฉํ ์ ์๊ฒ ๋จ)๋ ์ฐ์ ์ ๋ฐ์ ๋์ ์ ๊ฐ์ํํฉ๋๋ค. AI๋ฅผ ํ๋ฆฌ๋ฏธ์ ์๋น์ค์์ ๊ณต๊ณต ์๋น์ค ์ธํ๋ผ๋ก ์ ํํ๋ ์ด๋ฌํ ์ ํ์ ์์ ํ ์๋ก์ด ๋ฒ์ฃผ์ ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ฐ๋ฅํ๊ฒ ํ ์ ์์ต๋๋ค.
์์ฅ ์ํฅ ๋ฐ ๋ค์ ๋จ๊ณ
์ ๊ณ ๊ด๊ณ์๋ค์ Anthropic์ด OpenAI์ ๊ฐ๊ฒฉ ์ฑ ์ ์ ๋ต์ ๋์ํ ๊ฒ์ผ๋ก ์์ํ์ง๋ง, ์ง์ ์ ์ธ ๊ฐ๊ฒฉ ๋งค์นญ ๋ฐฉ์์ ์๋ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค. ๊ตฌ๊ธ์ ๋ฅ๋ง์ธ๋ ๊ทธ๋ฆฌ๊ณ ๋ฉํ๋ ์ด๋ฌํ ๋ฐํ๊ฐ ์์ ๋๋ ๋น๊ต์ ์กฐ์ฉํ์ง๋ง, ์์ผ๋ก ๋ช ๋ฌ ์์ ์์ง์ผ ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค.
๊ฐ ๋ฆด๋ฆฌ์ค ์ฌ์ด์ 48์๊ฐ ๊ฐ๊ฒฉ์ AI๊ฐ ์คํ์ ๊ธฐ์ ์์ ์์ ์ ์ธ ์ธํ๋ผ๋ก ์ ํ๋๋ ๊ณผ์ ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ์ฌ๋ฌ ํ์ฌ๊ฐ ๊ฑฐ์ ๋์ผํ ๋ฒค์น๋งํฌ ์ ์๋ฅผ ๋ฌ์ฑํ๋ฉด์๋ ๋ฐฑ๋ถ์จ ์ฐจ์ด๊ฐ ๋ฏธ๋ฏธํ ๊ฒฝ์ฐ, ๊ฒฝ์์ ๋ฐฐํฌ ํจ์จ์ฑ, ํตํฉ ํ์ง, ๊ทธ๋ฆฌ๊ณ ์๋น์ค ์์ ์ฑ์ ์ค์ฌ์ผ๋ก ์ ํ๋ฉ๋๋ค.
์ค์ง์ ์ธ ๊ฐ์ ์ ๋ฒค์น๋งํฌ ์ฐ์๋ณด๋ค ๋ ์ค์ํฉ๋๋ค. SWE-bench Verified๋ AI๊ฐ ์คํ์์ค ์ํํธ์จ์ด์ ์ค์ ๋ฒ๊ทธ๋ฅผ ์๋ณํ๊ณ ์์ ํ๋ ๋ฅ๋ ฅ์ ์ธก์ ํ๋ฉฐ, ๋ ๋ชจ๋ธ์ ์ ์๋ ์์จ ์ฝ๋ฉ ๊ธฐ๋ฅ์ ์๋นํ ๋ฐ์ ์ ๋ํ๋ ๋๋ค.
AI ๋ชจ๋ธ์ ์ถ๋ก ๋ฐ ์ฝ๋ฉ ๋ฅ๋ ฅ์ด ์ ์ ๋ ์ ๊ตํด์ง์ ๋ฐ๋ผ, ๊ฒฝ์์ ์ด์ ์ ๋จ์ํ ์ฑ๋ฅ ์งํ์์ ์ค์ ์ด์ ํ๊ฒฝ์์์ ๊ตฌํ ๋ฐ ์์ ์ฑ์ผ๋ก ์ฎ๊ฒจ๊ฐ๊ณ ์์ต๋๋ค. ๋๋ผ์ด ์ฌ์ค์ ๋ฌด์์ผ๊น์? ์ด๋ฌํ ์์ ์ฑ์ด ๋ค๋ฅธ ํ๊ธฐ์ ์ธ ๊ธฐ์ ๋ณด๋ค ๋ ํ์ ์ ์ธ ๋ณํ๋ฅผ ๊ฐ์ ธ์ฌ ์ ์๋ค๋ ๊ฒ์ ๋๋ค.