μΈκ³΅μ§λ₯
Sparse Autoencoders, GPT-4 λ° Claude 3 μ΄ν΄: μ¬μΈ΅μ μΈ κΈ°μ νꡬ

By
μμ μ¬ λ―Έν λ―Έν
μ€ν μΈμ½λ μκ°

μ¬μ§: Wikimedia Commonsλ₯Ό ν΅ν Michela Massi,(https://commons.wikimedia.org/wiki/File:Autoencoder_schema.png)
μ€ν μΈμ½λλ μ λ ₯ λ°μ΄ν°λ₯Ό μΈμ½λ©νκ³ μ¬κ΅¬μ±νμ¬ ν¨μ¨μ μΈ ννμ νμ΅νλ κ²μ λͺ©νλ‘ νλ μ κ²½λ§ ν΄λμ€μ λλ€. μ΄λ μ λ ₯ λ°μ΄ν°λ₯Ό μ μ¬ ννμΌλ‘ μμΆνλ μΈμ½λμ μ΄ μ μ¬ ννμμ μλ³Έ λ°μ΄ν°λ₯Ό μ¬κ΅¬μ±νλ λμ½λμ λ κ°μ§ μ£Όμ λΆλΆμΌλ‘ ꡬμ±λ©λλ€. μ λ ₯ λ°μ΄ν°μ μ¬κ΅¬μ±λ λ°μ΄ν° κ°μ μ°¨μ΄λ₯Ό μ΅μνν¨μΌλ‘μ¨ μ€ν μΈμ½λλ μ°¨μ ββμΆμ, μ΄μ νμ§, νΉμ§ μΆμΆ λ± λ€μν μμ μ μ¬μ©ν μ μλ μλ―Έ μλ νΉμ§μ μΆμΆν μ μμ΅λλ€.
μ€ν μΈμ½λλ 무μμ ν©λκΉ?
μ€ν μΈμ½λλ λΉμ§λ νμ΅μ ν΅ν΄ λ°μ΄ν°λ₯Ό μμΆνκ³ μ¬κ΅¬μ±νλ λ°©λ²μ νμ΅νλ©° μ¬κ΅¬μ± μ€λ₯λ₯Ό μ€μ΄λ λ° μ€μ μ λ‘λλ€. μΈμ½λλ μ λ ₯ λ°μ΄ν°λ₯Ό μ μ°¨μ 곡κ°μ λ§€ννμ¬ νμ κΈ°λ₯μ μΊ‘μ²νλ λ°λ©΄ λμ½λλ μ΄ μμΆλ ννμμ μλ μ λ ₯μ μ¬κ΅¬μ±νλ €κ³ μλν©λλ€. μ΄ νλ‘μΈμ€λ κΈ°μ‘΄ λ°μ΄ν° μμΆ κΈ°μ κ³Ό μ μ¬νμ§λ§ μ κ²½λ§μ μ¬μ©νμ¬ μνλ©λλ€.
μΈμ½λ E(x)λ μ λ ₯ λ°μ΄ν° xλ₯Ό μ μ°¨μ κ³΅κ° zμ λ§€ννμ¬ νμ κΈ°λ₯μ μΊ‘μ²ν©λλ€. λμ½λ D(z)λ μ΄ μμΆ ννμμ μλ μ λ ₯μ μ¬κ΅¬μ±νλ €κ³ μλν©λλ€.
μνμ μΌλ‘ μΈμ½λμ λμ½λλ λ€μκ³Ό κ°μ΄ ννλ μ μμ΅λλ€.
z = E(x)
xΜ = D(z) = D(E(x))
λͺ©νλ μλ μ
λ ₯κ³Ό μ¬κ΅¬μ±λ μΆλ ₯ κ°μ μ°¨μ΄λ₯Ό μΈ‘μ νλ μ¬κ΅¬μ± μμ€ L(x, xΜ)μ μ΅μννλ κ²μ
λλ€. μμ€ ν¨μμ λν μΌλ°μ μΈ μ νμ νκ· μ κ³± μ€μ°¨(MSE)μ
λλ€.
L(x, xΜ) = (1/N) β (xα΅’ β xΜα΅’)Β²
μ€ν μΈμ½λμλ μ¬λ¬ κ°μ§ μ©λκ° μμ΅λλ€.
- μ°¨μ μΆμ: μ λ ₯ λ°μ΄ν°μ μ°¨μμ μ€μμΌλ‘μ¨ μ€ν μΈμ½λλ μ€μν μ 보λ₯Ό 보쑴νλ©΄μ 볡μ‘ν λ°μ΄ν°μΈνΈλ₯Ό λ¨μνν μ μμ΅λλ€.
- νΉμ§ μΆμΆ: μΈμ½λκ° νμ΅ν μ μ¬ ννμ μ΄λ―Έμ§ λΆλ₯μ κ°μ μμ μ μ μ©ν κΈ°λ₯μ μΆμΆνλ λ° μ¬μ©λ μ μμ΅λλ€.
- μ΄μ νμ§: μ€ν μΈμ½λλ μ μμ μΈ λ°μ΄ν° ν¨ν΄μ μ¬κ΅¬μ±νλλ‘ νλ ¨λ μ μμΌλ―λ‘ μ΄λ¬ν ν¨ν΄μμ λ²μ΄λλ μ΄μ νμμ μλ³νλ λ° ν¨κ³Όμ μ λλ€.
- μ΄λ―Έμ§ μμ±: VAE(Variational Autoencoders)μ κ°μ μλ μΈμ½λμ λ³νμ νλ ¨ λ°μ΄ν°μ μ μ¬ν μλ‘μ΄ λ°μ΄ν° μνμ μμ±ν μ μμ΅λλ€.
ν¬μ μλ μΈμ½λ: νΉμ λ³ν
μ€ν μ€ μ€ν μΈμ½λ μ λ ₯ λ°μ΄ν°μ ν¬λ°ν ννμ μμ±νλλ‘ μ€κ³λ λ³νμ λλ€. νλ ¨ μ€μ μ¨κ²¨μ§ μ λμ ν¬μμ± μ μ½ μ‘°κ±΄μ λμ νμ¬ λ€νΈμν¬κ° μμμ λ΄λ°λ§ νμ±ννλλ‘ μ₯λ €νμ¬ λμ μμ€μ νΉμ§μ ν¬μ°©νλ λ° λμμ΄ λ©λλ€.
ν¬μ μλ μΈμ½λλ μ΄λ»κ² μλν©λκΉ?
ν¬μ μλ μΈμ½λλ κΈ°μ‘΄ μλ μΈμ½λμ μ μ¬νκ² μλνμ§λ§ ν¬μμ± νλν°λ₯Ό μμ€ ν¨μμ ν΅ν©ν©λλ€. μ΄ νλν°λ λλΆλΆμ μ¨κ²¨μ§ μ λμ΄ λΉνμ±νλλλ‘(μ¦, νμ±νκ° 0 λλ κ±°μ 0μ κ°κΉμ) νΉμ μκ°μ μμμ μ λ νμ μ§ν©λ§ νμ±νλλλ‘ ν©λλ€. ν¬μμ± μ μ½ μ‘°κ±΄μ λ€μν λ°©λ²μΌλ‘ ꡬνλ μ μμ΅λλ€.
- ν¬μμ± νλν°: λΉν¬μ νμ±νμ λΆμ΄μ΅μ μ£Όλ μμ€ ν¨μμ νμ μΆκ°ν©λλ€.
- ν¬μμ± μ κ·νκΈ°: μ κ·ν κΈ°μ μ μ¬μ©νμ¬ ν¬μ νμ±νλ₯Ό μ₯λ €ν©λλ€.
- ν¬μμ± λΉμ¨: νμ±νμμ μνλ ν¬μμ± μμ€μ κ²°μ νλ νμ΄νΌνλΌλ―Έν°λ₯Ό μ€μ ν©λλ€.
ν¬μμ± μ μ½ μ‘°κ±΄ ꡬν
ν¬μμ± μ μ½ μ‘°κ±΄μ λ€μν λ°©λ²μΌλ‘ ꡬνλ μ μμ΅λλ€.
- ν¬μμ± νλν°: λΉν¬μ νμ±νμ λΆμ΄μ΅μ μ£Όλ μμ€ ν¨μμ νμ μΆκ°ν©λλ€. μ΄λ μ’ μ’ μ¨κ²¨μ§ κ³μΈ΅μ νμ±νμ L1 μ κ·ν νμ μΆκ°νμ¬ λ¬μ±λ©λλ€. Lβββα΅£ββ = Ξ» β |hβ±Ό| μ¬κΈ°μ hβ±Όλ jλ²μ§Έ μλ μ λμ νμ±νμ΄κ³ Ξ»λ μ κ·ν λ§€κ°λ³μμ λλ€.
- KL λ°μ°: μ¨κ²¨μ§ μ λμ νκ· νμ±νμ μμ λͺ©ν κ° Ο μ¬μ΄μ Kullback-Leibler(KL) λ°μ°μ μ΅μννμ¬ ν¬μμ±μ μ μ©ν©λλ€. Lββ = β (Ο log(Ο / ΟΜβ±Ό) + (1-Ο) log((1- Ο) / (1-ΟΜβ±Ό))) μ¬κΈ°μ ΟΜβ±Όμ νλ ¨ λ°μ΄ν°μ λν μ¨κ²¨μ§ μ λ jμ νκ· νμ±νμ λλ€.
- ν¬μμ± λΉμ¨: νμ±νμμ μνλ ν¬μμ± μμ€μ κ²°μ νλ νμ΄νΌνλΌλ―Έν°λ₯Ό μ€μ ν©λλ€. μ΄λ νμ± λ΄λ°μ νΉμ λΉμ¨μ μ μ§νκΈ° μν΄ νλ ¨ μ€μ νμ±νλ₯Ό μ§μ μ νν¨μΌλ‘μ¨ κ΅¬νλ μ μμ΅λλ€.
κ²°ν© μμ€ ν¨μ
ν¬μ μ€ν μΈμ½λ νλ ¨μ μν μ 체 μμ€ ν¨μμλ μ¬κ΅¬μ± μμ€κ³Ό ν¬μμ± νλν°κ° ν¬ν¨λ©λλ€. Lβββββ = L( x, xΜ ) + Ξ» Lβββα΅£ββ
ν¬μ μλ μΈμ½λλ μ΄λ¬ν κΈ°μ μ μ¬μ©νμ¬ ν¨μ¨μ μ΄κ³ μλ―Έ μλ λ°μ΄ν° ννμ νμ΅ν μ μμΌλ―λ‘ λ€μν κΈ°κ³ νμ΅ μμ μ μ μ©ν λκ΅¬κ° λ©λλ€.
ν¬μ μ€ν μΈμ½λμ μ€μμ±
Sparse Autoencodersλ λ μ΄λΈμ΄ μ§μ λμ§ μμ λ°μ΄ν°μμ μ μ©ν κΈ°λ₯μ νμ΅νλ κΈ°λ₯μ νΉν μ μ©νλ©°, μ΄λ μ΄μ νμ§, λ Έμ΄μ¦ μ κ±°, μ°¨μ κ°μμ κ°μ μμ μ μ μ©ν μ μμ΅λλ€. λ°μ΄ν°μ κ°μ₯ μ€μν μΈ‘λ©΄μ ν¬μ°©νλ μ μ°¨μ ννμ νμ΅ν μ μμΌλ―λ‘ κ³ μ°¨μ λ°μ΄ν°λ₯Ό μ²λ¦¬ν λ νΉν μ μ©ν©λλ€. λν ν¬μ μλ μΈμ½λλ μ¬μΈ΅ μ κ²½λ§μ μ¬μ νλ ¨νλ λ° μ¬μ©λμ΄ κ°μ€μΉμ λν μ μ ν μ΄κΈ°νλ₯Ό μ 곡νκ³ μ§λ νμ΅ μμ μ μ±λ₯μ μ μ¬μ μΌλ‘ ν₯μμν¬ μ μμ΅λλ€.
GPT-4 μ΄ν΄
OpenAIκ° κ°λ°ν GPT-4λ λ³νκΈ° μν€ν μ²λ₯Ό κΈ°λ°μΌλ‘ ν λκ·λͺ¨ μΈμ΄ λͺ¨λΈμ λλ€. μ΄λ μ΄μ λ²μ μΈ GPT-2 λ° GPT-3μ μ±κ³΅μ κΈ°λ°μΌλ‘ λ λ§μ λ§€κ°λ³μμ νλ ¨ λ°μ΄ν°λ₯Ό ν΅ν©νμ¬ μ±λ₯κ³Ό κΈ°λ₯μ ν₯μμμΌ°μ΅λλ€.
GPT-4μ μ£Όμ νΉμ§
- νμ₯μ±: GPT-4μλ μ΄μ λͺ¨λΈλ³΄λ€ ν¨μ¬ λ λ§μ λ§€κ°λ³μκ° μμ΄ λ°μ΄ν°μ λ 볡μ‘ν ν¨ν΄κ³Ό λμμ€λ₯Ό ν¬μ°©ν μ μμ΅λλ€.
- λ€μμ±: ν μ€νΈ μμ±, λ²μ, μμ½, μ§λ¬Έ λ΅λ³ λ± κ΄λ²μν μμ°μ΄ μ²λ¦¬(NLP) μμ μ μνν μ μμ΅λλ€.
- ν΄μ κ°λ₯ν ν¨ν΄: μ°κ΅¬μλ€μ GPT-4μμ ν΄μ κ°λ₯ν ν¨ν΄μ μΆμΆνλ λ°©λ²μ κ°λ°νμ¬ λͺ¨λΈμ΄ μλ΅μ μμ±νλ λ°©λ²μ μ΄ν΄νλ λ° λμμ μ£Όμμ΅λλ€.
λκ·λͺ¨ μΈμ΄ λͺ¨λΈ μ΄ν΄μ κ³Όμ
μΈμμ μΈ κΈ°λ₯μλ λΆκ΅¬νκ³ GPT-4μ κ°μ λκ·λͺ¨ μΈμ΄ λͺ¨λΈμ ν΄μ κ°λ₯μ± μΈ‘λ©΄μμ μ¬κ°ν λ¬Έμ λ₯Ό μ겨μ€λλ€. μ΄λ¬ν λͺ¨λΈμ 볡μ‘μ±μΌλ‘ μΈν΄ μμ¬κ²°μ μ λ΄λ¦¬κ³ κ²°κ³Όλ₯Ό μμ±νλ λ°©λ²μ μ΄ν΄νκΈ°κ° μ΄λ ΅μ΅λλ€. μ°κ΅¬μλ€μ ν¬λͺ μ±κ³Ό μ λ’°μ±μ ν₯μμν€κΈ° μν΄ μ΄λ¬ν λͺ¨λΈμ λ΄λΆ μλμ ν΄μνλ λ°©λ²μ κ°λ°νκΈ° μν΄ λ Έλ ₯ν΄ μμ΅λλ€.
ν¬μ μλ μΈμ½λλ₯Ό GPT-4μ ν΅ν©

ν¬μ μ€ν μΈμ½λ νμ₯ λ° νκ° β κ°λ°©ν AI
λκ·λͺ¨ μΈμ΄ λͺ¨λΈμ μ΄ν΄νκ³ ν΄μνλ μ λ§ν μ κ·Ό λ°©μ μ€ νλλ ν¬μ μλ μΈμ½λλ₯Ό μ¬μ©νλ κ²μ λλ€. GPT-4μ κ°μ λͺ¨λΈμ νμ±νμ λν΄ ν¬μ μλ μΈμ½λλ₯Ό νλ ¨ν¨μΌλ‘μ¨, μ°κ΅¬μλ€μ ν΄μ κ°λ₯ν νΉμ§μ μΆμΆν μ μμ΅λλ€. λͺ¨λΈμ λμμ λν ν΅μ°°λ ₯μ μ 곡ν©λλ€.
ν΄μ κ°λ₯ν νΉμ§ μΆμΆ
μ΅κ·Ό λ°μ μΌλ‘ μΈν΄ GPT-4μ κ°μ λν λͺ¨λΈμ μ‘΄μ¬νλ λ°©λν μμ νΉμ§μ μ²λ¦¬ν μ μλλ‘ ν¬μ μ€ν μΈμ½λμ νμ₯μ΄ κ°λ₯ν΄μ‘μ΅λλ€. μ΄λ¬ν νΉμ§μ λ€μμ ν¬ν¨νμ¬ λͺ¨λΈ λμμ λ€μν μΈ‘λ©΄μ ν¬μ°©ν μ μμ΅λλ€.
- κ°λ μ μ΄ν΄: "λ²λ₯ ν μ€νΈ" λλ "DNA μμ΄"κ³Ό κ°μ νΉμ κ°λ μ μλ΅νλ κΈ°λ₯μ λλ€.
- νλ ν¨ν΄: "νΈκ²¬"μ΄λ "κΈ°λ§"κ³Ό κ°μ΄ λͺ¨λΈμ λμμ μν₯μ λ―ΈμΉλ νΉμ§.
ν¬μ μ€ν μΈμ½λ νλ ¨ λ°©λ²λ‘
ν¬μ μλ μΈμ½λ νλ ¨μλ μ¬λ¬ λ¨κ³κ° ν¬ν¨λ©λλ€.
- νμ€ν: λͺ¨λΈ νμ±νλ₯Ό μ μ²λ¦¬νμ¬ λ¨μ νμ€μ΄ μλμ§ νμΈν©λλ€.
- μΈμ½λ λ° λμ½λ μ€κ³: νμ±νλ₯Ό ν¬μ μ μ¬ ννμ λ§€ννκ³ μλ νμ±νλ₯Ό κ°κ° μ¬κ΅¬μ±νλλ‘ μΈμ½λ λ° λμ½λ λ€νΈμν¬λ₯Ό ꡬμ±ν©λλ€.
- ν¬μμ± μ μ½: ν¬μ νμ±νλ₯Ό μ₯λ €νκΈ° μν΄ μμ€ ν¨μμ ν¬μ μ μ½ μ‘°κ±΄μ λμ ν©λλ€.
- νλ ¨: μ¬κ΅¬μ± μμ€κ³Ό ν¬μμ± νλν°λ₯Ό μ‘°ν©νμ¬ μ€ν μΈμ½λλ₯Ό νλ ¨μν΅λλ€.
μ¬λ‘ μ°κ΅¬: ν¬μ μλ μΈμ½λλ₯Ό GPT-4λ‘ νμ₯
μ°κ΅¬μλ€μ ν¬μ μλ μΈμ½λλ₯Ό μ±κ³΅μ μΌλ‘ νλ ¨μμΌ°μ΅λλ€. GPT-4 νμ±ννμ¬ ν΄μ κ°λ₯ν μλ§μ κΈ°λ₯μ μ°Ύμλ λλ€. μλ₯Ό λ€μ΄, κ·Έλ€μ "μΈκ°μ κ²°ν¨", "κ°κ²© μΈμ", "μμ¬μ μ§λ¬Έ"κ³Ό κ°μ κ°λ κ³Ό κ΄λ ¨λ νΉμ§μ μλ³νμ΅λλ€. μ΄λ¬ν κΈ°λ₯μ GPT-4κ° μ 보λ₯Ό μ²λ¦¬νκ³ μλ΅μ μμ±νλ λ°©λ²μ λν κ·μ€ν ν΅μ°°λ ₯μ μ 곡ν©λλ€.
μ: μΈκ° λΆμμ μ± νΉμ§
GPT-4μμ μΆμΆλ νΉμ§ μ€ νλλ μΈκ° λΆμμ μ±μ κ°λ κ³Ό κ΄λ ¨μ΄ μμ΅λλ€. μ΄ κΈ°λ₯μ ν μ€νΈκ° μΈκ°μ κ²°μ μ΄λ λΆμμ μ±μ λ Όμνλ λ§₯λ½μμ νμ±νλ©λλ€. μ΄ κΈ°λ₯μ νμ±νλ₯Ό λΆμν¨μΌλ‘μ¨ μ°κ΅¬μλ€μ GPT-4κ° κ·Έλ¬ν κ°λ μ μ΄λ»κ² μΈμνκ³ μ²λ¦¬νλμ§ λ κΉμ΄ μ΄ν΄ν μ μμ΅λλ€.
AI μμ μ±κ³Ό μ λ’°μ±μ λν μμ¬μ
λκ·λͺ¨ μΈμ΄ λͺ¨λΈμμ ν΄μ κ°λ₯ν κΈ°λ₯μ μΆμΆνλ κΈ°λ₯μ AI μμ μ±κ³Ό μ λ’°μ±μ μ€μν μν₯μ λ―ΈμΉ©λλ€. μ°κ΅¬μλ€μ μ΄λ¬ν λͺ¨λΈμ λ΄λΆ λ©μ»€λμ¦μ μ΄ν΄ν¨μΌλ‘μ¨ μ μ¬μ μΈ νΈκ²¬, μ·¨μ½μ± λ° κ°μ μμμ μλ³ν μ μμ΅λλ€. μ΄ μ§μμ λ³΄λ€ μμ νκ³ μμ μ μΈ AI μμ€ν μ κ°λ°νλ λ° μ¬μ©λ μ μμ΅λλ€.
μ¨λΌμΈμΌλ‘ Sparse Autoencoder κΈ°λ₯ μ΄ν΄λ³΄κΈ°
ν¬μ μλ μΈμ½λλ‘ μΆμΆλ κΈ°λ₯μ νμνλ λ° κ΄μ¬μ΄ μλ μ¬λλ€μ μν΄ OpenAIλ λ€μμμ μ¬μ©ν μ μλ λνν λꡬλ₯Ό μ 곡νμ΅λλ€. μ€νμ€ μ€ν μΈμ½λ λ·°μ΄. μ΄ λꡬλ₯Ό μ¬μ©νλ©΄ μ¬μ©μλ GPT-4 λ° GPT-2 SMALLκ³Ό κ°μ λͺ¨λΈ λ΄μμ μλ³λ κΈ°λ₯μ 볡μ‘ν μΈλΆ μ 보λ₯Ό μ‘°μ¬ν μ μμ΅λλ€. λ·°μ΄λ νΉμ κΈ°λ₯, ν΄λΉ νμ±ν λ° ν΄λΉ κΈ°λ₯μ΄ λνλλ 컨ν μ€νΈλ₯Ό κ²μ¬ν μ μλ ν¬κ΄μ μΈ μΈν°νμ΄μ€λ₯Ό μ 곡ν©λλ€.
Sparse Autoencoder λ·°μ΄λ₯Ό μ¬μ©νλ λ°©λ²
- λ·°μ΄μ μ‘μΈμ€ν©λλ€. λ‘ μ΄λ μ€νμ€ μ€ν μΈμ½λ λ·°μ΄.
- λͺ¨λΈμ μ ννμΈμ: μ΄ν΄λ³΄κ³ μΆμ λͺ¨λΈμ μ ννμΈμ(μ: GPT-4 λλ GPT-2 SMALL).
- κΈ°λ₯ μ΄ν΄λ³΄κΈ°: ν¬μ μ€ν μΈμ½λκ° μΆμΆν κΈ°λ₯ λͺ©λ‘μ μ΄ν΄λ³΄μΈμ. κ°λ³ κΈ°λ₯μ ν΄λ¦νλ©΄ νμ±ν λ° ν΄λΉ κΈ°λ₯μ΄ λνλλ 컨ν μ€νΈλ₯Ό λ³Ό μ μμ΅λλ€.
- νμ±ν λΆμ: μκ°ν λꡬλ₯Ό μ¬μ©νμ¬ μ νν κΈ°λ₯μ νμ±νλ₯Ό λΆμν©λλ€. μ΄λ¬ν κΈ°λ₯μ΄ λͺ¨λΈμ μΆλ ₯μ μ΄λ€ μν₯μ λ―ΈμΉλμ§ μ΄ν΄ν©λλ€.
- ν¨ν΄ μλ³: λͺ¨λΈμ΄ μ 보λ₯Ό μ²λ¦¬νκ³ μλ΅μ μμ±νλ λ°©μμ 보μ¬μ£Όλ ν¨ν΄κ³Ό ν΅μ°°λ ₯μ μ°Ύμ보μΈμ.
ν΄λ‘λ 3 μ΄ν΄νκΈ°: ν΅μ°°κ³Ό ν΄μ
ν΄λ‘λ 3, μ€νΈλ‘ν½μ μμ° λͺ¨λΈλ λ³νκΈ° κΈ°λ° μΈμ΄ λͺ¨λΈμ ν΄μ κ°λ₯μ±μ νμ₯νλ λ° μμ΄ μ€μν μ§μ μ λνλ λλ€. Anthropicμ ν΄μ κ°λ₯μ± νμ ν¬μ μλ μΈμ½λλ₯Ό μ μ©νμ¬ Claude 3μ κ³ νμ§ κΈ°λ₯μ΄λ λͺ¨λΈμ μΆμμ μ΄ν΄μ μ μ¬μ μμ λ¬Έμ λ₯Ό λͺ¨λ λλ¬λ λλ€. λ³Έ μ°κ΅¬μμ μ¬μ©λ λ°©λ²λ‘ κ³Ό μ£Όμ μ°κ΅¬ κ²°κ³Όλ₯Ό μμΈν μ΄ν΄λ³΄κ² μ΅λλ€.
ν¬μ μλ μΈμ½λμ μ€μΌμΌλ§
SAE(Sparse Autoencoders)λ Claude 3μ νμ±νλ₯Ό ν΄λ νλ λ° μ€μΆμ μΈ μν μ νμ΅λλ€. μΌλ°μ μΈ μ κ·Ό λ°©μμλ ReLU λΉμ νμ±μ΄ λ€λ°λ₯΄λ μ ν λ³νμ μ¬μ©νμ¬ λͺ¨λΈμ νμ±νλ₯Ό ν΄μ κ°λ₯ν κΈ°λ₯μΌλ‘ λΆν΄νλ κ²μ΄ ν¬ν¨λ©λλ€. μ΄ λ°©λ²μ μ΄μ μ λ μμ λͺ¨λΈμμ ν¨κ³Όμ μΌλ‘ μλνλ κ²μΌλ‘ μ μ¦λμμΌλ©° Claude 3λ§νΌ ν° λͺ¨λΈλ‘ νμ₯νλ κ²μ΄ κ³Όμ μμ΅λλ€.
Claude 3μμ νΉμ§ κ°μκ° 1λ§ κ°, 4λ§ κ°, 34λ§ κ°λ‘ μλ‘ λ€λ₯Έ μΈ κ°μ§ SAEλ₯Ό νμ΅νμ΅λλ€. μ°μ° μ§μ½λμλ λΆκ΅¬νκ³ , μ΄ SAEλ€μ ν ν°λΉ νκ· 300κ° λ―Έλ§μ νΉμ§μ΄ νμ±νλμ΄ λͺ¨λΈ λΆμ°μ μλΉ λΆλΆμ μ€λͺ νμ΅λλ€. νμ΅μλ μ€μΌμΌλ§ λ²μΉμ μ μ©νμ¬ μ£Όμ΄μ§ μ°μ°λ λ΄μμ μ΅μ μ μ±λ₯μ 보μ₯νμ΅λλ€.
λ€μνκ³ μΆμμ μΈ νΉμ§
ν΄λ‘λ 3μμ μΆμΆλ νΌμ³λ μ λͺ μΈ, κ΅κ°, λμ, μ½λνμ μκ·Έλμ²κΉμ§ λ€μν 컨μ μ ν¬κ΄ν©λλ€. μ΄λ¬ν κΈ°λ₯μ λ§€μ° μΆμμ μ΄κ³ μ’ μ’ λ€μ€ μΈμ΄ λ° λ€μ€ λͺ¨λμ΄λ©° ꡬ체μ μ°Έμ‘°μ μΆμμ μ°Έμ‘° μ¬μ΄μμ μΌλ°νλ©λλ€. μλ₯Ό λ€μ΄, μΌλΆ κΈ°λ₯μ ν μ€νΈμ μ΄λ―Έμ§ λͺ¨λμ μν΄ νμ±νλμ΄ λ€μν μμμ κ±Έμ³ κ°λ μ νμ€νκ² μ΄ν΄νκ³ μμμ λνλ λλ€.
μμ κ΄λ ¨ κΈ°λ₯
μ΄ μ°κ΅¬μ μ€μν μΈ‘λ©΄μ μμ κ³Ό κ΄λ ¨μ΄ μμ μ μλ νΉμ§μ νμ νλ κ²μ΄μμ΅λλ€. μ¬κΈ°μλ 보μ μ·¨μ½μ , νΈν₯, κ±°μ§λ§, κΈ°λ§, μ첨, κ·Έλ¦¬κ³ μ물무기μ κ°μ μνν μ½ν μΈ μ κ΄λ ¨λ νΉμ§μ΄ ν¬ν¨λ©λλ€. μ΄λ¬ν νΉμ§μ΄ μ‘΄μ¬νλ€κ³ ν΄μ ν΄λΉ λͺ¨λΈμ΄ λ³Έμ§μ μΌλ‘ μ ν΄ν νμλ₯Ό μννλ€λ κ²μ μλ―Ένμ§λ μμ§λ§, μ΄λ¬ν νΉμ§μ μ‘΄μ¬λ μΆκ° μ‘°μ¬κ° νμν μ μ¬μ μνμ λλ¬λ λλ€.
λ°©λ²λ‘ λ° κ²°κ³Ό
μ΄ λ°©λ²λ‘ μλ λͺ¨λΈ νμ±νλ₯Ό μ κ·νν λ€μ ν¬μ μλ μΈμ½λλ₯Ό μ¬μ©νμ¬ μ΄λ¬ν νμ±νλ₯Ό κΈ°λ₯ λ°©ν₯μ μ ν μ‘°ν©μΌλ‘ λΆν΄νλ μμ μ΄ ν¬ν¨λμμ΅λλ€. νλ ¨μλ μ¬κ΅¬μ± μ€λ₯λ₯Ό μ΅μννκ³ L1 μ κ·νλ₯Ό ν΅ν΄ ν¬μμ±μ μ μ©νλ μμ μ΄ ν¬ν¨λμμ΅λλ€. μ΄ μ€μ μ ν΅ν΄ λͺ¨λΈ νμ±νλ₯Ό ν΄μ κ°λ₯ν μ‘°κ°μΌλ‘ λλ΅μ μΌλ‘ λΆν΄νλ κΈ°λ₯μ μΆμΆν μ μμμ΅λλ€.
κ²°κ³Όλ ν΄λΉ νΉμ§λ€μ΄ ν΄μ κ°λ₯ν λΏλ§ μλλΌ μμΈ‘ κ°λ₯ν λ°©μμΌλ‘ λͺ¨λΈ λμμ μν₯μ λ―ΈμΉλ€λ κ²μ 보μ¬μ£Όμμ΅λλ€. μλ₯Ό λ€μ΄, 골λ κ²μ΄νΈ λΈλ¦¬μ§μ κ΄λ ¨λ νΉμ§μ ν΄λ¨ννμ λͺ¨λΈμ΄ λ€λ¦¬μ κ΄λ ¨λ ν μ€νΈλ₯Ό μμ±νμ¬, νΉμ§κ³Ό λͺ¨λΈ μΆλ ₯ μ¬μ΄μ λͺ νν μ°κ΄μ±μ΄ μμμ 보μ¬μ£Όμμ΅λλ€.
κΈ°λ₯ ν΄μμ± νκ°
κΈ°λ₯ ν΄μμ±μ μλ λ° μλ λ°©λ²μ ν΅ν΄ νκ°λμμ΅λλ€. νΉμ΄μ±μ κ΄λ ¨ 컨ν μ€νΈμμ κΈ°λ₯μ΄ μΌλ§λ μμ μ μΌλ‘ νμ±νλλμ§λ‘ μΈ‘μ λμμΌλ©°, κΈ°λ₯ νμ±νμ κ°μ νκ³ λͺ¨λΈ μΆλ ₯μ λ³νλ₯Ό κ΄μ°°νμ¬ λμμ λν μν₯μ ν μ€νΈνμ΅λλ€. μ΄λ¬ν μ€νμ κΈ°λ₯μ κ°λ ₯ν νμ±νκ° μλν κ°λ μ λ§€μ° κ΅¬μ²΄μ μ΄λ©° λͺ¨λΈ λμμ ν° μν₯μ λ―ΈμΉλ€λ κ²μ 보μ¬μ£Όμμ΅λλ€.
ν₯ν λ°©ν₯ λ° μμ¬μ
ν¬μ μλ μΈμ½λλ₯Ό Claude 3μΌλ‘ νμ₯νλ λ° μ±κ³΅ν κ²μ λκ·λͺ¨ μΈμ΄ λͺ¨λΈμ μ΄ν΄νκΈ° μν μλ‘μ΄ κΈΈμ μ΄μμ΅λλ€. μ μ¬ν λ°©λ²μ ν¨μ¬ λ ν° λͺ¨λΈμ μ μ©νμ¬ μ μ¬μ μΌλ‘ λ 볡μ‘νκ³ μΆμμ μΈ κΈ°λ₯μ λ°κ²¬ν μ μμμ μμ¬ν©λλ€. λν μμ κ΄λ ¨ κΈ°λ₯μ μλ³μ μ μ¬μ μνμ μννκΈ° μν λͺ¨λΈ ν΄μ κ°λ₯μ±μ λν μ§μμ μΈ μ°κ΅¬μ μ€μμ±μ κ°μ‘°ν©λλ€.
κ²°λ‘
ν¬μ μλ μΈμ½λλ₯Ό GPT-4 λ° Claude 3κ³Ό κ°μ λͺ¨λΈλ‘ νμ₯νλ κΈ°μ μ λ°μ μ 볡μ‘ν μ κ²½λ§μ λν μ΄ν΄λ₯Ό νμ ν μ μλ μ΄λ¬ν κΈ°μ μ μ μ¬λ ₯μ κ°μ‘°ν©λλ€. μ°λ¦¬κ° μ΄λ¬ν λ°©λ²μ κ³μ κ°λ°νκ³ κ°μ ν¨μ λ°λΌ μ»μ ν΅μ°°λ ₯μ AI μμ€ν μ μμ μ±, μ λ’°μ± λ° μ λ’°μ±μ 보μ₯νλ λ° λ§€μ° μ€μν κ²μ λλ€.
μ λ μ§λ 50λ λμ κΈ°κ³ νμ΅κ³Ό λ₯ λ¬λμ λ§€νΉμ μΈ μΈκ³μ λͺ°λνμ΅λλ€. μ μ μ΄μ κ³Ό μ λ¬Έ ββμ§μμ νΉν AI/MLμ μ€μ μ λ XNUMXκ° μ΄μμ λ€μν μννΈμ¨μ΄ μμ§λμ΄λ§ νλ‘μ νΈμ κΈ°μ¬νλλ‘ μ΄λμμ΅λλ€. λμ κ³μλλ νΈκΈ°μ¬μ λν λ΄κ° λ νꡬνκ³ μΆμ λΆμΌμΈ μμ°μ΄ μ²λ¦¬λ‘ λλ₯Ό μ΄λμμ΅λλ€.
λλ μ’μν μ§λ λͺ¨λ₯Έλ€.
-


AI μ°μ μ μμ μ°μ μ μλ―Έν©λλ€.
-


λ€μ€ μμ΄μ νΈ μ λ ¬: AI μμ μ μλ‘μ΄ μ§ν
-


λ μ μμ€: λ ν° AI λͺ¨λΈμ΄ ν΄νΉνκΈ° λ μ¬μ΄ μ΄μ
-


MoE νλͺ : κ³ κΈ λΌμ°ν λ° μ λ¬Ένκ° LLMμ μ΄λ»κ² λ³νμν€κ³ μλκ°
-


μ€μΌμΌλ§ μλμ μ’ λ§: λͺ¨λΈ ν¬κΈ°λ³΄λ€ μκ³ λ¦¬μ¦ νμ μ΄ λ μ€μν μ΄μ
-


ν΅μ μ νμ: μμ΄μ νΈ AIκ° AI μ λ ¬μ λν μ λ©΄μ μ¬κ³ λ₯Ό κ°μνλ μ΄μ

