Artificial Intelligence
рдЕрдм рддрдХ рдХрд╛ рд╕рдмрд╕реЗ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рдУрдкрди рд╕реЛрд░реНрд╕ LLM: рдореЗрдЯрд╛ LLAMA 3.1-405B

By
рдЖрдпреБрд╖ рдорд┐рддреНрддрд▓ рдорд┐рддреНрддрд▓
рд▓рд╛рдорд╛ 3.1-405BрдореЗрдЯрд╛ рдПрдЖрдИ рджреНрд╡рд╛рд░рд╛ рд╡рд┐рдХрд╕рд┐рдд, рдУрдкрди-рд╕реЛрд░реНрд╕ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рдореЗрдВ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЫрд▓рд╛рдВрдЧ рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рддрд╛ рд╣реИред 405 рдмрд┐рд▓рд┐рдпрди рдорд╛рдкрджрдВрдбреЛрдВ рдХреЗ рд╕рд╛рде, рдпрд╣ рдЖрдЬ рддрдХ рдХрд╛ рд╕рдмрд╕реЗ рдмрдбрд╝рд╛ рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рд░реВрдк рд╕реЗ рдЙрдкрд▓рдмреНрдз рднрд╛рд╖рд╛ рдореЙрдбрд▓ рд╣реИ, рдЬреЛ рд╡рд┐рднрд┐рдиреНрди рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдореЗрдВ рдХреБрдЫ рд╕рдмрд╕реЗ рдЙрдиреНрдирдд рдорд╛рд▓рд┐рдХрд╛рдирд╛ рдореЙрдбрд▓реЛрдВ рдХреЛ рдЯрдХреНрдХрд░ рджреЗрддрд╛ рд╣реИ рдФрд░ рдпрд╣рд╛рдВ рддрдХ тАЛтАЛрдХрд┐ рдЙрдирд╕реЗ рдЖрдЧреЗ рдирд┐рдХрд▓ рдЬрд╛рддрд╛ рд╣реИред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ:
- 405 рдмрд┐рд▓рд┐рдпрди рдкреИрд░рд╛рдореАрдЯрд░
- 128K рдЯреЛрдХрди рд╕рдВрджрд░реНрдн рд▓рдВрдмрд╛рдИ
- рдмрд╣реБрднрд╛рд╖реА рд╕рдорд░реНрдерди (8 рднрд╛рд╖рд╛рдПрдВ)
- рдЕрдиреБрджреЗрд╢-рдЯреНрдпреВрдиреНрдб рд╕рдВрд╕реНрдХрд░рдг рдЙрдкрд▓рдмреНрдз рд╣реИ
- рдУрдкрди-рд╕реЛрд░реНрд╕ рдЕрдиреБрдореЗрдп рд▓рд╛рдЗрд╕реЗрдВрд╕ рдХреЗ рд╕рд╛рде
рдУрдкрди-рд╕реЛрд░реНрд╕ рдбреЛрдореЗрди рдореЗрдВ рдЗрд╕ рддрд░рд╣ рдХреЗ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рдореЙрдбрд▓ рдХрд╛ рдЬрд╛рд░реА рд╣реЛрдирд╛ рдПрдХ рдЧреЗрдо-рдЪреЗрдВрдЬрд░ рд╣реИ, рдЬреЛ рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдПрдЖрдИ рдХреНрд╖рдорддрд╛рдУрдВ рддрдХ рдкрд╣реБрдВрдЪ рдХреЛ рд▓реЛрдХрддрд╛рдВрддреНрд░рд┐рдХ рдмрдирд╛рддрд╛ рд╣реИ рдФрд░ рдкреВрд░реЗ рдЙрджреНрдпреЛрдЧ рдореЗрдВ рдирд╡рд╛рдЪрд╛рд░ рдХреЛ рдмрдврд╝рд╛рд╡рд╛ рджреЗрддрд╛ рд╣реИред
рдореЙрдбрд▓ рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдФрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг
рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдЗрдирдкреБрдЯ рдЯреЗрдХреНрд╕реНрдЯ рдЯреЛрдХрди рдХреЛ рдЯреЛрдХрди рдПрдореНрдмреЗрдбрд┐рдВрдЧ рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрд┐рдд рдХрд░рдиреЗ рд╕реЗ рд╢реБрд░реВ рд╣реЛрддреА рд╣реИред рдпреЗ рдПрдореНрдмреЗрдбрд┐рдВрдЧ рд╕реНрд╡-рдзреНрдпрд╛рди рдФрд░ рдлреАрдбрдлреЙрд░рд╡рд░реНрдб рдиреЗрдЯрд╡рд░реНрдХ рдХреА рдХрдИ рдкрд░рддреЛрдВ рд╕реЗ рд╣реЛрдХрд░ рдЧреБрдЬрд░рддреА рд╣реИрдВ, рдЬрд┐рд╕рд╕реЗ рдореЙрдбрд▓ рдХреЛ рдЯреЗрдХреНрд╕реНрдЯ рдХреЗ рднреАрддрд░ рдЬрдЯрд┐рд▓ рд╕рдВрдмрдВрдзреЛрдВ рдФрд░ рдирд┐рд░реНрднрд░рддрд╛рдУрдВ рдХреЛ рдкрдХрдбрд╝рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рдорд┐рд▓рддреА рд╣реИред рдСрдЯреЛрд░рд┐рдЧреНрд░реИрд╕рд┐рд╡ рдбрд┐рдХреЛрдбрд┐рдВрдЧ рддрдВрддреНрд░ рддрдм рдЖрдЙрдЯрдкреБрдЯ рдЯреЗрдХреНрд╕реНрдЯ рдЯреЛрдХрди рдЙрддреНрдкрдиреНрди рдХрд░рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдкреВрд░реА рд╣реЛрддреА рд╣реИред

-
рд╕рдореВрд╣реАрдХреГрдд рдХреНрд╡реЗрд░реА рдзреНрдпрд╛рди (рдЬреАрдХреНрдпреВрдП)
рд▓рд╛рдорд╛ 3.1 рд╕рдореВрд╣реАрдХреГрдд рдХреНрд╡реЗрд░реА рдЕрдЯреЗрдВрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ, рдЬреЛ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдиреБрдХреВрд▓рди рддрдХрдиреАрдХ рд╣реИ рдЬрд┐рд╕реЗ рдкрд┐рдЫрд▓реЗ рдЙрддреНрддрд░ рдореЗрдВ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдХрд╡рд░ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдЖрдЗрдП рдЗрд╕реЗ рдФрд░ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рджреЗрдЦреЗрдВ:
рд╕рдореВрд╣реАрдХреГрдд рдХреНрд╡реЗрд░реА рдЕрдЯреЗрдВрд╢рди (GQA) рдорд▓реНрдЯреА-рд╣реЗрдб рдЕрдЯреЗрдВрд╢рди рдХрд╛ рдПрдХ рдкреНрд░рдХрд╛рд░ рд╣реИ рдЬрд┐рд╕рдХрд╛ рдЙрджреНрджреЗрд╢реНрдп рдЕрдиреБрдорд╛рди рдХреЗ рджреМрд░рд╛рди рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рд▓рд╛рдЧрдд рдФрд░ рдореЗрдореЛрд░реА рдЙрдкрдпреЛрдЧ рдХреЛ рдХрдо рдХрд░рдирд╛ рд╣реИ, рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рд▓рдВрдмреЗ рдЕрдиреБрдХреНрд░рдореЛрдВ рдХреЗ рд▓рд┐рдПред рд▓рд╛рдорд╛ 3.1 405B рдореЙрдбрд▓ рдореЗрдВ, GQA рдХреЛ 8 рдХреБрдВрдЬреА-рдореВрд▓реНрдп рд╣реЗрдб рдХреЗ рд╕рд╛рде рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред
GQA рдЗрд╕ рдкреНрд░рдХрд╛рд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ:
- рдкреНрд░рддреНрдпреЗрдХ рдзреНрдпрд╛рди рд╢реАрд░реНрд╖ рдХреЗ рд▓рд┐рдП рдЕрд▓рдЧ-рдЕрд▓рдЧ рдХреБрдВрдЬреА рдФрд░ рдорд╛рди рдкреНрд░рдХреНрд╖реЗрдкрдг рд░рдЦрдиреЗ рдХреЗ рдмрдЬрд╛рдп, GQA рдПрдХрд╛рдзрд┐рдХ рдХреНрд╡реЗрд░реА рд╢реАрд░реНрд╖реЛрдВ рдХреЛ рдПрдХ рд╣реА рдХреБрдВрдЬреА рдФрд░ рдорд╛рди рд╢реАрд░реНрд╖реЛрдВ рдХреЛ рд╕рд╛рдЭрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдореВрд╣рд┐рдд рдХрд░рддрд╛ рд╣реИред
- рдпрд╣ рд╕рдореВрд╣реАрдХрд░рдг рдХреБрдВрдЬреА рдФрд░ рдореВрд▓реНрдп рдЕрдиреБрдорд╛рдиреЛрдВ рдореЗрдВ рдорд╛рдкрджрдВрдбреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреЛ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд░реВрдк рд╕реЗ рдХрдо рдХрд░ рджреЗрддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдореЙрдбрд▓ рдХрд╛ рдЖрдХрд╛рд░ рдЫреЛрдЯрд╛ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рдЕрдиреБрдорд╛рди рддреЗрдЬреА рд╕реЗ рд▓рдЧрддрд╛ рд╣реИред
- рдзреНрдпрд╛рди рдЧрдгрдирд╛ рдХреЛ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╡реНрдпрдХреНрдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ:
Attention(Q, K, V) = softmax(QK^T / sqrt(d_k))V
рдЬрд╣рд╛рдБ Q рдХреЛ g рд╕рдореВрд╣реЛрдВ рдореЗрдВ рдмрд╛рдВрдЯрд╛ рдЧрдпрд╛ рд╣реИ, рддрдерд╛ K рдФрд░ V рдХреЗ рд╕рд┐рд░ Q рд╕реЗ рдХрдо рд╣реИрдВред
рд▓рд╛рдорд╛ 3.1 405B рдореЗрдВ GQA рдХреЗ рд▓рд╛рднреЛрдВ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:
- рдореЗрдореЛрд░реА рдлрд╝реБрдЯрдкреНрд░рд┐рдВрдЯ рдореЗрдВ рдХрдореАрдХрдо рдХреБрдВрдЬреА рдФрд░ рдорд╛рди рдкреНрд░рдХреНрд╖реЗрдкрдг рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ рдореЙрдбрд▓ рдкреИрд░рд╛рдореАрдЯрд░реЛрдВ рдХреЛ рд╕рдВрдЧреНрд░рд╣реАрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрдо рдореЗрдореЛрд░реА рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИред
- рддреЗрдЬрд╝ рдЕрдиреБрдорд╛рдирдХреБрдВрдЬреА рдФрд░ рдореВрд▓реНрдп рдЕрдиреБрдорд╛рдиреЛрдВ рдХреЗ рд▓рд┐рдП рдХрдо рдЧрдгрдирд╛рдУрдВ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдХреЗ рд╕рд╛рде, рдЕрдиреБрдорд╛рди рдХреА рдЧрддрд┐ рдореЗрдВ рд╕реБрдзрд╛рд░ рд╣реЛрддрд╛ рд╣реИред
- рдкреНрд░рджрд░реНрд╢рди рдмрдирд╛рдП рд░рдЦрд╛рдорд╛рдкрджрдВрдбреЛрдВ рдореЗрдВ рдХрдореА рдХреЗ рдмрд╛рд╡рдЬреВрдж, GQA рдХреЛ рдХрдИ рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рдорд╛рдирдХ рдорд▓реНрдЯреА-рд╣реЗрдб рдЕрдЯреЗрдВрд╢рди рдХреЗ рдмрд░рд╛рдмрд░ рдкреНрд░рджрд░реНрд╢рди рдмрдирд╛рдП рд░рдЦрдиреЗ рдХреЗ рд▓рд┐рдП рджрд┐рдЦрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИред
-
рд╡рд┐рд╕реНрддрд╛рд░рд┐рдд рд╕рдВрджрд░реНрдн рдХреЗ рд▓рд┐рдП рджреЛ-рдЪрд░рдгреАрдп рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рдг
рд▓реЗрдЦ рдореЗрдВ 128K рдЯреЛрдХрди рд╕рдВрджрд░реНрдн рд╡рд┐рдВрдбреЛ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рджреЛ-рдЪрд░рдгреАрдп рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдпрд╣ Llama 3.1 405B рдХреА рдХреНрд╖рдорддрд╛рдУрдВ рдХрд╛ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдкрд╣рд▓реВ рд╣реИ:
рдЪрд░рдг 1: 8K рдЯреЛрдХрди рдкрд░ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рдг
- рдореЙрдбрд▓ рдХреЛ рдкрд╣рд▓реЗ 8K рдЯреЛрдХрди рддрдХ рдХреЗ рдЕрдиреБрдХреНрд░рдореЛрдВ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдпрд╣ рдЪрд░рдг рдореЙрдбрд▓ рдХреЛ рд╕рд╛рдорд╛рдиреНрдп рднрд╛рд╖рд╛ рд╕рдордЭ рдФрд░ рдирд┐рд░реНрдорд╛рдг рдХреНрд╖рдорддрд╛рдУрдВ рдХреЛ рд╕реАрдЦрдиреЗ рдХрд╛ рдЕрд╡рд╕рд░ рджреЗрддрд╛ рд╣реИред
рдЪрд░рдг 2: рд╕рдВрджрд░реНрдн рд╡рд┐рд╕реНрддрд╛рд░ рдХреЗ рд▓рд┐рдП рдирд┐рд░рдВрддрд░ рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рдг
- рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рдмрд╛рдж, рдореЙрдбрд▓ рдХреЛ рд╕рдВрджрд░реНрдн рд▓рдВрдмрд╛рдИ рдХреЛ 128K рдЯреЛрдХрди рддрдХ рдмрдврд╝рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдирд┐рд░рдВрддрд░ рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕реЗ рдЧреБрдЬрд░рдирд╛ рдкрдбрд╝рддрд╛ рд╣реИред
- рдЗрд╕ рдЪрд░рдг рдореЗрдВ рд╕рд╛рд╡рдзрд╛рдиреАрдкреВрд░реНрд╡рдХ рдбрд┐рдЬрд╛рдЗрди рдХрд┐рдП рдЧрдП рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХрд╛рд░реНрдпрдХреНрд░рдо рд╢рд╛рдорд┐рд▓ рд╣реЛрддреЗ рд╣реИрдВ, рддрд╛рдХрд┐ рдореЙрдбрд▓ рдХреЛ рдЫреЛрдЯреЗ рд╕рдВрджрд░реНрднреЛрдВ рдХреЛ рд╕рдВрднрд╛рд▓рдиреЗ рдХреА рдЕрдкрдиреА рдХреНрд╖рдорддрд╛ рдЦреЛрдП рдмрд┐рдирд╛ рд▓рдВрдмреЗ рдЕрдиреБрдХреНрд░рдореЛрдВ рдХреЛ рд╕рд╛рдорд╛рдиреНрдп рдмрдирд╛рдиреЗ рдореЗрдВ рдорджрдж рдорд┐рд▓ рд╕рдХреЗред
-
рдорд▓реНрдЯреАрдореЙрдбрд▓ рдХреНрд╖рдорддрд╛рдПрдБ
рдЬрдмрдХрд┐ рдкрд┐рдЫрд▓реА рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рдореЗрдВ рдорд▓реНрдЯреАрдореЙрдбрд▓ рдХреНрд╖рдорддрд╛рдУрдВ рдкрд░ рдЪрд░реНрдЪрд╛ рдХреА рдЧрдИ рдереА, рд╣рдо рдЗрд╕ рдкрд░ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рдмрддрд╛ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рд▓рд╛рдорд╛ 3.1 405B рдЗрд╕реЗ рдХреИрд╕реЗ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рд┐рдд рдХрд░рддрд╛ рд╣реИ:
рд░рдЪрдирд╛ рд╕рдВрдмрдВрдзреА рджреГрд╖реНрдЯрд┐рдХреЛрдг:
- рд▓рд╛рдорд╛ 3.1 405B рд╡рд┐рднрд┐рдиреНрди рддреМрд░-рддрд░реАрдХреЛрдВ (рдЬреИрд╕реЗ, рдЪрд┐рддреНрд░, рднрд╛рд╖рдг) рдХреЗ рд▓рд┐рдП рдЕрд▓рдЧ-рдЕрд▓рдЧ рдПрдирдХреЛрдбрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред
- рдпреЗ рдПрдирдХреЛрдбрд░ рд╡рд┐рднрд┐рдиреНрди рдореЛрдбреИрд▓рд┐рдЯреА рд╕реЗ рдкреНрд░рд╛рдкреНрдд рдЗрдирдкреБрдЯ рдХреЛ рдПрдХ рд╕рд╛рдЭрд╛ рдПрдореНрдмреЗрдбрд┐рдВрдЧ рд╕реНрдкреЗрд╕ рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрд┐рдд рдХрд░ рджреЗрддреЗ рд╣реИрдВ, рдЬрд┐рд╕реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рд╕рдордЭ рд╕рдХрддрд╛ рд╣реИред
рднрд╛рд╖рд╛ рдореЙрдбрд▓ рдХреЗ рд╕рд╛рде рдПрдХреАрдХрд░рдг:
- рдЗрди рд╡рд┐рд╢реЗрд╖реАрдХреГрдд рдПрдирдХреЛрдбрд░реНрд╕ рд╕реЗ рдкреНрд░рд╛рдкреНрдд рдЖрдЙрдЯрдкреБрдЯ рдХреЛ рдлрд┐рд░ рдореБрдЦреНрдп рднрд╛рд╖рд╛ рдореЙрдбрд▓ рдореЗрдВ рдлреАрдб рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдЗрд╕рд╕реЗ рд▓рд╛рдорд╛ 3.1 405B рдХреЛ рд╡рд┐рднрд┐рдиреНрди рдкреНрд░рдХрд╛рд░ рдХреЗ рдбреЗрдЯрд╛ рдХреЛ рдПрдХ рд╕рд╛рде рд╕рдВрд╕рд╛рдзрд┐рдд рдХрд░рдиреЗ рдФрд░ рд╕рдордЭрдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рдорд┐рд▓рддреА рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдпрд╣ рдХрдИ рддреМрд░-рддрд░реАрдХреЛрдВ рд╕реЗ рдЬреБрдбрд╝реЗ рдХрд╛рд░реНрдп рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рд╣реЛ рдЬрд╛рддрд╛ рд╣реИред
рдХреНрд░реЙрд╕-рдЕрдЯреЗрдВрд╢рди рдореИрдХреЗрдирд┐рдЬреНрдо:
- рд╡рд┐рднрд┐рдиреНрди рддреМрд░-рддрд░реАрдХреЛрдВ рдХреЗ рдПрдХреАрдХрд░рдг рдХреЛ рд╕рдВрднрд╛рд▓рдиреЗ рдХреЗ рд▓рд┐рдП, рд▓рд╛рдорд╛ 3.1 405рдмреА рд╕рдВрднрд╡рддрдГ рдХреНрд░реЙрд╕-рдЕрдЯреЗрдВрд╢рди рддрдВрддреНрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред
- рдпреЗ рддрдВрддреНрд░ рдореЙрдбрд▓ рдХреЛ рдкрд╛рда рддреИрдпрд╛рд░ рдХрд░рддреЗ рд╕рдордп рдпрд╛ рдЕрдиреНрдп рдХрд╛рд░реНрдп рдХрд░рддреЗ рд╕рдордп рд╡рд┐рднрд┐рдиреНрди рддреМрд░-рддрд░реАрдХреЛрдВ рд╕реЗ рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рдЬрд╛рдирдХрд╛рд░реА рдкрд░ рдзреНрдпрд╛рди рджреЗрдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддреЗ рд╣реИрдВред
рд▓рд╛рдорд╛ 3.1 405B рдХреА рдмрд╣реБрд╡рд┐рдз рдХреНрд╖рдорддрд╛рдПрдВ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреА рдПрдХ рд╡рд┐рд╕реНрддреГрдд рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХреЗ рджреНрд╡рд╛рд░ рдЦреЛрд▓рддреА рд╣реИрдВ, рдЬреИрд╕реЗ:
- рдЫрд╡рд┐ рдХреИрдкреНрд╢рдирд┐рдВрдЧ рдФрд░ рджреГрд╢реНрдп рдкреНрд░рд╢реНрди рдЙрддреНрддрд░
- рд╕рдВрджрд░реНрднрдЧрдд рд╕рдордЭ рдХреЗ рд╕рд╛рде рднрд╛рд╖рдг-рд╕реЗ-рдкрд╛рда рдкреНрд░рддрд┐рд▓реЗрдЦрди
- рдкрд╛рда, рдЪрд┐рддреНрд░ рдФрд░ рд╕рдВрднрд╛рд╡рд┐рдд рд░реВрдк рд╕реЗ рдЕрдиреНрдп рдбреЗрдЯрд╛ рдкреНрд░рдХрд╛рд░реЛрдВ рдХреЛ рд╕рдВрдпреЛрдЬрд┐рдд рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдмрд╣реБ-рдореЛрдбрд▓ рддрд░реНрдХ рдХрд╛рд░реНрдп
рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╡рд┐рд╡рд░рдг
- 1000 рд╕реЗ рдЕрдзрд┐рдХ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд 15 рдЦрд░рдм рдЯреЛрдХрди
- рдХрд╕реНрдЯрдо-рдирд┐рд░реНрдорд┐рдд GPU рдХреНрд▓рд╕реНрдЯрд░ 39.3M GPU рдШрдВрдЯреЗ 405B рдореЙрдбрд▓ рдХреЗ рд▓рд┐рдП
- рдмрд╣реБрднрд╛рд╖реА рдХреНрд╖рдорддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП рд╡рд┐рд╡рд┐рдз рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреНрдпреВрд░реЗрд╢рди
рдирд┐рд░реНрджреЗрд╢-рд╕рдВрдпреЛрдЬрд┐рдд рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдЕрддрд┐рд░рд┐рдХреНрдд рдкреНрд░рд╢рд┐рдХреНрд╖рдг рджрд┐рдпрд╛ рдЧрдпрд╛:
- рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рд░реВрдк рд╕реЗ рдЙрдкрд▓рдмреНрдз рдЕрдиреБрджреЗрд╢ рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рдмрд╛рд░реАрдХрд╝реА рд╕реЗ рдХрд╛рдо рдХрд┐рдпрд╛ рдЧрдпрд╛
- рдХреЗ рдКрдкрд░ 25M рдХреГрддреНрд░рд┐рдо рд░реВрдк рд╕реЗ рдЙрддреНрдкрдиреНрди рдЙрджрд╛рд╣рд░рдг
- рд╕реБрдкрд░рд╡рд╛рдЗрдЬреНрдб рдлрд╛рдЗрди-рдЯреНрдпреВрдирд┐рдВрдЧ (рдПрд╕рдПрдлрдЯреА) рдФрд░ рдорд╛рдирд╡ рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рдХреЗ рд╕рд╛рде рд╕реБрджреГрдвреАрдХрд░рдг рд╕реАрдЦрдирд╛ (рдЖрд░рдПрд▓рдПрдЪрдПрдл)
рдкреНрд░рджрд░реНрд╢рди рдмреЗрдВрдЪрдорд╛рд░реНрдХ
рддрд╛рд▓рд┐рдХрд╛ рдореЗрдВ рд▓рд╛рдорд╛ 3.1 405B, рдиреЗрдореЛрдЯреНрд░реЙрди 4 340B рдЗрдВрд╕реНрдЯреНрд░рдХреНрдЯ, GPT-4 (0125), GPT-4 рдУрдордиреА рдФрд░ рдХреНрд▓рд╛рдЙрдб 3.5 рд╕реЙрдиреЗрдЯ рдХреА рддреБрд▓рдирд╛ рдХреА рдЧрдИ рд╣реИред рдкреНрд░рдореБрдЦ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдореЗрдВ MMLU рдФрд░ IFEval рдЬреИрд╕реЗ рд╕рд╛рдорд╛рдиреНрдп рдХрд╛рд░реНрдп, HumanEval рдФрд░ GSM8K рдЬреИрд╕реЗ рдХреЛрдб рдХрд╛рд░реНрдп, рдФрд░ ARC рдЪреИрд▓реЗрдВрдЬ рдЬреИрд╕реЗ рддрд░реНрдХ рдХрд╛рд░реНрдп рд╢рд╛рдорд┐рд▓ рд╣реИрдВред рдкреНрд░рддреНрдпреЗрдХ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рд╕реНрдХреЛрд░ рдорд╛рдирд╡-рд╕рджреГрд╢ рдкрд╛рда рдХреЛ рд╕рдордЭрдиреЗ рдФрд░ рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ, рдЬрдЯрд┐рд▓ рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдФрд░ рдХреЛрдб рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдореЙрдбрд▓ рдХреА рдХреНрд╖рдорддрд╛ рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред рдЙрд▓реНрд▓реЗрдЦрдиреАрдп рд░реВрдк рд╕реЗ, рд▓рд╛рдорд╛ 3.1 405B рдФрд░ рдХреНрд▓рд╛рдЙрдб 3.5 рд╕реЙрдиреЗрдЯ рдХрдИ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдореЗрдВ рдЙрддреНрдХреГрд╖реНрдЯ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддреЗ рд╣реИрдВ, рдЬреЛ рд╕рд╛рдорд╛рдиреНрдп рдФрд░ рдбреЛрдореЗрди-рд╡рд┐рд╢рд┐рд╖реНрдЯ, рджреЛрдиреЛрдВ рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рдЙрдирдХреА рдЙрдиреНрдирдд рдХреНрд╖рдорддрд╛рдУрдВ рдХреЛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддреЗ рд╣реИрдВред
рд▓рд╛рдорд╛ 3.1-405B рдХреЗ рд▓рд┐рдП рдореЗрдореЛрд░реА рдЖрд╡рд╢реНрдпрдХрддрд╛рдПрдБ
рд▓рд╛рдорд╛ 3.1-405B рдХреЛ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд░реНрдпрд╛рдкреНрдд рдореЗрдореЛрд░реА рдФрд░ рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ:
- рдЬреАрдкреАрдпреВ рдореЗрдореЛрд░реА: 405B рдореЙрдбрд▓ рдХреБрд╢рд▓ рдЕрдиреБрдорд╛рди рдХреЗ рд▓рд┐рдП рдкреНрд░рддрд┐ A80 GPU 100GB рддрдХ GPU рдореЗрдореЛрд░реА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реИред рдЯреЗрдВрд╕рд░ рдкреИрд░реЗрд▓рд▓рд┐рдЬреНрдо рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд▓реЛрдб рдХреЛ рдХрдИ GPU рдореЗрдВ рд╡рд┐рддрд░рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
- рд░реИрдордореЙрдбрд▓ рдХреЗ рдореЗрдореЛрд░реА рдлреБрдЯрдкреНрд░рд┐рдВрдЯ рдХреЛ рд╕рдВрднрд╛рд▓рдиреЗ рдФрд░ рд╕реБрдЪрд╛рд░реВ рдбреЗрдЯрд╛ рдкреНрд░реЛрд╕реЗрд╕рд┐рдВрдЧ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдиреНрдпреВрдирддрдо 512GB рд╕рд┐рд╕реНрдЯрдо RAM рдХреА рдЕрдиреБрд╢рдВрд╕рд╛ рдХреА рдЬрд╛рддреА рд╣реИред
- рднрдВрдбрд╛рд░рдг: рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рдЖрдкрдХреЗ рдкрд╛рд╕ рдореЙрдбрд▓ рд╡рдЬрд╝рди рдФрд░ рд╕рдВрдмрдВрдзрд┐рдд рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЗ рд▓рд┐рдП рдХрдИ рдЯреЗрд░рд╛рдмрд╛рдЗрдЯреНрд╕ рдХрд╛ SSD рд╕реНрдЯреЛрд░реЗрдЬ рд╣реИред рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдФрд░ рдЕрдиреБрдорд╛рди рдХреЗ рджреМрд░рд╛рди рдбреЗрдЯрд╛ рдПрдХреНрд╕реЗрд╕ рд╕рдордп рдХреЛ рдХрдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╣рд╛рдИ-рд╕реНрдкреАрдб SSD рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИрдВ (рд▓рд╛рдорд╛ рдР рдореЙрдбрд▓)├в тВм <├в тВм < (рдЧреНрд░реЛрдХ)ред
рд▓рд╛рдорд╛ 3.1-405B рдХреЗ рд▓рд┐рдП рдЕрдиреБрдорд╛рди рдЕрдиреБрдХреВрд▓рди рддрдХрдиреАрдХреЗрдВ
рд▓рд╛рдорд╛ 405 рдЬреИрд╕реЗ 3.1B рдкреИрд░рд╛рдореАрдЯрд░ рдореЙрдбрд▓ рдХреЛ рдХреБрд╢рд▓рддрд╛рдкреВрд░реНрд╡рдХ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдХрдИ рдЕрдиреБрдХреВрд▓рди рддрдХрдиреАрдХреЛрдВ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИред рдкреНрд░рднрд╛рд╡реА рдЕрдиреБрдорд╛рди рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдпрд╣рд╛рдБ рдореБрдЦреНрдп рд╡рд┐рдзрд┐рдпрд╛рдБ рджреА рдЧрдИ рд╣реИрдВ:
рдХ) рдкрд░рд┐рдорд╛рдгреАрдХрд░рдг: рдХреНрд╡рд╛рдВрдЯрд╛рдЗрдЬрд╝реЗрд╢рди рдореЗрдВ рдореЙрдбрд▓ рдХреЗ рднрд╛рд░ рдХреА рдкрд░рд┐рд╢реБрджреНрдзрддрд╛ рдХреЛ рдХрдо рдХрд░рдирд╛ рд╢рд╛рдорд┐рд▓ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдореЗрдореЛрд░реА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрдо рд╣реЛрддрд╛ рд╣реИ рдФрд░ рд╕рдЯреАрдХрддрд╛ рд╕реЗ рдХреЛрдИ рдЦрд╛рд╕ рд╕рдордЭреМрддрд╛ рдХрд┐рдП рдмрд┐рдирд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдиреЗ рдХреА рдЧрддрд┐ рдореЗрдВ рд╕реБрдзрд╛рд░ рд╣реЛрддрд╛ рд╣реИред рд▓рд╛рдорд╛ 3.1, GPU рдкрд░ рдкреНрд░рджрд░реНрд╢рди рдХреЛ рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП QLoRA (рдХреНрд╡рд╛рдВрдЯрд╛рдЗрдЬреНрдб рд▓реЛ-рд░реИрдВрдХ рдЕрдбреЗрдкреНрдЯреЗрд╢рди) рдЬреИрд╕реА рддрдХрдиреАрдХреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ FP8 рдпрд╛ рдЙрд╕рд╕реЗ рднреА рдХрдо рдкрд░рд┐рд╢реБрджреНрдзрддрд╛ рддрдХ рдХреНрд╡рд╛рдВрдЯрд╛рдЗрдЬрд╝реЗрд╢рди рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг рдХреЛрдб:
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig model_name = "meta-llama/Meta-Llama-3.1-405B" bnb_config = BitsAndBytesConfig( load_in_8bit=True, # Change to load_in_4bit for 4-bit precision bnb_8bit_quant_type="fp8", bnb_8bit_compute_dtype=torch.float16, ) model = AutoModelForCausalLM.from_pretrained( model_name, quantization_config=bnb_config, device_map="auto" ) tokenizer = AutoTokenizer.from_pretrained(model_name)
рдмреА) рдЯреЗрдВрд╕рд░ рд╕рдорд╛рдирд╛рдВрддрд░рд╡рд╛рдж: рдЯреЗрдВрд╕рд░ рд╕рдорд╛рдВрддрд░рддрд╛ рдореЗрдВ рдЧрдгрдирд╛рдУрдВ рдХреЛ рд╕рдорд╛рдВрддрд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдореЙрдбрд▓ рдХреА рдкрд░рддреЛрдВ рдХреЛ рдХрдИ GPU рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рдирд╛ рд╢рд╛рдорд┐рд▓ рд╣реИред рдпрд╣ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рд▓рд╛рдорд╛ 3.1 рдЬреИрд╕реЗ рдмрдбрд╝реЗ рдореЙрдбрд▓реЛрдВ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧреА рд╣реИ, рдЬрд┐рд╕рд╕реЗ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХрд╛ рдХреБрд╢рд▓ рдЙрдкрдпреЛрдЧ рд╕рдВрднрд╡ рд╣реЛрддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг рдХреЛрдб:
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline model_name = "meta-llama/Meta-Llama-3.1-405B" model = AutoModelForCausalLM.from_pretrained( model_name, device_map="auto", torch_dtype=torch.float16 ) tokenizer = AutoTokenizer.from_pretrained(model_name) nlp = pipeline("text-generation", model=model, tokenizer=tokenizer, device=0)
рдЧ) рдХреЗрд╡реА-рдХреИрд╢ рдЕрдиреБрдХреВрд▓рди: рд▓рдВрдмреЗ рд╕рдВрджрд░реНрднреЛрдВ рдХреЛ рд╕рдВрднрд╛рд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдХреБрдВрдЬреА-рдореВрд▓реНрдп (KV) рдХреИрд╢ рдХрд╛ рдХреБрд╢рд▓ рдкреНрд░рдмрдВрдзрди рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИред рд▓рд╛рдорд╛ 3.1 рд╡рд┐рд╕реНрддрд╛рд░рд┐рдд рд╕рдВрджрд░реНрдн рд▓рдВрдмрд╛рдИ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИ, рдЬрд┐рд╕реЗ рдЕрдиреБрдХреВрд▓рд┐рдд KV-рдХреИрд╢ рддрдХрдиреАрдХреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдХреБрд╢рд▓рддрд╛рдкреВрд░реНрд╡рдХ рдкреНрд░рдмрдВрдзрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдЙрджрд╛рд╣рд░рдг рдХреЛрдб:
# Ensure you have sufficient GPU memory to handle extended context lengths output = model.generate( input_ids, max_length=4096, # Increase based on your context length requirement use_cache=True )
рдкрд░рд┐рдирд┐рдпреЛрдЬрди рд░рдгрдиреАрддрд┐рдпрд╛рдБ
Llama 3.1-405B рдХреЛ рддреИрдирд╛рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╣рд╛рд░реНрдбрд╡реЗрдпрд░ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдкрд░ рд╕рд╛рд╡рдзрд╛рдиреАрдкреВрд░реНрд╡рдХ рд╡рд┐рдЪрд╛рд░ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИред рдпрд╣рд╛рдБ рдХреБрдЫ рд╡рд┐рдХрд▓реНрдк рджрд┐рдП рдЧрдП рд╣реИрдВ:
рдХ) рдХреНрд▓рд╛рдЙрдб-рдЖрдзрд╛рд░рд┐рдд рдкрд░рд┐рдирд┐рдпреЛрдЬрди: AWS (P4d рдЗрдВрд╕реНрдЯреЗрдВрд╕) рдпрд╛ Google Cloud (TPU v4) рдЬреИрд╕реЗ рдХреНрд▓рд╛рдЙрдб рдкреНрд░рджрд╛рддрд╛рдУрдВ рд╕реЗ рдЙрдЪреНрдЪ-рдореЗрдореЛрд░реА GPU рдЗрдВрд╕реНрдЯреЗрдВрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВред
рдЙрджрд╛рд╣рд░рдг рдХреЛрдб:
# Example setup for AWS import boto3 ec2 = boto3.resource('ec2') instance = ec2.create_instances( ImageId='ami-0c55b159cbfafe1f0', # Deep Learning AMI InstanceType='p4d.24xlarge', MinCount=1, MaxCount=1 )
рдЦ) рдСрди-рдкреНрд░рд┐рдорд╛рдЗрд╕реЗрд╕ рдкрд░рд┐рдирд┐рдпреЛрдЬрди: рдЙрдЪреНрдЪ-рдкреНрд░рджрд░реНрд╢рди рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдХреНрд╖рдорддрд╛рдУрдВ рд╡рд╛рд▓реЗ рд╕рдВрдЧрдардиреЛрдВ рдХреЗ рд▓рд┐рдП, рд▓рд╛рдорд╛ 3.1 рдХреЛ рдСрди-рдкреНрд░рд┐рдорд╛рдЗрд╕реЗрд╕ рдкрд░ рддреИрдирд╛рдд рдХрд░рдиреЗ рд╕реЗ рдЕрдзрд┐рдХ рдирд┐рдпрдВрддреНрд░рдг рдФрд░ рд╕рдВрднрд╛рд╡рд┐рдд рд░реВрдк рд╕реЗ рдХрдо рджреАрд░реНрдШрдХрд╛рд▓рд┐рдХ рд▓рд╛рдЧрдд рдорд┐рд▓рддреА рд╣реИред
рдЙрджрд╛рд╣рд░рдг рд╕реЗрдЯрдЕрдк:
# Example setup for on-premises deployment # Ensure you have multiple high-performance GPUs, like NVIDIA A100 or H100 pip install transformers pip install torch # Ensure CUDA is enabled
рдЧ) рд╡рд┐рддрд░рд┐рдд рдЕрдиреБрдорд╛рди: рдмрдбрд╝реЗ рдкрд░рд┐рдирд┐рдпреЛрдЬрди рдХреЗ рд▓рд┐рдП, рдореЙрдбрд▓ рдХреЛ рдПрдХрд╛рдзрд┐рдХ рдиреЛрдбреНрд╕ рдореЗрдВ рд╡рд┐рддрд░рд┐рдд рдХрд░рдиреЗ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВред
рдЙрджрд╛рд╣рд░рдг рдХреЛрдб:
# Using Hugging Face's accelerate library from accelerate import Accelerator accelerator = Accelerator() model, tokenizer = accelerator.prepare(model, tokenizer)
рдХреЗрд╕ рдФрд░ рдПрдкреНрд▓рд┐рдХреЗрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВ
рд▓рд╛рдорд╛ 3.1-405B рдХреА рд╢рдХреНрддрд┐ рдФрд░ рд▓рдЪреАрд▓рд╛рдкрди рдХрдИ рд╕рдВрднрд╛рд╡рдирд╛рдУрдВ рдХреЛ рдЦреЛрд▓рддрд╛ рд╣реИ:
рдХ) рд╕рд┐рдВрдереЗрдЯрд┐рдХ рдбреЗрдЯрд╛ рдЬрдирд░реЗрд╢рди: рдЫреЛрдЯреЗ рдореЙрдбрд▓реЛрдВ рдХреЗ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рдЙрдЪреНрдЪ рдЧреБрдгрд╡рддреНрддрд╛ рд╡рд╛рд▓рд╛, рдбреЛрдореЗрди-рд╡рд┐рд╢рд┐рд╖реНрдЯ рдбреЗрдЯрд╛ рдЙрддреНрдкрдиреНрди рдХрд░реЗрдВред
рдЙрджрд╛рд╣рд░рдг рдЙрдкрдпреЛрдЧ рдорд╛рдорд▓рд╛:
from transformers import pipeline generator = pipeline("text-generation", model=model, tokenizer=tokenizer) synthetic_data = generator("Generate financial reports for Q1 2023", max_length=200)
рдЦ) рдЬреНрдЮрд╛рди рдЖрд╕рд╡рди: 405B рдореЙрдбрд▓ рдХреЗ рдЬреНрдЮрд╛рди рдХреЛ рдЫреЛрдЯреЗ, рдЕрдзрд┐рдХ рдкрд░рд┐рдирд┐рдпреЛрдЬрди рдпреЛрдЧреНрдп рдореЙрдбрд▓реЛрдВ рдореЗрдВ рд╕реНрдерд╛рдирд╛рдВрддрд░рд┐рдд рдХрд░рдирд╛ред
рдЙрджрд╛рд╣рд░рдг рдХреЛрдб:
# Use distillation techniques from Hugging Face from transformers import DistillationTrainer, DistillationTrainingArguments training_args = DistillationTrainingArguments( output_dir="./distilled_model", per_device_train_batch_size=2, num_train_epochs=3, logging_dir="./logs", ) trainer = DistillationTrainer( teacher_model=model, student_model=smaller_model, args=training_args, train_dataset=train_dataset, eval_dataset=eval_dataset, ) trainer.train()
рдЧ) рдбреЛрдореЗрди-рд╡рд┐рд╢рд┐рд╖реНрдЯ рдлрд╝рд╛рдЗрди-рдЯреНрдпреВрдирд┐рдВрдЧ: рдореЙрдбрд▓ рдХреЛ рд╡рд┐рд╢рд┐рд╖реНрдЯ рдХрд╛рд░реНрдпреЛрдВ рдпрд╛ рдЙрджреНрдпреЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд░реЗрдВред
рдЙрджрд╛рд╣рд░рдг рдХреЛрдб:
from transformers import Trainer, TrainingArguments training_args = TrainingArguments( output_dir="./domain_specific_model", per_device_train_batch_size=1, num_train_epochs=3, ) trainer = Trainer( model=model, args=training_args, train_dataset=train_dataset, eval_dataset=eval_dataset, ) trainer.train()
рдпреЗ рддрдХрдиреАрдХреЗрдВ рдФрд░ рд░рдгрдиреАрддрд┐рдпрд╛рдБ рдЖрдкрдХреЛ Llama 3.1-405B рдХреА рдкреВрд░реА рдХреНрд╖рдорддрд╛ рдХрд╛ рджреЛрд╣рди рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░реЗрдВрдЧреА, рдЬрд┐рд╕рд╕реЗ рдХреБрд╢рд▓, рд╕реНрдХреЗрд▓реЗрдмрд▓ рдФрд░ рд╡рд┐рд╢рд┐рд╖реНрдЯ AI рдЕрдиреБрдкреНрд░рдпреЛрдЧ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рд╣реЛрдВрдЧреЗред
рднрд╡рд┐рд╖реНрдп рдХреА рд░реВрдк рд░реЗрдЦрд╛
рд▓рд╛рдорд╛ 3.1-405B рдХреЗ рдЬрд╛рд░реА рд╣реЛрдиреЗ рд╕реЗ рдХрдИ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдирд╡рд╛рдЪрд╛рд░ рдореЗрдВ рддреЗрдЬреА рдЖрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ:
- рд╡рд┐рд╢рд┐рд╖реНрдЯ рдбреЛрдореЗрди рдХреЗ рд▓рд┐рдП рдмреЗрд╣рддрд░ рдлрд╝рд╛рдЗрди-рдЯреНрдпреВрдирд┐рдВрдЧ рддрдХрдиреАрдХ
- рдЕрдзрд┐рдХ рдХреБрд╢рд▓ рдЕрдиреБрдорд╛рди рд╡рд┐рдзрд┐рдпреЛрдВ рдХрд╛ рд╡рд┐рдХрд╛рд╕
- рдореЙрдбрд▓ рд╕рдВрдкреАрдбрд╝рди рдФрд░ рдЖрд╕рд╡рди рдореЗрдВ рдкреНрд░рдЧрддрд┐
рдирд┐рд╖реНрдХрд░реНрд╖
рд▓рд╛рдорд╛ 3.1-405рдмреА рдУрдкрди-рд╕реЛрд░реНрд╕ рдПрдЖрдИ рдореЗрдВ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдореАрд▓ рдХрд╛ рдкрддреНрдерд░ рд╣реИ, рдЬреЛ рдРрд╕реА рдХреНрд╖рдорддрд╛рдПрдВ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдкрд╣рд▓реЗ рдХреНрд▓реЛрдЬреНрдб-рд╕реЛрд░реНрд╕ рдореЙрдбрд▓реЛрдВ рддрдХ рд╣реА рд╕реАрдорд┐рдд рдереАрдВред
рдЬреИрд╕реЗ-рдЬреИрд╕реЗ рд╣рдо рдЗрд╕ рдореЙрдбрд▓ рдХреА рд╢рдХреНрддрд┐ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░рддреЗ рд░рд╣реЗрдВрдЧреЗ, рдЗрд╕рдХреЗ рдЙрдкрдпреЛрдЧ рдХреЛ рдЬрд╝рд┐рдореНрдореЗрджрд╛рд░реА рдФрд░ рдиреИрддрд┐рдХ рджреГрд╖реНрдЯрд┐рдХреЛрдг рд╕реЗ рджреЗрдЦрдирд╛ рдЬрд╝рд░реВрд░реА рд╣реИред рдЗрд╕ рдореЙрдбрд▓ рдХреЗ рд╕рд╛рде рдЙрдкрд▓рдмреНрдз рдХрд░рд╛рдП рдЧрдП рдЙрдкрдХрд░рдг рдФрд░ рд╕реБрд░рдХреНрд╖рд╛ рдЙрдкрд╛рдп рдЬрд╝рд┐рдореНрдореЗрджрд╛рд░реА рд╕реЗ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд░рдиреЗ рдХрд╛ рдПрдХ рдврд╛рдБрдЪрд╛ рдкреНрд░рджрд╛рди рдХрд░рддреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдирд┐рд░рдВрддрд░ рд╕рддрд░реНрдХрддрд╛ рдФрд░ рд╕рд╛рдореБрджрд╛рдпрд┐рдХ рд╕рд╣рдпреЛрдЧ рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реЛрдЧрд╛ рдХрд┐ рдЗрд╕ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рддрдХрдиреАрдХ рдХрд╛ рдЙрдкрдпреЛрдЧ рд╕рдорд╛рдЬ рдХреЗ рд▓рд╛рдн рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рдПред
рдореИрдВрдиреЗ рдкрд┐рдЫрд▓реЗ рдкрд╛рдВрдЪ рд╕рд╛рд▓ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рдХреА рдЖрдХрд░реНрд╖рдХ рджреБрдирд┐рдпрд╛ рдореЗрдВ рдбреВрдмрдиреЗ рдореЗрдВ рдмрд┐рддрд╛рдП рд╣реИрдВред рдореЗрд░реЗ рдЬреБрдиреВрди рдФрд░ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдиреЗ рдореБрдЭреЗ рдПрдЖрдИ/рдПрдордПрд▓ рдкрд░ рд╡рд┐рд╢реЗрд╖ рдзреНрдпрд╛рди рджреЗрдиреЗ рдХреЗ рд╕рд╛рде 50 рд╕реЗ рдЕрдзрд┐рдХ рд╡рд┐рд╡рд┐рдз рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдореЗрдВ рдпреЛрдЧрджрд╛рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░реЗрд░рд┐рдд рдХрд┐рдпрд╛ рд╣реИред рдореЗрд░реА рдирд┐рд░рдВрддрд░ рдЬрд┐рдЬреНрдЮрд╛рд╕рд╛ рдиреЗ рдореБрдЭреЗ рдкреНрд░рд╛рдХреГрддрд┐рдХ рднрд╛рд╖рд╛ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг рдХреА рдУрд░ рднреА рдЖрдХрд░реНрд╖рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдПрдХ рдРрд╕рд╛ рдХреНрд╖реЗрддреНрд░ рдЬрд┐рд╕реЗ рдореИрдВ рдФрд░ рдЕрдзрд┐рдХ рдЬрд╛рдирдиреЗ рдХреЗ рд▓рд┐рдП рдЙрддреНрд╕реБрдХ рд╣реВрдВред
рд╢рд╛рдпрдж рддреБрдо рдкрд╕рдВрдж рдХрд░реЛрдЧреЗ
-
рдЬрдм AI рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдореЙрдбрд▓ рдХреЛ рдЭреВрда рдмреЛрд▓рдирд╛ рд╕рд┐рдЦрд╛рддреЗ рд╣реИрдВ
-
рдПрд▓рдПрд▓рдПрдо рд╣рдореЗрдВ рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдХреЛ рдкреБрдирд░реНрдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреИрд╕реЗ рдордЬрдмреВрд░ рдХрд░ рд░рд╣реЗ рд╣реИрдВ
-
рдмрдбрд╝реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рдордзреНрдп рдХреЛ рдХреНрдпреЛрдВ рднреВрд▓ рдЬрд╛рддреЗ рд╣реИрдВ: рдПрдЖрдИ рдХреЗ рдЫрд┐рдкреЗ рд╣реБрдП рдмреНрд▓рд╛рдЗрдВрдб рд╕реНрдкреЙрдЯ рдХреЛ рдЙрдЬрд╛рдЧрд░ рдХрд░рдирд╛
-
рдПрд▓рдПрд▓рдПрдо рдХреА рдореЗрдореЛрд░реА рд╕реАрдорд╛рдПрдБ: рдЬрдм рдПрдЖрдИ рдмрд╣реБрдд рдЕрдзрд┐рдХ рдпрд╛рдж рд░рдЦрддрд╛ рд╣реИ
-
рдПрд▓рдПрд▓рдПрдореНрд╕ рдЖрд╕рд╛рди рдкрд╣реЗрд▓рд┐рдпреЛрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЬрд╝реНрдпрд╛рджрд╛ рдХреНрдпреЛрдВ рд╕реЛрдЪрддреЗ рд╣реИрдВ рд▓реЗрдХрд┐рди рдХрдард┐рди рдкрд╣реЗрд▓рд┐рдпреЛрдВ рдХреЛ рдЫреЛрдбрд╝ рджреЗрддреЗ рд╣реИрдВ
-
рд╢реЛрдз рдореЗрдВ рдкрд╛рдпрд╛ рдЧрдпрд╛ рдХрд┐ рдЬрдм AI рдХреЛ рдкрддрд╛ рдЪрд▓рддрд╛ рд╣реИ рдХрд┐ рдЙрд╕рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИ рддреЛ рд╡рд╣ рдЕрд▓рдЧ рддрд░рд╣ рд╕реЗ рдХрд╛рд░реНрдп рдХрд░рддрд╛ рд╣реИ