ဉာဏ်ရည်တု

Llama 3 အကြောင်း သိလိုသမျှ အစွမ်းထက်ဆုံး Open-Source Model သို့တိုင် | အသုံးပြုရန် သဘောတရားများ

နောက်ဆုံးရေးသားချိန် on ဧပြီလ 24, 2024

Meta Llama 3 ပွင့်လင်းအရင်းအမြစ် LLM OUTPERFORM GPT 4

Meta သည် မကြာသေးမီက ထုတ်ပြန်ခဲ့သည်။ မီးတောက် ၂၎င်း၏ခေတ်မီသော open source ကြီးမားသောဘာသာစကားမော်ဒယ် (LLM) ၏ နောက်မျိုးဆက်။ ဆောင်းပါးတွင် ကျယ်ကျယ်ပြန့်ပြန့်သုံးသပ်ချက်တွင်ဖော်ပြထားသည့်အတိုင်း Llama 3 သည် ၎င်း၏အရင်ကချမှတ်ခဲ့သောအခြေခံအုတ်မြစ်များကိုတည်ဆောက်ခြင်း Llama 2 ကို ChatGPT တွင် သိသာထင်ရှားသော open-source ပြိုင်ဘက်အဖြစ် နေရာချထားပေးသည့်စွမ်းရည်များကို မြှင့်တင်ရန် ရည်ရွယ်သည်။ Llama 2- ChatGPT သို့ Open-Source Challenger သို့ နက်နက်ရှိုင်းရှိုင်း ထိုးဆင်းပါ။.

ဤဆောင်းပါးတွင် ကျွန်ုပ်တို့သည် Llama 3 ၏နောက်ကွယ်ရှိ အဓိကသဘောတရားများကို ဆွေးနွေးမည်ဖြစ်ပြီး၊ ၎င်း၏ဆန်းသစ်သောဗိသုကာပညာနှင့် လေ့ကျင့်ရေးလုပ်ငန်းစဉ်များကို လေ့လာစူးစမ်းကာ ဤအဆန်းသစ်ဆုံးပုံစံကို တာဝန်သိစွာအသုံးပြုပုံ၊ အသုံးချပုံနှင့် လက်တွေ့ကျသောလမ်းညွှန်ချက်ပေးမည်ဖြစ်သည်။ သင်သည် သုတေသီ၊ ဆော့ဖ်ဝဲရေးသူ သို့မဟုတ် AI ဝါသနာရှင်ဖြစ်ပါစေ၊ သင့်ပရောဂျက်များနှင့် အက်ပ်လီကေးရှင်းများအတွက် Llama 3 ၏စွမ်းအားကို အသုံးချရန် လိုအပ်သော အသိပညာနှင့် အရင်းအမြစ်များကို ဤပို့စ်က ပေးဆောင်မည်ဖြစ်သည်။

Llama ၏ဆင့်ကဲဖြစ်စဉ်- Llama 2 မှ Llama 3

Meta ၏ CEO ဖြစ်သူ Mark Zuckerberg၊ ထုတ်ပြန်ကြေညာ Meta AI မှ ဖန်တီးထားသည့် နောက်ဆုံးပေါ် AI မော်ဒယ် Llama 3 ၏ ပွဲဦးထွက်။ ခေတ်မီဆန်းသစ်သော မော်ဒယ်၊ ယခု open-sourced သည် Messenger နှင့် Instagram အပါအဝင် Meta ၏ ထုတ်ကုန်အမျိုးမျိုးကို မြှင့်တင်ရန် သတ်မှတ်ထားသည်။ Zuckerberg က Llama 3 သည် Meta AI ကို အဆင့်အမြင့်မားဆုံးအဖြစ် သတ်မှတ်ကြောင်း မီးမောင်းထိုးပြခဲ့သည်။ AI လက်ထောက်ကို လွတ်လပ်စွာ ရနိုင်သည်။.

Llama 3 ၏ အသေးစိတ်အချက်များအကြောင်း မပြောမီ၊ ၎င်း၏ရှေ့ဆက်ဖြစ်သော Llama 2 ကို အကျဉ်းချုံးပြန်ကြည့်ကြပါစို့။ 2022 ခုနှစ်တွင် မိတ်ဆက်ခဲ့သော Llama 2 သည် သုံးစွဲသူများ၏ ဟာ့ဒ်ဝဲပေါ်တွင် လုပ်ဆောင်နိုင်သည့် အစွမ်းထက်ပြီး ထိရောက်သော မော်ဒယ်ကို ပေးဆောင်သည့် open-source LLM အခင်းအကျင်းတွင် အရေးပါသော မှတ်တိုင်တစ်ခုဖြစ်သည်။ .

သို့သော်၊ Llama 2 သည် ထင်ရှားသော အောင်မြင်မှုဖြစ်သော်လည်း ၎င်း၏ ကန့်သတ်ချက်များရှိသည်။ အသုံးပြုသူများသည် မှားယွင်းသောငြင်းဆိုမှုများ (ညင်သာပျော့ပျောင်းသောအချက်ပြမှုများကို ဖြေကြားရန် ငြင်းဆန်သည့်ပုံစံ)၊ အကန့်အသတ်ရှိသောအကူအညီနှင့် ကျိုးကြောင်းဆင်ခြင်ခြင်းနှင့် ကုဒ်ထုတ်လုပ်ခြင်းကဲ့သို့သော နယ်ပယ်များတွင် တိုးတက်မှုအတွက် အခန်းများကို အသုံးပြုသူများက အစီရင်ခံကြသည်။

Llama 3 ကိုထည့်သွင်းပါ- ဤစိန်ခေါ်မှုများအတွက် Meta ၏တုံ့ပြန်မှုနှင့် အသိုင်းအဝိုင်း၏တုံ့ပြန်ချက်။ Llama 3 ဖြင့် Meta သည် ယနေ့ခေတ်တွင် ရရှိနိုင်သော ထိပ်တန်းမူပိုင်မော်ဒယ်များနှင့်အတူ အကောင်းဆုံး open-source မော်ဒယ်များကို တည်ဆောက်ရန် စီစဉ်နေပြီး တာဝန်ယူမှုရှိသော ဖွံ့ဖြိုးတိုးတက်မှုနှင့် အသုံးချမှုဆိုင်ရာ အလေ့အကျင့်များကို ဦးစားပေးလုပ်ဆောင်နေပါသည်။

Llama 3- ဗိသုကာနှင့် လေ့ကျင့်ရေး

Llama 3 တွင် အဓိက တီထွင်ဆန်းသစ်မှုများထဲမှ တစ်ခုသည် သိသိသာသာ ချဲ့ထွင်ထားသော ဝေါဟာရကို ပါ၀င်သည့် ၎င်း၏ တိုကင်ဆာ၊ 128,256 တိုကင် (Llama 32,000 တွင် 2 မှတက်သည်)။ ဤပိုကြီးသောဝေါဟာရသည် အဝင်နှင့်အထွက်အတွက်ရော စာသားများ၏ ကုဒ်နံပါတ်ကို ပိုမိုထိရောက်စွာ ကုဒ်သွင်းနိုင်စေကာ ပိုမိုအားကောင်းသော ဘာသာစကားမျိုးစုံနှင့် စွမ်းဆောင်ရည်တိုးတက်မှုများကို ဖြစ်ပေါ်စေနိုင်သည်။

Llama 3 လည်း ပါဝင်သည်။ Grouped-Query အာရုံစိုက် (GQA) သည် အရွယ်အစားပိုကောင်းစေပြီး မော်ဒယ်သည် ရှည်လျားသောအကြောင်းအရာများကို ပိုမိုထိရောက်စွာကိုင်တွယ်ရန် ကူညီပေးသည့် ထိရောက်သောကိုယ်စားပြုနည်းစနစ်တစ်ခုဖြစ်သည်။ ဟိ 8B Llama 3 ဗားရှင်းသည် GQA ကို အသုံးပြုထားပြီး နှစ်မျိုးစလုံးကို အသုံးပြုထားသည်။ 8B နှင့် 70B မော်ဒယ်များအထိ ဆက်တိုက်လုပ်ဆောင်နိုင်သည်။ 8,192 တိုကင်.

လေ့ကျင့်ရေးဒေတာနှင့် အတိုင်းအတာ

Llama 3 အတွက် အသုံးပြုသည့် လေ့ကျင့်ရေးဒေတာသည် ၎င်း၏ စွမ်းဆောင်ရည်မြှင့်တင်မှုအတွက် အရေးကြီးသောအချက်ဖြစ်သည်။ Meta သည် ကြီးမားသော ဒေတာအတွဲကို ကျော်လွန်သွားခဲ့သည်။ ၂.၇၅ ထရီလီယံ အများသူငှာရရှိနိုင်သော အွန်လိုင်းရင်းမြစ်များမှ တိုကင်များ၊ Llama 2 အတွက် အသုံးပြုသည့် ဒေတာအတွဲထက် ခုနစ်ဆပိုကြီးသည်။ ဤဒေတာအတွဲတွင် အင်္ဂလိပ်မဟုတ်သော အရည်အသွေးမြင့်ဒေတာ၏ သိသာထင်ရှားသောအပိုင်း (၅%) ကျော်လည်း ပါဝင်သည်၊၊ 30 ဘာသာစကားများအနာဂတ်တွင် ဘာသာစကားမျိုးစုံအသုံးပြုမှုများအတွက် ပြင်ဆင်မှု။

ဒေတာအရည်အသွေးကို သေချာစေရန်၊ Meta သည် ဒေတာအရည်အသွေးကို ခန့်မှန်းရန် Llama 2 တွင် လေ့ကျင့်ထားသော ဒေတာအရည်အသွေးကို ခန့်မှန်းရန် heuristic filters၊ NSFW စစ်ထုတ်မှုများ၊ NSFW စစ်ထုတ်မှုများအပါအဝင် အဆင့်မြင့်စစ်ထုတ်ခြင်းနည်းပညာများကို အသုံးပြုခဲ့သည်။ အဖွဲ့သည် ကြိုတင်လေ့ကျင့်ခြင်းအတွက် အကောင်းဆုံးဒေတာရင်းမြစ်များ၏ ရောနှောမှုကို ဆုံးဖြတ်ရန် ကျယ်ပြန့်သော စမ်းသပ်မှုများကို ပြုလုပ်ခဲ့ပြီး Llama 3 သည် အသေးအဖွဲ၊ STEM၊ ကုဒ်နှင့် သမိုင်းဆိုင်ရာ အသိပညာများအပါအဝင် ကျယ်ပြန့်သောအသုံးပြုမှုကိစ္စများတွင် ကောင်းမွန်စွာလုပ်ဆောင်ကြောင်း သေချာစေပါသည်။

ကြိုတင်လေ့ကျင့်ခြင်းကို ချဲ့ထွင်ခြင်းသည် Llama 3 ၏ ဖွံ့ဖြိုးတိုးတက်မှု၏ နောက်ထပ်အရေးကြီးသော ကဏ္ဍတစ်ခုဖြစ်သည်။ Meta သည် ၎င်းတို့ကို လက်တွေ့မလေ့ကျင့်မီ ကုဒ်ထုတ်လုပ်ခြင်းကဲ့သို့သော အဓိကလုပ်ဆောင်မှုများတွင် ၎င်း၏အကြီးဆုံးမော်ဒယ်များ၏ စွမ်းဆောင်ရည်ကို ခန့်မှန်းနိုင်စေသည့် အတိုင်းအတာဥပဒေများကို ရေးဆွဲခဲ့သည်။ ယင်းက ဒေတာရောနှောမှုနှင့် တွက်ချက်ခွဲဝေမှုဆိုင်ရာ ဆုံးဖြတ်ချက်များကို အသိပေးခဲ့ပြီး၊ နောက်ဆုံးတွင် ပိုမိုထိရောက်ပြီး ထိရောက်သော လေ့ကျင့်မှုကို ဖြစ်စေသည်။

Llama 3 ၏အကြီးဆုံးမော်ဒယ်များသည် စိတ်ကြိုက်တည်ဆောက်ထားသော 24,000 GPU အစုအဝေးနှစ်ခုတွင် လေ့ကျင့်သင်ကြားထားပြီး data parallelization၊ model parallelization နှင့် pipeline parallelization နည်းပညာများကို ပေါင်းစပ်အသုံးပြုထားသည်။ Meta ၏အဆင့်မြင့်လေ့ကျင့်ရေးစဥ်သည် အလိုအလျောက်အမှားရှာဖွေခြင်း၊ ကိုင်တွယ်ခြင်းနှင့် ပြုပြင်ထိန်းသိမ်းခြင်းများ၊ GPU အားချိန်အား မြှင့်တင်ပေးပြီး Llama 2 နှင့် နှိုင်းယှဉ်ပါက ခန့်မှန်းခြေအားဖြင့် လေ့ကျင့်ရေးစွမ်းဆောင်ရည်ကို သုံးဆတိုးစေသည်။

Instruction Fine-tuning and Performance

Llama 3 ၏ ချက်တင်နှင့် ဆွေးနွေးမှု အပလီကေးရှင်းများအတွက် အလားအလာ အပြည့်အဝကို လော့ခ်ဖွင့်ရန် Meta သည် ညွှန်ကြားချက်ကို ချိန်ညှိခြင်းအတွက် ၎င်း၏ချဉ်းကပ်ပုံကို ဆန်းသစ်တီထွင်ခဲ့သည်။ ၎င်း၏နည်းလမ်းကိုပေါင်းစပ် ကြီးကြပ် ညှိနှိုင်းမှု (SFT)၊ ငြင်းပယ်ခြင်းနမူနာ၊ proximal policy optimization (PPO) နှင့် တိုက်ရိုက်ဦးစားပေး ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်း။ (DPO)။

SFT တွင်အသုံးပြုသည့် အချက်များ၏ အရည်အသွေးနှင့် PPO နှင့် DPO တွင်အသုံးပြုသော ဦးစားပေးအဆင့်သတ်မှတ်ချက်များသည် aligned မော်ဒယ်များ၏စွမ်းဆောင်ရည်တွင် အရေးပါသောအခန်းကဏ္ဍမှ ပါဝင်ခဲ့သည်။ Meta ၏အဖွဲ့သည် ဤဒေတာကို ဂရုတစိုက်ရွေးချယ်ပြီး လူသားမှတ်စုများပေးသော မှတ်စုများပေါ်တွင် အရည်အသွေးအာမခံချက်များစွာကို ပြုလုပ်ခဲ့သည်။

PPO နှင့် DPO မှတစ်ဆင့် ဦးစားပေးအဆင့်သတ်မှတ်ခြင်းဆိုင်ရာ သင်တန်းပေးခြင်းသည် ကျိုးကြောင်းဆင်ခြင်ခြင်းနှင့် ကုဒ်ရေးခြင်းဆိုင်ရာ လုပ်ဆောင်ချက်များကို Llama 3 ၏ စွမ်းဆောင်ရည်ကို သိသိသာသာ တိုးတက်စေသည်။ မော်ဒယ်တစ်ဦးသည် ကျိုးကြောင်းဆီလျော်သောမေးခွန်းကို တိုက်ရိုက်ဖြေဆိုရန် ရုန်းကန်နေရသည့်တိုင် မှန်ကန်သော ကျိုးကြောင်းဆင်ခြင်ခြင်းလမ်းကြောင်းကို ထုတ်ပေးနိုင်ဆဲဖြစ်ကြောင်း Meta တွေ့ရှိခဲ့သည်။ ဦးစားပေးအဆင့်သတ်မှတ်ချက်များဆိုင်ရာ လေ့ကျင့်မှုသည် မော်ဒယ်အား ဤလမ်းကြောင်းများမှ အဖြေမှန်ကို ရွေးချယ်နည်းကို လေ့လာနိုင်စေခဲ့သည်။

ရလဒ်များသည် ၎င်းတို့အတွက်ဖြစ်သည်- Llama 3 သည် သာမန်စက်မှုလုပ်ငန်းစံနှုန်းများတွင် ရရှိနိုင်သော open-source ချတ်မော်ဒယ်များစွာကို စွမ်းဆောင်ရည်ထက်သာလွန်စေပြီး 8B နှင့် 70B ကန့်သတ်စကေးများတွင် LLM များအတွက် ခေတ်မီသောစွမ်းဆောင်ရည်အသစ်ကို ဖန်တီးပေးသည်။

တာဝန်ယူမှုရှိသော ဖွံ့ဖြိုးတိုးတက်မှုနှင့် ဘေးကင်းရေးဆိုင်ရာ ထည့်သွင်းစဉ်းစားမှုများ

နောက်ဆုံးပေါ် စွမ်းဆောင်ရည်ကို လိုက်စားနေချိန်တွင် Meta သည် Llama 3 အတွက် တာဝန်ရှိသော ဖွံ့ဖြိုးတိုးတက်မှုနှင့် အသုံးချမှုဆိုင်ရာ အလေ့အကျင့်များကို ဦးစားပေးလုပ်ဆောင်ခဲ့သည်။ ကုမ္ပဏီသည် Llama 3 မော်ဒယ်များကို ကျယ်ပြန့်သော ဂေဟစနစ်၏ တစ်စိတ်တစ်ပိုင်းအဖြစ် စိတ်ကူးပုံဖော်ကာ ယာဉ်မောင်းထိုင်ခုံတွင် ဒီဇိုင်းဆွဲခွင့်ပေးကာ၊ ၎င်းတို့၏ သီးခြားအသုံးပြုမှုကိစ္စများနှင့် ဘေးကင်းရေးလိုအပ်ချက်များအတွက် မော်ဒယ်များကို စိတ်ကြိုက်ပြင်ဆင်ပါ။

Meta သည် ကျယ်ပြန့်သော အနီရောင်အဖွဲ့ခွဲလေ့ကျင့်ခန်းများကို ပြုလုပ်ခဲ့ပြီး ပြိုင်ဘက်ကင်းသော အကဲဖြတ်မှုများ ပြုလုပ်ကာ ၎င်း၏ ညွှန်ကြားချက်ပုံစံများတွင် ကျန်ရှိနေသော အန္တရာယ်များကို လျှော့ချရန်အတွက် ဘေးကင်းရေး လျော့ပါးသက်သာစေရေး နည်းပညာများကို အကောင်အထည်ဖော်ခဲ့သည်။ သို့သော်လည်း၊ ကုမ္ပဏီသည် ကျန်ရှိသောအန္တရာယ်များရှိနေနိုင်သည်ကို အသိအမှတ်ပြုပြီး developer များသည် ၎င်းတို့၏ သီးခြားအသုံးပြုမှုကိစ္စများတွင် အဆိုပါအန္တရာယ်များကို အကဲဖြတ်ရန် အကြံပြုထားသည်။

တာဝန်သိစွာ အသုံးချခြင်းကို ပံ့ပိုးရန်အတွက် Meta သည် ၎င်းတို့၏ အပလီကေးရှင်းများအတွက် မော်ဒယ်နှင့် စနစ်အဆင့် ဘေးကင်းရေး အကောင်းဆုံး အလေ့အကျင့်များကို အကောင်အထည်ဖော်ရန် developer များအတွက် ပြည့်စုံသော အရင်းအမြစ်ကို ပံ့ပိုးပေးသည့် ၎င်း၏ တာဝန်သိအသုံးပြုမှု လမ်းညွှန်ကို အပ်ဒိတ်လုပ်ထားပါသည်။ လမ်းညွှန်တွင် အကြောင်းအရာ စိစစ်ခြင်း၊ အန္တရာယ် အကဲဖြတ်ခြင်းနှင့် Llama Guard 2 နှင့် Code Shield ကဲ့သို့သော ဘေးကင်းရေး ကိရိယာများ အသုံးပြုခြင်း စသည့် အကြောင်းအရာများ ပါဝင်သည်။

MLCommons အမျိုးအစားခွဲခြားသတ်မှတ်မှုတွင်တည်ဆောက်ထားသော Llama Guard 2 သည် LLM သွင်းအားစုများ (အကြံပြုချက်များ) နှင့် တုံ့ပြန်မှုများကို အမျိုးအစားခွဲရန်၊ အန္တရာယ်ကင်းသည်ဟု ယူဆနိုင်သော သို့မဟုတ် အန္တရာယ်ရှိသော အကြောင်းအရာများကို ရှာဖွေဖော်ထုတ်ရန် ဒီဇိုင်းထုတ်ထားသည်။ CyberSecEval 2 သည် မော်ဒယ်၏ ကုဒ်စကားပြန်ကို အလွဲသုံးစားလုပ်ခြင်းမှ ကာကွယ်ရန် အစီအမံများ ပေါင်းထည့်ခြင်းဖြင့်၊ ထိုးစစ်ဆင်သည့် ဆိုက်ဘာလုံခြုံရေး စွမ်းရည်နှင့် ထိုးနှက်တိုက်ခိုက်မှုများကို ခံနိုင်ရည်ရှိနိုင်မှုတို့ကို တားဆီးပေးသည်။

Code Shield၊ Llama 3 နှင့် နိဒါန်းအသစ်တစ်ခုသည် LLMs မှထုတ်လုပ်သော မလုံခြုံသောကုဒ်များကို အနုမာနအချိန်ပိုင်းစီစစ်ခြင်း၊ မလုံခြုံသောကုဒ်အကြံပြုချက်များ၊ ကုဒ်စကားပြန်အလွဲသုံးစားလုပ်ခြင်းနှင့် လုံခြုံသောအမိန့်ပေးသည့်လုပ်ဆောင်မှုတို့နှင့်ဆက်စပ်သည့် အန္တရာယ်များကို လျော့ပါးစေပါသည်။

Llama 3 ကိုဝင်ရောက်ခြင်းနှင့်အသုံးပြုခြင်း။

Meta AI ၏ Llama 3 ကို လွှင့်တင်ပြီးနောက်၊ Mac၊ Windows နှင့် Linux အပါအဝင် အမျိုးမျိုးသော လည်ပတ်မှုစနစ်များတွင် ဒေသဆိုင်ရာ ဖြန့်ကျက်မှုအတွက် အခမဲ့အရင်းအမြစ်ကိရိယာများစွာကို ရရှိစေခဲ့သည်။ ဤကဏ္ဍတွင် ထင်ရှားသော ကိရိယာသုံးမျိုး- Ollama၊ Open WebUI နှင့် LM Studio တစ်ခုစီသည် Llama 3 ၏ ကိုယ်ရေးကိုယ်တာ စွမ်းရည်များကို အသုံးချရန်အတွက် သီးခြားအင်္ဂါရပ်တစ်ခုစီကို ပေးဆောင်သည်။

အိုလာမာ- Mac၊ Linux နှင့် Windows အတွက် ရနိုင်သည်၊ အိုလာမာ Llama 3 နှင့် အခြားသော ကြီးမားသော ဘာသာစကား မော်ဒယ်လ်များ ၏ လုပ်ဆောင်ချက်ကို တစ်ကိုယ်ရေသုံး ကွန်ပျူတာများ တွင် ရိုးရှင်းသော ဟာ့ဒ်ဝဲ အားနည်းသော သူများပင် ဖြစ်သည်။ ၎င်းတွင် လွယ်ကူသော မော်ဒယ်စီမံခန့်ခွဲမှုအတွက် ပက်ကေ့ဂျ်မန်နေဂျာတစ်ခု ပါ၀င်ပြီး မော်ဒယ်များကို ဒေါင်းလုဒ်လုပ်ခြင်းနှင့် လုပ်ဆောင်ခြင်းအတွက် ပလပ်ဖောင်းများတစ်လျှောက် ညွှန်ကြားချက်များကို ပံ့ပိုးပေးသည်။

Docker ဖြင့် WebUI ကိုဖွင့်ပါ။: ဤကိရိယာသည် အသုံးပြုသူအတွက် အဆင်ပြေစေသည်၊ Docker-based interface ကို Mac၊ Linux နှင့် Windows တို့နှင့် တွဲဖက်အသုံးပြုနိုင်သည်။ ၎င်းသည် Ollama registry မှ မော်ဒယ်များနှင့် ချောမွေ့စွာ ပေါင်းစပ်ထားပြီး အသုံးပြုသူများကို ဒေသတွင်း ဝဘ်အင်တာဖေ့စ်အတွင်း Llama 3 ကဲ့သို့ မော်ဒယ်များနှင့် အသုံးချကာ အပြန်အလှန် တုံ့ပြန်နိုင်စေပါသည်။

LM Studio- Mac၊ Linux နှင့် Windows များတွင် အသုံးပြုသူများကို ပစ်မှတ်ထားခြင်း၊ LM Studio မော်ဒယ်များစွာကို ပံ့ပိုးပေးပြီး llama.cpp ပရောဂျက်တွင် တည်ဆောက်ထားသည်။ ၎င်းသည် ချတ်အင်တာဖေ့စ်ကိုထောက်ပံ့ပေးပြီး Llama 3 8B Instruct မော်ဒယ်အပါအဝင် မော်ဒယ်အမျိုးမျိုးနှင့် တိုက်ရိုက်အပြန်အလှန်ဆက်သွယ်မှုကို လွယ်ကူချောမွေ့စေသည်။

ဤကိရိယာများသည် အသုံးပြုသူများသည် နည်းပညာဆိုင်ရာကျွမ်းကျင်မှုနှင့် လိုအပ်ချက်များစွာကို လိုက်လျောညီထွေဖြစ်စေပြီး ၎င်းတို့၏ကိုယ်ပိုင်စက်ပစ္စည်းများတွင် Llama 3 ကို ထိရောက်စွာအသုံးပြုနိုင်ကြောင်း သေချာစေပါသည်။ ပလက်ဖောင်းတစ်ခုစီတိုင်းသည် စနစ်ထည့်သွင်းမှုနှင့် မော်ဒယ်အပြန်အလှန်လုပ်ဆောင်မှုအတွက် အဆင့်ဆင့်လုပ်ဆောင်မှုများကို ပေးဆောင်ထားပြီး အဆင့်မြင့် AI ကို ဆော့ဖ်ဝဲရေးသားသူများနှင့် ဝါသနာရှင်များအတွက် ပိုမိုအသုံးပြုနိုင်စေပါသည်။

Llama 3 ကို Scale တွင် အသုံးပြုခြင်း။

မော်ဒယ်အလေးချိန်များကို တိုက်ရိုက်ဝင်ရောက်ခွင့် ပေးသည့်အပြင်၊ Meta သည် Llama 3 ကို အတိုင်းအတာဖြင့် ချောမွေ့စွာ အသုံးပြုနိုင်စေရန် cloud ဝန်ဆောင်မှုပေးသူများ၊ မော်ဒယ် API ဝန်ဆောင်မှုများနှင့် ဟာ့ဒ်ဝဲပလက်ဖောင်းများနှင့် ပူးပေါင်းထားသည်။

Llama 3 ၏အဓိကအားသာချက်များထဲမှတစ်ခုမှာ tokenizer အသစ်ကြောင့်၎င်း၏တိုးတက်လာသောတိုကင်ထိရောက်မှုဖြစ်သည်။ စံသတ်မှတ်ချက်များက Llama 3 အထိ လိုအပ်ကြောင်း ပြသသည်။ 15% ပိုနည်းသော တိုကင်များ Llama 2 နှင့် နှိုင်းယှဉ်ပါက ပိုမိုမြန်ဆန်ပြီး တွက်ခြေကိုက်သော ကောက်ချက်ချမှုကို ဖြစ်ပေါ်စေသည်။

Llama 8 ၏ 3B ဗားရှင်းတွင် Grouped Query Attention (GQA) ၏ ပေါင်းစပ်မှုသည် Llama 7 ၏ 2B ဗားရှင်းနှင့် အညီ ဆက်လက်ထိန်းသိမ်းထားရန် ပံ့ပိုးပေးပါသည်။

ဖြန့်ကျက်ခြင်းလုပ်ငန်းစဉ်ကို ရိုးရှင်းစေရန် Meta သည် ပွင့်လင်းသောအရင်းအမြစ်ကုဒ်နှင့် ကောင်းစွာချိန်ညှိခြင်း၊ အသုံးချခြင်း၊ မော်ဒယ်အကဲဖြတ်ခြင်းနှင့် အခြားအရာများအတွက် နမူနာများပါရှိသော Llama Recipes သိုလှောင်ခန်းကို ပံ့ပိုးပေးထားပါသည်။ ဤသိမ်းဆည်းမှုသည် Llama 3 ၏စွမ်းရည်များကို ၎င်းတို့၏အပလီကေးရှင်းများတွင် အသုံးချလိုသည့် developer များအတွက် အဖိုးတန်အရင်းအမြစ်တစ်ခုဖြစ်သည်။

Llama 3 ၏စွမ်းဆောင်ရည်ကို စူးစမ်းလေ့လာလိုသူများအတွက် Meta သည် ၎င်း၏နောက်ဆုံးထွက်မော်ဒယ်များကို Llama 3 နည်းပညာဖြင့် တည်ဆောက်ထားသော ထိပ်တန်း AI လက်ထောက်ဖြစ်သည့် Meta AI နှင့် ပေါင်းစပ်ထားသည်။ သုံးစွဲသူများသည် Facebook၊ Instagram၊ WhatsApp၊ Messenger၊ နှင့် ဝဘ်ကဲ့သို့သော Meta အက်ပ်များမှတစ်ဆင့် Meta AI နှင့် အပြန်အလှန် တုံ့ပြန်နိုင်ပြီး ၎င်းတို့အတွက် အရေးကြီးသောအရာများနှင့် ချိတ်ဆက်နိုင်သည်။

Llama 3 အတွက် နောက်တစ်ခုက ဘာလဲ။

8B နှင့် 70B မော်ဒယ်များသည် Llama 3 ထုတ်ဝေမှု၏အစကို အမှတ်အသားပြုသော်လည်း Meta သည် ဤအမိုက်စား LLM ၏အနာဂတ်အတွက် ရည်မှန်းချက်ကြီးကြီးထားပြီး အစီအစဉ်များရှိပါသည်။

လာမည့်လများတွင် Multimodality (ရုပ်ပုံများနှင့် ဗီဒီယိုများကဲ့သို့ မတူညီသောဒေတာပုံစံများကို စီမံဆောင်ရွက်နိုင်ခြင်းနှင့် ထုတ်လုပ်နိုင်မှု)၊ ဘာသာစကားပေါင်းစုံ (ဘာသာစကားမျိုးစုံကို ပံ့ပိုးပေးခြင်း) နှင့် စွမ်းဆောင်ရည်မြှင့်တင်မှုအတွက် ပိုရှည်သော ဆက်စပ်ဝင်းဒိုးများအပါအဝင် လာမည့်လများတွင် မိတ်ဆက်လာမည့်လများတွင် စွမ်းရည်အသစ်များကို မြင်တွေ့နိုင်မည်ဟု မျှော်လင့်နိုင်ပါသည်။ ကျယ်ပြန့်သော အကြောင်းအရာ လိုအပ်သော အလုပ်များ။

ထို့အပြင် Meta သည် လက်ရှိလေ့ကျင့်သင်ကြားလျက်ရှိပြီး စွမ်းဆောင်ရည်နှင့် စွမ်းဆောင်ရည်များတွင် အလားအလာရှိသော ခေတ်ရေစီးကြောင်းများကို ပြသနေသည့် ဘောင်ပေါင်း 400 ဘီလီယံကျော်ရှိသည့် မော်ဒယ်များအပါအဝင် ပိုမိုကြီးမားသော မော်ဒယ်အရွယ်အစားများကို ထုတ်ပြန်ရန် စီစဉ်ထားသည်။

နယ်ပယ်ကို ပိုမိုတိုးတက်ကောင်းမွန်လာစေရန်၊ Meta သည် ပိုမိုကျယ်ပြန့်သော AI အသိုင်းအဝိုင်းနှင့် ၎င်း၏တွေ့ရှိချက်များနှင့် ထိုးထွင်းသိမြင်မှုများကို မျှဝေခြင်းဖြင့် Llama 3 တွင် အသေးစိတ်သုတေသနစာတမ်းတစ်စောင်ကိုလည်း ထုတ်ဝေမည်ဖြစ်ပါသည်။

လာမည့်အရာများကို လျှို့ဝှက်စွာ အစမ်းကြည့်ရှုမှုအနေဖြင့် Meta သည် ၎င်း၏အကြီးဆုံး LLM မော်ဒယ်၏စွမ်းဆောင်ရည်ကို စံသတ်မှတ်ချက်အမျိုးမျိုးတွင် အစောပိုင်းလျှပ်တစ်ပြက်ပုံအချို့ကို မျှဝေထားသည်။ ဤရလဒ်များသည် အစောပိုင်းစစ်ဆေးရေးဂိတ်တစ်ခုအပေါ် အခြေခံထားပြီး အပြောင်းအလဲရှိနိုင်သော်လည်း ၎င်းတို့သည် Llama 3 ၏ အနာဂတ်အလားအလာကို စိတ်လှုပ်ရှားဖွယ်ရာ အရိပ်အမြွက်ပြသပေးပါသည်။

ကောက်ချက်

Llama 3 သည် စွမ်းဆောင်ရည်၊ စွမ်းဆောင်ရည်နှင့် တာဝန်ယူမှုရှိသော ဖွံ့ဖြိုးတိုးတက်မှုဆိုင်ရာ အလေ့အကျင့်များ၏ နယ်နိမိတ်များကို တွန်းအားပေးသည့် open-source ကြီးမားသော ဘာသာစကားမော်ဒယ်များ၏ ဆင့်ကဲဖြစ်စဉ်တွင် သိသာထင်ရှားသော မှတ်တိုင်တစ်ခုဖြစ်သည်။ ၎င်း၏ဆန်းသစ်သောဗိသုကာပညာ၊ ကြီးမားသောလေ့ကျင့်ရေးဒေတာအတွဲနှင့် ဆန်းသစ်သောပြင်ဆင်မှုနည်းပညာများဖြင့် Llama 3 သည် LLM များအတွက် 8B နှင့် 70B ကန့်သတ်ဘောင်စကေးများတွင် ခေတ်မီသောစံနှုန်းအသစ်များကို ချမှတ်ပေးပါသည်။

သို့သော်၊ Llama 3 သည် အစွမ်းထက်သော ဘာသာစကားပုံစံတစ်ခုမျှသာဖြစ်သည်။ ၎င်းသည် ပွင့်လင်းပြီး တာဝန်သိသော AI ဂေဟစနစ်ကို မွေးမြူရန် Meta ၏ ကတိကဝတ်ကို သက်သေခံချက်ဖြစ်သည်။ ပြည့်စုံသောအရင်းအမြစ်များ၊ ဘေးကင်းရေးကိရိယာများနှင့် အကောင်းဆုံးအလေ့အကျင့်များကို ပံ့ပိုးပေးခြင်းဖြင့် Meta သည် developer များအား Llama 3 ၏ အလားအလာများကို ၎င်းတို့၏ သီးခြားအသုံးပြုမှုကိစ္စများနှင့် ပရိသတ်များနှင့် အံဝင်ခွင်ကျဖြစ်စေသော တာဝန်ယူမှုရှိသော ဖြန့်ကျက်မှုကို သေချာစေကာ၊

Llama 3 ခရီးစဉ်သည် စွမ်းဆောင်ရည်အသစ်များ၊ မော်ဒယ်အရွယ်အစားများနှင့် မိုးကုပ်စက်ဝိုင်းပေါ်ရှိ သုတေသနတွေ့ရှိချက်များနှင့်အတူ၊ AI အသိုက်အဝန်းသည် ဤထူးခြားဆန်းသစ်သော LLM မှ ပေါ်ထွက်လာမည့် ဆန်းသစ်သောအသုံးချမှုများနှင့် အောင်မြင်မှုများကို သံသယစိတ်ဖြင့် စောင့်မျှော်နေပါသည်။

သင်သည် သဘာဝဘာသာစကားလုပ်ဆောင်ခြင်း၏ နယ်နိမိတ်များကို တွန်းအားပေးနေသည့် သုတေသီဖြစ်စေ၊ ဉာဏ်ရည်ထက်မြက်သော အပလီကေးရှင်းများ၏ မျိုးဆက်သစ်များကို တည်ဆောက်နေသည့် developer ဖြစ်စေ၊ နောက်ဆုံးပေါ်တိုးတက်မှုများကို သိချင်သော AI ဝါသနာအိုးဖြစ်စေ Llama 3 သည် သင်၏လက်နက်တိုက်တွင် အစွမ်းထက်သောကိရိယာတစ်ခုဖြစ်လာမည်ဟု ကတိပြုသည်၊ တံခါးအသစ်များကိုဖွင့်ကာ၊ ဖြစ်နိုင်ခြေရှိသောကမ္ဘာကိုဖွင့်ပါ။

Related ခေါင်းစဉ်များ:Llama လာမာ ၂ မီးတောက် ၂ LLM LLM များ meta

Next ကို up ကို

Microsoft မှ Phi-3 ကို ထုတ်ဖော်ပြသခဲ့သည်- အရွယ်အစားသေးငယ်သော စွမ်းဆောင်ရည်ဖြင့် ထိပ်တန်းစွမ်းဆောင်ရည်ကို ပေးစွမ်းနိုင်သော အစွမ်းထက်သော အဖွင့် AI မော်ဒယ်များ

သတိရနေတယ်မနေပါနဲ့

FrugalGPT- ကြီးမားသောဘာသာစကားမော်ဒယ်များအတွက် ကုန်ကျစရိတ်ပိုကောင်းအောင်ပြုလုပ်ရာတွင် ပါရာဒိုင်းအပြောင်းအရွှေ့တစ်ခု

Aayush Mittal

လွန်ခဲ့သည့်ငါးနှစ်တာကာလအတွင်း ကျွန်ုပ်သည် စွဲမက်ဖွယ်ကောင်းသော Machine Learning နှင့် Deep Learning ၏ကမ္ဘာကြီးတွင် ကိုယ့်ကိုယ်ကို နှစ်မြှုပ်နေခဲ့သည်။ ကျွန်ုပ်၏စိတ်အားထက်သန်မှုနှင့် ကျွမ်းကျင်မှုသည် AI/ML ကို အထူးအာရုံစိုက်ခြင်းဖြင့် ကွဲပြားသောဆော့ဖ်ဝဲလ်အင်ဂျင်နီယာပရောဂျက် 50 ကျော်တွင် ပါဝင်ကူညီနိုင်စေခဲ့သည်။ ဆက်လက်လေ့လာစူးစမ်းလိုစိတ်ပြင်းပြသော ကျွန်ုပ်၏စိတ်အားထက်သန်မှုရှိသော နယ်ပယ်တစ်ခုဖြစ်သည့် Natural Language Processing သို့လည်း ကျွန်ုပ်ကို ဆွဲဆောင်ခဲ့ပါသည်။

Unite.AI

Llama 3 အကြောင်း သိလိုသမျှ အစွမ်းထက်ဆုံး Open-Source Model သို့တိုင် | အသုံးပြုရန် သဘောတရားများ

ဉာဏ်ရည်တု

Llama 3 အကြောင်း သိလိုသမျှ အစွမ်းထက်ဆုံး Open-Source Model သို့တိုင် | အသုံးပြုရန် သဘောတရားများ

မာတိကာ

Llama ၏ဆင့်ကဲဖြစ်စဉ်- Llama 2 မှ Llama 3

Llama 3- ဗိသုကာနှင့် လေ့ကျင့်ရေး

လေ့ကျင့်ရေးဒေတာနှင့် အတိုင်းအတာ

Instruction Fine-tuning and Performance

တာဝန်ယူမှုရှိသော ဖွံ့ဖြိုးတိုးတက်မှုနှင့် ဘေးကင်းရေးဆိုင်ရာ ထည့်သွင်းစဉ်းစားမှုများ

Llama 3 ကိုဝင်ရောက်ခြင်းနှင့်အသုံးပြုခြင်း။

Llama 3 ကို Scale တွင် အသုံးပြုခြင်း။

Llama 3 အတွက် နောက်တစ်ခုက ဘာလဲ။

ကောက်ချက်

Unite.AI

Llama 3 အကြောင်း သိလိုသမျှ အစွမ်းထက်ဆုံး Open-Source Model သို့တိုင် | အသုံးပြုရန် သဘောတရားများ

မာတိကာ

Llama ၏ဆင့်ကဲဖြစ်စဉ်- Llama 2 မှ Llama 3

Llama 3- ဗိသုကာနှင့် လေ့ကျင့်ရေး

လေ့ကျင့်ရေးဒေတာနှင့် အတိုင်းအတာ

Instruction Fine-tuning and Performance

တာဝန်ယူမှုရှိသော ဖွံ့ဖြိုးတိုးတက်မှုနှင့် ဘေးကင်းရေးဆိုင်ရာ ထည့်သွင်းစဉ်းစားမှုများ

Llama 3 ကိုဝင်ရောက်ခြင်းနှင့်အသုံးပြုခြင်း။

Llama 3 ကို Scale တွင် အသုံးပြုခြင်း။

Llama 3 အတွက် နောက်တစ်ခုက ဘာလဲ။

ကောက်ချက်

သင်ကြိုက်နှစ်သက်စေခြင်းငှါ