ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ

ဉာဏ်ရည်တု

Gemma- Google သည် Open Source မှတဆင့် အဆင့်မြင့် AI စွမ်းရည်များကို ယူဆောင်လာသည်။

mm

Published

 on

Google Open Source LLM Gemma

ဥာဏ်ရည်တု (AI) နယ်ပယ်သည် မကြာသေးမီနှစ်များအတွင်း ကြီးမားသောတိုးတက်မှုကို တွေ့မြင်ရပြီး တိုးတက်မှုများစွာဖြင့် တွန်းအားပေးခဲ့သည်။ နက်ရှိုင်းသောသင်ယူမှု နှင့် သဘာဝဘာသာစကားအပြောင်းအလဲနဲ့ (NLP)။ ဒီတိုးတက်မှုတွေရဲ့ ရှေ့ဆုံးကပါ။ ကြီးမားသောဘာသာစကားမော်ဒယ်များ (LLMs) – လူသားနှင့်တူသော စာသားများကို ဖန်တီးပြီး စကားစမြည်ပြောဆိုခြင်း လုပ်ငန်းများတွင် ပါဝင်နိုင်သည့် များပြားလှသော စာသားဒေတာများကို လေ့ကျင့်သင်ကြားထားသည့် AI စနစ်များ။

Google ၏ PaLM၊ Anthropic's Claude နှင့် DeepMind's Gopher ကဲ့သို့သော LLM များသည် ကုဒ်ရေးခြင်းမှ သာမန်အသိတရားဆိုင်ရာ ကျိုးကြောင်းဆင်ခြင်ခြင်းအထိ ထူးထူးခြားခြား စွမ်းဆောင်ရည်များကို ပြသခဲ့သည်။ သို့သော်၊ ဤမော်ဒယ်အများစုသည် သုတေသန၊ တီထွင်ဖန်တီးမှုနှင့် အကျိုးရှိသောအသုံးချပလီကေးရှင်းများအတွက် ၎င်းတို့၏ဝင်ရောက်ခွင့်ကို ကန့်သတ်ထားသည်။

၎င်းသည် ၎င်းတို့၏ အစွမ်းထက်သော မူပိုင် Gemini မော်ဒယ်များကို အခြေခံ၍ Google ၏ DeepMind မှ LLM မိသားစုဝင်ဖြစ်သော Gemma ၏ မကြာသေးမီက အရင်းအမြစ်ရှာဖွေခြင်းနှင့်အတူ ပြောင်းလဲသွားသည်။ ဤဘလော့ဂ်ပို့စ်တွင်၊ ၎င်း၏ဗိသုကာလက်ရာ၊ လေ့ကျင့်ရေးလုပ်ငန်းစဉ်၊ စွမ်းဆောင်ရည်နှင့် တာဝန်ယူမှုရှိသော ထုတ်ပြန်ချက်များကို ပိုင်းခြားစိတ်ဖြာပြီး Gemma အကြောင်းကို စူးစမ်းလေ့လာပါမည်။

Gemma ၏ခြုံငုံသုံးသပ်ချက်

ဖေဖော်ဝါရီ 2023 တွင် DeepMind open sourced ပါ။ Gemma မော်ဒယ်များ၏ အရွယ်အစား နှစ်ခု - စက်ပေါ်တွင် ဖြန့်ကျက်ခြင်းအတွက် ပြင်ဆင်ထားသည့် 2 ဘီလီယံ ပါရာမီတာ ဗားရှင်း နှင့် GPU/TPU အသုံးပြုမှုအတွက် ဒီဇိုင်းထုတ်ထားသော ပိုကြီးသော 7 ဘီလီယံ ပါရာမီတာ ဗားရှင်း။

Gemma သည် DeepMind ၏ ထိပ်တန်း Gemini မော်ဒယ်များအတွက် အလားတူ transformer-based ဗိသုကာနှင့် လေ့ကျင့်ရေးနည်းစနစ်ကို အသုံးချသည်။ ၎င်းကို ဝဘ်စာရွက်စာတမ်းများ၊ သင်္ချာနှင့် ကုဒ်များမှ စာသားတိုကင် 6 ထရီလီယံအထိ လေ့ကျင့်ထားသည်။

DeepMind သည် Gemma ၏ အကြမ်းထည်ကြိုတင်လေ့ကျင့်ထားသည့် စစ်ဆေးရေးဂိတ်နှစ်ခုစလုံးအပြင် ဆွေးနွေးပွဲ၊ ညွှန်ကြားချက်နောက်လိုက်နှင့် ကုဒ်ရေးခြင်းကဲ့သို့သော နယ်ပယ်များတွင် ပိုမိုကောင်းမွန်အောင်လုပ်ဆောင်နိုင်သော စွမ်းဆောင်ရည်များအတွက် ကြီးကြပ်ထားသော သင်ယူမှုနှင့် လူသားတုံ့ပြန်ချက်တို့ဖြင့် ကောင်းစွာချိန်ညှိထားသော ဗားရှင်းများကို ထုတ်ပြန်ခဲ့သည်။

Gemma နဲ့ စတင်လိုက်ပါ။

Gemma ၏ အဖွင့်ထုတ်ဝေမှုသည် ၎င်း၏အဆင့်မြင့် AI စွမ်းရည်များကို ဆော့ဖ်ဝဲရေးသားသူများ၊ သုတေသီများနှင့် ဝါသနာရှင်များထံ အသုံးပြုနိုင်စေသည်။ ဤသည်မှာ စတင်ရန် အမြန်လမ်းညွှန်ချက်ဖြစ်သည်-

Platform သည် Agnostic Deployment

Gemma ၏ အဓိက အားသာချက်မှာ ၎င်း၏ ပြောင်းလွယ်ပြင်လွယ်ဖြစ်သည် – သင်သည် ၎င်းကို CPUs, GPUs, သို့မဟုတ် TPUs များတွင် သုံးနိုင်သည်။ CPU အတွက်၊ TensorFlow Lite သို့မဟုတ် HuggingFace Transformers ကို အသုံးချပါ။ GPU/TPU တွင် အရှိန်မြှင့်လုပ်ဆောင်မှုအတွက် TensorFlow ကို အသုံးပြုပါ။ Google Cloud ၏ Vertex AI ကဲ့သို့သော Cloud ဝန်ဆောင်မှုများသည် ချောမွေ့စွာ အတိုင်းအတာကို ပံ့ပိုးပေးပါသည်။

ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်များကို ဝင်ရောက်ကြည့်ရှုပါ။

Gemma သည် သင့်လိုအပ်ချက်ပေါ် မူတည်၍ ကြိုတင်လေ့ကျင့်ထားသော ပုံစံကွဲများ ရှိသည်။ 2B နှင့် 7B မော်ဒယ်များသည် ပြင်းထန်သော ထုတ်လုပ်မှုစွမ်းရည်များကို ပေးဆောင်သည်။ စိတ်ကြိုက်ချိန်ညှိခြင်းအတွက်၊ 2B-FT နှင့် 7B-FT မော်ဒယ်များသည် စံပြစမှတ်များဖြစ်သည်။

စိတ်လှုပ်ရှားစရာ အက်ပ်များကို တည်ဆောက်ပါ။

ဇာတ်လမ်းဖန်တီးမှု၊ ဘာသာစကားဘာသာပြန်မှု၊ မေးခွန်းဖြေဆိုခြင်းနှင့် ဖန်တီးမှုအကြောင်းအရာထုတ်လုပ်ခြင်းကဲ့သို့သော Gemma ဖြင့် မတူကွဲပြားသော အပလီကေးရှင်းများကို သင်တည်ဆောက်နိုင်သည်။ အဓိကအချက်မှာ သင်၏ကိုယ်ပိုင်ဒေတာအတွဲများကို ကောင်းစွာချိန်ညှိခြင်းဖြင့် Gemma ၏အားသာချက်များကို အသုံးချခြင်းဖြစ်သည်။

ဗိသုကာအတတ်ပညာ

Gemma သည် multi-query focus နှင့် rotary positional embedding များကဲ့သို့ တိုးတက်မှုအပေါ် တည်ဆောက်ထားသည့် ဒီကုဒ်ဒါ-သီးသန့် transformer ဗိသုကာကို အသုံးပြုသည်-

  • ထရန်စဖော်မာ: 2017 တွင် မိတ်ဆက်ခဲ့သည်၊ အာရုံစူးစိုက်မှု ယန္တရားများကို အခြေခံသည့် Transformer ဗိသုကာလက်ရာသည် NLP တွင် နေရာအနှံ့ဖြစ်လာသည်။ Gemma သည် စာသားတွင် တာဝေးအကွာအဝေး မှီခိုမှုကို ပုံစံထုတ်ရန် ထရန်စဖော်မာ၏ စွမ်းရည်ကို အမွေဆက်ခံသည်။
  • ကုဒ်ဒါဖြင့်သာ- Gemma သည် BART သို့မဟုတ် T5 ကဲ့သို့သော ကုဒ်ကုဒ်ကုဒ်ဒါကုဒ်ဒါမော်ဒယ်များနှင့်မတူဘဲ transformer decoder stack တစ်ခုကိုသာ အသုံးပြုသည်။ ၎င်းသည် စာသားထုတ်လုပ်ခြင်းကဲ့သို့သော လုပ်ငန်းဆောင်တာများအတွက် ခိုင်မာသော မျိုးဆက်ပွားစွမ်းရည်များကို ပေးဆောင်သည်။
  • Multi-query အာရုံစိုက်- Gemma သည် ၎င်း၏ပိုကြီးသောပုံစံတွင် မေးခွန်းပေါင်းများစွာကို အာရုံစူးစိုက်မှုပြုလုပ်ထားပြီး အာရုံစူးစိုက်မှုတစ်ခုစီတွင် မေးခွန်းများစွာကို အပြိုင်ပိုမိုမြန်ဆန်စွာ လုပ်ဆောင်နိုင်စေမည်ဖြစ်သည်။
  • Rotary positional မြှပ်နှံမှုများ- Gemma သည် ပကတိအနေအထားကုဒ်နံပါတ်များအစား rotary embeddings များကို အသုံးပြု၍ တည်နေရာအချက်အလက်ကို ကိုယ်စားပြုသည်။ ဤနည်းပညာသည် တည်နေရာအချက်အလက်ကို ထိန်းသိမ်းထားစဉ် မော်ဒယ်အရွယ်အစားကို လျှော့ချပေးသည်။

Multi-query အာရုံစူးစိုက်မှုနှင့် rotary positional မြှပ်နှံမှုများကဲ့သို့သော နည်းပညာများကို အသုံးပြုခြင်းသည် Gemma မော်ဒယ်များအား စွမ်းဆောင်ရည်၊ အနုမာနအမြန်နှုန်းနှင့် မော်ဒယ်အရွယ်အစားတို့ကြား အကောင်းဆုံးသော ဖလှယ်မှုတစ်ခုသို့ ရောက်ရှိစေပါသည်။

ဒေတာနှင့် လေ့ကျင့်ရေးလုပ်ငန်းစဉ်

Gemma သည် စာသားဒေတာ 6 ထရီလီယံအထိ လေ့ကျင့်သင်ကြားခဲ့သည်။အဓိကအားဖြင့် အင်္ဂလိပ်လို၊ ၎င်းတွင် ဝဘ်စာရွက်စာတမ်းများ၊ သင်္ချာစာသားနှင့် အရင်းအမြစ်ကုဒ်တို့ ပါဝင်သည်။ DeepMind သည် ဒေတာစစ်ထုတ်ခြင်း၊ အဆိပ်အတောက်ဖြစ်စေသော သို့မဟုတ် အန္တရာယ်ရှိသော အကြောင်းအရာများကို အမျိုးအစားခွဲခြင်းနှင့် အသွင်ခွဲခြင်းဆိုင်ရာ အချက်အလက်များကို ဖယ်ရှားခြင်းတွင် သိသာထင်ရှားသော အားထုတ်မှုများကို မြှုပ်နှံထားသည်။

Gemma-5B ကိုလေ့ကျင့်ရန် အသုံးပြုသည့် TPU 4096 အထိဖြင့် Google ၏ TPUv7 အခြေခံအဆောက်အအုံကို အသုံးပြု၍ လေ့ကျင့်မှုကို ပြုလုပ်ခဲ့ပါသည်။ ထိရောက်သော မော်ဒယ်နှင့် ဒေတာအပြိုင် နည်းစနစ်များသည် ကြီးမားသော မော်ဒယ်များကို ကုန်ပစ္စည်း ဟာ့ဒ်ဝဲဖြင့် လေ့ကျင့်ပေးခဲ့သည်။

အဆင့်ဆင့်သော လေ့ကျင့်မှုကို အသုံးပြုပြီး အရည်အသွေးမြင့်၊ သက်ဆိုင်ရာ စာသားများကို အာရုံစိုက်ရန် ဒေတာဖြန့်ဖြူးမှုကို စဉ်ဆက်မပြတ် ချိန်ညှိထားပါသည်။ နောက်ဆုံးအဆင့် ညှိုနှိုင်းမှုအဆင့်များသည် စွမ်းရည်မြှင့်တင်ရန်အတွက် လူမှဖန်တီးထားသော ပေါင်းစပ်မှုနှင့် ပေါင်းစပ်သင်ကြားမှုဆိုင်ရာ ညွှန်ကြားချက်များကို ပေါင်းစပ်အသုံးပြုထားသည်။

မော်ဒယ်လ် စွမ်းဆောင်ရည်

DeepMind သည် မေးခွန်းဖြေဆိုခြင်း၊ ကျိုးကြောင်းဆင်ခြင်ခြင်း၊ သင်္ချာ၊ ကုဒ်ဆွဲခြင်း၊ သာမန်အသိဥာဏ် နှင့် ဆွေးနွေးပြောဆိုခြင်းစွမ်းရည်များ ပါဝင်သော ကျယ်ပြန့်သော စံသတ်မှတ်ချက် 25 ခုကျော်ရှိသော Gemma မော်ဒယ်များကို အကဲဖြတ်ပါသည်။

Gemma သည် စံသတ်မှတ်ချက်အများစုရှိ အရွယ်အစားတူ open source မော်ဒယ်များနှင့် နှိုင်းယှဉ်ပါက ခေတ်မီသောရလဒ်များကို ရရှိသည်။ အချို့သောအချက်များ-

  • သင်္ချာအတတ်ပညာ: Gemma သည် GSM8K နှင့် MATH ကဲ့သို့သော သင်္ချာဆိုင်ရာ ကျိုးကြောင်းဆင်ခြင်ခြင်းဆိုင်ရာ စာမေးပွဲများတွင် ထူးချွန်ပြီး Codex နှင့် Anthropic's Claude ကဲ့သို့ စွမ်းဆောင်ရည် 10 မှတ်ထက် ပိုပါသည်။
  • ကုဒ်: Gemma သည် ကုဒ်အတွက် အထူးလေ့ကျင့်သင်ကြားခြင်း မခံရသော်လည်း MBPP ကဲ့သို့ ပရိုဂရမ်းမင်းစံနှုန်းများတွင် Codex ၏ စွမ်းဆောင်ရည်နှင့် ကိုက်ညီသည် သို့မဟုတ် ကျော်လွန်နေပါသည်။
  • တွေ့ဆုံဆွေးနွေးရေး- Gemma သည် လူသားအကြိုက် စမ်းသပ်မှုများတွင် Anthropic ၏ Mistral-51.7B ထက် 7% အနိုင်ရနှုန်းဖြင့် ခိုင်မာသော စကားပြောဆိုနိုင်စွမ်းကို သရုပ်ပြသည်။
  • ဆင်ခြင်ခြင်း: ARC နှင့် Winogrande ကဲ့သို့ ကောက်ချက်ချရန် လိုအပ်သည့် အလုပ်များတွင် Gemma သည် အခြား 7B မော်ဒယ်များကို 5-10 မှတ်ဖြင့် စွမ်းဆောင်နိုင်သည်။

Gemma ၏ နယ်ပယ်စုံတွင် ဘက်စုံသုံးနိုင်မှုသည် ၎င်း၏ ပြင်းထန်သော အထွေထွေထောက်လှမ်းရေးစွမ်းရည်ကို ပြသသည်။ လူသားအဆင့် စွမ်းဆောင်ရည်နှင့် ကွာဟချက်များ ရှိနေသော်လည်း၊ Gemma သည် open source NLP တွင် ရှေ့သို့ ခုန်တက်ခြင်းကို ကိုယ်စားပြုသည်။

ဘေးကင်းရေးနှင့် တာဝန်ကျေမှု

မော်ဒယ်ကြီးများ၏ ပွင့်လင်းရင်းမြစ်အလေးများကို ထုတ်လွှတ်ခြင်းသည် ရည်ရွယ်ချက်ရှိရှိ အလွဲသုံးစားမှုနှင့် မွေးရာပါ မော်ဒယ်ဘက်လိုက်မှုများအတွက် စိန်ခေါ်မှုများကို မိတ်ဆက်ပေးသည်။ DeepMind သည် အန္တရာယ်များကို လျော့ပါးစေရန် ခြေလှမ်းများကို လုပ်ဆောင်ခဲ့သည်-

  • ဒေတာစစ်ထုတ်ခြင်း- ဖြစ်နိုင်ချေရှိသော အဆိပ်အတောက်ဖြစ်စေသော၊ တရားမဝင် သို့မဟုတ် ဘက်လိုက်သောစာသားများကို အမျိုးအစားခွဲခွဲခြားမှုများနှင့် heuristics များအသုံးပြု၍ လေ့ကျင့်ရေးဒေတာမှ ဖယ်ရှားခဲ့သည်။
  • အဆင့်သတ်မှတ်ချက်များ: Gemma သည် ဘေးကင်းမှု၊ တရားမျှတမှုနှင့် ကြံ့ခိုင်မှုတို့ကို အကဲဖြတ်ရန် ရွေးချယ်ထားသော စံသတ်မှတ်ချက် 30+ တွင် စမ်းသပ်ထားသည်။ ၎င်းသည် အခြားမော်ဒယ်များနှင့် ကိုက်ညီသည် သို့မဟုတ် ကျော်လွန်သွားပါသည်။
  • ကောင်းမွန်စွာဖမ်းနိုင်သော: အချက်အလက်စစ်ထုတ်ခြင်းနှင့် သင့်လျော်သော ကာကွယ်တားဆီးခြင်း/ငြင်းဆိုခြင်းအပြုအမူများကဲ့သို့ ဘေးကင်းရေးစွမ်းရည်များ တိုးတက်ကောင်းမွန်လာစေရန် မော်ဒယ်အား ချိန်ညှိခြင်းအား အာရုံစိုက်ထားသည်။
  • သတ်မှတ်ချက်များ: Gemma မော်ဒယ်များကို ရိုင်းစိုင်းသော၊ တရားမဝင်သော သို့မဟုတ် သိက္ခာမဲ့သော အသုံးချမှုများကို တားမြစ်ထားသည်။ သို့သော်လည်း ဥပဒေစိုးမိုးရေးမှာ စိန်ခေါ်မှုရှိနေဆဲဖြစ်သည်။
  • မော်ဒယ်ကတ်များ ပွင့်လင်းမြင်သာမှုကို မြှင့်တင်ရန်အတွက် မော်ဒယ်စွမ်းရည်များ၊ ကန့်သတ်ချက်များနှင့် ဘက်လိုက်မှုများကို အသေးစိတ်ဖော်ပြသည့် ကတ်များကို ထုတ်ဝေခဲ့သည်။

ပွင့်လင်းသောအရင်းအမြစ်မှအန္တရာယ်များရှိနေသော်လည်း DeepMind မှ Gemma ၏ထုတ်ပြန်မှုသည် ၎င်း၏ဘေးကင်းလုံခြုံရေးပရိုဖိုင်နှင့် သုတေသနပြုနိုင်မှုအပေါ်အခြေခံ၍ အသားတင်လူမှုအကျိုးပြုအကျိုးခံစားခွင့်များကိုပေးဆောင်သည်ဟု DeepMind မှဆုံးဖြတ်ခဲ့သည်။ သို့သော်လည်း ဖြစ်နိုင်ချေရှိသော အန္တရာယ်များကို သတိထားစောင့်ကြည့်ခြင်းသည် အရေးကြီးပါသည်။

AI ဆန်းသစ်တီထွင်မှု၏ Next Wave ကိုဖွင့်ခြင်း။

Gemma ကို open source မော်ဒယ်မိသားစုအဖြစ် ထုတ်ဝေခြင်းသည် AI အသိုက်အဝန်းတစ်လျှောက် တိုးတက်မှုကို လော့ခ်ဖွင့်ရန် ရပ်တည်သည်-

  • Accessibility: Gemma သည် ၎င်းတို့၏ကိုယ်ပိုင် LLMs များကို လေ့ကျင့်သင်ကြားရန်အတွက် ယခင်က မြင့်မားသော ကွန်ပျူတာ/ဒေတာ ကုန်ကျစရိတ်များကို ရင်ဆိုင်ခဲ့ရသည့် ခေတ်မီ NLP ဖြင့် တည်ဆောက်ရန် အဖွဲ့အစည်းများအတွက် အတားအဆီးများကို လျှော့ချပေးသည်။
  • နယူး applications များ: ကြိုတင်လေ့ကျင့်ထားသော နှင့် ပြင်ဆင်ထားသော စစ်ဆေးရေးဂိတ်များကို အခမဲ့ရှာဖွေခြင်းဖြင့်၊ DeepMind သည် ပညာရေး၊ သိပ္ပံနှင့် ဝင်ရောက်နိုင်မှုကဲ့သို့သော နယ်ပယ်များတွင် အကျိုးပြုအက်ပ်များကို ပိုမိုလွယ်ကူစွာ ဖွံ့ဖြိုးတိုးတက်စေပါသည်။
  • customization: developer များသည် လုပ်ငန်းဆိုင်ရာ သို့မဟုတ် ဒိုမိန်းဆိုင်ရာ သီးသန့်အက်ပ်လီကေးရှင်းများအတွက် Gemma ကို သီးသန့်ဒေတာများကို ဆက်လက်လေ့ကျင့်ခြင်းဖြင့် စိတ်ကြိုက်ပြင်ဆင်နိုင်သည်။
  • သုတေသန: Gemma ကဲ့သို့ ပွင့်လင်းသော မော်ဒယ်များသည် လက်ရှိ NLP စနစ်များကို စစ်ဆေးခြင်း နှင့် အနာဂတ် သုတေသန လမ်းညွှန်ချက်များကို တောက်ပစေပါသည်။
  • ဆန်းသစ်တီထွင်မှု: Gemma ကဲ့သို့ ခိုင်မာသော အခြေခံမော်ဒယ်များ ရရှိနိုင်မှုသည် ဘက်လိုက်မှု လျော့ပါးစေရေး၊ အဖြစ်မှန်နှင့် AI ဘေးကင်းရေး ကဲ့သို့သော နယ်ပယ်များတွင် တိုးတက်မှုကို အရှိန်မြှင့်ပေးမည်ဖြစ်သည်။

Gemma ၏ စွမ်းရည်များကို ပွင့်လင်းသော ရင်းမြစ်များဖြင့် ပံ့ပိုးပေးခြင်းဖြင့်၊ DeepMind သည် လူမှုဆက်ဆံရေး ကောင်းမွန်မှုအတွက် AI ၏ တာဝန်သိမှု ဖွံ့ဖြိုးတိုးတက်မှုကို တွန်းအားပေးရန် မျှော်လင့်ပါသည်။

ရှေ့ကိုအဆိုပါလမ်းမ

AI တွင် ခုန်တက်လိုက်တိုင်း၊ ကျွန်ုပ်တို့သည် နယ်ပယ်အားလုံးတွင် လူသားဉာဏ်ရည်ထက်မြက်သည့် ပြိုင်ဘက် သို့မဟုတ် ပြိုင်ဘက်ထက်ကျော်လွန်သော မော်ဒယ်များဆီသို့ ပိုမိုနီးကပ်စွာ ချဉ်းကပ်သွားပါသည်။ Gemma ကဲ့သို့သော စနစ်များသည် မိမိကိုယ်ကို ကြီးကြပ်ကွပ်ကဲသည့် မော်ဒယ်များတွင် လျင်မြန်စွာ တိုးတက်လာသည်ကို အမှတ်အသားပြုကာ ပိုမိုအဆင့်မြင့်သော သိမြင်နိုင်စွမ်းများကို ဖွင့်ပေးပါသည်။

သို့သော်၊ လူသားဉာဏ်ရည်သည် အထွတ်အထိပ် စိုးမိုးနေဆဲဖြစ်သည့် AI ၏ ယုံကြည်စိတ်ချရမှု၊ အဓိပ္ပာယ်ဖွင့်ဆိုမှုနှင့် ထိန်းချုပ်နိုင်မှုတို့ကို မြှင့်တင်ရန် လုပ်ဆောင်နေဆဲဖြစ်သည်။ သင်္ချာပညာကဲ့သို့ ဒိုမိန်းများသည် ခန့်မှန်းခြေ 64% လူသားစွမ်းဆောင်ရည်နှင့် နှိုင်းယှဉ်ပါက Gemma က MMLU တွင် 89% ရမှတ်ဖြင့် ရမှတ်ဖြင့် ဆက်လက်တည်ရှိနေပါသည်။

ယခင်ကထက် ပိုမိုစွမ်းဆောင်နိုင်သော AI စနစ်များ၏ ဘေးကင်းမှုနှင့် ကျင့်ဝတ်များကို သေချာစေခြင်းဖြင့် အဆိုပါကွက်လပ်များကို ပိတ်လိုက်ခြင်းသည် လာမည့်နှစ်များတွင် အဓိကစိန်ခေါ်မှုများ ဖြစ်လာမည်ဖြစ်သည်။ DeepMind သည် ပေါ်ပေါက်လာသော အန္တရာယ်များကို စီမံခန့်ခွဲရာတွင် AI ၏ အကျိုးကျေးဇူးများကို ဒီမိုကရေစီရရှိရန် ရည်မှန်းထားသောကြောင့် ပွင့်လင်းမှုနှင့် သတိထားမှုကြား မှန်ကန်သော ချိန်ခွင်လျှာကို ချိန်ညှိခြင်းသည် အရေးကြီးပါသည်။

Dario Amodei ၏ ANC၊ DeepMind's Ethics & Society အဖွဲ့၊ နှင့် Anthropic ၏ ဖွဲ့စည်းပုံအခြေခံဥပဒေဆိုင်ရာ AI ကဲ့သို့သော AI ဘေးကင်းမှုကို မြှင့်တင်ရန် အစပျိုးမှုများသည် ဤလိုအပ်ချက်ကို အသိအမှတ်ပြုမှု တိုးလာကြောင်း အချက်ပြသည်။ အဓိပ္ပာယ်ပြည့်ဝသော တိုးတက်မှုသည် သုတေသီများ၊ တီထွင်သူများ၊ မူဝါဒချမှတ်သူများနှင့် အများပြည်သူတို့အကြား ပွင့်လင်းမြင်သာသော အထောက်အထားအခြေပြု ဆွေးနွေးမှု လိုအပ်မည်ဖြစ်သည်။

တာဝန်သိစွာသွားလာပါက Gemma သည် AI ၏ထိပ်သီးအစည်းအဝေးကိုကိုယ်စားပြုသည်မဟုတ်ဘဲ DeepMind ၏ခြေရာကိုလိုက်လျှောက်လိုက်သော AI မျိုးဆက်သစ်များအတွက် အခြေခံစခန်းတစ်ခုဖြစ်သည်။

ကောက်ချက်

DeepMind ၏ Gemma မော်ဒယ်များ ထုတ်ဝေမှုသည် ကျဉ်းမြောင်းသော စံနှုန်းများကို ယေဘုယျ ထောက်လှမ်းရေးစွမ်းရည်များအဖြစ်သို့ ကျော်လွှားနိုင်သော open source AI အတွက် ခေတ်သစ်ကို ဆိုလိုပါသည်။ ဘေးကင်းပြီး ကျယ်ကျယ်ပြန့်ပြန့် လက်လှမ်းမီနိုင်စေရန်အတွက် အကျယ်တဝင့် စမ်းသပ်ထားသည့် Gemma သည် AI တွင် တာဝန်ရှိသော ပွင့်လင်းသော အရင်းအမြစ်ရှာဖွေခြင်းအတွက် စံအသစ်တစ်ခုကို သတ်မှတ်သည်။

သမဝါယမတန်ဖိုးများနှင့်အတူ ပြိုင်ဆိုင်မှုရှိသောစိတ်ဓာတ်ဖြင့် Gemma ကဲ့သို့သော အောင်မြင်မှုများကို မျှဝေခြင်းသည် AI ဂေဟစနစ်အတွင်းရှိ လှေအားလုံးကို မြှင့်တင်ပေးပါသည်။ ယခုအခါ အသိုက်အဝန်းတစ်ခုလုံးသည် ၎င်းတို့၏ အစပျိုးမှုများကို မောင်းနှင်ရန် သို့မဟုတ် ပံ့ပိုးရန် စွယ်စုံရ LLM မိသားစုသို့ ဝင်ရောက်နိုင်ပြီဖြစ်သည်။

အန္တရာယ်များရှိနေသော်လည်း DeepMind ၏နည်းပညာနှင့်ကျင့်ဝတ်ဆိုင်ရာလုံ့လဝီရိယသည် Gemma ၏အကျိုးကျေးဇူးများသည်၎င်း၏ဖြစ်နိုင်သောအန္တရာယ်များထက်သာလွန်ကြောင်းယုံကြည်မှုပေးပါသည်။ AI စွမ်းရည်များ ပိုမိုအဆင့်မြင့်လာသည်နှင့်အမျှ ပွင့်လင်းမှုနှင့် သတိထားမှုကြားတွင် ဤထူးခြားချက်ကို ထိန်းသိမ်းထားရန် အရေးကြီးပါသည်။

Gemma သည် လူသားအားလုံးကို အကျိုးပြုသည့် AI နှင့် ပိုမိုနီးကပ်စွာ ခြေတစ်လှမ်းလှမ်းယူသည်။ ဒါပေမယ့် ကောင်းမွန်တဲ့ အထွေထွေ ဉာဏ်ရည်တုကို လျှောက်လှမ်းဖို့ ကြီးမားတဲ့ စိန်ခေါ်မှုများစွာကို စောင့်မျှော်နေဆဲပါ။ AI သုတေသီများ၊ ဆော့ဖ်ဝဲရေးသားသူများနှင့် လူ့အဖွဲ့အစည်းကြီးများက ပူးပေါင်းဆောင်ရွက်မှုတိုးတက်မှုကို ထိန်းသိမ်းထားနိုင်လျှင် Gemma သည် နောက်ဆုံးထိပ်သီးအစည်းအဝေးထက် တစ်နေ့တွင် သမိုင်းဝင်အခြေစိုက်စခန်းတစ်ခုအဖြစ် မြင်လာနိုင်သည်။

လွန်ခဲ့သည့်ငါးနှစ်တာကာလအတွင်း ကျွန်ုပ်သည် စွဲမက်ဖွယ်ကောင်းသော Machine Learning နှင့် Deep Learning ၏ကမ္ဘာကြီးတွင် ကိုယ့်ကိုယ်ကို နှစ်မြှုပ်နေခဲ့သည်။ ကျွန်ုပ်၏စိတ်အားထက်သန်မှုနှင့် ကျွမ်းကျင်မှုသည် AI/ML ကို အထူးအာရုံစိုက်ခြင်းဖြင့် ကွဲပြားသောဆော့ဖ်ဝဲလ်အင်ဂျင်နီယာပရောဂျက် 50 ကျော်တွင် ပါဝင်ကူညီနိုင်စေခဲ့သည်။ ဆက်လက်လေ့လာစူးစမ်းလိုစိတ်ပြင်းပြသော ကျွန်ုပ်၏စိတ်အားထက်သန်မှုရှိသော နယ်ပယ်တစ်ခုဖြစ်သည့် Natural Language Processing သို့လည်း ကျွန်ုပ်ကို ဆွဲဆောင်ခဲ့ပါသည်။