- ဝေါဟာရပညာ (A မှ D)
- AI စွမ်းရည်ထိန်းချုပ်မှု
- AI Ops
- အယ်လ်ဘမ်များ
- ပိုင်ဆိုင်မှု စွမ်းဆောင်ရည်
- အော်တိုကုဒ်ဒါ
- နောက်ကြောင်းပြန်ထွက်လာပါတယ်။
- Bayes သီအိုရီ
- Big Data
- Chatbot- စတင်သူလမ်းညွှန်
- ကွန်ပျူတာစဉ်းစားတွေးခေါ်
- ကွန်ပျူတာ Vision ၏
- ရှုပ်ထွေးမှု Matrix
- Convolutional အာရုံကြောကွန်ယက်များ
- ဆိုက်ဘာလုံခြုံရေး
- Data Fabric
- ဒေတာပုံပြင်ပြောခြင်း။
- ဒေတာကိုသိပ္ပံ
- ဒေတာသိုလှောင်ခြင်း
- ဆုံးဖြတ်ချက်ပင်
- Deepfakes
- နက်ရှိုင်းသောသင်ယူခြင်း
- နက်ရှိုင်းသောအားဖြည့်သင်ယူမှု
- Devops
- DevSecOps
- ပျံ့နှံ့မှုပုံစံများ
- ဒစ်ဂျစ်တယ်အမွှာ
- Dimensionality လျှော့ချရေး
- အသုံးအနှုန်း (E to K)
- အနားသတ် AI
- စိတ်ခံစားမှု AI
- စုစည်းသင်ယူမှု
- ကျင့်ဝတ်ဆိုင်ရာ Hacking
- ETL
- ရှင်းပြနိုင်သော AI
- ဖက်ဒရယ်သင်ယူမှု
- FinOps
- Generative AI ဖြစ်သည်
- မျိုးရိုးဗီဇဆန့်ကျင်ကွန်ယက်
- Generative vs. ခွဲခြားဆက်ဆံမှု
- Gradient မြှင့်တင်ခြင်း။
- Gradient အဆင်း
- ရိုက်ချက်အနည်းငယ်သာ သင်ယူပါ။
- Image ကိုအမျိုးအစားခွဲခြား
- အိုင်တီလုပ်ငန်းများ (ITOPs)
- Incident Automation
- အင်ဂျင်နီယာသြဇာ
- K-Means Clustering
- K-အနီးဆုံးအိမ်နီးချင်းများ
- ဝေါဟာရ (L မှ Q)
- အသုံးအနှုန်း (R မှ Z)
- အားဖြည့်သင်ယူခြင်း
- တာဝန်ရှိ AI
- RLHF
- စက်ရုပ်လုပ်ငန်းစဉ်အလိုအလျောက်
- Structured vs Unstructured
- စိတ်ဓါတ်ခွဲခြမ်းစိတ်ဖြာ
- ကြီးကြပ်သူနှင့် ကြီးကြပ်မထားသော
- ပံ့ပိုးမှု Vector Machines
- Synthetic Data များ
- Synthetic Media
- စာသားခွဲခြား
- TinyML
- လွှဲပြောင်းသင်ယူခြင်း။
- Transformer Neural Networks များ
- Turing စမ်းသပ်မှု
- Vector Similarity ရှာဖွေမှု
AI ၅၀
Structured vs Unstructured Data
မာတိကာ
ဖွဲ့စည်းပုံမရှိသောဒေတာ ဒေတာဆိုသည်မှာ ကြိုတင်သတ်မှတ်ထားသော ပုံစံဖြင့် မဖွဲ့စည်းထားခြင်း သို့မဟုတ် တိကျသောဒေတာပုံစံတစ်ခု ချို့တဲ့ခြင်းဖြစ်ပါသည်။ ဗကသ၊ စနစ်တကျဒေတာ ဒေတာဆိုသည်မှာ ၎င်းတွင်ပါရှိသော ကြိုတင်သတ်မှတ်ထားသောပုံစံဖြင့် ဒေတာအချက်များကြားတွင် ရှင်းလင်းပြတ်သားနိုင်သော ဆက်ဆံရေးရှိသည်။ အဲဒါက ဖွဲ့စည်းတည်ဆောက်ပုံနဲ့ ဖွဲ့စည်းပုံမထားတဲ့ ဒေတာတို့ရဲ့ ခြားနားချက်အတွက် အတိုချုံးအဖြေပဲ၊ ဒါပေမယ့် ဒေတာ အမျိုးအစား နှစ်ခုကြားက ကွာခြားချက်ကို အနီးကပ် လေ့လာကြည့်ရအောင်။
Structured Data ဆိုတာ ဘာလဲ။
ကွန်ပြူတာသိပ္ပံနှင့်ပတ်သက်လာလျှင် ဒေတာတည်ဆောက်ပုံများသည် ဒေတာသိမ်းဆည်းခြင်းနှင့် စုစည်းခြင်းဆိုင်ရာ သီးခြားနည်းလမ်းများကို ရည်ညွှန်းသည်။ မတူညီသော ဒေတာဖွဲ့စည်းပုံများသည် ဒေတာအချက်များကြားတွင် မတူညီသော ဆက်နွယ်မှုများရှိသော်လည်း ဒေတာကိုလည်း တည်ဆောက်ပုံမဖော်နိုင်ပါ။ ဒေတာကို ဖွဲ့စည်းတည်ဆောက်ထားသည်ဟု ဆိုလိုခြင်းမှာ အဘယ်နည်း။ ဤအဓိပ္ပါယ်ဖွင့်ဆိုချက်ကို ပိုမိုရှင်းလင်းစေရန်၊ ဒေတာဖွဲ့စည်းပုံတည်ဆောက်ပုံနည်းလမ်းအချို့ကို လေ့လာကြည့်ကြပါစို့။
ဖွဲ့စည်းတည်ဆောက်ပုံဒေတာကို Excel ဖိုင်များ သို့မဟုတ် ဇယားများတွင် သိမ်းဆည်းလေ့ရှိသည်။ SQL ဒေတာဘေ့စ်များ။ ဤကိစ္စများတွင်၊ ဒေတာ၏အတန်းများနှင့် ကော်လံများသည် မတူညီသော ကိန်းရှင်များ သို့မဟုတ် အင်္ဂါရပ်များကို ကိုင်ဆောင်ထားပြီး မည်သည့်နေရာတွင် ဒေတာအတန်းများနှင့် ကော်လံများ ဖြတ်သည်ကို စစ်ကြည့်ခြင်းဖြင့် ဒေတာအမှတ်များကြား ဆက်စပ်မှုကို ပိုင်းခြားသိရှိနိုင်ပေသည်။ ဖွဲ့စည်းတည်ဆောက်ထားသော ဒေတာသည် ဆက်စပ်ဒေတာဘေ့စ်တစ်ခုတွင် အလွယ်တကူ အံဝင်ခွင်ကျဖြစ်နိုင်ပြီး ဖွဲ့စည်းတည်ဆောက်ထားသည့် ဒေတာအတွဲတစ်ခုတွင် မတူညီသော အင်္ဂါရပ်များ ဥပမာများသည် အမည်များ၊ လိပ်စာများ၊ ရက်စွဲများ၊ မိုးလေဝသစာရင်းအင်းများ၊ ခရက်ဒစ်ကတ်နံပါတ်များ အစရှိသည်တို့ ပါဝင်နိုင်သည်။ ဖွဲ့စည်းပုံဒေတာသည် များသောအားဖြင့် စာသားဒေတာများဖြစ်သော်လည်း၊ ရုပ်ပုံများနှင့် အသံကဲ့သို့သော အရာများကို စနစ်တကျ ဒေတာအဖြစ် သိမ်းဆည်းထားနိုင်သည်။
အာရုံခံကိရိယာများ၊ ဝဘ်လော့ဂ်များ၊ ကွန်ရက်ဒေတာနှင့် လက်လီရောင်းချခြင်း သို့မဟုတ် e-commerce ဒေတာများကဲ့သို့သော အရာများကဲ့သို့ ဒေတာဖွဲ့စည်းပုံတည်ဆောက်ပုံ၏ ဘုံအရင်းအမြစ်များ ပါဝင်သည်။ ကွန်ပျူတာများနှင့် အခြားစက်ပစ္စည်းများမှ စုဆောင်းထားသော အချက်အလက်များဖြင့် စာရင်းဇယားများ သို့မဟုတ် ဒေတာဘေ့စ်များကို ဖြည့်ထားသူများကလည်း ဖွဲ့စည်းတည်ဆောက်ပုံဒေတာကို ထုတ်ပေးနိုင်သည်။ ဥပမာအားဖြင့်၊ အွန်လိုင်းဖောင်များမှ စုဆောင်းထားသော ဒေတာများကို ဒေတာဖွဲ့စည်းပုံတစ်ခုသို့ ချက်ချင်း ပေးပို့လေ့ရှိသည်။
ဖွဲ့စည်းတည်ဆောက်ထားသော ဒေတာကို သိမ်းဆည်းခြင်း၏ ရှည်လျားသောသမိုင်းကြောင်းရှိသည်။ relational databases ကို နှင့် SQL ။ ဤဖော်မတ်များတွင် စာဖတ်ခြင်းနှင့် စာရေးရလွယ်ကူခြင်းတို့ကြောင့် ဤသိုလှောင်မှုနည်းလမ်းများသည် လူကြိုက်များပြီး ပလက်ဖောင်းများနှင့် ဘာသာစကားအများစုသည် အဆိုပါဒေတာဖော်မတ်များကို အနက်ပြန်ဆိုနိုင်သောကြောင့်ဖြစ်သည်။
စက်သင်ယူမှုအခြေအနေတွင်၊ စနစ်ကျသောဒေတာသည် စက်သင်ယူမှုစနစ်အား လေ့ကျင့်ရန်ပိုမိုလွယ်ကူသည်၊ အဘယ်ကြောင့်ဆိုသော် ဒေတာအတွင်းရှိပုံစံများသည် ပိုမိုရှင်းလင်းပြတ်သားသောကြောင့်ဖြစ်သည်။ အချို့သောအင်္ဂါရပ်များကို machine learning classifier တွင် ထည့်သွင်းနိုင်ပြီး ရွေးချယ်ထားသော အင်္ဂါရပ်များအပေါ်အခြေခံ၍ အခြားဒေတာဖြစ်ရပ်များကို အညွှန်းတပ်ရန် အသုံးပြုနိုင်သည်။ ဆန့်ကျင်ဘက်အနေနှင့်၊ ဖွဲ့စည်းတည်ဆောက်ပုံမထားသော အချက်အလက်ဆိုင်ရာ စက်သင်ယူမှုစနစ်တစ်ခုကို လေ့ကျင့်ခြင်းသည် ပိုမိုရှင်းလင်းလာမည့် အကြောင်းရင်းများကြောင့် ပိုမိုခက်ခဲပါသည်။
Unstructured Data ဆိုတာ ဘာလဲ။
Unstructured data သည် ကြိုတင်သတ်မှတ်ထားသော data model သို့မဟုတ် ဖွဲ့စည်းပုံအရ စုစည်းထားခြင်းမဟုတ်သော ဒေတာဖြစ်သည်။ ဖွဲ့စည်းတည်ဆောက်ပုံမရှိသောဒေတာကို အရည်အသွေးကောင်းမွန်သောဒေတာဟု မကြာခဏခေါ်ဝေါ်လေ့ရှိပြီး ၎င်းအား တည်ဆောက်ပုံဒေတာအတွက်အသုံးပြုသည့် ပုံမှန်နည်းလမ်းများကိုအသုံးပြု၍ သမားရိုးကျနည်းလမ်းများဖြင့် ခွဲခြမ်းစိတ်ဖြာခြင်း သို့မဟုတ် လုပ်ဆောင်ခြင်းမပြုနိုင်သောကြောင့်ဖြစ်သည်။
ဖွဲ့စည်းပုံမရှိသောဒေတာသည် ဒေတာအချက်များကြားတွင် သတ်မှတ်ထားသော ဆက်ဆံရေးများမရှိသောကြောင့်၊ ၎င်းကို ဆက်စပ်ဒေတာဘေ့စ်များတွင် စုစည်း၍မရပါ။ ဆန့်ကျင်ဘက်အနေနှင့်၊ ဖွဲ့စည်းပုံမထားသောဒေတာကို သိမ်းဆည်းသည့်နည်းလမ်းမှာ ပုံမှန်အားဖြင့်ဖြစ်သည်။ NoSQL ဒေတာဘေ့စ်သို့မဟုတ် ဆက်နွယ်မှုမရှိသော ဒေတာဘေ့စ်။ ဒေတာဘေ့စ်၏ဖွဲ့စည်းပုံသည် အနည်းငယ်စိုးရိမ်ရပါက၊ data lake သို့မဟုတ် unstructured data အစုအဝေးကြီးတစ်ခုသည် NoSQL database အစား data ကိုသိမ်းဆည်းရန်အတွက်အသုံးပြုနိုင်ပါသည်။
ဖွဲ့စည်းတည်ဆောက်ပုံမရှိသောဒေတာသည် ခွဲခြမ်းစိတ်ဖြာရန် ခက်ခဲပြီး မဖွဲ့စည်းထားသောဒေတာကို နားလည်သဘောပေါက်ခြင်းသည် ဖြစ်နိုင်ချေရှိသောအင်္ဂါရပ်များကိုပိုင်းခြားသိရှိရန် ဒေတာအပိုင်းပိုင်းတစ်ခုချင်းစီကို စစ်ဆေးခြင်းနှင့် ရေကူးကန်အတွင်းရှိ အခြားဒေတာအပိုင်းများတွင် ယင်းအင်္ဂါရပ်များဖြစ်ပေါ်ခြင်းရှိ၊
ဒေတာအများစုသည် အစီအစဥ်မရှိသော ဖော်မတ်များဖြင့် ရှိနေကြပြီး၊ ဖွဲ့စည်းပုံမထားသောဒေတာသည် ဒေတာအားလုံး၏ 80% ဝန်းကျင်တွင် ပါဝင်သည်ဟု ခန့်မှန်းထားသည်။ ဒေတာကို တည်ဆောက်ရာတွင် အထောက်အကူဖြစ်စေရန် ဒေတာတူးဖော်ခြင်းနည်းပညာကို အသုံးပြုနိုင်သည်။
စက်သင်ယူမှုနှင့်ပတ်သက်၍၊ အချို့သောနည်းပညာများသည် ဖွဲ့စည်းတည်ဆောက်ပုံမထားသောဒေတာကို စီစဥ်ပြီး ၎င်းကို ဖွဲ့စည်းတည်ဆောက်ထားသည့်ဒေတာအဖြစ်သို့ ပြောင်းလဲရန် ကူညီပေးနိုင်ပါသည်။ ဖွဲ့စည်းပုံမရှိသောဒေတာကို ဖွဲ့စည်းတည်ဆောက်ထားသည့်ဒေတာအဖြစ်သို့ ပြောင်းလဲရန်အတွက် လူကြိုက်များသောကိရိယာမှာ autoencoder ဟုခေါ်သော စနစ်တစ်ခုဖြစ်သည်။
ဘလော့ဂါနှင့် ပရိုဂရမ်မာများအတွက် အထူးပြုပါ။ စက်သင်ယူ နှင့် နက်ရှိုင်းသောသင်ယူခြင်း အကြောင်းအရာများ လူမှုဆက်ဆံရေးကောင်းမွန်ရန်အတွက် AI ၏စွမ်းအားကို အခြားသူများအား ကူညီပေးနိုင်ရန် Daniel က မျှော်လင့်ထားသည်။