ဆောင်းပါးတို ခေါ်ဆိုမှုစင်တာ စကားဝိုင်းများအတွက် AI အခြေခံ လိမ်ညာသည့် ကိရိယာတစ်ခု - Unite.AI
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ

ဉာဏ်ရည်တု

Call Center စကားဝိုင်းများအတွက် AI-အခြေခံ လိမ်ညာသည့်ကိရိယာ

mm
နောက်ဆုံးရေးသားချိန် on

ဂျာမနီရှိ သုတေသီများသည် ဖုန်းခေါ်ဆိုမှုစင်တာနှင့် ပံ့ပိုးရေးဝန်ထမ်းများနှင့် အော်ဒီယိုဆက်သွယ်မှုတွင် သုံးစွဲသူများအတွက် AI-အခြေခံလိမ်ညာသည့်ကိရိယာအဖြစ် လုပ်ဆောင်ရန် အဓိကရည်ရွယ်သည့် အသံပိုင်းခြားစိတ်ဖြာမှုစနစ်တစ်ခု ဖန်တီးရန် စက်သင်ယူမှုကို အသုံးပြုခဲ့သည်။

အဆိုပါ စံနစ် သေဒဏ်နှင့် ကျူရှင်ခများ၏ အကျင့်စာရိတ္တဆိုင်ရာ အကျင့်စာရိတ္တနှင့် ကျူရှင်ခများ အပါအဝင် အငြင်းပွားဖွယ်ရာ အကြောင်းအရာများ ငြင်းခုံမှုများအတွင်း ကျောင်းသားများနှင့် ဆရာ ၄၀ မှ အထူးဖန်တီးထားသည့် အသံမှတ်တမ်းများကို အသုံးပြုသည်။ မော်ဒယ်သည် Convolutional Neural Networks (CNNs) နှင့် Long-Term Memory (LSTM) ကိုအသုံးပြုသည့် ဗိသုကာပညာအပေါ် လေ့ကျင့်သင်ကြားခဲ့ပြီး တိကျမှုနှုန်း 40% ရရှိခဲ့သည်။

အလုပ်၏ဖော်ပြထားသောရည်ရွယ်ချက်သည် ဖောက်သည်ဆက်သွယ်မှုများကို ကိုးကားဖော်ပြသော်လည်း ၎င်းသည် ယေဘူယျရည်ရွယ်ချက်ဖြင့် လိမ်လည်ထောက်လှမ်းသည့်ကိရိယာအဖြစ် ထိထိရောက်ရောက်လုပ်ဆောင်ကြောင်း သုတေသီများက ဝန်ခံသည်-

'တွေ့ရှိချက်များသည် ကျယ်ပြန့်သော ဝန်ဆောင်မှုလုပ်ငန်းစဉ်များနှင့် သက်ဆိုင်ပြီး တယ်လီဖုန်းမှတစ်ဆင့် ဖောက်သည် အပြန်အလှန်တုံ့ပြန်မှုအားလုံးအတွက် အထူးအသုံးဝင်ပါသည်။ တင်ပြထားသည့် အယ်လဂိုရီသမ်ကို အေးဂျင့်က ဖောက်သည်က သူ/သူ၏ခံယူချက်ကို ပြောဆိုနေခြင်းရှိမရှိ သိရန် အထောက်အကူဖြစ်စေသည့် မည်သည့်အခြေအနေတွင်မဆို အသုံးချနိုင်သည်။

'ဥပမာ၊ ၎င်းသည် သံသယဖြစ်ဖွယ်အာမခံတောင်းဆိုမှုများ လျော့ကျစေခြင်း သို့မဟုတ် အလုပ်အင်တာဗျူးများတွင် မမှန်သောထုတ်ပြန်ချက်များ ဖြစ်ပေါ်စေနိုင်သည်။ ယင်းက ဝန်ဆောင်မှုကုမ္ပဏီများအတွက် လုပ်ငန်းလည်ပတ်မှုဆုံးရှုံးမှုကို လျှော့ချရုံသာမက ဖောက်သည်များအား ပိုမိုသစ္စာရှိစေရန်လည်း အားပေးသည်။'

Dataset မျိုးဆက်

ဂျာမန်ဘာသာစကားဖြင့် သင့်လျော်သော အများသူငှာရရှိနိုင်သည့် ဒေတာအတွဲတစ်ခုမရှိသောအခါ၊ Neu-Ulm University of Applied Sciences (HNU) မှ သုတေသီများသည် ၎င်းတို့၏ကိုယ်ပိုင်အရင်းအမြစ်ကို ဖန်တီးခဲ့သည်။ အနိမ့်ဆုံး အသက် 40 နှစ်ရှိ စေတနာ့ဝန်ထမ်း ၄၀ ကို တက္ကသိုလ်နှင့် ဒေသဆိုင်ရာ ကျောင်းများတွင် လွှင့်တင်ထားသည်။ စေတနာ့ဝန်ထမ်းများကို 16 ယူရို Amazon ဘောက်ချာဖြင့် ပေးချေခဲ့သည်။

ဆွေးနွေးပွဲများသည် ထင်မြင်ယူဆချက်များကို ကွဲပြားစေပြီး မီးလောင်မှုဖြစ်ပွားသည့်အကြောင်းအရာများနှင့်ပတ်သက်၍ ပြင်းထန်သောတုံ့ပြန်မှုများကို နှိုးဆွရန် ဒီဇိုင်းထုတ်ထားသော ဆွေးနွေးငြင်းခုံသည့်ကလပ်ပုံစံဖြင့် ပြုလုပ်ခဲ့ခြင်းဖြစ်ပြီး ဖုန်းပေါ်ရှိ ပြဿနာရှိသောဖောက်သည်ပြောဆိုမှုများတွင် ဖြစ်ပေါ်လာနိုင်သည့် ဖိစီးမှုကို ထိထိရောက်ရောက်ပုံစံထုတ်ကာ ကျင်းပခြင်းဖြစ်သည်။

စေတနာ့ဝန်ထမ်းများသည် အများပြည်သူရှေ့တွင် သုံးမိနစ်ကြာ လွတ်လပ်စွာ ဟောပြောခဲ့သည့် ခေါင်းစဉ်များမှာ-

- ဂျာမနီတွင် သေဒဏ်နှင့် လူထုကွပ်မျက်မှုများကို ပြန်လည်စတင်သင့်ပါသလား။
- ဂျာမနီတွင် ကုန်ကျစရိတ် အကျုံးဝင်သော ကျူရှင်ခကို ကောက်ခံသင့်ပါသလား။
– ဟီးရိုးအင်း နှင့် crystal meth ကဲ့သို့သော ပြင်းထန်သော မူးယစ်ဆေးဝါးများကို ဂျာမနီတွင် တရားဝင်ခွင့်ပြုသင့်ပါသလား။
- McDonald's သို့မဟုတ် Burger King ကဲ့သို့သော ကျန်းမာရေးနှင့် မညီညွတ်သော အမြန်အစားအစာ ဝန်ဆောင်မှုပေးနေသည့် စားသောက်ဆိုင်များကို ဂျာမနီတွင် ပိတ်ပင်သင့်ပါသလား။

ကြိုတင်စီမံဆောင်ရွက်ခြင်း

ပရောဂျက်သည် NLP ချဉ်းကပ်မှုတစ်ခုထက် အလိုအလျောက် စကားပြောအသိအမှတ်ပြုမှု (ASR) ချဉ်းကပ်မှုတွင် အသံပိုင်းဆိုင်ရာ စကားပြောအင်္ဂါရပ်များကို ခွဲခြမ်းစိတ်ဖြာခြင်းအား နှစ်သက်သဘောကျသည် (စကားများကို ဘာသာစကားအဆင့်ဖြင့် ခွဲခြမ်းစိတ်ဖြာပြီး ဟောပြောချက်၏ 'အပူချိန်' ကို ဘာသာစကားအသုံးပြုမှုမှ တိုက်ရိုက် ကောက်ချက်ချသည်)။

အကြိုလုပ်ဆောင်ပြီးသား ထုတ်ယူထားသောနမူနာများကို Mel-frequency Cepstral Coefficients (MFCCs) ဖြင့် ကနဦးပိုင်းခြားခွဲခြမ်းစိတ်ဖြာကာ စကားပြောဆိုမှုတွင် အလွန်ရေပန်းစားနေသေးသော ရှေးခေတ်နည်းလမ်းတစ်ခုဖြစ်သည်။ အဆိုပါနည်းလမ်းကို 1980 ခုနှစ်တွင် စတင်အဆိုပြုခဲ့ပြီးကတည်းက ၎င်းသည် စကားတွင် ထပ်တလဲလဲဖြစ်နေသောပုံစံများကို အသိအမှတ်ပြုခြင်းအတွက် တွက်ချက်ခြင်းဆိုင်ရာ အရင်းအမြစ်များနှင့်အတူ သိသိသာသာ ချွေတာနိုင်သည့်အပြင် အသံဖမ်းယူမှုအရည်အသွေးအဆင့်အမျိုးမျိုးအတွက် ခံနိုင်ရည်ရှိသည်။ 2020 ခုနှစ် ဒီဇင်ဘာလတွင် လော့ခ်ချမှုအခြေအနေများတွင် VOIP ပလပ်ဖောင်းများပေါ်တွင် အစည်းအဝေးများကို လုပ်ဆောင်ခဲ့ခြင်းဖြစ်သောကြောင့် လိုအပ်သည့်အခါ အရည်အသွေးညံ့ဖျင်းသောအသံအတွက် ထည့်သွင်းနိုင်သည့် အသံသွင်းဘောင်တစ်ခုရှိရန် အရေးကြီးပါသည်။

အထက်ဖော်ပြပါ နည်းပညာဆိုင်ရာ ကန့်သတ်ချက်နှစ်ခု (1980 ခုနှစ်များအစောပိုင်းတွင် ကန့်သတ်ထားသော CPU အရင်းအမြစ်များနှင့် ကြပ်တည်းနေသောကွန်ရက်အခြေအနေတွင် VOIP ချိတ်ဆက်မှု၏ထူးခြားမှုများ) သည် (ထင်သာမြင်သာရှိ) ပုံမှန်မဟုတ်သော ကြံ့ခိုင်သော 'နည်းပညာကျဲ' မော်ဒယ်ကို ထိထိရောက်ရောက်ဖန်တီးရန် ဤနေရာတွင် ပေါင်းစပ်ထားသည်ကို သတိပြုရန်မှာ စိတ်ဝင်စားစရာကောင်းပါသည်။ စံပြလုပ်ငန်းခွင်အခြေအနေများနှင့် အဆင့်မြင့်အရင်းအမြစ်များမရှိခြင်း - ရလဒ်ဆိုင်ရာ အယ်လဂိုရီသမ်အတွက် ပစ်မှတ်ကွင်းကို အတုခိုးခြင်း။

ထို့နောက် လျင်မြန်သော Fourier Transform (TFF) Mel Scale သို့ အပြီးသတ်မြေပုံမဖော်မီ 'audio frame' တစ်ခုစီ၏ ရောင်စဉ်တန်းပရိုဖိုင်ကို ထောက်ပံ့ပေးရန်အတွက် အသံအပိုင်းများကို အယ်လဂိုရီသမ်ကို အသုံးပြုထားသည်။

သင်တန်း၊ ရလဒ်များနှင့် ကန့်သတ်ချက်များ

လေ့ကျင့်နေစဉ်အတွင်း၊ ထုတ်ယူထားသော အင်္ဂါရပ်များကို အချိန်နှင့်အမျှ ဖြန့်ဝေထားသော convolutional network အလွှာသို့ ဖြန့်ကျက်ပြီး LSTM အလွှာသို့ ပေးပို့သည်။

AI အမှန်တရားရှာဖွေရေးကိရိယာအတွက် လေ့ကျင့်ရေးလုပ်ငန်းစဉ်၏ တည်ဆောက်ပုံ။ အရင်းအမြစ်- https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

AI အမှန်တရားရှာဖွေရေးကိရိယာအတွက် လေ့ကျင့်ရေးလုပ်ငန်းစဉ်၏ တည်ဆောက်ပုံ။ အရင်းအမြစ်- https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

နောက်ဆုံးတွင်၊ ဟောပြောသူသည် ၎င်းတို့အမှန်ဟုယုံကြည်သည့်အရာများကို ပြောဆိုနေခြင်းရှိ၊ မရှိအတွက် ဒွိဟိတ်ခန့်မှန်းချက်တစ်ခုကို ဖန်တီးရန်အတွက် နျူရွန်အားလုံးသည် တစ်ခုနှင့်တစ်ခု ချိတ်ဆက်ထားသည်။

လေ့ကျင့်သင်ကြားပြီးနောက် စမ်းသပ်မှုများတွင်၊ စနစ်သည် ရည်ရွယ်ချက်ပိုင်းခြားသိမြင်မှုဆိုင်ရာ တိကျမှုအဆင့် (98.91% အထိ) ရရှိခဲ့သည် (ပြောသောအကြောင်းအရာသည် ရည်ရွယ်ချက်ကို ထင်ဟပ်ခြင်းမရှိသော) ဖြစ်သည်။ အဆိုပါအလုပ်သည် အသံပုံစံများကိုအခြေခံ၍ ခံယူချက်သတ်မှတ်ခြင်းအား သက်သေပြပြီး NLP ပုံစံဖြင့် ဘာသာစကားကို ဖျက်ဆီးခြင်းမရှိဘဲ ၎င်းကို အောင်မြင်နိုင်သည်ဟု သုတေသီများက သုံးသပ်သည်။

ကန့်သတ်ချက်များအရ စမ်းသပ်နမူနာသည် သေးငယ်ကြောင်း သုတေသီများက ဝန်ခံသည်။ စာတမ်းတွင် ၎င်းအား အတိအလင်းဖော်ပြထားခြင်းမရှိသော်လည်း၊ ထုထည်နိမ့်သောစမ်းသပ်မှုဒေတာသည် ယူဆချက်များ၊ ဗိသုကာပြုထားသောအင်္ဂါရပ်များနှင့် ယေဘူယျလေ့ကျင့်ရေးလုပ်ငန်းစဉ်များသည် အချက်အလက်နှင့် လွန်ကဲနေပါက နောက်ပိုင်းတွင် အသုံးပြုနိုင်မှုကို လျှော့ချနိုင်သည်။ ပရောဂျက်တစ်လျှောက် တည်ဆောက်ထားသော မော်ဒယ်ရှစ်ခုအနက် ခြောက်ခုသည် သင်ယူမှုလုပ်ငန်းစဉ်တွင် တစ်ချိန်ချိန်၌ တပ်ဆင်မှုလွန်ကဲသွားကြောင်းနှင့် မော်ဒယ်အတွက် သတ်မှတ်ထားသည့် ကန့်သတ်ဘောင်များ၏ အသုံးချနိုင်မှုကို ယေဘူယျဖော်ပြရန်အတွက် နောက်ထပ်လုပ်ဆောင်ရမည့် အလုပ်များရှိကြောင်း စာတမ်းတွင် မှတ်သားထားသည်။

ထို့အပြင်၊ ဤသဘောသဘာဝကို သုတေသနပြုရာတွင် အမျိုးသားဝိသေသလက္ခဏာများကို ထည့်သွင်းတွက်ချက်ရမည်ဖြစ်ပြီး ဒေတာထုတ်လုပ်ခြင်းတွင် ပါ၀င်သည့် ဂျာမန်ဘာသာရပ်များတွင် ယဉ်ကျေးမှုများတစ်လျှောက် တိုက်ရိုက်ပုံတူမထားသော ဆက်သွယ်ရေးပုံစံများ ရှိနိုင်သည် - ယင်းလေ့လာမှုတွင် ဖြစ်ပေါ်လာမည့် အခြေအနေတစ်ရပ်ဖြစ်ကြောင်း စာတမ်းတွင် မှတ်သားထားသည်။ မည်သည့်လူမျိုး။