AI Careers 101-
Data Engineer ဆိုတာ ဘာလဲ ? လစာ၊ တာဝန်၊ လမ်းပြမြေပုံ
By
Haziqa Sajidမာတိကာ
ဒေ သ က နံ က သစ် . ဒါပေမယ့် ဘယ်သူက ဒီဆီတွေကို ထုတ်ယူပြီး သန့်စင်ပေးတာလဲ။ ဒေတာအင်ဂျင်နီယာများ ဒေတာအင်ဂျင်နီယာများသည် ခွဲခြမ်းစိတ်ဖြာခြင်းနှင့် မော်ဒယ်ပြုလုပ်ခြင်းအတွက် အသုံးပြုနိုင်သည့် အရည်အသွေးမြင့်ဒေတာသို့ ဒေတာကုန်ကြမ်းအဖြစ်သို့ ပြောင်းလဲရန် စနစ်များကို ဒီဇိုင်းရေးဆွဲ၍ တီထွင်ဖန်တီးကြသည်။
ဒေတာဗဟိုပြုအဖွဲ့အစည်းတိုင်း၏ ပထမအဆင့်မှာ မတူညီသော အရင်းအမြစ်များမှ အချက်အလက်များကို စုဆောင်းရန်ဖြစ်သည်။ ထို့နောက် ဒေတာကို လိုအပ်သော ဖော်မတ်အဖြစ် ပြောင်းလဲပြီး ဒေတာအခြေခံအဆောက်အအုံသို့ တင်ဆောင်သည်။ ဒေတာသိပ္ပံပညာရှင်များနှင့် လေ့လာဆန်းစစ်သူများသည် ထိုးထွင်းအမြင်များကို ထုတ်ယူရန်နှင့် စီးပွားရေးပြဿနာများကို ဖြေရှင်းရန်အတွက် အချက်အလက်များကို ဝင်ရောက်ကြည့်ရှုနိုင်သည်။ ဒေတာအင်ဂျင်နီယာသည် ဤလုပ်ငန်းစဉ်တစ်ခုလုံးကို ဦးဆောင်သည်။ ဒေတာ အင်ဂျင်နီယာများ မရှိလျှင် အဖွဲ့အစည်းများသည် ၎င်းတို့၏ ဒေတာကို ထိထိရောက်ရောက် အသုံးမပြုနိုင်တော့ဘဲ လုပ်ငန်းအခွင့်အလမ်းများ ဆုံးရှုံးသွားနိုင်သည်။
ဒေတာအင်ဂျင်နီယာသည် လစာမြင့်သည့် အသက်မွေးဝမ်းကျောင်းတစ်ခုလည်းဖြစ်သည်။ အတိုင်းပါပဲ။ Glassdoor ရဲ့ ခန့်မှန်းချေ၊ ပျမ်းမျှဒေတာအင်ဂျင်နီယာလစာသည် အမေရိကန်ပြည်ထောင်စုတွင် တစ်နှစ်လျှင် $113,784 ဖြစ်သည်။
ဤဘလော့ဂ်တွင်၊ ကျွန်ုပ်တို့သည် ကျွမ်းကျင်သောဒေတာအင်ဂျင်နီယာတစ်ဦးဖြစ်လာရန် အကြောင်းပြချက်၊ တာဝန်များနှင့် လမ်းပြမြေပုံနှင့် ဒေတာအင်ဂျင်နီယာတစ်ဦးသည် ဒေတာသိပ္ပံပညာရှင်နှင့် မည်သို့ကွာခြားသည်ကို ဆွေးနွေးပါမည်။
ဘာကြောင့် Data Engineer တစ်ယောက်ဖြစ်လာတာလဲ။
ဒေတာအင်ဂျင်နီယာများသည် နာရီ၏လိုအပ်ချက်ဖြစ်သည်။ ၎င်းတို့သည် ကုမ္ပဏီတစ်ခု၏ ဒေတာဗျူဟာ၏ အရေးပါသော အစိတ်အပိုင်းတစ်ခုဖြစ်ပြီး ကျွန်ုပ်တို့ဒေတာထုတ်လုပ်သည့် အလျင်၊ ထုထည်နှင့် အမျိုးအစားများသည် လျင်မြန်စွာ တိုးများလာသောကြောင့် ဖြစ်သည်။
2025 နှစ်ကုန်မှာတော့ ပိုများတယ်။ ၄၄ zettabytes ဒေတာများကို ဖန်တီး၊ ဖမ်းယူ၊ သုံးစွဲမည်ဖြစ်သည်။ ဤမျှများပြားသော ဒေတာကုန်ကြမ်းများကို ကိုင်တွယ်ရန် ဒေတာအင်ဂျင်နီယာများ လိုအပ်ပါသည်။ ထိုသို့သော မြင့်မားသော ၀ယ်လိုအားဖြင့်၊ ၎င်းသည် ဒေတာဂေဟစနစ်တွင် အလားအလာရှိသော အသက်မွေးဝမ်းကြောင်းကို ပေးဆောင်သည်။
Data Engineer ၏ တာဝန်များ
ဒေတာအင်ဂျင်နီယာတစ်ဦး၏ အလုပ်မှာ အဖွဲ့အစည်း၏ ဒေတာလိုအပ်ချက်များကို နားလည်ရန်နှင့် သန့်ရှင်း၍ရနိုင်သော ဒေတာများကို ပေးဆောင်ရန် စနစ်များတည်ဆောက်ရန်ဖြစ်သည်။ နေ့စဉ်နှင့်အမျှ ၎င်းတို့သည် အောက်ပါတာဝန်များကို ထမ်းဆောင်ကြသည်-
- ဒေတာပိုက်လိုင်းများကို ဒီဇိုင်းဆွဲခြင်း၊ တည်ဆောက်ခြင်းနှင့် ထိန်းသိမ်းခြင်း။
- ဒေတာလိုအပ်ချက်များကို ကောင်းစွာနားလည်ရန် ဒေတာလေ့လာသုံးသပ်သူများနှင့် သိပ္ပံပညာရှင်များနှင့် လက်တွဲဆောင်ရွက်ပါ။
- ဒေတာရင်းမြစ်များကို အတည်ပြုခြင်းနှင့် ဒေတာအရည်အသွေးအပေါ် အာရုံစိုက်ခြင်း။
- ဒေတာစည်းမျဉ်းများနှင့် ကိုက်ညီမှုရှိစေရန်
Data Engineer တစ်ယောက်ဖြစ်အောင် ဘယ်လို လုပ်ရမလဲ။
ဒေတာအင်ဂျင်နီယာတစ်ယောက်ဖြစ်လာရန် လမ်းပြမြေပုံမှာ အောက်ပါအတိုင်းဖြစ်သည်။
1) သက်ဆိုင်ရာ Data Engineering ကျွမ်းကျင်မှု ရယူပါ။
က) Coding
တစ်ဦး၏အဆိုအရ ခွဲခြမ်းစိတ်ဖြာခြင်း ဒေတာအင်ဂျင်နီယာ 17,000 အလုပ်တင်ခြင်းများတွင် 70% ထက်ပိုသော စုဆောင်းသူများသည် Python နှင့် SQL ကျွမ်းကျင်သော ကိုယ်စားလှယ်လောင်းများကို ရှာဖွေကြသည်။ ထို့ကြောင့် Python နှင့် SQL တို့ကို လေ့လာခြင်းသည် ဒေတာအင်ဂျင်နီယာတစ်ယောက်ဖြစ်လာရန် ပထမဆုံးခြေလှမ်းဖြစ်သင့်သည်။ ထို့အပြင်၊ Scala နှင့် Java ကဲ့သို့သော အခြားသော ပရိုဂရမ်းမင်းဘာသာစကားများနှင့် ရင်းနှီးကျွမ်းဝင်မှုက သင့်အား ပြိုင်ဆိုင်မှုဆိုင်ရာ အားသာချက်များကို ပေးစွမ်းနိုင်သည်။
b) ETL (Extract, Transform, Load)
ETL ဆိုသည်မှာ အမျိုးမျိုးသော အရင်းအမြစ်များမှ ဒေတာများကို သိုလှောင်ရုံတစ်ခုသို့ ထုတ်ယူခြင်း၊ ၎င်းအား ခွဲခြမ်းစိတ်ဖြာရန် ရည်ရွယ်သည့် ပုံစံအဖြစ် ပြောင်းလဲခြင်းနှင့် ဒေတာသိုလှောင်ရုံသို့ တင်ခြင်းတို့ကို ဆိုလိုသည်။ ETL ပိုက်လိုင်းများကို ဖန်တီးထိန်းသိမ်းခြင်းသည် ဒေတာအင်ဂျင်နီယာ၏ တာဝန်ဖြစ်သည်။ ထို့ကြောင့် ETL ကဲ့သို့သော ကိရိယာများကို သင်ယူပါ။ စုပေါင်း နှင့် ပြက္ခဒိန် data engineering အတွက် လိုအပ်ပါသည်။
ဂ) ဒေတာသိုလှောင်မှုစနစ်များ
စုစည်းထားသော အချက်အလက်များကို သိမ်းဆည်းရန်အတွက် ဒေတာဘေ့စ်များကို အသုံးပြုပါသည်။ မတူညီသောဒေတာသိုလှောင်မှုအမျိုးအစားများအဖြစ် ဆက်စပ်မှု၊ NoSQL နှင့် ဒေတာအိုင်များနှင့် ရင်းနှီးကျွမ်းဝင်မှုမှာ မရှိမဖြစ်လိုအပ်ပါသည်။
ဃ) Big Data ကိရိယာများ
Apache Spark၊ Apache Hadoop နှင့် Apache Hive ကဲ့သို့သော ကြီးမားသော ဒေတာကိရိယာများကို နားလည်ရန်မှာ ဒေတာအင်ဂျင်နီယာတစ်ယောက်ဖြစ်လာရန် လိုအပ်သည်။ ဤကိရိယာများကို ဒေတာအမြောက်အမြားကို လုပ်ဆောင်ခြင်း၊ သိမ်းဆည်းခြင်းနှင့် စုံစမ်းမေးမြန်းခြင်းအတွက် အသုံးပြုပါသည်။
င) Cloud Computing
AWS (Amazon Web Services) နှင့် Microsoft Azure ကဲ့သို့သော Cloud ဝန်ဆောင်မှုပေးသူများသည် ဒေတာသိုလှောင်မှုနှင့် စီမံဆောင်ရွက်မှုအတွက် အရွယ်အစားအလိုက်တွက်ချက်နိုင်သော အရင်းအမြစ်များကို ပေးဆောင်သည်။ Cloud ကွန်ပျူတာဆိုင်ရာ အသိအမှတ်ပြုလက်မှတ်များ cloud ပလပ်ဖောင်းအမျိုးမျိုး၏ အခြေခံနှင့် အဆင့်မြင့် သဘောတရားများကို လေ့လာပြီး လေ့ကျင့်ရန် ကူညီပေးနိုင်သည်။
f) Soft Skills များ
ဒေတာအင်ဂျင်နီယာတစ်ဦးသည် ဒေတာသိပ္ပံပညာရှင်များနှင့် ဒေတာခွဲခြမ်းစိတ်ဖြာသူများအပါအဝင် အခြားအဖွဲ့၀င်များနှင့် ပူးပေါင်းဆောင်ရွက်ရန် ကောင်းမွန်သော ဆက်သွယ်ရေးစွမ်းရည်ရှိသင့်သည်။ တီထွင်ဖန်တီးနိုင်စွမ်းနှင့် ပြဿနာဖြေရှင်းခြင်းသည် ဒေတာအင်ဂျင်နီယာဘဝစက်ဝန်းတွင် စိန်ခေါ်မှုများကို ဖြေရှင်းရာတွင် ကူညီပေးနိုင်သည်။
2) အောင်လက်မှတ်ရယူခြင်း။
လက်မှတ်များသည် ယုံကြည်စိတ်ချရမှုကို မြှင့်တင်ပေးပြီး သင့်အလုပ်ရှင်၏ ယုံကြည်မှုကို ရရှိစေပါသည်။ ဒေတာအင်ဂျင်နီယာ လက်မှတ်များကို Coursera နှင့် Udemy ကဲ့သို့ ယုံကြည်စိတ်ချရသော ပညာရေးဆိုင်ရာ ပလပ်ဖောင်းများမှ ရယူနိုင်ပါသည်။ ၎င်းတို့တွင် ကျွမ်းကျင်သော ပညာတတ်များဖြင့် သင်ကြားပေးသည့် အရည်အသွေးမြင့် လက်တွေ့သင်ရိုးညွှန်းတမ်းများ ရှိသည်။ သို့သော် သင်ကိုယ်တိုင် စာရင်းသွင်းခြင်းမပြုမီ သင်တန်းနှင့် နည်းပြသုံးသပ်ချက်များကို ဖတ်ပါ။ ၎င်းတို့ရရှိထားသော လက်မှတ်များကို ရှာဖွေရန် ပရော်ဖက်ရှင်နယ် ဒေတာအင်ဂျင်နီယာများ၏ LinkedIn ပရိုဖိုင်များကိုလည်း သွားရောက်ကြည့်ရှုနိုင်ပါသည်။ ၎င်းသည် စက်မှုလုပ်ငန်းတွင် လက်ရှိရေပန်းစားနေသည့် မည်သည့်ကိရိယာများ သို့မဟုတ် ပလပ်ဖောင်းများကို ပိုမိုကောင်းမွန်စွာ နားလည်နိုင်စေမည်ဖြစ်သည်။
3) သင်၏ Data Engineering Portfolio တည်ဆောက်ခြင်း။
အစုစုသည် ဘာသာရပ်နှင့်ပတ်သက်၍ ကိုယ်စားလှယ်လောင်းတစ်ဦး၏ နားလည်မှုကို အကဲဖြတ်ရန် အကောင်းဆုံး တိုင်းတာမှုတစ်ခုဖြစ်သည်။ ဒေတာဘေ့စ်ဒီဇိုင်းနှင့် ဖွံ့ဖြိုးတိုးတက်မှုဆိုင်ရာ ပရောဂျက်များစွာကို ဖန်တီးခြင်းသည် သင့်အား အခြားလျှောက်ထားသူများနှင့် ခွဲခြားနိုင်သည်။ သင်၏ ဒေတာအင်ဂျင်နီယာပရောဂျက်ကို GitHub တွင် အပ်လုဒ်လုပ်ခြင်းနှင့် LinkedIn သို့မဟုတ် Medium ကဲ့သို့သော ပလပ်ဖောင်းများတွင် ဘလော့ဂ်ပို့စ်တစ်ခုမျှဝေခြင်းသည် သင်၏ဒေတာကျွမ်းကျင်မှုကို ပြသရန်အတွက် အရေးကြီးသောခြေလှမ်းတစ်ခုဖြစ်သည်။
4) Entry-Level Data Engineering Job ကို အာမခံခြင်း။
ကိစ္စအများစုတွင်၊ ဒေတာအင်ဂျင်နီယာသည် ဝင်ခွင့်အဆင့် ရာထူးမဟုတ်ပါ။ ဒေတာခွဲခြမ်းစိတ်ဖြာသူအဖြစ် entry-level အလုပ်တစ်ခုရယူခြင်းသည် ကောင်းမွန်သောအစပြုမှုတစ်ခုဖြစ်သည်။ အတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုများ ပိုမိုရရှိလာသည်နှင့်အမျှ သင်သည် data engineer ရာထူးအထိ လုပ်ဆောင်နိုင်သည်။
Data Engineer နှင့် Data Scientist အကြား အဓိက ကွာခြားချက်များ
ဒေတာသိပ္ပံပညာရှင်များနှင့် ဒေတာအင်ဂျင်နီယာများအသုံးပြုသည့် ကျွမ်းကျင်မှုနှင့် ကိရိယာများကြားတွင် ဆင်တူမှုများရှိသော်လည်း ၎င်းတို့ကြားတွင် အောက်ပါအတိုင်း ကွဲပြားချက်အချို့ရှိပါသည်။
parameter | ဒေတာများကိုအင်ဂျင်နီယာချုပ် | ဒေတာကိုသိပ္ပံပညာရှင် |
တာဝန်များ | ဒေတာခွဲခြမ်းစိတ်ဖြာမှုအတွက် ဒေတာအခြေခံအဆောက်အအုံများ (ဒေတာသိုလှောင်ရုံများ၊ ဒေတာကန်များစသည်ဖြင့်) ပြုလုပ်ခြင်းသည် ဒေတာအင်ဂျင်နီယာတစ်ဦး၏ အဓိကတာဝန်ဖြစ်သည်။ | ဒေတာသိပ္ပံပညာရှင်တစ်ဦးသည် လျှို့ဝှက်ပုံစံများကို ရှာဖွေရန်၊ တည်ဆောက်မှုပုံစံများနှင့် မမြင်ရသော အချက်အလက်များအတွက် ခန့်မှန်းချက်များကို ပြုလုပ်ရန် တာဝန်ရှိသည်။ |
ကျွမ်းကျင်မှု | Python၊ SQL နှင့် Java တို့ကို အသုံးပြု၍ ဒေတာဘေ့စ်ဒီဇိုင်းနှင့် ETL လုပ်ငန်းစဉ်များတွင် ကျွမ်းကျင်ရမည်။ | Python သို့မဟုတ် R ကို အသုံးပြု၍ ဒေတာကို ပုံဖော်ခြင်း၊ ကိန်းဂဏန်းခွဲခြမ်းစိတ်ဖြာခြင်းနှင့် စက်သင်ယူခြင်းတွင် ကျွမ်းကျင်သည်။ |
Tools များ | SQL ဒေတာဘေ့စ်များ၊ MongoDB၊ Apache Spark၊ Apache Hadoop နှင့် Cloud Platforms (AWS၊ GCP စသည်ဖြင့်) | Pandas၊ Scikit-Learn၊ Tableau၊ PyTorch/TensorFlow နှင့် Cloud Platforms |
အဆုံးသတ်ပန်းတိုင် | အရည်အသွေးမြင့်၊ လက်လှမ်းမီနိုင်သော ဒေတာကို ပေးဆောင်ရန် | ရှုပ်ထွေးသော စီးပွားရေးပြဿနာများကို ဖြေရှင်းပြီး ကုမ္ပဏီများကို ဒေတာမောင်းနှင်သော ဆုံးဖြတ်ချက်များချရာတွင် ကူညီပေးပါ။ |
Data Engineer က အဆင့် ၇ နေရာမှာ ရှိနေပါတယ်။ Glassdoor 50 ခုနှစ်အတွက် အမေရိကတွင် အကောင်းဆုံးအလုပ်အကိုင် 2022 ခု။ ဒေတာဗဟိုပြုအဖွဲ့အစည်းတွင် ကြီးမားသောဒေတာအခန်းကဏ္ဍများ ပိုမိုရှင်းလင်းလာသည်နှင့်အမျှ ဒေတာအင်ဂျင်နီယာများ၏ လိုအပ်ချက်သည် ဆက်လက်တိုးလာမည်ဖြစ်သည်။
AI နှင့်ပတ်သက်သော အကြောင်းအရာများ ပိုမိုလိုချင်ပါသလား။ သွားလည်ပါ။ unite.ai
ဟာဇီကာ AI နှင့် SaaS ကုမ္ပဏီများအတွက် နည်းပညာဆိုင်ရာ အကြောင်းအရာများကို ရေးသားရာတွင် အတွေ့အကြုံများစွာရှိသည့် Data Scientist တစ်ဦးဖြစ်သည်။
သင်ကြိုက်နှစ်သက်စေခြင်းငှါ
ဒေတာသိုလှောင်ခြင်းအတွက် စတင်သူလမ်းညွှန်
Data Storytelling ဆိုတာ ဘာလဲ အစိတ်အပိုင်းများ၊ အကျိုးကျေးဇူးများနှင့် ဥပမာများ
Data Analyst ဆိုတာ ဘာလဲ။ လစာ၊ တာဝန်၊ ကျွမ်းကျင်မှု၊ နှင့် အလုပ်ရှာဖွေရေးလမ်းကြောင်း
Reverse ETL ဆိုတာ ဘာလဲ။ အကျိုးကျေးဇူးများ၊ စိန်ခေါ်မှုများနှင့် အသုံးပြုမှုကိစ္စများ
Data Ingestion မှ Data Integration သို့
အကောင်းဆုံး ETL ကိရိယာ ၁၀ ခု (မေလ 10)