stub 10ka Maktabadaha Python ee ugu Wanaagsan ee Falanqaynta Dareenka (2024) - Unite.AI
Connect nala

Maktabadaha Python

10ka Maktabadaha Python ee ugu Wanaagsan ee Falanqaynta Dareenka

Updated on

Falanqaynta dareenka waa farsamo awood leh oo aad isticmaali karto si aad u falanqeyso falcelinta macaamiisha ama la socoshada warbaahinta bulshada. Iyadoo taas la yiraahdo, falanqaynta dareenka ayaa aad u dhib badan maadaama ay ku lug leedahay xog aan qaabaysan iyo kala duwanaansho luqadeed. 

Farsamaynta luuqadda dabiiciga ah (NLP), falanqaynta dareenka ayaa loo isticmaali karaa si loo go'aamiyo in xogtu tahay mid togan, taban, ama dhexdhexaad ah. Marka laga soo tago diiradda saaridda kala-soocidda qoraalka, waxay sidoo kale ogaan kartaa dareeno iyo dareen gaar ah, sida xanaaq, farxad, iyo murugo. Falanqaynta dareenka ayaa xitaa loo adeegsadaa si loo go'aamiyo waxa la doonayo, sida haddii qof uu danaynayo iyo in kale. 

Falanqaynta dareenka waa qalab aad u awood badan oo si isa soo taraya loo geynayo dhammaan noocyada ganacsiyada, waxaana jira dhowr maktabadood oo Python ah oo gacan ka geysan kara fulinta nidaamkan. 

Waa kuwan 10-ka maktabadood ee ugu wanaagsan ee Python ee falanqaynta dareenka: 

1. Qaabka

Liiskayaga ugu sarreeya ee maktabadaha Python ee ugu fiican ee falanqaynta dareenka waa Qaabka, kaas oo ah maktabad ujeedo badan leh oo wax ka qaban karta NLP, macdanta xogta, falanqaynta shabakada, barashada mashiinka, iyo aragga. 

Qaabka waxa uu bixiyaa sifooyin kala duwan, oo ay ku jiraan helida kuwa sare iyo isbarbardhigga. Waxa kale oo ay fulin kartaa xaqiiqada iyo ogaanshaha ra'yiga, taas oo ka dhigaysa in ay u muuqato doorashada ugu sareysa ee falanqaynta dareenka. Hawsha Qaabka ku jirta waxay soo celisaa polarity iyo mawduuca qoraalka la bixiyay, oo leh natiijadii Polarity ee u dhaxaysa mid aad u wanaagsan ilaa aad taban. 

Waa kuwan qaar ka mid ah astaamaha ugu muhiimsan ee Qaabka: 

  • Maktabad ujeedo badan leh
  • Helitaanka kuwa ugu sarreeya iyo isbarbardhigga
  • Soo celiyaa kala-duwanaanshaha iyo mawduuca qoraalka la bixiyay
  • Polarity waxay u dhaxaysaa mid aad u togan ilaa mid taban

2. VADER

Ikhtiyaarka kale ee ugu sarreeya ee falanqaynta dareenka waa VADER (Valence Aware Dictionary and sEntiment Reasoner), kaas oo ah qaanuun/ qaamuus ku salaysan, falanqaynta dareenka il-furan maktabad horay loo dhisay gudaha NLTK. Qalabka waxaa si gaar ah loogu talagalay dareenka lagu muujiyo baraha bulshada, waxaana uu adeegsadaa isku darka qaamuuska dareenka A iyo liiska sifooyin qaamuus ah oo guud ahaan lagu calaamadeeyay sida waafaqsan jihayntooda semantic sida togan ama taban. 

VADER waxay xisaabisaa dareenka qoraalka oo soo celisaa itimaalka jumlada gelinta la bixiyay inay noqoto mid togan, taban, ama neural ah. Qalabku wuxuu falanqayn karaa xogta dhammaan noocyada warbaahinta bulshada, sida Twitter iyo Facebook. 

Waa kuwan qaar ka mid ah sifooyinka ugu muhiimsan ee VADER: 

  • Uma baahna xogta tababarka
  • Faham dareenka qoraalka ka kooban emoticons, slangs, conjunions, iwm. 
  • Aad ugu fiican qoraalka warbaahinta bulshada
  • Maktabad il furan

3. BERT

BERT (Wakiilada Encoder-ka laba jiho ee ka yimid Transformers) waa qaabka ugu sarreeya ee barashada mashiinka loo isticmaalo hawlaha NLP, oo ay ku jiraan falanqaynta dareenka. Waxaa sameeyay 2018 Google, maktabadda waxaa lagu tababaray Ingiriisiga Wikipedia iyo BooksCorpus, waxayna caddaysay inay tahay mid ka mid ah maktabadaha ugu saxsan ee hawlaha NLP. 

Sababtoo ah BERT waxaa lagu tababaray qoraal weyn, waxay leedahay awood wanaagsan oo lagu fahmo luqadda iyo inay bartaan kala duwanaanshaha qaababka xogta. 

Waa kuwan qaar ka mid ah astaamaha ugu muhiimsan ee BERT: 

  • Si fudud loo hagaajin karo
  • Hawlaha NLP ee ballaaran, oo ay ku jiraan falanqaynta dareenka
  • Lagu tababbaray korpus weyn oo qoraal ah oo aan calaamadayn
  • Qaab laba jiho ah oo qoto dheer

4. TextBlob

TextBlob waa doorasho kale oo weyn oo loogu talagalay falanqaynta dareenka. Maktabadda fudud ee Python waxay taageertaa falanqaynta adag iyo hawlgallada xogta qoraalka ah. Hababka ku salaysan qaamuuska, TextBlob waxa ay ku qeexdaa dareenka jihayntiisa semantic iyo xoojinta erey kasta oo jumlad ah, kaas oo u baahan qaamuus hore loo sii qeexay oo kala saaraya ereyada taban iyo kuwa togan. Qalabku wuxuu ku meeleeyaa buundooyinka gaarka ah dhammaan ereyada, iyo dareenka kama dambaysta ah ayaa la xisaabiyaa. 

TextBlob wuxuu soo celiyaa polarity iyo mawduuca jumlada, oo leh kala duwanaansho Polarity ah oo taban ama togan. Calaamadaha semantiga maktabadda ayaa ka caawiya falanqaynta, oo ay ku jiraan emoticons, calamadaha cajaa'ibka, emojis, iyo in ka badan. 

Waa kuwan qaar ka mid ah astaamaha ugu muhiimsan ee TextBlob: 

  • Maktabadda Python ee fudud
  • Waxay taageertaa falanqaynta adag iyo hawlgallada xogta qoraalka ah
  • Ku meeleeya buundooyinka dareenka shakhsi ahaaneed
  • Waxay soo celisaa kala-soocida iyo nuxurka jumlada

5. boosCy

Maktabad NLP ah oo furan, spaCy waa ikhtiyaar kale oo sare oo loogu talagalay falanqaynta dareenka. Maktabadu waxay awood u siisaa horumariyayaasha inay abuuraan codsiyo farsamayn kara oo fahmi kara qoraallada tirada badan, waxaana loo isticmaalaa in lagu dhiso hababka fahamka luqadda dabiiciga ah iyo hababka soo saarista macluumaadka. 

Iyada oo la adeegsanayo spaCy, waxaad samayn kartaa falanqaynta dareenka si aad uga soo ururiso macluumaadka dhumucda leh ee ku saabsan alaabtaada ama summadaada ilo kala duwan, sida iimaylo, warbaahinta bulshada, iyo faallooyinka alaabta. 

Waa kuwan qaar ka mid ah sifooyinka ugu muhiimsan ee SpaCy: 

  • Degdeg ah oo si fudud loo isticmaali karo
  • Ku fiican horumarinta bilowga ah
  • Hagaajinta qoraallada tirada badan
  • Falanqaynta dareenka oo leh ilo kala duwan

6. CoreNLP

Stanford CoreNLP waa maktabad kale oo Python ah oo ka kooban noocyo kala duwan oo qalab tignoolajiyada luqadda aadanaha ah kuwaas oo gacan ka geysta adeegsiga falanqaynta luqadda qoraalka. CoreNLP wuxuu ku daraa aaladaha Stanford NLP, oo ay ku jiraan falanqaynta dareenka. Waxa kale oo ay taageertaa shan luuqadood guud ahaan: Ingiriis, Carabi, Jarmal, Shiine, Faransiis, iyo Isbaanish. 

Qalabka dareenka waxaa ku jira barnaamijyo kala duwan oo lagu taageerayo, qaabkana waxaa loo isticmaali karaa in lagu falanqeeyo qoraalka iyadoo lagu darayo "dareen" liiska falanqeeyayaasha. Waxa kale oo ka mid ah khadka taliska ee taageerada iyo taageerada tababarka moodeelka. 

Waa kuwan qaar ka mid ah sifooyinka ugu muhiimsan ee CoreNLP: 

  • Waxay ku daraysaa qalabka Stanford NLP
  • Waxay taageertaa shan luqadood
  • Wuxuu falanqeeyaa qoraalka isagoo ku daraya "dareen"
  • Khadka taliska ee taageerada iyo taageerada tababarka moodeelka

7. scikit-bartaan

Maktabadda Python-ka ah ee ku taal Github, scikit-learn waxay asal ahaan ahayd kordhinta qolo saddexaad ee maktabadda SciPy. In kasta oo ay si gaar ah faa'iido u leedahay algorithms-barashada mashiinka qadiimiga ah sida kuwa loo isticmaalo ogaanshaha spamka iyo aqoonsiga sawirka, scikit-learn ayaa sidoo kale loo isticmaali karaa hawlaha NLP, oo ay ku jiraan falanqaynta dareenka. 

Maktabadda Python waxay kaa caawin kartaa inaad sameyso falanqaynta dareenka si aad u falanqeyso fikradaha ama dareenka iyada oo loo marayo xogta adoo tababaraya qaab soo saari kara haddii qoraalku yahay mid togan ama xun. Waxay bixisaa dhowr vectorizers si loo turjumo dukumeenti gelinta qaybaha sifada, waxayna la timaadaa tiro kalasaarayaal kala duwan oo horeba loo dhex dhisay. 

Waa kuwan qaar ka mid ah sifooyinka ugu muhiimsan ee scikit-Learn: 

  • Lagu dhisay SciPy iyo NumPy
  • Lagu caddeeyey codsiyada nolosha dhabta ah
  • Noocyo kala duwan iyo algorithms
  • Waxaa isticmaala shirkadaha waaweyn sida Spotify

8. polyglot

Hal doorasho oo kale oo weyn oo loogu talagalay falanqaynta dareenka waa Polyglot, oo ah maktabad furan oo Python ah oo loo isticmaalo in lagu fuliyo hawlgallo badan oo NLP ah. Maktabadu waxay ku salaysan tahay Numpy oo si cajiib ah ayey u dhakhso badan tahay iyadoo bixinaysa amarro badan oo kala duwan. 

Mid ka mid ah meelaha ugu iibka badan ee Polyglot waa in ay taageerto codsiyada badan ee luqadaha badan. Marka loo eego dukumeentigeeda, waxay taageertaa falanqaynta dareenka 136 luqadood. Waxa lagu yaqaan hawlkarnimadeeda, xawligeeda, iyo toosnaanteeda. Polyglot waxaa badanaa loo doortaa mashaariicda ku lug leh luqadaha aan taageereynin spaCy. 

Waa kuwan qaar ka mid ah sifooyinka ugu muhiimsan ee Polyglot: 

  • Luqado badan leh oo leh 136 luqadood oo lagu taageeray falanqaynta dareenka
  • Lagu dul dhisay NumPy
  • Il furan
  • hufan, degdeg ah, oo toosan

9. PyTorch

Ku dhow dhammaadka liiskayaga waa PyTorch, maktabad kale oo furan oo Python ah. Maktabadu waxa ay samaysay kooxda cilmi-baadhista AI ee Facebook, waxa ay awood kuu siinaysaa in aad fuliso codsiyo kala duwan, oo ay ku jiraan falanqaynta dareenka, halkaas oo ay ku ogaan karto in jumladu tahay mid togan ama taban.

PyTorch aad buu ugu dheereeyaa fulinta, waxaana lagu shaqayn karaa soo-saareyaal la fududeeyay ama CPU-yada iyo GPU-yada. Waxaad ku ballaarin kartaa maktabadda API-yada xoogga leh, waxayna leedahay qalab luqadeed oo dabiici ah. 

Waa kuwan qaar ka mid ah astaamaha ugu muhiimsan ee PyTorch: 

  • Cloud platform iyo nidaamka deegaanka
  • Qaab dhismeed adag
  • Aad u degdeg badan
  • Waxaa lagu qali karaa soo-saareyaal la fududeeyay, CPU-yada, ama GPU-yada

10. kartina

Xiritaanka liiskayaga 10ka maktabadood ee ugu fiican Python ee falanqaynta dareenka waa Flair, taas oo ah maktabad NLP-fudud oo furan. Qaab dhismeedkeedu wuxuu si toos ah ugu dhisan yahay PyTorch, kooxda cilmi-baadhista ee Flair waxay soo saartay dhowr nooc oo horay loo tababaray oo hawlo kala duwan ah. 

Mid ka mid ah moodooyinka horay loo tababaray waa qaabka falanqaynta dareenka oo lagu tababaray xogta IMDB, waana sahlan tahay in la raro lana sameeyo saadaal. Waxa kale oo aad ku tababari kartaa kala-soore leh Flair adiga oo isticmaalaya xogtaada. In kasta oo ay tahay nooc hore loo tababaray oo faa'iido leh, xogta lagu tababaray waxaa laga yaabaa in aanay guud ahaan u soo bixin qaybaha kale, sida Twitter-ka. 

Waa kuwan qaar ka mid ah astaamaha ugu muhiimsan ee Flair: 

  • Il furan
  • Waxay taageertaa tiro luuqado ah
  • Si fudud loo isticmaalo
  • Dhowr nooc oo horay loo tababaray, oo ay ku jiraan falanqaynta dareenka

Alex McFarland waa wariye iyo qoraa AI ah oo sahaminaya horumaradii ugu dambeeyay ee sirdoonka macmal. Waxa uu la kaashaday shirkado badan oo AI ah oo bilaabay iyo daabacaadyo caalami ah.