stub Мэдрэмжийн шинжилгээ хийх шилдэг 10 Python номын сан (2024) - Unite.AI
бидэнтэй хамт холбоно

Пайтоны Номын сан

Мэдрэмжийн шинжилгээ хийх шилдэг 10 Python номын сан

шинэчлэгдсэн on

Мэдрэмжийн шинжилгээ нь хэрэглэгчийн санал хүсэлтийг шинжлэх эсвэл олон нийтийн мэдээллийн хэрэгслийг хянах зэрэгт ашиглаж болох хүчирхэг арга юм. Үүний зэрэгцээ, мэдрэмжийн шинжилгээ нь бүтэцгүй өгөгдөл, хэлний өөрчлөлтийг агуулдаг тул маш төвөгтэй байдаг. 

Байгалийн хэл боловсруулах (NLP) техник, мэдрэмжийн шинжилгээг өгөгдөл эерэг, сөрөг эсвэл төвийг сахисан эсэхийг тодорхойлоход ашиглаж болно. Текстийн туйлшралд анхаарлаа хандуулахаас гадна ууртай, аз жаргалтай, гунигтай гэх мэт тодорхой мэдрэмж, сэтгэл хөдлөлийг илрүүлж чаддаг. Мэдрэмжийн шинжилгээг хэн нэгэн сонирхож байгаа эсэх гэх мэт санаа зорилгыг тодорхойлоход ашигладаг. 

Мэдрэмжийн шинжилгээ нь бүх төрлийн бизнесүүдэд улам бүр ашиглагдаж байгаа маш хүчирхэг хэрэгсэл бөгөөд энэ үйл явцыг хэрэгжүүлэхэд туслах хэд хэдэн Python номын сан байдаг. 

Сэтгэл хөдлөлийн дүн шинжилгээ хийх шилдэг 10 Python сангууд энд байна. 

1. Хээ

Сэтгэл хөдлөлийн дүн шинжилгээ хийх шилдэг Python сангуудын жагсаалтыг тэргүүлж байгаа нь NLP, өгөгдөл олборлолт, сүлжээний дүн шинжилгээ, машин сурах, дүрслэлийг удирдах боломжтой олон зориулалттай Python номын сан болох Pattern юм. 

Загвар нь давуу болон харьцуулалтыг олох зэрэг өргөн хүрээний боломжуудыг олгодог. Энэ нь мөн бодит байдал, үзэл бодлыг илрүүлэх боломжтой бөгөөд энэ нь сэтгэл хөдлөлийн дүн шинжилгээ хийх хамгийн шилдэг сонголт болдог. Загварын функц нь өгөгдсөн текстийн туйлшрал болон субьектив байдлыг буцаадаг бөгөөд туйлшралын үр дүн өндөр эерэгээс маш сөрөг хүртэл хэлбэлздэг. 

Pattern-ийн зарим гол шинж чанарууд энд байна: 

  • Олон зориулалттай номын сан
  • Дээд болон харьцуулалтыг олох
  • Өгөгдсөн текстийн туйлшрал ба субьектив байдлыг буцаана
  • Туйлшрал нь маш эерэгээс маш сөрөг хүртэл хэлбэлздэг

2. ВАДЕР

Мэдрэмжийн шинжилгээний өөр нэг шилдэг сонголт бол VADER (Valence Aware Dictionary ба sEntiment Reasoner) бөгөөд энэ нь дүрэм/тайлбар толь бичигт суурилсан, NLTK доторх нээлттэй эхийн мэдрэмжийн анализаторын урьдчилан бүтээсэн номын сан юм. Энэхүү хэрэгсэл нь олон нийтийн мэдээллийн хэрэгслээр илэрхийлэгдсэн мэдрэмжүүдэд тусгайлан зориулагдсан бөгөөд энэ нь мэдрэмжийн лексикон болон ерөнхийдөө утгын чиг баримжаагаар нь эерэг эсвэл сөрөг гэж шошгологдсон үгийн сангийн шинж чанаруудын жагсаалтыг хослуулан ашигладаг. 

VADER нь текстийн мэдрэмжийг тооцоолж, өгөгдсөн оролтын өгүүлбэр эерэг, сөрөг эсвэл мэдрэлийн байх магадлалыг буцаана. Энэхүү хэрэгсэл нь Twitter, Facebook гэх мэт олон нийтийн мэдээллийн хэрэгслийн бүх төрлийн мэдээлэлд дүн шинжилгээ хийх боломжтой. 

VADER-ийн зарим үндсэн шинж чанарууд энд байна. 

  • Сургалтын мэдээлэл шаарддаггүй
  • Эмотикон, хэллэг, холбоо үг гэх мэтийг агуулсан текстийн мэдрэмжийг ойлгох. 
  • Сошиал медиа текстэд маш сайн
  • Нээлттэй эхийн номын сан

3. БЕРТ

BERT (Transformers-ийн хоёр чиглэлт кодлогчийн төлөөлөл) нь мэдрэмжийн шинжилгээ зэрэг NLP даалгавруудад ашиглагддаг шилдэг машин сургалтын загвар юм. Google-ийн 2018 онд бүтээсэн номын сан нь англи хэлний Wikipedia болон BooksCorpus дээр сургагдсан бөгөөд NLP даалгаврын хамгийн зөв номын сангуудын нэг болох нь батлагдсан. 

BERT нь том текстийн корпус дээр бэлтгэгдсэн тул хэлийг ойлгох, өгөгдлийн хэв маягийн хувьсах чадварыг сурах илүү чадвартай. 

BERT-ийн зарим үндсэн шинж чанарууд энд байна. 

  • Тохируулахад хялбар
  • Мэдрэмжийн шинжилгээ зэрэг өргөн хүрээний NLP даалгаврууд
  • Шошгогүй текстийн том корпус дээр сургасан
  • Гүн хоёр чиглэлтэй загвар

4. TextBlob

TextBlob бол мэдрэмжийн дүн шинжилгээ хийх өөр нэг гайхалтай сонголт юм. Энгийн Python номын сан нь текстэн өгөгдөл дээр нарийн төвөгтэй дүн шинжилгээ хийх, үйлдлүүдийг дэмждэг. Тайлбар толь бичигт суурилсан хандлагын хувьд TextBlob нь сэтгэгдлийг утгын чиг баримжаа болон өгүүлбэр дэх үг бүрийн эрч хүчээр тодорхойлдог бөгөөд энэ нь сөрөг болон эерэг үгсийг ангилах урьдчилан тодорхойлсон толь бичиг шаарддаг. Уг хэрэгсэл нь бүх үгэнд тус тусад нь оноо өгдөг бөгөөд эцсийн мэдрэмжийг тооцдог. 

TextBlob нь өгүүлбэрийн туйлшрал ба субьектив байдлыг буцаадаг бөгөөд туйлшралын муж нь сөрөгээс эерэг хооронд байдаг. Номын сангийн семантик шошго нь эмотикон, анхаарлын тэмдэг, эможи гэх мэт дүн шинжилгээ хийхэд тусалдаг. 

TextBlob-ийн зарим үндсэн шинж чанарууд энд байна: 

  • Энгийн Python номын сан
  • Текст өгөгдөл дээр нарийн төвөгтэй дүн шинжилгээ хийх, үйлдлүүдийг дэмждэг
  • Хувь хүний ​​мэдрэмжийн оноог өгдөг
  • Өгүүлбэрийн туйлшрал ба субъектив байдлыг буцаана

5. зайтай

Нээлттэй эх сурвалжийн NLP номын сан, spaCy бол сэтгэлийн дүн шинжилгээ хийх өөр нэг шилдэг сонголт юм. Номын сан нь хөгжүүлэгчдэд асар их хэмжээний текстийг боловсруулж, ойлгох боломжтой програмуудыг бий болгох боломжийг олгодог бөгөөд үүнийг байгалийн хэлийг ойлгох систем, мэдээлэл задлах системийг бий болгоход ашигладаг. 

SpaCy-ийн тусламжтайгаар та цахим шуудан, сошиал медиа, бүтээгдэхүүний тойм гэх мэт өргөн хүрээний эх сурвалжаас бүтээгдэхүүн, брэндийнхээ талаар гүн гүнзгий мэдээлэл цуглуулахын тулд сэтгэлийн шинжилгээ хийх боломжтой. 

SpaCy-ийн зарим гол онцлогууд энд байна. 

  • Хурдан бөгөөд хэрэглэхэд хялбар
  • Анхлан хөгжүүлэгчдэд тохиромжтой
  • Их хэмжээний текстийг боловсруулах
  • Өргөн хүрээний эх сурвалж бүхий мэдрэмжийн шинжилгээ

6. CoreNLP

Стэнфордын CoreNLP бол текстэнд хэл шинжлэлийн шинжилгээ хийхэд туслах хүний ​​хэлний технологийн төрөл бүрийн хэрэгслийг агуулсан өөр нэг Python номын сан юм. CoreNLP нь сэтгэл хөдлөлийн шинжилгээ зэрэг Стэнфордын NLP хэрэгслүүдийг агуулдаг. Мөн англи, араб, герман, хятад, франц, испани гэсэн нийт таван хэлийг дэмждэг. 

Мэдрэмжийн хэрэгсэл нь түүнийг дэмжих янз бүрийн програмуудыг агуулдаг бөгөөд уг загварыг аннотаторуудын жагсаалтад "сэтгэл хөдлөл"-ийг нэмж текстэд дүн шинжилгээ хийхэд ашиглаж болно. Энэ нь мөн дэмжлэг үзүүлэх командын мөр, сургалтын загварт дэмжлэгийг агуулдаг. 

CoreNLP-ийн зарим үндсэн шинж чанарууд энд байна. 

  • Стэнфордын NLP хэрэгслийг агуулсан
  • Таван хэлийг дэмждэг
  • "Сэтгэл"-ийг нэмж текстэд дүн шинжилгээ хийдэг
  • Тушаалын шугамын дэмжлэг ба загвар сургалтын дэмжлэг

7. scikit-сурах

Github дээрх бие даасан Python номын сан, scikit-learn нь анх SciPy номын сангийн гуравдагч талын өргөтгөл байсан юм. Энэ нь спам илрүүлэх, зураг таних зэрэгт ашигладаг сонгодог машин сургалтын алгоритмуудад ялангуяа ашигтай байдаг ч scikit-learn-ийг NLP даалгаврууд, түүний дотор мэдрэмжийн шинжилгээнд ашиглаж болно. 

Python номын сан нь текст эерэг эсвэл сөрөг байвал гарах загварыг сургах замаар өгөгдөлд дамжуулан үзэл бодол, мэдрэмжийг шинжлэхийн тулд сэтгэлийн шинжилгээ хийхэд тусална. Энэ нь хэд хэдэн боломжийг олгодог векторчид Оролтын баримт бичгүүдийг функцүүдийн вектор болгон хөрвүүлэх боломжтой бөгөөд энэ нь аль хэдийн суулгасан хэд хэдэн өөр ангилагчтай ирдэг. 

Scikit-learn-ийн зарим гол онцлогууд энд байна. 

  • SciPy болон NumPy дээр бүтээгдсэн
  • Бодит хэрэглүүрүүдээр батлагдсан
  • Төрөл бүрийн загвар, алгоритмууд
  • Spotify зэрэг томоохон компаниуд ашигладаг

8. Полиглот

Мэдрэмжийн шинжилгээний өөр нэг гайхалтай сонголт бол олон төрлийн NLP үйлдлүүдийг хийхэд ашигладаг нээлттэй эхийн Python номын сан болох Polyglot юм. Номын сан нь Numpy дээр суурилсан бөгөөд маш хурдан бөгөөд олон төрлийн тусгай тушаалуудыг санал болгодог. 

Polyglot-ийн хамгийн их борлуулалттай цэгүүдийн нэг нь олон хэлний өргөн хэрэглээний програмуудыг дэмждэг явдал юм. Баримт бичгийн дагуу энэ нь 136 хэлний мэдрэмжийн шинжилгээг дэмждэг. Энэ нь үр ашигтай, хурдан, шулуун гэдгээрээ алдартай. Полиглотыг ихэвчлэн spaCy дэмждэггүй хэлийг хамарсан төслүүдэд сонгодог. 

Полиглотын зарим гол шинж чанарууд энд байна. 

  • Мэдрэмжийн шинжилгээг дэмждэг 136 хэлтэй олон хэл
  • NumPy дээр бүтээгдсэн
  • Нээлттэй эх
  • Үр дүнтэй, хурдан бөгөөд шууд

9. ПиТорч

Бидний жагсаалтын төгсгөлд PyTorch, өөр нэг нээлттэй эхийн Python номын сан байна. Facebook-ийн хиймэл оюун ухааны судалгааны багийн бүтээсэн тус номын сан нь өгүүлбэр эерэг эсвэл сөрөг эсэхийг илрүүлэх мэдрэмжийн шинжилгээ зэрэг олон төрлийн программуудыг хэрэгжүүлэх боломжийг олгодог.

PyTorch нь маш хурдан гүйцэтгэлтэй бөгөөд хялбаршуулсан процессор эсвэл CPU болон GPU дээр ажиллах боломжтой. Та хүчирхэг API-уудаараа номын санг өргөжүүлэх боломжтой бөгөөд энэ нь байгалийн хэлний хэрэгсэлтэй. 

PyTorch-ийн зарим үндсэн шинж чанарууд энд байна. 

  • Үүлэн платформ ба экосистем
  • Бат бөх хүрээ
  • Маш хурдан
  • Хялбаршуулсан процессор, CPU эсвэл GPU дээр ажиллах боломжтой

10. Flair

Сэтгэл хөдлөлийн дүн шинжилгээ хийх шилдэг 10 Python номын сангийн жагсаалтыг хааж байгаа нь энгийн нээлттэй эхийн NLP номын сан болох Flair юм. Үүний хүрээ нь PyTorch дээр шууд бүтээгдсэн бөгөөд Flair-ийн ард байгаа судалгааны баг олон төрлийн даалгаварт зориулж хэд хэдэн урьдчилан бэлтгэгдсэн загваруудыг гаргасан. 

Урьдчилан бэлтгэгдсэн загваруудын нэг нь IMDB датасет дээр бэлтгэгдсэн мэдрэмжийн шинжилгээний загвар бөгөөд ачаалах, таамаглахад хялбар байдаг. Та мөн өгөгдлийн багцаа ашиглан ангилагчийг Flair-аар сургаж болно. Хэдийгээр энэ нь урьдчилан бэлтгэгдсэн ашигтай загвар боловч сургагдсан өгөгдөл нь Twitter гэх мэт бусад домэйнуудын адил ерөнхийдөө тохирохгүй байж магадгүй юм. 

Flair-ийн зарим гол онцлогууд энд байна: 

  • Нээлттэй эх
  • Хэд хэдэн хэлийг дэмждэг
  • Ашиглахад хялбар
  • Урьдчилан бэлтгэгдсэн хэд хэдэн загварууд, түүний дотор мэдрэмжийн шинжилгээ

Алекс Макфарланд бол хиймэл оюун ухааны хамгийн сүүлийн үеийн хөгжлийг судалж буй хиймэл оюун ухааны сэтгүүлч, зохиолч юм. Тэрээр дэлхий даяарх олон тооны хиймэл оюун ухааны стартапууд болон хэвлэлүүдтэй хамтран ажилласан.