AI 101
Å to je NLU (Razumijevanje prirodnog jezika)?
Razumijevanje prirodnog jezika (NLU) je tehniÄki koncept unutar Å”ire teme obrade prirodnog jezika. NLU je proces odgovoran za prevoÄenje prirodnih, ljudskih rijeÄi u format koji raÄunalo može protumaÄiti. U biti, prije nego Å”to raÄunalo može obraditi jeziÄne podatke, mora ih razumjeti.
Tehnike za NLU ukljuÄuju koriÅ”tenje zajedniÄke sintakse i gramatiÄkih pravila kako bi se raÄunalu omoguÄilo razumijevanje znaÄenja i konteksta prirodnog ljudskog jezika. Krajnji cilj ovih tehnika je da Äe raÄunalo imati "intuitivno" razumijevanje jezika, sposobno pisati i razumjeti jezik baÅ” onako kako to Äini Äovjek, bez stalnog pozivanja na definicije rijeÄi.
Definiranje NLU (razumijevanje prirodnog jezika)
Postoje brojne tehnike koje kompjuterski znanstvenici i NLP struÄnjaci koriste kako bi omoguÄili raÄunalima da razumiju ljudski jezik. VeÄina tehnika spada u kategoriju "sintaktiÄke analize". SintaktiÄke analitiÄke tehnike ukljuÄuju:
- lematizacija
- raspoloženje
- segmentacija rijeÄi
- raÅ”Älanjivanje
- morfoloŔku segmentaciju
- lomljenje reÄenice
- oznaÄavanje dijela govora
Ove sintaktiÄke analitiÄke tehnike primjenjuju gramatiÄka pravila na grupe rijeÄi i pokuÅ”avaju koristiti ta pravila za izvoÄenje znaÄenja. Nasuprot tome, NLU radi koriÅ”tenjem tehnika "semantiÄke analize".
SemantiÄka analiza primjenjuje raÄunalne algoritme na tekst, pokuÅ”avajuÄi razumjeti znaÄenje rijeÄi u njihovom prirodnom kontekstu, umjesto oslanjanja na pristupe temeljene na pravilima. GramatiÄka ispravnost/netoÄnost izraza ne mora nužno biti u korelaciji s valjanoÅ”Äu izraza. Mogu postojati fraze koje su gramatiÄki toÄne, ali besmislene, i fraze koje su gramatiÄki netoÄne, ali imaju znaÄenje. Kako bi razlikovao najsmislenije aspekte rijeÄi, NLU primjenjuje niz tehnika namijenjenih otkrivanju znaÄenja skupine rijeÄi s manje oslanjanja na gramatiÄku strukturu i pravila.
NLU je polje koje se razvija i mijenja i smatra se jednim od teÅ”kih problema umjetne inteligencije. Razvijaju se razne tehnike i alati kako bi strojevi mogli razumjeti ljudski jezik. VeÄina NLU sustava ima zajedniÄke osnovne komponente. Potreban je leksikon za jezik, kao i neka vrsta analizatora teksta i gramatiÄka pravila za usmjeravanje stvaranja prikaza teksta. Sustav takoÄer zahtijeva teoriju semantike kako bi se omoguÄilo razumijevanje reprezentacija. Postoje razne semantiÄke teorije koje se koriste za tumaÄenje jezika, poput stohastiÄke semantiÄke analize ili naivne semantike.
UobiÄajene NLU tehnike ukljuÄuju:
Prepoznavanje imenovanih entiteta je proces prepoznavanja "imenovanih entiteta", koji su ljudi i važna mjesta/stvari. Prepoznavanje imenovanih entiteta funkcionira razlikovanjem temeljnih koncepata i referenci u tijelu teksta, identificiranjem imenovanih entiteta i njihovim smjeÅ”tanjem u kategorije kao Å”to su lokacije, datumi, organizacije, ljudi, radovi itd. Nadzirani modeli temeljeni na gramatiÄkim pravilima obiÄno se koriste za izvoÄenje NER-a zadaci.
ViÅ”eznaÄnost rijeÄi i smisla je proces odreÄivanja znaÄenja ili smisla rijeÄi na temelju konteksta u kojem se rijeÄ pojavljuje. RazliÄitost smisla rijeÄi Äesto koristi oznake dijela govora kako bi kontekstualizirala ciljnu rijeÄ. Nadzirane metode razjaÅ”njenja smisla rijeÄi ukljuÄuju koriÅ”tenje vektorskih strojeva za podrÅ”ku i uÄenje temeljeno na memoriji. MeÄutim, veÄina modela razjaÅ”njenja smisla rijeÄi su polu-nadzirani modeli koji koriste i oznaÄene i neoznaÄene podatke.
Primjeri NLU (razumijevanje prirodnog jezika)
UobiÄajeni primjeri NLU-a ukljuÄuju automatsko rasuÄivanje, automatsko usmjeravanje karata, strojno prevoÄenje i odgovaranje na pitanja.
Automatizirano rasuÄivanje
Automatizirano zakljuÄivanje je disciplina koja ima za cilj dati strojevima odreÄenu vrstu logike ili rezoniranja. To je grana kognitivne znanosti koja nastoji izvoditi zakljuÄke na temelju medicinskih dijagnoza ili programski/automatski rjeÅ”avati matematiÄke teoreme. NLU se koristi za pomoÄ u prikupljanju i analizi informacija i stvaranju zakljuÄaka na temelju informacija.
Automatsko usmjeravanje karata
NLU se Äesto koristi za automatizaciju zadataka korisniÄke službe. Kada se generira tiket korisniÄke službe, chatbotovi i drugi strojevi mogu protumaÄiti osnovnu prirodu potreba korisnika i preusmjeriti ih na odgovarajuÄi odjel. Tvrtke primaju tisuÄe zahtjeva za podrÅ”ku svaki dan, tako da su NLU algoritmi korisni u odreÄivanju prioriteta prijava i omoguÄavanju agentima za podrÅ”ku da njima postupaju na uÄinkovitije naÄine.
Strojni prijevod
TeÅ”ko je toÄno prevesti govor ili tekst s jednog jezika na drugi. Zapravo, strojni prijevod jedan je od najtežih problema u NLP-u i NLU-u. Mnogi sustavi za strojno prevoÄenje oslanjaju se na lingvistiÄka pravila za prevoÄenje izmeÄu jezika, ali istraživaÄi traže sofisticiranije naÄine prevoÄenja izmeÄu jezika. NLU strojno prevoÄenje pokuÅ”ava omoguÄiti toÄniji prijevod oÄuvanjem konteksta i semantiÄkih informacija povezanih s ciljnim tekstom. Najprecizniji sustavi za strojno prevoÄenje kombiniraju lingvistiÄka pravila s algoritmima koji izvlaÄe semantiÄko znaÄenje.
Odgovaranje na pitanje
Prepoznavanje govora koristi NLU tehnike kako bi omoguÄilo raÄunalima razumjeti pitanja postavljen s prirodnim jezikom. NLU se koristi kako bi korisnicima ureÄaja dao odgovor na njihovom prirodnom jeziku, umjesto da im pruži popis moguÄih odgovora. Kada digitalnom pomoÄniku postavite pitanje, NLU se koristi da pomogne strojevima da razumiju pitanja, odabiruÄi najprikladnije odgovore na temelju znaÄajki kao Å”to su prepoznati entiteti i kontekst prethodnih izjava.