Kunsmatige Intelligensie

KI-stelsels verkies moontlik menslike taal in plaas van numeriese data

Opgedateer on Desember 9, 2022

nuwe navorsing afkomstig van Columbia Engineering dui daarop dat kunsmatige intelligensie (KI) stelsels menslike taal verkies in plaas van syferdata soos 1'e en 0'e. Die nuwe studie is van professor Hod Lipson in meganiese ingenieurswese en PhD-student Boyuan Chen, en dit het getoon dat KI-stelsels hoër prestasievlakke kan bereik as dit met menslike taalklanklêers geprogrammeer word.

In 'n vergelyking langs mekaar het die navorsers bevind dat 'n neurale netwerk wat deur klanklêers opgelei is, hoër prestasievlakke bereik het om voorwerpe te identifiseer, in vergelyking met die ander netwerk wat met eenvoudige binêre insette geprogrammeer is.

Lipson is 'n James en Sally Scapa-professor in innovasie en 'n lid van Columbia se Data Science Institute.

"Om te verstaan hoekom hierdie bevinding betekenisvol is, is dit nuttig om te verstaan hoe neurale netwerke gewoonlik geprogrammeer word, en waarom die gebruik van die klank van die menslike stem 'n radikale eksperiment is," het hy gesê.

Die gebruik van binêre getalle is kompak en presies, terwyl menslike taal meer kompleks en nie-binêr is wanneer dit in 'n digtale lêer vasgelê word. Programmeerders wyk gewoonlik nie van die getalle af wanneer hulle 'n neurale netwerk ontwikkel nie, aangesien dit hoogs doeltreffend is.

Die span het met hierdie navorsing begin nadat hulle gedink het dat neurale netwerke nie hul volle potensiaal bereik nie, en hulle het geglo dat hulle vinniger en beter kan wees as hulle opgelei word met die menslike stem en spesifieke woorde.

Opleiding van die netwerke

Wanneer 'n nuwe masjienleertegniek getoets word, lei KI-navorsers dikwels 'n neurale netwerk op om spesifieke voorwerpe en diere in 'n versameling foto's te herken.

Die span, wat Chen, Lipson, Yu Li en Susan Raghupathi ingesluit het, het 'n beheerde eksperiment opgestel om hul hipotese te toets, en hulle het twee nuwe neurale netwerke geskep. Hulle het probeer om hulle op te lei om 10 verskillende soorte voorwerpe te herken tussen 50,000 XNUMX foto's wat "oefenbeelde" genoem word.

Een van die KI-stelsels is op 'n meer tradisionele manier met numeriese waardes opgelei, terwyl die eksperimentele neurale netwerk baie anders opgelei is. Dit is gevoer met 'n datatabel met rye wat 'n foto van 'n dier of voorwerp bevat, en die tweede kolom het 'n menslike stem-oudiolêer gehad, wat die woord vir die dier of voorwerp uitgespreek het. Daar was geen 1'e of 0'e betrokke by die eksperimentele netwerk nie.

Albei die KI-stelsels is vir 'n totaal van 15 uur opgelei. Die resultate het getoon dat die oorspronklike netwerk met 'n reeks van tien 1'e en 0'e geantwoord het, terwyl die eksperimentele neurale netwerk 'n stem voortgebring het wat duidelik probeer "sê" wat die voorwerp in die beeld is. Alhoewel die oorspronklike stem nie verstaanbaar was nie, het dit uiteindelik 'n punt bereik om meestal korrek te wees.

Die twee netwerke het ewe goed gevaar en die dier of voorwerp 92% van die tyd korrek geïdentifiseer. Die navorsers het toe besluit om die eksperiment vir 'n tweede keer uit te voer, maar hierdie keer het hulle minder foto's tydens die proses gebruik.

Die tradisionele netwerk het swak gevaar as gevolg van spaardata, soos verwag sou word, wat tot ongeveer 35% akkuraatheid gedaal het. Die eksperimentele netwerk het egter twee keer so goed gevaar, met 70% akkuraatheid, ondanks minder data.

Behalwe kategoriese etiketvoorstelling vir beeldklassifikasie

Beyond Categorical Label Representation for Image Classification

Watch this video on YouTube

Verrassende resultate

Volgende keer het die span moeiliker beelde gebruik, soos 'n korrupte beeld van 'n hond. Selfs met die moeiliker beelde was die stemopgeleide neurale netwerk ongeveer 50% van die tyd korrek, terwyl die tradisionele netwerk net 20% akkuraat was.

Boyuan Chen is die hoofnavorser van die studie.

“Ons bevindinge is direk in stryd met hoeveel kenners opgelei is om oor rekenaars en syfers te dink; dit is 'n algemene aanname dat binêre insette 'n meer doeltreffende manier is om inligting na 'n masjien oor te dra as oudiostrome van soortgelyke inligting 'rykheid',” verduidelik Chen. “Trouens, toe ons hierdie navorsing by 'n groot KI-konferensie ingedien het, het een anonieme beoordelaar ons referaat verwerp bloot omdat hulle gevoel het ons resultate is net 'te verrassend en onintuïtief'.

"As jy dink aan die feit dat menslike taal al tienduisende jare deur 'n optimaliseringsproses gaan, dan maak dit volkome sin dat ons gesproke woorde 'n goeie balans tussen geraas en sein gevind het," het Lipson gesê. "Daarom, wanneer dit deur die lens van Shannon Entropy gesien word, maak dit sin dat 'n neurale netwerk wat met menslike taal opgelei is beter sal presteer as 'n neurale netwerk wat met eenvoudige 1'e en 0'e opgelei is."

Die studie sal op 3 Mei 2021 by die Internasionale Konferensie oor Leervoorstellings aangebied word.

"Ons moet daaraan dink om nuwe en beter maniere te gebruik om KI-stelsels op te lei in plaas daarvan om groter datastelle te versamel," het Chen gesê. "As ons heroorweeg hoe ons opleidingsdata aan die masjien aanbied, kan ons 'n beter werk as onderwysers doen."

"Een van die grootste raaisels van menslike evolusie is hoe ons voorvaders taal verwerf het, en hoe kinders so moeiteloos leer praat," voeg Lipson by. "As menslike kleuters die beste leer met herhalende gesproke onderrig, kan KI-stelsels miskien ook."

Verwante onderwerpe:AI kunsmatige intelligensie Kunsmatige neurale netwerke

Pexip werk saam met NVIDIA om meeslepende videovergadering-ervarings te skep

Moenie mis nie

Habana Labs AI-versnellers om in Voyager-superrekenaar gebruik te word

Alex McFarland

Alex McFarland is 'n KI-joernalis en skrywer wat die jongste ontwikkelings in kunsmatige intelligensie ondersoek. Hy het wêreldwyd met talle KI-opstarters en publikasies saamgewerk.