cung Hulumtuesi kryesor për Amazon Alexa argumenton se Testi Turing është i vjetëruar - Unite.AI
Lidhu me ne

Inteligjenca e Përgjithshme Artificiale

Hulumtuesi kryesor për Amazon Alexa argumenton se Testi Turing është i vjetëruar

mm
Përditësuar on

Rohit Prasad, nënkryetar dhe shkencëtar kryesor i Alexa në Amazon, kohët e fundit argumentoiTesti Turing, i përdorur prej kohësh për të matur sofistikimin e modeleve të AI, duhet të tërhiqet si pikë referimi për AI.

Shkencëtari kompjuterik dhe matematikani Alan Turing fillimisht prezantoi konceptin e testit Turing më shumë se 70 vjet më parë. Qëllimi i testit Turing ishte të ndihmonte në përgjigjen e pyetjes së inteligjencës së makinës, duke përcaktuar nëse një makinë ishte e aftë të "mendonte" në kuptimin njerëzor. Për t'iu përgjigjur kësaj pyetjeje, Turing argumentoi se nëse makinat mund të shfaqin sjellje bisedore aq të sofistikuara sa që një vëzhgues njerëzor nuk mund të dallojë midis dialogut të kompjuterit dhe dialogut të njeriut, makina duhet të konsiderohet e aftë për të menduar.

Kufizimet e Testit Turing

Prasad argumentoi se testi i Turingut është i kufizuar në shumë mënyra dhe se vetë Turing madje ka vërejtur disa nga këto kufizime në punimin e tij fillestar. Ndërsa AI është bërë gjithnjë e më shumë i integruar në çdo aspekt të jetës sonë, njerëzit kujdesen më pak që ajo të mos dallohet nga një njeri dhe më shumë që ndërveprimet e tyre me AI të jenë të pandërprera, argumenton Prasad. Për këtë arsye, testi Turing duhet të konsiderohet i vjetëruar dhe të zëvendësohet me standarde më të dobishme.

Prasad vuri në dukje se shumë chatbot të hershëm u krijuan duke pasur parasysh kalimin e testit Turing dhe vitet e fundit disa chatbot kanë arritur vazhdimisht të mashtrojnë më shumë se një të tretën e gjyqtarëve njerëzorë (shiriti që kërkohej për të kaluar testin Turing). Sidoqoftë, duke qenë në gjendje të imitoni me sukses modelet e të folurit të njerëzve nuk do të thotë se një makinë mund të konsiderohet vërtet "inteligjente". Modelet e AI mund të jenë jashtëzakonisht të aftë në një fushë dhe jashtëzakonisht të munguara në të tjerat, duke mos pasur asnjë formë të inteligjencës së përgjithshme. Pavarësisht kësaj, testi Turing mbetet një pikë referimi e përdorur zakonisht për chatbot dhe asistentët dixhitalë, me Prasad duke vënë në dukje se drejtuesit e biznesit dhe gazetarët vazhdimisht pyesin se kur Alexa do të jetë në gjendje të kalojë testin Turing.

Sipas Prasad, një nga çështjet kryesore me përdorimin e testit Turing për të vlerësuar inteligjencën e makinerisë është se ai ul pothuajse tërësisht aftësinë e makinave për të kërkuar informacion dhe për të kryer llogaritje të shpejta rrufe. Programet e AI injektojnë pauza artificiale në përgjigje të pyetjeve të ndërlikuara të matematikës dhe gjeografisë për të mashtruar njerëzit, por ato kanë një përgjigje për pyetje të tilla pothuajse menjëherë. Përtej kësaj, testi Turing nuk merr parasysh aftësinë në rritje të AI për të përdorur të dhënat e mbledhura nga sensorë të jashtëm, duke injoruar mënyrën se si AI-të mund të ndërveprojnë me botën përreth tyre përmes vizionit dhe algoritmeve të lëvizjes, duke u mbështetur vetëm në komunikimin me tekst.

Krijimi i standardeve të reja

Prasad argumentoi se duhet të krijohen forma të reja të matjes së inteligjencës, metoda që janë më të përshtatshme për vlerësimin e një lloji të përgjithshëm të inteligjencës. Këto teste duhet të pasqyrojnë se si AI përdoret në të vërtetë në shoqërinë moderne dhe qëllimet e njerëzve për përdorimin e saj. Testet duhet të jenë në gjendje të përcaktojnë se sa mirë një AI rrit inteligjencën njerëzore dhe sa mirë AI përmirëson jetën e përditshme të njerëzve. Më tej, një test duhet të kuptojë se si një AI po manifeston tipare të inteligjencës të ngjashme me njeriun, duke përfshirë aftësinë gjuhësore, vetë-mbikëqyrjen dhe "mendjen e shëndoshë".

Fushat aktuale dhe të rëndësishme të kërkimit të AI, si arsyetimi, drejtësia, bashkëbisedimi dhe të kuptuarit shqisor nuk vlerësohen nga testi Turing, por ato mund të maten në mënyra të ndryshme. Prasad shpjegoi se një mënyrë për të matur këto tipare të inteligjencës është zbërthimi i sfidave në detyra përbërëse. Një metodë tjetër për vlerësimin është krijimi i një sfide në shkallë të gjerë në botën reale për ndërveprimin njeri-kompjuter.

Kur Amazon krijoi çmimin Alexa, krijoi një rubrikë që kërkonte që robotët socialë të flisnin me një njeri për 20 minuta. Robotët do të vlerësohen në aftësinë e tyre për të biseduar në mënyrë koherente për një gamë të gjerë temash si teknologjia, sporti, politika dhe argëtimi. Konsumatorët ishin përgjegjës për shënimin e robotëve gjatë fazës së zhvillimit, duke u caktuar atyre pikë bazuar në dëshirën e tyre për të biseduar përsëri me robotin. Gjatë raundit final, gjyqtarët e pavarur ishin përgjegjës për vlerësimin e robotëve duke përdorur një shkallë prej 5 pikësh. Rubrika e përdorur nga gjyqtarët mbështetej në metoda që lejojnë AI-të të shfaqin atribute të rëndësishme njerëzore si ndjeshmëria, aty ku është e përshtatshme.

Në fund të fundit, Prasad argumentoi se përhapja në rritje e pajisjeve të fuqizuara nga AI si Alexa përfaqëson një mundësi të rëndësishme për të matur progresin e AI, por do të na duhen metrika të ndryshme për të përfituar nga kjo mundësi e re.

"Inteligjenca artificiale e tillë duhet të jetë ekspert në një numër të madh detyrash gjithnjë në rritje, gjë që është e mundur vetëm me aftësi më të përgjithësuar të të mësuarit në vend të inteligjencës specifike të detyrës," shpjegoi Prasad. "Prandaj, për dekadën e ardhshme dhe më tej, dobia e shërbimeve të AI, me aftësitë e tyre biseduese dhe ndihmëse proaktive në pajisjet e ambientit, janë një provë e denjë."

 

Bloger dhe programues me specialitete në Mësim Machine Mësim i thellë temave. Daniel shpreson të ndihmojë të tjerët të përdorin fuqinë e AI për të mirën sociale.