stubbur Hvað er ruglingsfylki? - Unite.AI
Tengja við okkur

AI 101

Hvað er ruglingsfylki?

mm
Uppfært on

Eitt öflugasta greiningartæki í vélanámi og gagnafræði í rugl fylkið. Ruglingsfylki er fær um að gefa rannsakendum nákvæmar upplýsingar um hvernig vélanámsflokkari hefur staðið sig með tilliti til markflokkanna í gagnasafninu. Ruglingsfylki mun sýna sýnidæmi sem hafa verið flokkuð á réttan hátt á móti rangflokkuðum dæmum. Við skulum skoða nánar hvernig ruglingsfylki er byggt upp og hvernig hægt er að túlka það.

Hvað er ruglingsfylki?

Byrjum á því að gefa einfalda skilgreiningu á ruglingsfylki. Ruglingsfylki er forspárgreiningartæki. Nánar tiltekið er það tafla sem sýnir og ber saman raunveruleg gildi við spáð gildi líkansins. Innan samhengis vélanáms er ruglingsfylki notað sem mælikvarði til að greina hvernig vélanámsflokkari stóð sig á gagnasafni. Ruglingsfylki býr til sjónræna mælikvarða eins og nákvæmni, nákvæmni, sérhæfni og muna.

Ástæðan fyrir því að ruglingsfylki er sérstaklega gagnlegt er sú að ólíkt öðrum tegundum flokkunarmælinga eins og einfaldri nákvæmni, myndar ruglingsfylki heildstæðari mynd af því hvernig líkan stóð sig. Aðeins að nota mælikvarða eins og nákvæmni getur leitt til aðstæðna þar sem líkanið er algjörlega og stöðugt að misgreina einn flokk, en það fer óséður vegna þess að árangur er að meðaltali góð. Á meðan, rugl fylkið gefur samanburð á mismunandi gildum eins og rangar neikvæðar, sannar neikvæðar, rangar jákvæðar og sannar jákvæðar.

Við skulum skilgreina mismunandi mælikvarða sem ruglingsfylki táknar.

Muna í ruglingsfylki

Muna er fjöldi raunverulega jákvæðra dæma deilt með fjölda fölsk-neikvæðra dæma og heildar jákvæðra dæma. Með öðrum orðum, innköllun er dæmigerð fyrir hlutfall sannra jákvæðra dæma sem vélanámslíkan hefur flokkað. Innköllun er gefin upp sem hlutfall jákvæðra dæma sem líkanið gat flokkað úr öllum jákvæðu dæmunum í gagnasafninu. Þetta gildi getur einnig verið nefnt „hithlutfall“ og tengt gildi er „næmi“, sem lýsir líkum á innköllun, eða hraða raunverulegra jákvæðra spára.

Nákvæmni í ruglingsfylki

Eins og muna, er nákvæmni gildi sem fylgist með frammistöðu líkans með tilliti til jákvæðrar dæmaflokkunar. Ólíkt muna þó, er nákvæmni umhugað um hversu mörg dæmanna sem líkanið merkti jákvætt voru sannarlega jákvæð. Til að reikna þetta út er fjölda sannra jákvæðra dæma deilt með fjölda rangra jákvæðra dæma auk sannra jákvæðra.

Til að gera greinarmun á muna og nákvæmni skýrari, nákvæmni miðar að því að reikna út hlutfall allra dæma sem merkt eru jákvæð sem voru sannarlega jákvæð, en muna fylgist með prósentu allra sannra jákvæðra dæma sem líkanið gæti þekkt.

Sérkenni í ruglingsfylki

Þó að innköllun og nákvæmni séu gildi sem rekja jákvæð dæmi og hið sanna jákvæða hlutfall, sérhæfni mælir hið sanna neikvæða hlutfall eða fjölda dæma sem líkanið skilgreindi sem neikvætt sem voru raunverulega neikvæð. Þetta er reiknað út með því að taka fjölda dæma sem flokkast sem neikvæð og deila þeim með fjölda rangra jákvæðra dæma ásamt raunverulegu neikvæðu dæmunum.

Að hafa skilning á ruglingsfylki

Mynd: Jackverr í gegnum Wikimedia Commons, (https://commons.wikimedia.org/wiki/File:ConfusionMatrix.png), CC BY SA 3.0

Dæmi um ruglingsfylki

Eftir að hafa skilgreint nauðsynleg hugtök eins og nákvæmni, muna, næmi og sértækni, getum við skoðað hvernig þessi mismunandi gildi eru táknuð innan ruglingsfylkis. Ruglingsfylki er myndað í flokkunartilvikum, sem á við þegar um tvo eða fleiri flokka er að ræða. Ruglingsfylki sem myndast getur verið eins hátt og breitt og nauðsynlegt er og geymt hvaða fjölda flokka sem þú vilt, en í einföldunarskyni munum við skoða 2 x 2 ruglingsfylki fyrir tvöfalda flokkunarverkefni.

Sem dæmi má gera ráð fyrir að verið sé að nota flokkunartæki til að ákvarða hvort sjúklingur sé með sjúkdóm eða ekki. Eiginleikarnir verða færðir inn í flokkarann ​​og flokkarinn mun skila einni af tveimur mismunandi flokkum - annað hvort er sjúklingurinn ekki með sjúkdóminn eða svo.

Byrjum á vinstri hlið fylkisins. Vinstri hlið ruglingsfylkisins táknar spárnar sem flokkarinn gerði fyrir einstaka flokka. Tvöfaldur flokkunarverkefni mun hafa tvær línur hér. Varðandi efsta hluta fylkisins, þá fylgist það með sönnum gildum, raunverulegum flokkamerkjum, gagnatilvikanna.

Hægt er að túlka ruglingsfylki með því að skoða hvar raðir og dálkar skerast. Athugaðu spár líkansins gegn sönnum merkjum líkansins. Í þessu tilviki eru True Positives gildin, fjöldi réttar jákvæðra spár, staðsett í efra vinstra horninu. Falsku jákvæðu atriðin eru að finna í efra hægra horninu, þar sem dæmin eru í raun neikvæð en flokkarinn merkti það sem jákvætt.

Neðra vinstra hornið á hnitanetinu sýnir tilvik sem flokkarinn hefur merkt sem neikvæð en voru raunverulega jákvæð. Að lokum er neðra hægra hornið á ruglingsfylki þar sem True Negative gildin eru að finna, eða þar sem raunverulega röng dæmi eru.

Þegar gagnasafnið inniheldur fleiri en tvo flokka vex fylkið um það marga flokka. Til dæmis, ef það eru þrír flokkar, verður fylkið 3 x 3 fylki. Burtséð frá stærð ruglingsfylkisins er aðferðin við að túlka þau nákvæmlega sú sama. Vinstra megin inniheldur spáð gildi og raunveruleg flokksmerki liggja yfir efst. Tilvikin sem flokkarinn hefur spáð rétt fyrir um keyra á ská frá efst til vinstri til neðst til hægri. Með því að skoða fylkið er hægt að greina fjórar forspármælingar sem fjallað er um hér að ofan.

Til dæmis er hægt að reikna út muna með því að taka sanna jákvæðu og falska neikvæðu, leggja þá saman og deila þeim með fjölda sannra jákvæðra dæma. Á sama tíma er hægt að reikna út nákvæmni með því að sameina rangar jákvæðar og sannar jákvæðar og skipta síðan gildinu í heildarfjölda sanna jákvæða.

Þó að maður gæti eytt tíma í að reikna mælikvarða handvirkt eins og nákvæmni, muna og sérhæfni, þá eru þessar mælingar svo almennt notaðar að flest vélanámssöfn hafa aðferðir til að sýna þær. Til dæmis, Scikit-learn fyrir Python hefur aðgerð sem býr til ruglingsfylki.

Bloggari og forritari með sérsvið í vél Learning og Deep Learning efni. Daniel vonast til að hjálpa öðrum að nota kraft gervigreindar í félagslegum tilgangi.