Futuristična serija

6 najboljših knjig o strojnem učenju in AI vseh časov (maj 2024)

Posodobljeno on April 23, 2024

Svet umetne inteligence je lahko zastrašujoč zaradi terminologije in različnih algoritmov strojnega učenja, ki so na voljo. Potem ko sem prebral več kot 50 najbolj priporočljivih knjig o strojnem učenju, sem sestavil svoj osebni seznam knjig, ki jih je treba prebrati.

Izbrane knjige temeljijo na vrstah idej, ki so predstavljene, in na tem, kako dobro so predstavljeni različni koncepti, kot so globoko učenje, učenje z okrepitvijo in genetski algoritmi. Najpomembneje je, da seznam temelji na knjigah, ki futuristom in raziskovalcem najbolje utirajo pot k izgradnji dokazljivo odgovorne in razložljive umetne inteligence.

# 6. Kako deluje umetna inteligenca: od čarovništva do znanosti avtorja Ronald T. Kneusel

»Kako deluje umetna inteligenca« je jedrnata in jasna knjiga, zasnovana tako, da opiše temeljne temelje strojnega učenja. Ta knjiga olajša spoznavanje bogate zgodovine strojnega učenja, ki potuje od začetkov podedovanih sistemov umetne inteligence do pojava sodobnih metodologij.

Zgodovina je večplastna, začenši z dobro utemeljenimi sistemi AI, kot so podporni vektorski stroji, odločitvena drevesa in naključni gozdovi. Ti prejšnji sistemi so tlakovali pot prelomnemu napredku, ki je vodil v razvoj bolj sofisticiranih pristopov, kot so nevronske mreže in konvolucijske nevronske mreže. Knjiga govori o neverjetnih zmožnostih, ki jih ponujajo veliki jezikovni modeli (LLM), ki so gonilo današnjega najsodobnejšega generativnega umetne inteligence.

Razumevanje osnov, na primer, kako lahko tehnologija pretvorbe šuma v sliko posnema obstoječe posnetke in celo ustvari nove slike brez primere iz navidezno naključnih pozivov, je ključnega pomena za razumevanje sil, ki poganjajo današnje generatorje slik. Ta knjiga čudovito pojasnjuje te temeljne vidike in omogoča bralcem, da razumejo zapletenost in osnovno mehaniko tehnologij za ustvarjanje slik.

Ron Kneusel, avtor, izkazuje hvalevreden trud pri razjasnitvi svojih pogledov na to, zakaj ChatGPT OpenAI in njegov model LLM pomenita začetek prave umetne inteligence. Natančno predstavi, kako različni LLM-ji kažejo pojavne lastnosti, ki so zmožne intuitivnega razumevanja teorije uma. Zdi se, da te pojavne lastnosti postanejo bolj izrazite in vplivne glede na velikost modela usposabljanja. Kneusel razpravlja o tem, kako večja količina parametrov običajno povzroči najbolj spretne in uspešne modele LLM, kar zagotavlja globlji vpogled v dinamiko skaliranja in učinkovitost teh modelov.

Ta knjiga je svetilnik za tiste, ki želijo izvedeti več o svetu umetne inteligence, saj ponuja podroben, a razumljiv pregled evolucijske poti tehnologij strojnega učenja, od njihovih osnovnih oblik do današnjih pionirskih entitet. Ne glede na to, ali ste novinec ali nekdo, ki dobro razume to temo, je »Kako deluje umetna inteligenca« zasnovan tako, da vam zagotovi izpopolnjeno razumevanje transformativnih tehnologij, ki še naprej oblikujejo naš svet.

# 5. Življenje 3.0 avtorja Max Tegmark

"Življenje 3.0” ima ambiciozen cilj in to je raziskati možnosti, kako bomo sobivali z AI v prihodnosti. Splošna umetna inteligenca (AGI) je morebitna in neizogibna posledica argument eksplozije inteligence izdelal britanski matematik Irving Good leta 1965. Ta argument določa, da bo nadčloveška inteligenca rezultat stroja, ki se lahko nenehno samoizboljšuje. Slavni citat za eksplozijo inteligence je naslednji:

»Naj ultrainteligentni stroj definiramo kot stroj, ki lahko daleč preseže vse intelektualne dejavnosti katerega koli človeka, še tako pametnega. Ker je načrtovanje strojev ena od teh intelektualnih dejavnosti, bi ultrainteligentni stroj lahko oblikoval še boljše stroje; potem bi nedvomno prišlo do 'eksplozije inteligence' in človeška inteligenca bi ostala daleč zadaj. Tako je prvi ultrainteligentni stroj zadnji izum, ki bi ga človek kdaj potreboval."

Max Tegmark uvede knjigo v teoretično prihodnost življenja v svetu, ki ga nadzoruje AGI. Od tega trenutka naprej se postavljajo eksplozivna vprašanja, kot je na primer, kaj je inteligenca? Kaj je spomin? Kaj je računanje? in kaj je učenje? Kako ta vprašanja in možni odgovori sčasoma vodijo do paradigme stroja, ki lahko uporablja različne vrste strojnega učenja za doseganje prebojev v samoizboljšanju, ki so potrebni za doseganje človeške ravni inteligence, in neizogibno posledično superinteligenco?

To so vrsta naprednega razmišljanja in pomembna vprašanja, ki jih Life 3.0 raziskuje. Življenje 1.0 so preproste življenjske oblike, kot so bakterije, ki se lahko spremenijo le z evolucijo, ki spremeni svojo DNK. Life 2.0 so oblike življenja, ki lahko preoblikujejo lastno programsko opremo, na primer učenje novega jezika ali spretnosti. Life 3.0 je umetna inteligenca, ki ne more samo spremeniti svojega lastnega vedenja in veščin, temveč lahko spremeni tudi lastno strojno opremo, na primer nadgradi svoj robotski jaz.

Šele ko razumemo prednosti in pasti AGI, lahko začnemo pregledovati možnosti, da zagotovimo, da zgradimo prijazen AI, ki se lahko uskladi z našimi cilji. Da bi to naredili, bomo morda morali tudi razumeti, kaj je zavest? In kako se bo zavest AI razlikovala od naše?

Ta knjiga raziskuje veliko vročih tem in mora biti obvezno branje za vsakogar, ki resnično želi razumeti, kako je AGI potencialna grožnja, pa tudi potencialna rešilna bilka za prihodnost človeške civilizacije.

# 4. Človeško združljivo: umetna inteligenca in problem nadzora avtorja Stuart Russell

Kaj se zgodi, če nam uspe zgraditi inteligentnega agenta, nekaj, kar zaznava, kar deluje in je bolj inteligentno od svojih ustvarjalcev? Kako bomo prepričali stroje, da bodo dosegli naše cilje namesto svojih ciljev?

Zgoraj navedeno vodi do enega najpomembnejših konceptov knjige "Človeško združljivo: umetna inteligenca in problem nadzora« je, da se moramo izogibati »vstavljanju namena v stroj«, kot je nekoč rekel Norbert Wiener. Inteligenten stroj, ki je preveč prepričan o svojih stalnih ciljih, je najboljša vrsta nevarne umetne inteligence. Z drugimi besedami, če umetna inteligenca ne želi upoštevati možnosti, da se moti pri izvajanju svojega vnaprej programiranega namena in funkcije, potem morda ne bo mogoče, da bi se sistem umetne inteligence sam izklopil.

Težava, kot jo je opisal Stuart Russell, je v ukazovanju umetni inteligenci/robotu, da noben ukaz ni namenjen doseči za vsako ceno. Ni v redu žrtvovati človeško življenje, da bi prinesli kavo, ali speči mačko na žaru, da bi dobili kosilo. Treba je razumeti, da "čim hitreje me odpelji na letališče" ne pomeni, da so lahko kršeni predpisi o prehitri vožnji, tudi če to navodilo ni izrecno. Če se umetna inteligenca zmoti, potem je varnost pred izpadom določena vnaprej programirana stopnja negotovosti. Z nekaj negotovosti se lahko AI izzove, preden dokonča nalogo, da morda poišče verbalno potrditev.

V dokumentu iz leta 1965 z naslovom "Ugibanja o prvem ultrainteligenčnem stroju“, je IJ Good, briljantni matematik, ki je delal skupaj z Alanom Turingom, izjavil: “Preživetje človeka je odvisno od zgodnje konstrukcije ultrainteligentnega stroja”. Povsem možno je, da moramo zgraditi najnaprednejšo umetno inteligenco, ki jo lahko, da bi se rešili pred ekološko, biološko in humanitarno katastrofo.

Ta temeljni članek pojasnjuje eksplozijo inteligence, pri čemer ta teorija pravi, da lahko ultrainteligentni stroj oblikuje še boljše in boljše stroje z vsako ponovitvijo, kar neizogibno vodi do ustvarjanja AGI. Čeprav je lahko AGI na začetku enako inteligenten kot človek, bi v kratkem času hitro presegel ljudi. Zaradi tega vnaprejšnjega zaključka je za razvijalce umetne inteligence pomembno, da aktualizirajo temeljna načela, ki so predstavljena v tej knjigi, in se naučijo, kako jih varno uporabiti pri oblikovanju sistemov umetne inteligence, ki so sposobni ne samo služiti ljudem, temveč jih rešiti pred njimi samimi. .

Kot je opisal Stuart Russell, umik od raziskav umetne inteligence ni možnost, moramo iti naprej. Ta knjiga je načrt, ki nas vodi k oblikovanju varnih, odgovornih in dokazano koristnih sistemov umetne inteligence.

# 3. Kako ustvariti um avtor Ray Kurzweil

Ray Kurzweil je eden vodilnih svetovnih izumiteljev, mislecev in futuristov, so ga imenovali »nemirni genij« The Wall Street Journala in »najboljši misleči stroj« revije Forbes. Je tudi soustanovitelj Univerze Singularity in je najbolj znan po svoji revolucionarni knjigi »The Singularity is Near«. “Kako ustvariti um” se manj ukvarja z vprašanji eksponentne rasti, ki so značilnost njegovega drugega dela, namesto tega se osredotoča na to, kako moramo razumeti človeške možgane, da jih z obratnim inženiringom ustvarimo za končni misleči stroj.

Eno od temeljnih načel, opisanih v tem temeljnem delu, je, kako prepoznavanje vzorcev deluje v človeških možganih. Kako ljudje prepoznamo vzorce v vsakdanjem življenju? Kako nastanejo te povezave v možganih? Knjiga se začne z razumevanjem hierarhičnega razmišljanja, to je razumevanje strukture, ki je sestavljena iz različnih elementov, ki so razporejeni v vzorec, ta razporeditev nato predstavlja simbol, kot je črka ali znak, nato pa je to nadalje razporejeno v naprednejši vzorec kot je beseda in na koncu stavek. Sčasoma ti vzorci tvorijo ideje, te ideje pa se spremenijo v izdelke, za izgradnjo katerih so odgovorni ljudje.

Ker gre za knjigo Raya Kurzweila, seveda ne traja dolgo, preden se uvede eksponentno razmišljanje. "Zakon pospeševanja donosa« je zaščitni znak te temeljne knjige. Ta zakon prikazuje, kako se tehnologije in tempo pospeševanja pospešujejo zaradi težnje, da se napredek hrani sam s seboj, kar še povečuje stopnjo napredka. To razmišljanje lahko nato uporabimo za to, kako hitro se učimo razumeti in izvajati obratni inženiring človeških možganov. To pospešeno razumevanje sistemov za prepoznavanje vzorcev v človeških možganih se lahko nato uporabi za izgradnjo sistema AGI.

Ta knjiga je tako spremenila prihodnost umetne inteligence, da je Eric Schmidt najel Raya Kurzweila za delo pri projektih umetne inteligence, potem ko je končal branje te temeljne knjige. Nemogoče je orisati vse ideje in koncepte, o katerih se razpravlja v kratkem članku, kljub temu pa je to knjiga, ki jo morate prebrati, če želite bolje razumeti, kako delujejo človeške nevronske mreže, da bi oblikovali napredno umetna nevronska mreža.

Prepoznavanje vzorcev je ključni element za globoko učenje in ta knjiga ponazarja, zakaj.

# 2. Glavni algoritem avtorja Pedro Domingos

Osrednja hipoteza o Glavni algoritem je, da je vse znanje – preteklost, sedanjost in prihodnost – mogoče izpeljati iz podatkov z enim samim univerzalnim učnim algoritmom, ki je kvantificiran kot glavni algoritem. Knjiga podrobno opisuje nekatere vrhunske metodologije strojnega učenja, daje podrobne razlage, kako delujejo različni algoritmi, kako jih je mogoče optimizirati in kako lahko sodelujejo pri doseganju končnega cilja ustvarjanja glavnega algoritma. To je algoritem, ki je sposoben rešiti kakršno koli težavo, ki mu jo nahranimo, in to vključuje zdravljenje raka.

Bralec bo začel z učenjem o Naivni Bayes, preprost algoritem, ki ga je mogoče razložiti z eno preprosto enačbo. Od tam pospeši polno hitrost v bolj zanimive tehnike strojnega učenja. Da bi razumeli tehnologije, ki nas pospešujejo k temu glavnemu algoritmu, se učimo konvergenčnih osnov. Prvič, iz nevroznanosti se učimo o plastičnosti možganov, človeških nevronskih mrežah. Drugič, v lekciji preidemo na naravno selekcijo, da razumemo, kako oblikovati genetski algoritem, ki simulira evolucijo in naravno selekcijo. Z genetskim algoritmom se populacija hipotez v vsaki generaciji križa in mutira, od tam najmočnejši algoritmi proizvedejo naslednjo generacijo. Ta razvoj ponuja vrhunsko samoizboljšanje.

Drugi argumenti prihajajo iz fizike, statistike in seveda najboljšega računalništva. Nemogoče je celovito pregledati vse različne vidike, ki se jih dotika ta knjiga, zaradi ambicioznega obsega knjige, ki določa okvir za gradnjo glavnega algoritma. To ogrodje je to knjigo potisnilo na drugo mesto, saj vse druge knjige o strojnem učenju gradijo na tem v neki obliki.

# 1. Tisoč možganov avtorja Jeff Hawkins

"Tisoč možganov” gradi na konceptih, ki so obravnavani v prejšnji knjigi Jeffa Hawkinsa z naslovom “On Intelligence”. »On Intelligence« je raziskal okvir za razumevanje delovanja človeške inteligence in kako je mogoče te koncepte nato uporabiti za izgradnjo končnih sistemov AI in AGI. Temeljito analizira, kako naši možgani predvidevajo, kaj bomo doživeli, preden to izkusimo.

Čeprav je »Tisoč možganov« odlična samostojna knjiga, bomo v njej najbolj uživali in jo cenili, če »O inteligenci” se najprej prebere.

"Tisoč možganov" temelji na najnovejši raziskavi Jeffa Hawkinsa in podjetja, ki ga je ustanovil. numenta. Numenta ima primarni cilj razviti teorijo o delovanju neokorteksa, sekundarni cilj pa je, kako je mogoče to teorijo o možganih uporabiti za strojno učenje in strojno inteligenco.

Numentino prvo večje odkritje leta 2010 vključuje, kako nevroni napovedujejo, drugo odkritje leta 2016 pa je vključevalo zemljevidne referenčne okvire v neokorteksu. Knjiga najprej in predvsem podrobno opisuje, kaj je "teorija tisočerih možganov", kaj so referenčni okviri in kako teorija deluje v resničnem svetu. Ena najbolj temeljnih komponent te teorije je razumevanje, kako se je neokorteks razvil do svoje trenutne velikosti.

Neokorteks se je začel majhen, podobno kot pri drugih sesalcih, vendar se je eksponentno povečal (le omejen z velikostjo porodnega kanala), ne z ustvarjanjem ničesar novega, temveč z večkratnim kopiranjem osnovnega vezja. V bistvu tisto, kar razlikuje ljudi, ni organski material možganov, temveč število kopij enakih elementov, ki tvorijo neokorteks.

Teorija se nadalje razvija v to, kako je neokorteks oblikovan s približno 150,000 kortikalnimi stebri, ki niso vidni pod mikroskopom, saj med njimi ni vidnih meja. Kako ti kortikalni stebri komunicirajo med seboj, je implementacija temeljnega algoritma, ki je odgovoren za vsak vidik zaznavanja in inteligence.

Še pomembneje pa je, da knjiga razkriva, kako je mogoče to teorijo uporabiti pri izdelavi inteligentnih strojev in možne prihodnje posledice za družbo. Možgani se na primer naučijo modela sveta tako, da opazujejo, kako se vložki spreminjajo skozi čas, zlasti ko se uporablja gibanje. Kortikalni stebri potrebujejo referenčni okvir, ki je fiksiran na predmet; ti referenčni okviri omogočajo kortikalnemu stebru, da se nauči lokacij funkcij, ki določajo resničnost predmeta. V bistvu lahko referenčni okviri organizirajo katero koli vrsto znanja. To vodi do najpomembnejšega dela te temeljne knjige, ali so lahko referenčni okviri potencialno ključni manjkajoči člen pri izgradnji naprednejšega AI ali celo sistema AGI? Jeff sam verjame v neizogibno prihodnost, ko se bo AGI naučil modelov sveta z uporabo zemljevidov podobnih referenčnih okvirov, podobnih neokorteksu, in opravlja izjemno delo, ko ponazarja, zakaj verjame v to.