Connect with us

Kunstig intelligens

Fotonicke brikker ser ut til å øke hastigheten på AI-prosesser dramatisk

mm

Et team av forskere søkte nylig å bruke fotonicke prosessorer til kunstig intelligens-applikasjoner, og viste at fotonicke prosessorer kan overgå den informasjonsbehandlingskapasiteten til vanlige elektroniske brikker.

Forskingsteamet utviklet en ny brikkearkitektur og tilnærming som kombinerer datalagring og dataprosessering i én enhet. Brikken ble laget med faseendringsmateriale (som brukes i DVD-er). Fotonicke (lysbaserte) prosessorer brukes til å produsere en datamaskinbrikke som kan utføre beregninger med høy hastighet, og i en studie som nylig ble publisert i Nature, kunne forskningsteamet vise at disse nye brikken kunne forbedre tradisjonelle elektroniske brikker betydelig, takket være deres evne til å raskt prosessere informasjon parallelt.

Matris-vektor-multiplikasjon

De neurale nettverkene som ligger under mange av de mest avanserte AI-applikasjonene, opererer gjennom matris-vektor-multiplikasjon. Forskingsteamet lagde et maskinvar-basert akselerasjonssystem som muliggjør disse multiplikasjonene å utføres parallelt. De optiske brikken utnytter det faktum at forskjellige lysspekter ikke forstyrer hverandre, noe som betyr at de kan brukes til å utføre beregninger parallelt. Forskingsteamet brukte en “frekvenskomb” utviklet av EPFL, som lyskilde for å gi den fotonicke brikken de forskjellige lysspekterne.

Utviklingen av frekvenskomben ble ledet av professor Tobias Kippenberg ved EPFL. Kippenburg er en av hovedforfatterne av studien, sammen med medforfatter Wolfram Pernice fra Münster Universitet. Ifølge Pernice kan lysbaserte prosessorer øke hastigheten på de beregningsintensive oppgavene som er involvert i maskinlæring, og utføre beregninger med enda høyere hastighet enn spesialisert maskinvare som Tensor Processing Units (TPU-er) og de mest avanserte GPU-ene.

Neuralt nettverkstreningsprosess

Etter at de fotonicke brikken var designet og bygget, testet forskerne dem på et neuralt nettverk som var designet for å gjenkjenne håndskrevne tall. Nettverkstreningsprosessen tok i bruk den bølgelengdemultiplexingen som var muliggjort av brikken, og den kunne oppnå høyere datarater og beregningsdensiteter enn noensinne før.

Som Johannes Feldmann, hovedforfatter av studien og doktorgradsstudent ved Münster Universitet forklarte via TechXplore:

“Konvolusjonsoperasjonen mellom inndata og ett eller flere filter – som kan være en markering av kanter i et bilde, for eksempel – kan overføres svært godt til vår matrisarkitektur. Utnytting av lys for signaloverføring muliggjør at prosessoren kan utføre parallell dataprosessering gjennom bølgelengdemultiplexing, noe som fører til en høyere beregningsdensitet og mange matrisemultiplikasjoner som utføres i bare ett tidssteg.”

Arbeidet er bemerkelsesverdig på grunn av at det kunne muliggjøre at neurale nettverk kan trenes på store datasett på en brøkdel av den vanlige tiden det tar å trenere et nettverk. Når store data blir enda større, blåst opp av internettet og den økende spredningen av smarte enheter, vil dataforskere trenge nye måter å holde trenings tidene på store datasett så lavt som mulig. Tradisjonell elektronik opererer vanligvis i det lave GHz-området, mens optisk modulasjonshastighet kan gå opp til 50 GHz til 100 GHz-området.

Forskningen kunne ha viktige implikasjoner for applikasjoner som skytjenester, medisinsk bildebehandling og autonome kjøretøy, som alle krever evnen til å prosessere store mengder data fra multiple kilder så raskt som mulig.

Forskningsprosjektet var et resultat av et samarbeid mellom et internasjonalt team av forskere fra Pitt Universitet, Universitetet i Münster i Tyskland, Englands Exeter og Oxford Universiteter, IBM Zurich og École Polytechnique Fédérale (EPFL) i Sveits.

Blogger og programmerer med spesialområder i Machine Learning og Deep Learning emner. Daniel håper å hjelpe andre med å bruke kraften av AI for sosialt godt.