Ajatusjohtajat
Pyhä Graal laskennallisen tehon aiheessa tekoälyssä

Huolimatta uskomattomasta edistymisestä, tekoälyn kykyjä rajoittavat edelleen odotukset, jotka perustuvat todellisiin maailman odotuksiin. Rakennamme monimutkaisia malleja, ajamme neuroverkkoja ja testaamme algoritmeja, mutta edistys askartelee usein odottamattomissa paikoissa.
Ongelma ei usein ole algoritmeissa tai tiedoissa, vaan laskennallisessa tehossa, joka mahdollistaa mallien oppimisen ja toiminnan tarvittavassa mittakaavassa. Mitä siis piilee tämän esteen takana? Tarkastelkaamme tärkeää resurssia, jota ilman edes lupaavimmat tekoälyprojektit eivät voi siirtyä laboratoriosta eteenpäin.
Laskennan puute ja sen seuraukset
Ymmärtääksemme tämän aiheen, aloitetaan matkustaen mobiiliviestinnän historiaan. Kun 3G- ja myöhemmin 4G-verkkoteknologiat ilmestyivät, internet oli jo lähes globaali. Ja kun 5G esiteltiin, monet ihmiset esittivät täysin järkevän kysymyksen: “Internet on nopeampi – mutta mitä se merkitsee?”
Todellisuudessa internetin nopeuden lisääntyminen ei ole vain käyttäjien mukavuutta. Se muuttaa koko teknologisen maiseman. Käyttötarkoitukset, jotka olivat aiemmin mahdottomia, tulevat mahdollisiksi. 5G osoittautui oleivan paljon nopeampi kuin 4G, ja tämä hyppy ei ollut asteittainen, kuten siirtymä 1G:stä 2G:hen, vaan eksponentiaalinen. Tämän seurauksena uudet sovellukset, laitteet ja koko teknologian luokat voivat ilmestyä.
Liikennevalokamerat, reaaliaikaiset liikenteen analyysijärjestelmät ja automaattiset liikenteen säätömekanismit – kaikki tämä tulee mahdolliseksi uusien viestintäteknologioiden ansiosta. Poliisi saa uusia keinoja tietojen vaihtoon, ja avaruudessa teleskoopit ja satelliitit voivat lähettää valtavat määrät tietoa Maahan. Laadullinen hyppy perustavanlaatuisessa teknologiassa ajaa koko ekosysteemin kehitystä.
Sama periaate koskee laskennallista tehoa. Kuvitellaan ihmiskunnan kokonaislaskennallinen kapasiteetti hypoteettisissa yksiköissä. Tänään meillä saattaa olla, sanotaan, kymmenen tällaista yksikköä. Niiden avulla voimme generoida kuvia ja videoita, kirjoittaa tekstejä, luoda markkinointimateriaalia… Tämä on jo merkittävää, mutta sovellusten valikoima on pääasiassa rajoitettu.
Kuvitellaan, että meillä ei olisi kymmenen, vaan tuhat tällaista yksikköä. Yhtäkkiä teknologiat, jotka olivat aiemmin liian kalliita, tulevat toteuttamiskelpoisiksi, ja startupit, jotka hylättiin korkeiden laskennallisten kustannusten vuoksi, alkavat tuottaa taloudellista järkeä.
Ota esimerkiksi robotitaksit. Nykyään ne riippuvat pääasiassa heikoista paikallisista tietokoneista, jotka on asennettu ajoneuvoon. Mutta jos videovirta lähetettäisiin pilveen, jossa on valtavat laskennalliset resurssit, data voitaisiin prosessoida ja palauttaa reaaliajassa. Ja tämä on kriittistä: auto, joka liikkuu 100 km/h, on tehtävä päätöksiä sekunneissa – suoraan, kääntyä, jarruttaa tai ei jarruttaa.
Silloin täysin toimiva robotitaksialan tulee mahdolliseksi, ei vain eristyneitä ratkaisuja, joita näemme tänään. Mikä tahansa paikallinen tietokone, joka on asennettu autoon, on luonnostaan rajoitettu tavalla, joka ei ole yhteydessä oleva järjestelmä. Mitä nopeammin voimme skaalata sitä, sitä nopeammin maailma ympärillämme muuttuu.
Pääsy piireihin ja “kultainen lippu” tekoälyssä
Laskennallisen tehon kontekstissa nousee kysymys: onko pääsy moderniin piireihin muuttumassa “kultaiseksi lipuksi” tekoälymarkkinoille? Luovatko suuret toimijat, jotka allekirjoittavat sopimukset piirivalmistajien kanssa tai valmistavat niitä itse, aukon suurten yritysten ja muiden välille?
Tällainen aukko ilmenee vain yhdessä tapauksessa: jos liiketoimintamalli on keskittynyt yksinomaan piirien myymiseen suurille asiakkaille. Käytännössä valmistajat kuten NVIDIA pyrkivät tarjoamaan pilviratkaisuja kaikille. Heidän optimoidut piirinsä ovat saatavilla pilvessä sekä OpenAI:lle että itsenäisille kehittäjille.
Jopa strategiset liitot yritysten välillä, kuten Google, Anthropic, Microsoft, OpenAI, Amazon ja NVIDIA, ovat pääasiassa yhteistyössä jaettujen resurssien hyödyntämiseksi, eikä markkinoiden sulkemiseksi. Tämä malli mahdollistaa laskennallisten resurssien tehokkaan jakamisen, jolloin teknologisen kehityksen kiihdyttäminen.
Jos jäljitetään laskennallisten resurssien ketjua, se alkaa loppukäyttäjästä. Esimerkiksi kun käytät WhatsAppia videopuheluun ja viestintään, yrityksen on varmistettava, että palvelu toimii: tietojen tallentaminen ja prosessointi, mallien ajaminen videon puhdistamiseen, efektiensä lisäämiseen ja kuvanlaadun parantamiseen.
Omien palvelimien ylläpitäminen on kallista, ne vanhenevat, ja niiden ylläpito vaatii jatkuvaa huolenpitoa. Siksi pilviratkaisut, “pilvi”, ovat syntyneet. Markkinaa hallitsevat kolme toimijaa: Google Cloud, AWS ja Microsoft Azure. Muut yritykset eivät voi kilpailla tässä mittakaavassa: infrastruktuurin mittakaava on liian laaja.
Pilvipalvelut ovat massiivisia tietokeskuksia, joissa on jäähdytys, voimansaanti ja ympäri vuorokauden huolto. Niissä on palvelimia ja erikoispiirejä NVIDIA:ltä, AMD:ltä ja muilta valmistajilta, mikä mahdollistaa laajamittaiset laskennalliset prosessit.
Tässä kohtaa tulemme avainkysymykseen, jonka käsitin aiemmassa kirjoituksessani tietokeskuksista, ja haluan jatkaa sitä tässä: mikä on pääsyyllinen tässä järjestelmässä? Onko se sähkön puute tai vaikeus jäähdyttää tietokeskuksia alueilla, joissa ilmasto tekee siitä erityisen haasteellisen? Todellisuudessa salaisuus piilee piireissä itse…
Pyhä Graal
Miksi NVIDIA on tänään arvoltaan noin 5 biljoonaa dollaria ja lasketaan maailman menestyneimpiin pörssinoteerattuihin yrityksiin? Syy on yksinkertainen: NVIDIA valmistaa piirejä, joilla tekoälymallit koulutetaan ja suoritetaan.
Kunkin näistä piireistä kuluttaa valtavat määrät sähköä, kun koulutetaan suuria malleja tai prosessoidaan kasvavia tietomääriä. Mutta miten tehokkaasti tuo energia käytetään? Tässä kohtaa erikoispiirit tulevat mukaan; ne hoitavat tiettyjä tehtäviä paljon tehokkaammin kuin yleiskäyttöiset GPU:t.
Tekoälymallit eroavat. OpenAI:llä on yksi malliperhe, Anthropic toinen. Käsitteet saattavat olla samanlaiset, mutta matemaattiset rakenteet ja laskennalliset prosessit ovat erilaiset. Yleiskäyttöinen piiri, joka kouluttaa OpenAI-malleja (kuten ChatGPT) verrattuna Anthropic-malleihin (kuten Claude), toimii “yksi kokoa” -työkaluna, kuluttaen, sanotaan, 100 000 tuntia laskentaa yhdelle mallille ja 150 000 toiselle. Tehokkuus vaihtelee merkittävästi ja on harvoin optimaalinen.
Yritykset ratkaisevat tämän ongelman valmistamalla erikoispiirejä. Esimerkiksi yksi piiri voidaan optimoida ChatGPT-arkkitehtuuriin ja kouluttaa siinä, sanotaan, 20 minuutissa, kun taas toinen on suunniteltu Anthropicin arkkitehtuuriin ja suorittaa myös koulutuksen 20 minuutissa. Energiankulutus ja koulutusaika vähenevät useita kertoja verrattuna yleiskäyttöiseen piiriin.
Kun nämä piirit myydään suurille yrityksille, kuten Google, Amazon, Microsoft tai Azure, ne tarjotaan erillisinä tuotteina. Käyttäjät voivat valita, esimerkiksi, piirin, joka on optimoitu YOLO-mallille tai yksinkertaisemman, halvemman piirin Xen-arkkitehtuuriin. Tällä tavoin yritykset saavat pääsyn laskennallisiin resursseihin, jotka on suunniteltu heidän tehtäviinsä, eikä yleiskäyttöisiin GPU:hin. Jos käyttäjällä on kymmenen eri toimintoa, hän voi käyttää kymmentä eri erikoispiiriä.
Trendi on selvä: erikoispiirit korvaavat vähitellen yleiskäyttöisiä piirejä. Monet startupit työskentelevät ASIC:ien (Application-Specific Integrated Circuits) parissa, piirejä, jotka on suunniteltu tiettyihin laskennallisiin tehtäviin. Ensimmäiset ASIC:t ilmestyivät Bitcoin-kaivostoiminnassa: aluksi cryptocurrency kaivettiin NVIDIA:n GPU:illa, sitten piirejä luotiin yksinomaan Bitcoinille, eikä niillä voinut suorittaa muita tehtäviä.
Näen tämän käytännössä: sama laitteistokonfiguraatio voi tuottaa täysin erilaisia tuloksia riippuen tehtävästä. Omassa startupissani Introspector tutkimme näitä prosesseja todellisissa projekteissa, ja strategisena neuvonantajana Keymakr:ssa havainnan, miten asiakkaat saavat tehokkuutta erikoispiireistä, mikä mahdollistaa mallien suorittamisen nopeammin. Projektit, jotka aiemmin tyrehtivät koulutuksen tai suorituksen aikana, saavuttavat vakaat tulokset tällä lähestymistavalla.
Mutta kapea erikoistuminen kantaa riskejä. Piiri, joka on optimoitu Anthropicin arkkitehtuuriin, ei toimi OpenAI-mallien kouluttamiseen, ja päinvastoin. Jokainen uusi arkkitehtuuri vaatii uuden sukupolven laitteita, mikä luo riskin laajamittaisesta “vanhenemisesta”. Jos Anthropic julkaisee uuden arkkitehtuurin huomenna, kaikki edellisen sukupolven piirit tulevat tehottomiksi tai käyttökelvottomiksi. Uusien piirien valmistaminen maksaa miljardeja dollareita ja voi kestää vuosia.
Tämä luo dilemmansa: pitäisikö valmistaa erikoispiirejä, jotka toimivat täydellisesti kapeassa skenaariossa, vai jatkaa yleiskäyttöisten piirien valmistamista, jotka ratkaisevat kaikki tehtävät kohtuullisesti hyvin, mutta eivät vaadi täydellistä korvaamista, kun arkkitehtuureja muutetaan?
Tehokkuus tällä kontekstissa mitataan kolmella pääparametrillä: suoritusaika, sähkönkulutus ja lämmöntuotto. Nämä mitat liittyvät suoraan toisiinsa: mitä kauemmin järjestelmä suorittaa, sitä enemmän energiaa se kuluttaa ja sitä enemmän lämpöä se tuottaa. Yhden parametrin vähentäminen parantaa automaattisesti muita kahta.
Tässä piilee tekoälyn suorituskyvyn “pyhä Graal”: jos ainakin yksi perustavanlaatuisista tehokkuusmittareista voidaan optimoida, muut mittarit paranevat melkein automaattisesti.
Kestävä prosessi
Erikoispiirien kasvavan käytön myötä ylijäämän riski on tullut ajankohtaiseksi. Tällä hetkellä ylijäämäkalustosta on jo merkittävä, ja yritykset ovat ratkaisemassa tätä ongelmaa eri kestävillä tavoilla, mukaan lukien olemassa olevien resurssien uudelleenkäyttö.
Laitteiden kierrätys on kestävän kehityksen avainosa teknologia-alalla. Piirit sisältävät merkittäviä määriä jalometalleja, kuten kultaa, kuparia, alumiinia, palladiumia ja harvinaisia maametalleja, sekä materiaaleja, joita käytetään mikropiireissä ja transistoreissa. Kun laitteet vanhenevat, nämä arvokkaat resurssit voidaan palauttaa tuotantoon, mikä vähentää uusien komponenttien kustannuksia ja samalla vähentää teollisuuden ympäristövaikutuksia.
Jotkut erikoistuneet tehtaat ja yritykset keskittyvät kierrätysprosesseihin ja jalometallien erottamiseen vanhoista komponenteista. Esimerkiksi jotkut laitokset käyttävät hydrometallurgisia prosesseja ja edistyneitä kemiallisia menetelmiä kultaa ja kuparia erottamaan korkealla puhtausasteella, mikä mahdollistaa näiden materiaalien uudelleenkäytön uusissa piireissä.
Lisäksi yritykset ovat ottaneet käyttöön suljetun mallin, jossa vanhaa laitteistoa päivitetään tai integroidaan uusiin ratkaisuihin, mikä vähentää tarvetta primäärisille raaka-aineille. Tällaiset lähestymistavat auttavat vähentämään jätettä ja samalla vähentävät tuotannon hiilijalanjälkeä, koska perinteinen kaivostoiminta ja metallinjalostus vaativat merkittäviä määriä energiaa.
Piirien ja laitteiden elinkaaren kestävä hallinta voisi tulla teollisuuden standardiksi, jossa teknologinen edistysaskel on yhdistetty ympäristövastuuseen.












