Ajatusjohtajat

Tekoälykriisi: Miksi infrastruktuuri on tärkein

mm
A professional technician in a modern data center inspecting a server rack with a tablet, showing a contrast between older server cabinets and new, high-density AI infrastructure.

Teckoäly on merkittävin teknologia elämämme aikana, ja lähestymme merkittävää käännekohtaa, joka muuttaa liiketoimintakenttää.

Teckoälyn käyttöönotto on kasvamassa, ja 78 %:lla yrityksistä on tekoälyä käytössä vuonna 2025, ja markkinoiden arvioidaan olevan 1,81 biljoonaa dollaria vuoteen 2030 mennessä. Mutta kasvun takana on vaikeampi totuus: monilla yrityksillä on vaikeuksia kääntää tekoälyä todellisiksi, skaalattaviksi ja konkreettisiksi tuloksiksi. On selvää, että monet yritykset ottavat tekoälyn käyttöön ilman operatiivisia muutoksia, joita tarvitaan sen käyttämiseen laajassa mittakaavassa ja täydellä arvolla.

Samaan aikaan tekoälyn taustalla oleva infrastruktuuri ei ole kehittynyt tarpeeksi. Organisaatiot ja mallit ovat edelleen rajoitettuja saatavilla olevan GPU-laskennan määrästä, ja saatavilla oleva datakeskuksen kapasiteetti on ennätyksellisen alhainen koko maailmassa. Uuden tekoälykapasiteetin kehittäminen on rajoitettu sähköntarjonnan, rakennusajankohdan ja työvoimapulon vuoksi.

Tämä on tekoälykriisi – jakautuminen niiden välillä, jotka rakentavat ja ottavat tekoälyn käyttöön tarvittavassa tahdissa, ja niiden, jotka ovat rajoitettuja perinteisten mallien vuoksi. Vuoteen 2035 mennessä on mahdollista, että tämä kuilu voi vaatia puolet nykyisistä yrityksistä. Kilpailu on alkanut: sopeudu tai kuole.

Teckoälyn lupaavuuden toteuttaminen

Vuoden jälkeen otsikkoja herättävistä, useiden gigawattien ilmoituksista, organisaatiot kohtaavat lopulta markkinatodellisuuden tänä vuonna. Kuka todella toteuttaa tekoälyä ja kuka vain luottaa otsikoihin ja lehdistötiedotteisiin ollakseen osa keskustelua.

Ero kertomuksen ja toteutuksen välillä tulee selvemmäksi, erityisesti kun tekoälyn tuotto on todellinen johtoryhmän fokus tänään. Voittajat ovat organisaatiot, jotka voivat koota koko pinon yhteen, eli GPU-huippukapasiteetin, sähkön, pääoman ja kestävän toimitusketjun, ja osoittaa sen toiminnassa ja tuloksissa, ei vain markkinoinnissa. Ne, jotka toteuttavat, kiihdyttävät nopeasti ja nousevat luotettaviksi pitkän aikavälin johtajiksi. Ne, jotka ovat kiinni luovissa ilmoituksissa, jäävät jälkeen. Ja kuilu jatkuu kasvamassa näiden kahden välillä.

Rajoittavat tekijät

Laskennan säännöt ovat muuttuneet perusteellisesti. Vuodesta 2019 lähtien tekoälymallien laskentakapasiteetti on tuplaantunut noin joka 10 kuukauden välein. Genen tekoälyn kehittyminen on kiihdyttänyt kasvua, ja NVIDIA:n äärimmäinen suunnitteluratkaisu on asettanut vauhtia, joka vain kiihtyy. Mutta useimmat datakeskukset on suunniteltu perinteisten työkuormien mukaan, eivät modernin GPU-laskennan, jääntymisen, lämmönvaatimusten ja liikenteen mukaan.

Perinteiset lähestymistavat eivät pysy tekoälyyn perustuvan muutoksen tahdissa. Yrittää ajaa tekoälykuormia perinteisissä ympäristöissä on kuin yhdistää nopeasti paraneva Formula 1 -moottori perheen autoon; kori ei ole suunniteltu käsittelemään suorituskykyä ja muutosta. Ja kun perinteisesti rakennettu datakeskus tulee käyttöön, laitteisto on jo kehittynyt sen suunnitteluparametrien ulottumattomiin.

Koko teollisuuden alalla, jossa on sijoitettu miljardeja perinteiseen infrastruktuuriin, tämä luo epämukavan todellisuuden. Joko omaksutaan uudelleenrakentamisen kustannukset, toivotaan, että vanhemmat prosessorit säilyttävät arvonsa, tai jäävätkö jälkeen niiden, jotka suunnittelivat muuttuvan tekoälyn alusta alkaen. Tärkeää on, että jälkiasennus on vaikeaa. Edistys vaatii tarkoituksenmukaista infrastruktuuria, mukaan lukien suoraan piiriin nestehäily, korkean kaistanleveyden verkkorakenteet ja uudelleensuunnitellut voimajärjestelmät.

Rakentaminen jatkuvaan muutokseen

Tähän ongelmaan vaaditaan täysin uudenlainen lähestymistapa infrastruktuuriin, joka on jo saavuttamassa suosiota. Teollisuus siirtyy joustavia, standardoituja yksiköitä, jotka voidaan ottaa käyttöön, päivittää ja korvata osittain, kun vaatimukset kehittyvät. Sen sijaan, että rakennettaisiin kiinteitä laitoksia, jotka on optimoitu tiettyyn ajankohtaan, operointiyksiköt ottavat yhä enemmän käyttöön kapasiteettia vaiheittain, lisäten tiheämpää segmenttiä, kun piirirakenteet ja sähköntarpeet muuttuvat.

Tämä joustavampi lähestymistapa voi nyt tarjota GPU-optimoitua kapasiteettia kuukausien sijaan vuosien. Ulkopuolinen valmistus ja standardoidut komponentit mahdollistavat järjestelmien rakentamisen ja testaamisen säädetyissä ympäristöissä, kiihdyttäen käyttöönottoa ja vähentäen paikan päällä tarvittavaa monimutkaisuutta ja ammattitaitoista työvoimaa. Olennaisesti, päivitykset voidaan suorittaa, kun muu osa laitosta on edelleen toiminnassa, ja poistetut osat voidaan kunnostaa ja uudelleen ottaa käyttöön, pidentäen käyttöikää, vähentäen浪费a ja maksimoiden tuoton.

Sopeutuminen on elintärkeää ympäristössä, jossa suorituskykyvaatimukset kehittyvät nopeammin kuin perinteisten datakeskusten elinikä. Joustavuus on nyt määrittävä vaatimus perinteisen joustamattomuuden sijaan, johon olemme tottuneet perinteisissä rakenteissa.

Teckoälykriisi on jo täällä

Teckoälykriisi ei ole enää tuleva skenaario; se on toteutumassa reaaliajassa. Ero datakeskuksien välillä, jotka on suunniteltu jatkuvaan muutokseen, ja niiden, jotka ovat rajoitettuja perinteisten oletusten vuoksi, on jo nähtävissä, ja se kiihtyy tästä lähtien. Tämä ei ole pelkästään teknologinen sykli; se on rakenteellinen reset, miten infrastruktuuria suunnitellaan, rahoitetaan ja toimitetaan. Organisaatiot, jotka omaksuvat sopeutumisen, kokoavat koko pinon yhteen ja toteuttavat vauhdilla, määrittävät seuraavan vuosikymmenen. Loput eivät vain jää jälkeen, vaan ne tulevat olemaan merkityksettömiä.

Harqs Singh, teknologiajohtaja ja InfraPartnersin perustaja, johtaa yhtiön kehitystyötä AI-pohjaisissa datakeskuksissa, jotka on valmistettu edistyneillä etävalmistusmenetelmillä. Aikaisemmin BlackRockin teknologia- ja datajohtajana Harqsilla on syvä asiantuntemus digitaalisessa infrastruktuurissa, tekoälyssä ja kestävyydessä globaaleilla alustoilla. Hänen kokemuksensa monipuolisilla aloilla syventää hänen lähestymistapaansa ja kannustaa häntä edistämään innovatiivisia liiketoimintamalleja ja toimialan muutosta.

Harqs on tunnustettu innovaatioiden edistäjä toimialalla ja on ollut aktiivisesti mukana muokkaamassa toimialan parhaita käytäntöjä ja luomassa standardeja, kuten Data Center Maturity Model.