Connect with us

Ajatusjohtajat

Tekoälykatastrofi: Miksi infrastruktuuri on tärkein

mm
A professional technician in a modern data center inspecting a server rack with a tablet, showing a contrast between older server cabinets and new, high-density AI infrastructure.

Tekoäly on merkittävin teknologia elämämme aikana, ja lähestymme suurta käännekohtaa, joka muuttaa liiketoimintamaiseman.

Otto on kasvamassa, ja 78% yrityksistä ottaa tekoälyn käyttöön vuonna 2025, ja markkinoiden arvioidaan olevan 1,81 biljoonaa dollaria vuoteen 2030 mennessä. Kasvun taustalla on kuitenkin vaikeampi totuus: monilla yrityksillä on vaikeuksia kääntää tekoälyä todellisiksi, skaalattaviksi ja konkreettisiksi tuloksiksi. On selvää, että monet ottaa tekoälyn käyttöön ilman operatiivisia muutoksia, jotka vaaditaan sen suorittamiseen laajassa mittakaavassa ja täydellä arvolla.

Samaan aikaan tekoälyn taustalla oleva infrastruktuuri ei ole kehittymässä tarvittavalla tahdilla. Organisaatiot ja mallit ovat edelleen rajoitettuja saatavilla olevan GPU-laskennan määrässä, kun taas saatavilla oleva datakeskuksen kapasiteetti on ennätyksellisen alhainen koko maailmassa. Uuden tekoälykapasiteetin kehittäminen on rajoitettua saatavilla olevan sähköntarjonnan, rakennusaikataulujen ja työvoimapulon vuoksi.

Tämä on tekoälykatastrofi – jakautuminen niiden välillä, jotka rakentavat ja ottavat tekoälyn käyttöön tarvittavassa tahdissa, ja niiden, jotka ovat rajoitettuja konservatiivisilla perinnetapoilla. Vuoteen 2035 mennessä on mahdollista, että tämä kuilu voi vaatia puolet nykyisistä yrityksistä. Kilpailu on käynnissä: sopeudu tai kuole.

Tekoälyn lupausten toteutus

Vuoden jälkeen, jolloin olemme nähneet otsikkoja, jotka ovat kerrottu useista gigawatteja, organisaatiot kohtaavat lopulta markkinatodellisuuden tänä vuonna. Kuka on todella toteuttamassa asioita, ja kuka vain luottaa otsikoihin ja lehdistötiedotteisiin ollakseen osa keskustelua.

Ero tarinan ja toteutuksen välillä tulee selkeämmin ilmi, erityisesti kun tekoälyn tuotto on todellinen johtoryhmän fokus tänään. Voittajat ovat organisaatiot, jotka voivat koota koko pinon yhteen, eli GPU-huippu, sähkö, pääoma ja kestävä toimitusketju, ja osoittaa sen toiminnassa ja tuotossa, ei vain markkinoinnissa. Ne, jotka toteuttavat, kiihdyttävät nopeasti ja nousevat luotettaviksi pitkän aikavälin johtajiksi. Ne, jotka ovat kiinni luovissa ilmoituksissa, jäävät jälkeen. Ja kuilu jatkaa laajenemistaan näiden kahden välillä.

Rajoittavat tekijät

Laskennan säännöt ovat muuttuneet perustavasti. Vuodesta 2019 lähtien tekoälymallien laskentakapasiteetti on tuplaantunut noin joka 10 kuukauden välein. Gen AI:n kehittyminen on kiihdyttänyt kasvua, ja NVIDIA:n äärimmäinen yhteensuunnittelu on asettanut tahdin, joka vain kiihtyy. Kuitenkin useimmat datakeskukset on suunniteltu perinteisten työkuormien mukaan, eivätkä ne ole suunniteltu modernin GPU-laskennan tehokkuuden, jäähdytysvaatimusten ja liikenteen malleja varten.

Perinteiset lähestymistavat eivät pysy tekoälyajoittaisen muutoksen tahdissa. Yrittää ajaa tekoälytyökuormia perinteisissä ympäristöissä on kuin yhdistää nopeasti paraneva Formula 1 -moottori perheen autoon; kori ei ole suunniteltu käsittelemään suorituskykyä ja muutosta. Ja kun perinteisesti rakennettu datakeskus tulee käyttöön, laitteisto on jo kehittynyt sen suunnitteluparametrien ulkopuolelle.

Koko teollisuuden alueella, jossa on sijoitettu miljardeja perinteiseen infrastruktuuriin, tämä luo epämukavan todellisuuden. Joko omaksua kustannukset uudelleenrakentamisesta, toivoo, että vanhemmat sirut säilyvät arvokkaina, tai jää tasaisesti jälkeen niiden, jotka suunnittelivat muuttuvan tekoälyn alusta alkaen. Tärkeää on, että jälkiasennus on vaikeaa. Edistys vaatii tarkoituksenmukaista infrastruktuuria, mukaan lukien suoraan sirun jäähdytys, korkean kaistanleveyden verkkotyö ja uudelleensuunnitellut voimajärjestelmät.

Rakentaminen jatkuvaan muutokseen

Ongelman ratkaisu vaatii täysin uuden lähestymistavan infrastruktuuriin, joka on jo saavuttamassa suosiota. Teollisuus siirtyy joustavia, standardoituja yksiköitä, jotka voidaan ottaa käyttöön, päivittää ja korvata osissa, kun vaatimukset kehittyvät. Sen sijaan, että rakennettaisiin kiinteitä tiloja, jotka on optimoitu tiettyyn ajankohtaan, operaattorit ovat yhä enenevissä määrin käyttäjiä kapasiteettia vaiheittain, lisäten korkeampitiheyksisiä osia, kun siruarkkitehtuuri ja tehovaatimukset muuttuvat.

Tämä joustavampi lähestymistapa voi nyt toimittaa GPU-optimoitua kapasiteettia kuukausissa, ei vuosissa. Ulkopuolinen valmistus ja standardoidut komponentit mahdollistavat järjestelmien rakentamisen ja testaamisen kontrolloiduissa ympäristöissä, kiihdyttäen käyttöönottoa ja vähentäen paikan päällä olevaa monimutkaisuutta ja ammattitaitoista työvoimaa. Olennaisesti, päivitykset voidaan suorittaa, kun muu sivusto on edelleen toiminnassa, ja poistetut osat voidaan kunnostaa ja uudelleen ottaa käyttöön, pidentäen käyttöikää, vähentäen浪费a ja maksimoiden tuoton.

Sopeutumiskyky on olennainen ympäristössä, jossa suorituskykyvaatimukset kehittyvät nopeammin kuin perinteisten datakeskusten elinikä. Joustavuus on nyt määrittävä vaatimus perinteisen joustamattomuuden sijaan, jota olemme tottuneet perinteisiin rakennuksiin.

Katastrofi on jo täällä

Tekoälykatastrofi ei ole enää tuleva skenaario; se on tapahtumassa reaaliajassa. Ero datakeskuksien välillä, jotka on suunniteltu jatkuvaan muutokseen, ja niiden, jotka ovat rajoitettuja perinteisten oletusten mukaan, on jo nähtävissä, ja se kiihtyy tästä lähtien. Tämä ei ole pelkästään teknologinen sykli; se on rakenteellinen reset siitä, miten infrastruktuuria suunnitellaan, rahoitetaan ja toimitetaan. Organisaatiot, jotka omaksuvat sopeutumiskyvyn, kokoavat koko pinon yhteen ja toteuttavat nopeasti, määrittävät seuraavan vuosikymmenen. Loput eivät vain jää jälkeen, vaan ne tulevat olemaan merkityksettömiä.

Harqs Singh, Chief Technology Officer ja InfraPartnersin perustaja, johtaa yrityksen kehitystä AI-tietokeskuksissa, jotka on rakennettu edistyneen etävalmistuksen avulla. Aikaisemmin BlackRockin teknologian ja data- ja AI:n COO, Harqsilla on syvä asiantuntemus digitaalisessa infrastruktuurissa, AI:ssa ja kestävyydessä globaaleilla alustoilla. Hänen kokemuksensa monilla aloilla rikastaa hänen lähestymistapaansa ja kannustaa häntä edistämään innovatiivisia liiketoimintamalleja ja toimialan muutosta.

Harqs on tunnustettu innovaatioiden edistämisestä alalla ja on ollut aktiivisesti mukana muotoilemassa toimialan parhaita käytäntöjä ja rakentamisen standardeja, kuten Data Center Maturity Model.