Connect with us

Ajatusjohtajat

Milla Jovovichin MemPalace pyrkii ratkaisemaan tekoälyn muistiongelman

mm
A woman standing in a luminous, neoclassical hallway, interacting with glowing holographic data structures representing a

Miljoonat ihmiset avaa päivittäin chat-ikkunan ja alkavat selittää itseään tekoälylle (AI). Se kuuntelee tarkkaavaisesti, luo välittömästi älymäisen kuulostavan vastauksen ja sitten, kun istunto päättyy, unohtaa jokaisen yksityiskohdan vuorovaikutuksesta.

Tämän rituaalin mittakaava on hämmästyttävä. Yksin ChatGPT käsittelee yli miljardi kyselyä päivässä, ja siinä on yli 800 miljoonaa viikoittain aktiivista käyttäjää vuoden 2025 lopussa. Generatiivisen tekoälyn käyttö on saavuttanut yli 16 % maailman väestöstä, luku joka ei ollut merkittävä kolme vuotta sitten.

Tähän malliin tukeutuu valtava infrastruktuuri, jolla on kasvava ympäristöhintansa: Yhdysvaltain datakeskukset kuluttivat 183 terawattituntia sähköä vuonna 2024, mikä on enemmän kuin 4 % maan kokonaissähkönkulutuksesta, tai noin Pakistanin vuosittaisen sähkönkulutuksen verran.

Tekoälyjärjestelmien muistin puutteen vuoksi suuri osa tästä energiasta kuluu kontekstin uudelleenluomiseen. Toistuvat selitykset, projektien uudelleenesittelyt ja kontekstin kaataminen kunkin istunnon alussa ovat hukkaan menevää laskentaa.

Muisti on se, mikä muuttaa työkalun yhteistyökumppaniksi

Tekoälyavustajilla ei ole oletusarvoisesti pysyvää muistia. Tämä ei olisi ongelma, jos käyttäisimme tekoälyä laskimena: syötä luku, saat tuloksen, siirry eteenpäin.

Mutta useimmat ihmiset eivät enää käytä sitä tavalla. Heillä on pitkiä, iteraatioita vaativia, syvästi kontekstuaalisia keskusteluja tekoälyn kanssa – rakentavat asioita viikkojen tai kuukausien ajan, kehittävät jaettua kieltä, päätöksiä ja historiaa. Tekoälyn aktiivisesti hallitseman kontekstin määrä voi vaihdella tilausluokan mukaan.

Tekoäly on osoittautunut erinomaiseksi työkaluksi, mutta kehityksen alkuvaiheista lähtien se on pyrkinyt olemaan kumppani. Tämä tavoite vaatii muistia. Ilman sitä edistys askel askeleelta jatkuu.

Pysyvä muisti muuttaa sitä, mitä tekoäly voi tehdä käytännössä. Kehittäjä saa tekoälyn, joka muistaa arkkitehtuuripäätökset ja niihin liittyvät syyt. Tiimi saa tekoälyn, joka tietää projektin historian ilman uudelleenohjelmointia. Kirjailija saa tekoälyn, joka on kertynyt tietoa heidän työstään ajan myötä. Mallin kyky on vähemmän kuin se, voiko se kertyä tietoa siitä, kuka sitä käyttää.

Miksi tämä on ollut vaikea ratkaista

Haaste ei ole ainoastaan tallennus, vaan myös hakeminen. Teoriassa voit syöttää jokaisen aiemman keskustelun uuteen istuntoon. Mutta se muuttuu nopeasti laskennallisesti absurdiksi. Kontekstiuudet, vaikka laajenevat, eivät ole äärettömiä. Kuukausien mittaisen epästrukturoidun chatin kaataminen kysymykseen ei ole ainoastaan tehokasta, vaan myös ajan- ja energiankulutusta.

Paras Pandey, data-insinööri, toteaa ydinkysymyksen yksinkertaisesti: “Tekoälyn muisti on todella hakutarkkuuden ongelma, joka on pukeutunut tallennusongelman muotoon. Voit säilyttää mitä tahansa, mutta haaste on hakea oikea osa siitä johtopäätöksen aikana ilman, että täytät aukot. Se on vaikeampi versio siitä, mitä olemme ratkaisseet datajärjestelmissä vuosien ajan, ja ala on edelleen varhaisessa vaiheessa.”

Nykyiset tekoälyn muistiin liittyvät lähestymistavat sisältävät järjestelmien sallimisen päättää, mitä muistetaan. Mutta antamalla tekoälyn päättää, mitä on tärkeää, heittää usein pois juuri sellaisen hienostuneen kontekstin, joka teki alkuperäisen vaihdon arvokkaaksi. Säilytät yleisen idean, mutta menetät koko keskustelun, jossa selitit tarkat huolesi ja vaihtoehdot, jotka hylkäsit.

Idealinen tilanne olisi tehdä oikea tieto löydettäväksi oikeaan aikaan

MemPalacen saapuminen

Tämä on täsmälleen ongelma, johon MemPalace, hiljattain julkaistu avoimen lähdekoodin projekti, pyrkii ratkaisemaan. Sen sijaan, että yhteenvedon tai hävittäminen, se tallentaa keskustelut kokonaisuudessaan ja rakentaa navigoivan rakenteen niiden ympärille, lainaten antiikin Kreikan muistipalatsin tekniikasta, jossa puhujat sijoittivat ajatuksia mielikuvituksellisiin huoneisiin, jotta he voivat muistaa ne myöhemmin.

Se, mikä tekee MemPalacesta merkittävän, ei ole ainoastaan lähestymistavan eleganssi. Se on tulokset. Standardien akateemisten mittareiden mukaan tekoälyn muistin hakemisessa MemPalace on saavuttanut korkeimmat koskaan julkaistut tulokset ilmaiselle järjestelmälle, ja se tekee niin käyttäen ainoastaan omaa laitetta, ilman tilausta, ilman pilvipalveluja ja ilman ulkoisia API:ita.

Kilpailevat kaupalliset palvelut veloittavat missä tahansa 20 ja 250 dollarin välillä kuukaudessa vastaavan, usein heikommin suorittavan toiminnallisuuden.

Tämä yhdistelmä parhaimmasta suorituskyvystä, täysin paikallisesta ja täysin ilmaisesta on harvinainen ja sen arvoinen, johon on kiinnitettävä huomiota. Ja koska se toimii laitteistollasi eikä etäpalvelimilla, jokainen kysely, jonka ohjautat MemPalacen kautta, on yksi, joka ei lisää datakeskuksien teollisuuden kasvavaa energialaskua.

Laajempi kuva

MemPalace on yksi projekti, mutta se osoittaa jotain suurempaa: tunnustamista, että pysyvä muisti ei ole premium-lisäys tekoälyjärjestelmiin, vaan perusominaisuus uusille tekoälyn käyttötapauksille.

Projekti on rakennettu pienellä tiimillä, Milla Jovovich (kyllä, näyttelijä Resident Evil -elokuvasta), Ben Sigman ja Claude, ja siinä on mainittu ainoastaan seitsemän committia.

Se, että järjestelmä, joka ylittää kaupallisia tuotteita, joilla on omat insinööritiimit, tuli niin niukasta ponnistelusta, kertoo jotain siitä, missä todellinen vaikeus piilee.

Ongelma ei ollut tietokoneissa tai resursseissa. Se oli selkeä malli siitä, mitä muisti todella tarvitsee.

Juan Pablo Aguirre Osorio on avustaja Espacio Media Incubatoriin. Taustansa täysipainoisesta ohjelmistokehityksestä, Juan Pablo tuo teknisen taustan raportoidessaan viimeisimmistä teknologioista, mukaan lukien tekoäly. Hänen työtään on esitetty HackerNoonissa, The Sociablessa ja muissa, ja hän toimi aikaisemmin Microsoftin opiskelija-ambassadoreina.