Connect with us

Tekoäly

Gemman paljastus: Google hyppää avoimeen generatiiviseen tekoälyyn

mm

Google esitteli hiljattain Gemman, avoimen lähdekoodin kielen mallin, joka jakaa teknologisen perustansa Gemini:n kanssa, Googlen erittäin edistyneen tekoälyn. Nimestään Gemma, joka tulee latinan sanasta “jalokivi”, on suunniteltu olevan helpommin saatavissa kuin sen edeltäjä, Gemini 1.5, säilyttäen samalla tasapainon korkean suorituskyvyn ja vastuullisen käytön välillä. Tämä askel avoimen lähdekoodin generatiiviseen tekoälyyn korostaa Googlen sitoutumista tekoälytekniikan demokratisoimiseen, sallien laajemman soveltamisen ja innovaation alalla. Artikkeli valottaa Gemman erityispiirteitä ja miten se erottuu kahdesta johtavasta avoimen lähdekoodin tekoälymallista markkinoilla, Meta Llama 2 ja Mistralin Mistral 7B.

Gemma: Uusi askel kielen malleissa

Gemma on perhe kevyistä, avoimen lähdekoodin kielen malleista, saatavilla 2 miljardin ja 7 miljardin parametrin konfiguraatioina, jotta se sopii laajasti erilaisiin laskentatarpeisiin. Sitä voidaan käyttää useilla alustoilla, mukaan lukien GPU, TPU, CPU ja laitteistosoftware, osoittaen sen monipuolisuutta. Gemman arkkitehtuuri hyödyntää edistyneitä neuroverkkojen tekniikoita, erityisesti transformer arkkitehtuuri, joka on ollut takana useista viimeaikaisista tekoälykehityksistä.

Mikä erottaa Gemman on sen poikkeuksellinen suorituskyky tekstipohjaisissa tehtävissä, jossa se ylittää kilpailijansa 11:stä 18 akateemisesta vertailusta. Se menestyy kielen ymmärtämisessä, päättelyssä, kysymyksiin vastaamisessa, arkisen järjen päättelyssä ja erikoistuneissa aloissa, kuten matematiikassa, tieteessä ja koodauksessa. Tämä suorituskyky korostaa Gemman merkittävää panosta kielen mallien evoluutioon.

Avainominaisuudet

Gemma esittelee joukon ominaisuuksia, jotka on suunniteltu helpottamaan pääsyä ja integrointia eri tekoälykehityskehyksiin ja projekteihin:

  • Yhteensopivuus eri kehyksissä: Gemma tarjoaa työkaluja inferenceen ja valvottuun hienosäätöön, jotka ovat yhteensopivia suurten kehityskehysten kanssa, kuten JAX, PyTorch ja TensorFlow kanssa native Keras 3.0:n kautta. Tämä varmistaa, että kehittäjät voivat käyttää mieluisia työkaluja ilman uusien ympäristöjen sopeutumisen esteitä.
  • Pääsy valmiisiin resursseihin: Gemma on varustettu Colab ja Kaggle -muistikirjoilla välittömäksi käyttöön, sekä integraatioilla suosituilla alustoilla, kuten Hugging Face ja NVIDIA NeMo. Nämä resurssit pyrkivät yksinkertaistamaan Gemman käytön aloittamista sekä uusille että kokeneille kehittäjille.
  • Joustava ja optimoitu käyttöönotto: Gemma on suunniteltu käytettäväksi monilla eri laitteilla, henkilökohtaisista laitteista pilvipalveluihin ja IoT-laitteisiin, optimoituna tekoälylaitteille, varmistaen huipputason suorituskyvyn laitteiden yli. Se tukee myös helppoa käyttöönottoa, mukaan lukien Vertex AI ja Google Kubernetes Engine.
  • Vastuullinen tekoäly: Korostamalla turvallista ja eettistä tekoälykehitystä, Gemma sisältää automaattisen tietojen suodattamisen, vahvistusoppimisen ihmisten palautteen perusteella ja kattavat testit, jotta se noudattaa korkeita luotettavuuden ja turvallisuuden standardeja. Google tarjoaa myös työkalun ja resursseja kehittäjille, jotta he voivat ylläpitää vastuullisia tekoälykäytäntöjä.
  • Innovaatioiden edistäminen suotuisilla ehdoilla: Gemman käyttöehdot tukevat vastuullisia kaupallisia sovelluksia ja innovaatioita, tarjoamalla ilmaisia krediittejä tutkimukseen ja kehitykseen, mukaan lukien pääsy Kaggleen, ilmaisen tason Colab -muistikirjoihin ja Google Cloud -krediittejä, jotta tutkijat ja kehittäjät voivat tutkia uusia tekoälyrajoja.

Vertailu muihin avoimen lähdekoodin malleihin

  • Gemma Vs Llama 2: Gemma ja Llama 2, kehitetty Googlella ja Metalla, esittelevät omat vahvuutensa avoimen lähdekoodin kielen mallien alueella, palvelemalla eri käyttäjien tarpeita ja mieltymyksiä. Gemma on erityisesti optimoitu tehtäviin STEM-alalla, kuten koodin generoimisessa ja matemaattisissa ongelmanratkaisuissa, mikä tekee siitä arvokkaan resurssin tutkijoille ja kehittäjille, jotka tarvitsevat erikoistuneita toimintoja, erityisesti NVIDIA-alustoilla. Toisaalta Llama 2 houkuttelee laajempaa yleisöä monipuolisuudellaan käsitellä laajaa valikoimaa yleisiä kielitehtäviä, mukaan lukien tekstin tiivistäminen ja luovan kirjoittamisen. Gemman keskittyminen STEM-aiheisiin tehtäviin saattaa rajoittaa sen soveltamista laajemmin erilaisiin todellisiin tilanteisiin, kun taas Llama 2:n korkeat laskennalliset vaatimukset voivat estää sen saatavuuden resursseja rajoittuneilla käyttäjillä. Nämä eroavaisuudet korostavat tekoälytekniikoiden moninaisia sovelluksia ja mahdollisia rajoituksia, heijastellen eri polkuja, joita ne seuraavat tekoälytekniikan edistämiseksi ja haasteiden ratkaisemiseksi digitaalisessa aikakaudessa.
  • Gemma 7B Vs Mistral 7B: Vaikka sekä Gemma 7B että Mistral AI:n Mistral 7B -mallit luokitellaan kevyiksi, avoimen lähdekoodin kielen malleiksi, ne erottuvat eri aloilla. Gemma 7B erottuu koodin generoimis- ja matemaattisten ongelmanratkaisukyvyistään, kun taas Mistral 7B tunnetaan loogisista päättelytaitoistaan ja todellisten tilanteiden käsittelystä. Nämä eroavaisuudet huolimatta, molemmat mallit tarjoavat samanlaisia suorituskykyjä inference-nopeuden ja viiveen suhteen. Mistral 7B:n täysin avoimen lähdekoodin luonne mahdollistaa suoremman muokkaamisen verrattuna Gemma 7B:hen. Tämä ero saatavuudessa korostuu Googlen vaatimuksesta, jossa käyttäjien on hyväksyttävä tiettyjä ehtoja ennen kuin he voivat käyttää Gemmaa, tavoitteena varmistaa vahvat turvallisuuden ja yksityisyyden toimenpiteet. Vastaavasti Mistral AI:n lähestymistapa saattaa aiheuttaa haasteita samanlaisiden standardien toteuttamisessa.

Yhteenveto

Googlein Gemma edustaa merkittävää askelta avoimen lähdekoodin generatiivisessa tekoälyssä, tarjoamalla monipuolisen ja helposti saatavissa olevan kielen mallin, joka on suunniteltu sekä korkean suorituskyvyn että vastuullisen käytön takaamiseksi. Seuraamalla Googlen edistyneen tekoälyn, Gemini, teknologista osaamista, Gemma on suunniteltu demokratisoimaan tekoälytekniikkaa, edistäen laajempaa soveltamista ja innovaatioita. Konfiguraatiot, jotka on suunniteltu täyttämään moninaiset laskentatarpeet, ja joukko ominaisuuksia, jotka varmistavat helpon pääsyn, yhteensopivuuden eri kehyksissä ja optimoidun käyttöönoton, Gemma asettaa uuden standardin tekoälyalalla. Sen poikkeuksellinen suorituskyky erityisissä STEM-tehtävissä erottaa sen kilpailijoista, kuten Meta Llama 2 ja Mistral AI:n Mistral 7B, joilla on omat vahvuutensa. Kuitenkin Gemman kattava lähestymistapa vastuulliseen tekoälykehitykseen ja sen tuki innovaatioille suotuisilla ehdoilla korostavat Googlen sitoutumista edistämään tekoälytekniikkaa eettisellä ja saatavalla tavalla.

Tohtori Tehseen Zia on COMSATS University Islamabadin apulaisprofessori, joka on suorittanut AI-tutkinnon Wienin Teknillisen yliopiston, Itävallassa. Erityisalanaan ovat Tekoäly, Konenäkö, Data Science ja Machine Learning, ja hän on tehnyt merkittäviä töitä julkaisemalla artikkeleita arvostetuissa tieteellisissä lehdissä. Tohtori Tehseen on myös johtanut useita teollisuusprojekteja pää tutkijana ja toiminut AI-konsulttina.