Connect with us

Kunstig intelligens

Playing Catch-Up: Google’s Latest Developments from the 2023 Developer Conference

mm

Onsdag arrangerte Google sin årlige utviklerkonferanse. Arrangementet var et markant brudd med de vanlige flerdagsarrangementene fra fortiden, og ble denne året kondensert til en enkelt dag med annonseringer og showcases. Et merkbart fravær i 2020, returnerte konferansen med en redusert stab, men med ingen mangel på nye utviklinger.

Google-arrangementet satte scenen for Alphabet-sjefen, Sundar Pichai. Fra Shoreline Amphitheater i Silicon Valley, introduserte Pichai selskapets ambisiøse visjon om å reimagininere sine kjerneprodukter, som søk, ved hjelp av generativ AI. Denne uttalelsen dannet ryggraden for dagens presentasjoner og produktlanseringer.

I området kunstig intelligens, introduserte Google sitt andre-generasjons Pathways Language Model (PaLM 2). Dette store språkmodellen representerer en evolusjon fra den forrige iterasjonen, og driver mange Google-produkter. Selskapet har utviklet AI-systemer i mange år, med transformer-arkitekturen som sitter i hjertet av moderne AI-systemer, som chatbots.

Google’s Catch-up i AI

Denne introduksjonen kommer på et tidspunkt når Google anses for å spille catch-up til rivaler som OpenAI, hvis GPT-3, ChatGPT, GPT-4 og DALL-E-modeller har gjort betydelige bølger i AI-feltet. Google’s respons er PaLM 2, som kan håndtere skriving, kode og beregninger på over 100 språk, vitenskapelige datasamlinger og kode. PaLM 2 er tilgjengelig i fire størrelser: Gecko, Otter, Bison og Unicorn. I tillegg er det spesialiserte versjoner for medisinske og sikkerhetsapplikasjoner, kjent som Med-PaLM 2 og sec-PaLM.

Merkbart er at Google integrerer PaLM 2 i 25 produkter og funksjoner, med flere av disse tilgjengelige for tidlig testing via Search Labs. Et slikt produkt er Bard, en AI-chatbot som nå kjører på PaLM 2. Denne chatboten er designet for å assistere utviklere med kode i 20 programmeringsspråk og vil snart kunne angi kilde for sine forslag. Google planlegger også å integrere Bard med ulike Google-apps og tredjeparts-tjenester, inkludert Adobe Firefly og Instacart.

Integrerende Generativ AI i Google Søk

Generativ AI blir integrert i Google Søk-grensesnittet også. Den har som mål å håndtere flere spørringer samtidig, og gi en enkelt, AI-generert anbefalt svar. Google planlegger også å legge til funksjoner i sin bilde-søk-system for å hjelpe brukerne å forstå opphavet til bilder, når de først ble indeksert og hvor andre steder de kan finnes. Denne funksjonen vil være spesielt nyttig for å skille mellom ekte fotos og AI-genererte eller manipulerte bilder.

Google utvikler Duet AI for Workspace, en samling av PaLM-drevne AI-funksjoner som skal lanseres senere i år. Denne samlingen inkluderer funksjoner som AI-genererte slide-bilder i Google Slides, organisering av rader og kolonner på forespørsel i Google Sheets, unike bakgrunner i Google Meet og AI-skrivestøtte i Google Docs. Google Cloud-kunder vil få tilgang til Duet AI for Google Cloud, inkludert funksjoner som kodehjelp, chat-hjelp og Duet AI for AppSheet.

Nye Hardware-annonseringer

Vendte mot hardware, viste Google 6,1-tommers Pixel 7a-smarttelefonen, utstyrt med en større kamera-sensor og en AI-beregning-chip, Tensor G2. Telefonen inkluderer også en AI-drevet Call Assist-funksjon, med funksjoner som Direct My Call, Call Screen, Hold for Me, Clear Calling (støyreduksjon) og Wait Times (ventetidsestimering).

Konferansen så også introduksjonen av den lenge ventede Pixel Fold, en brettablet-smarttelefon som blir en 7,6-tommers tablet når den åpnes. Enheten kan utføre unike funksjoner, som live-oversettelse mellom to språk på paneler som vender mot hverandre. Forhåndsbestillinger av Pixel Fold kommer også med en komplementær Pixel Watch.

Pixel Fold var sentral i demonstrasjonen av Google’s Universal Translator-prosjekt, et konsept Google har fremmet i mange år, med mål om å fasilitere sanntids konversasjons-oversettelse. Videre antydet selskapet lanseringen av en 11-tommers Pixel Tablet, som kan integreres i Google’s hjemme-automatiseringssystemer.

Generativ AI på tvers av produktlinjen

En av hovedtemaene for konferansen var anvendelsen av generativ AI på tvers av Google’s produktlinje. For eksempel, annonserte Google Magic Compose-funksjonen for Android, som bruker generativ AI til å foreslå svar på tekst-meldinger. Gmail vil introdusere et varslingssystem for tilfeller hvor en brukers e-postadresse vises på dark web, potensielt indikerer informasjonstyveri eller målretting av skadelige aktører. Videre vil Google Photos snart motta en Magic Editor for å gjøre komplekse endringer i bilder.

MusicLM, en funksjon som kan transformere tekstbeskrivelser av musikk til lyd, var en annen interessant annonsering. Google annonserte også at Android-drevne biler snart vil kunne kjøre populære apper som YouTube, Waze, Zoom, Microsoft Teams og Cisco Webex.

Google’s Project Starline, et nytt 3D video-konferansesystem, er fortsatt i prototype-stadiet, men det har blitt skalert ned til en TV-størrelse-enhet. En annen ny initiativ er Project Tailwind, en notebook-app som inkluderer en chatbot som kan trekke informasjon fra Google Drive, organisere tanker og angi kilder.

Annonseringene på konferansen demonstrerte Google’s forpliktelse til AI, med Sundar Pichai som uttalte at “AI er ikke bare en markeds-aktiverer, det er også en stor plattform-endring”. Denne visjonen ble tydelig reflektert i variasjonen av AI-drevne produkter og funksjoner som ble lansert gjennom dagen, og indikerer Google’s pågående innsats for å opprettholde sin posisjon som en ledende aktør i AI-feltet. Ettersom tech-giganten fortsetter å innovere og utvide sine AI-egenskaper, kan forbrukere og utviklere forvente en rekke nye verktøy designet for å strømlinje og forbedre deres digitale erfaringer.

Alex McFarland er en AI-journalist og forfatter som utforsker de nyeste utviklingene innen kunstig intelligens. Han har samarbeidet med tallrike AI-startups og publikasjoner verden over.