Connect with us

Künstliche Intelligenz

Aufholjagd: Googles neueste Entwicklungen von der Entwicklerkonferenz 2023

mm

Am Mittwoch hat Google seine jährliche Entwicklerkonferenz ausgerichtet. Die Veranstaltung war ein deutlicher Bruch mit den üblichen mehrtägigen Veranstaltungen der Vergangenheit und wurde in diesem Jahr auf einen einzigen, vollgepackten Tag mit Ankündigungen und Präsentationen kondensiert. Eine bemerkenswerte Abwesenheit im Jahr 2020, die Konferenz kehrte mit einem reduzierten Mitarbeiterstab zurück, aber mit keinem Mangel an neuen Entwicklungen.

Googles Veranstaltung bereitete den Boden für den CEO von Alphabet, Sundar Pichai. Von der Shoreline Amphitheater in Silicon Valley aus stellte Pichai die ambitionierte Vision des Unternehmens vor, seine Kernprodukte wie die Suche mithilfe von generativer KI neu zu imaginieren. Diese Aussage bildete den Rückgrat der Präsentationen und Produktvorstellungen des Tages.

Im Bereich der künstlichen Intelligenz stellte Google sein zweites Pathways Language Model (PaLM 2) vor. Dieses große Sprachmodell stellt eine Evolution von der vorherigen Iteration dar und treibt zahlreiche Google-Produkte an. Das Unternehmen entwickelt seit vielen Jahren KI-Systeme, wobei die Transformer-Architektur im Herzen moderner KI-Systeme wie Chatbots sitzt.

Googles Aufholjagd in KI

Diese Einführung kommt zu einem Zeitpunkt, an dem Google als Nachzügler gegenüber Konkurrenten wie OpenAI wahrgenommen wird, deren Modelle GPT-3, ChatGPT, GPT-4 und DALL-E große Wellen in der KI-Branche gemacht haben. Googles Antwort ist PaLM 2, das in der Lage ist, Schreiben, Codieren und Berechnungen in über 100 Sprachen, wissenschaftlichen Datensätzen und Code zu bearbeiten. PaLM 2 ist in vier Größen erhältlich: Gecko, Otter, Bison und Unicorn. Darüber hinaus gibt es spezielle Versionen für medizinische und Sicherheitsanwendungen, die als Med-PaLM 2 und sec-PaLM bekannt sind.

Bemerkenswerterweise integriert Google PaLM 2 in 25 Produkte und Funktionen, von denen einige bereits für frühe Tests über Search Labs verfügbar sind. Ein solches Produkt ist Bard, ein KI-Chatbot, der jetzt auf PaLM 2 läuft. Dieser Chatbot ist dafür ausgelegt, Entwicklern bei der Codierung in 20 Programmiersprachen zu helfen und wird bald in der Lage sein, die Quelle seiner Vorschläge zu nennen. Google plant auch, Bard mit verschiedenen Google-Apps und Diensten von Drittanbietern wie Adobe Firefly und Instacart zu integrieren.

Integrieren von generativer KI in Google Search

Generative KI wird auch in die Google-Suchoberfläche integriert. Sie soll mehrere Anfragen gleichzeitig bearbeiten und eine einzige, von KI generierte empfohlene Antwort liefern. Google plant auch, Funktionen zu seinem Bildsuchsystem hinzuzufügen, um Benutzern zu helfen, die Herkunft von Bildern, wenn sie erstmals indiziert wurden und wo sie möglicherweise gefunden werden können, zu verstehen. Diese Funktion wird besonders nützlich sein, um zwischen echten Fotos und KI-generierten oder manipulierten Bildern zu unterscheiden.

Google entwickelt Duet AI für Workspace, ein Paket von PaLM-gesteuerter KI-Funktionen, das später in diesem Jahr veröffentlicht wird. Dieses Paket umfasst Funktionen wie KI-generierte Bildschirmhintergründe in Google Slides, Organisation von Zeilen und Spalten auf Anfrage in Google Sheets, einzigartige Hintergründe in Google Meet und KI-Schreibhilfe in Google Docs. Google Cloud-Kunden erhalten Zugang zu Duet AI für Google Cloud, einschließlich Funktionen wie Code-Assistenz, Chat-Assistenz und Duet AI für AppSheet.

Neue Hardware-Ankündigungen

Wenn man sich der Hardware zuwendet, stellte Google das 6,1-Zoll-Smartphone Pixel 7a vor, das mit einem größeren Kamerasensor und einem AI-Rechenchip, dem Tensor G2, ausgestattet ist. Das Telefon verfügt auch über eine AI-gesteuerte Call-Assist-Funktion mit Funktionen wie Direct My Call, Call Screen, Hold for Me, Clear Calling (Geräuschreduzierung) und Wait Times (Schätzung der Wartezeit).

Die Konferenz sah auch die Vorstellung des lang erwarteten Pixel Fold, eines faltbaren Smartphones, das sich in ein 7,6-Zoll-Tablet verwandelt, wenn es aufgeklappt wird. Das Gerät kann einzigartige Funktionen ausführen, wie z. B. die Live-Übersetzung zwischen zwei Sprachen auf Panels, die in entgegengesetzte Richtungen zeigen. Vorbestellungen des Pixel Fold werden auch mit einer kostenlosen Pixel Watch geliefert.

Der Pixel Fold stand im Mittelpunkt der Demonstration von Googles Universal Translator-Projekt, einem Konzept, das Google seit Jahren vorantreibt und das darauf abzielt, Echtzeit-Übersetzungen von Konversationen zu ermöglichen. Darüber hinaus kündigte das Unternehmen die Veröffentlichung eines 11-Zoll-Pixel-Tablets an, das in Googles Hausautomatisierungssysteme integriert werden kann.

Generative KI über die gesamte Produktpalette

Einige der wichtigsten Themen der Konferenz waren die Anwendung von generativer KI über die gesamte Produktpalette von Google. So kündigte Google beispielsweise die Magic Compose-Funktion für Android an, die generative KI verwendet, um Antworten auf Textnachrichten vorzuschlagen. Gmail wird ein Warnsystem für Fälle einführen, in denen die E-Mail-Adresse eines Benutzers im Dark Web aufgeführt ist, was möglicherweise auf Diebstahl von Informationen oder gezielte Angriffe durch schädliche Akteure hinweist. Darüber hinaus wird Google Photos bald einen Magic Editor für komplexe Änderungen an Bildern erhalten.

MusicLM, eine Funktion, die Textbeschreibungen von Musik in Audio umwandeln kann, war eine weitere interessante Ankündigung. Google kündigte auch an, dass Android-betriebene Autos bald in der Lage sein werden, beliebte Apps wie YouTube, Waze, Zoom, Microsoft Teams und Cisco Webex auszuführen.

Googles Project Starline, ein neuartiges 3D-Video-Konferenzsystem, befindet sich noch im Prototypenstadium, wurde jedoch auf ein gerätegroßes Gerät skaliert. Ein weiteres neues Vorhaben ist Project Tailwind, eine Notiz-App, die einen Chatbot enthält, der Informationen aus Google Drive abrufen, Gedanken organisieren und Quellen zitieren kann.

Die Ankündigungen auf der Konferenz zeigten Googles Engagement für KI, da Sundar Pichai erklärte, dass “KI nicht nur ein Marktenabler ist, sondern auch ein großer Plattformwechsel”. Diese Vision spiegelte sich deutlich in der Vielzahl von KI-gesteuerten Produkten und Funktionen wider, die im Laufe des Tages vorgestellt wurden und Googles anhaltende Bemühungen zeigen, seine Position als führender Spieler im KI-Bereich zu behaupten. Da der Technologieriese weiterhin innoviert und seine KI-Fähigkeiten erweitert, können Verbraucher und Entwickler eine Reihe neuer Tools erwarten, die darauf ausgelegt sind, ihre digitalen Erfahrungen zu rationalisieren und zu verbessern.

Alex McFarland ist ein KI-Journalist und Schriftsteller, der die neuesten Entwicklungen im Bereich der künstlichen Intelligenz erforscht. Er hat mit zahlreichen KI-Startups und Veröffentlichungen weltweit zusammengearbeitet.