Искусственный интеллект
Playing Catch-Up: Google’s Latest Developments from the 2023 Developer Conference

В среду Google провела свою ежегодную конференцию для разработчиков. Мероприятие стало заметным отклонением от обычных многодневных конференций прошлого года, в этом году оно было сжато в один насыщенный день объявлений и демонстраций. Заметным отсутствием в 2020 году стала конференция, которая вернулась с сокращенным штатом сотрудников, но без нехватки новых разработок.
Мероприятие Google стало площадкой для амбициозного видения генерального директора Alphabet, Сундара Пичаи. Из Shoreline Amphitheater в Кремниевой долине Пичаи представил компанию с видением переосмысления своих основных продуктов, таких как поиск, с помощью генеративного ИИ. Это заявление стало основой для презентаций и демонстраций продукции в течение дня.
В области искусственного интеллекта Google представила свою вторую генерацию модели языка Pathways (PaLM 2). Эта большая языковая модель представляет собой эволюцию от предыдущей итерации, обеспечивая работу numerous продуктов Google. Компания разрабатывает системы ИИ в течение многих лет, с архитектурой трансформера в сердце современных систем ИИ, таких как чат-боты.
Google’s Catch-up в ИИ
Это введение происходит в то время, когда Google воспринимается как догоняющая своих конкурентов, таких как OpenAI, чьи модели GPT-3, ChatGPT, GPT-4 и DALL-E произвели значительные волны в области ИИ. Ответом Google является PaLM 2, способная обрабатывать написание, кодирование и расчеты более чем на 100 языках, научных наборов данных и кода. PaLM 2 доступна в четырех размерах: Gecko, Otter, Bison и Unicorn. Кроме того, существуют специализированные версии для медицинских и безопасных приложений, известные как Med-PaLM 2 и sec-PaLM.
Отметим, что Google интегрирует PaLM 2 в 25 продуктов и функций, многие из которых доступны для раннего тестирования через Search Labs. Одним из таких продуктов является Bard, чат-бот ИИ, который теперь работает на PaLM 2. Этот чат-бот предназначен для помощи разработчикам в кодировании на 20 языках программирования и скоро сможет цитировать источники своих предложений. Google также планирует интегрировать Bard с различными приложениями Google и сервисами третьих лиц, включая Adobe Firefly и Instacart.
Интеграция генеративного ИИ в Google Search
Генеративный ИИ интегрируется в интерфейс Google Search. Он направлен на обработку нескольких запросов одновременно, предоставляя один, сгенерированный ИИ, рекомендуемый ответ. Google также планирует добавить функции в свою систему поиска изображений, чтобы помочь пользователям понять происхождение изображений, когда они были впервые проиндексированы и где еще они могут быть найдены. Эта функция будет особенно полезна для различения между подлинными фотографиями и сгенерированными или манипулированными изображениями ИИ.
Google разрабатывает Duet AI для Workspace, набор возможностей ИИ на основе PaLM, который должен быть запущен позже в этом году. Этот набор включает функции, такие как сгенерированные ИИ изображения в Google Slides, организация строк и столбцов по требованию в Google Sheets, уникальные фоны в Google Meet и помощь в написании в Google Docs. Клиенты Google Cloud получат доступ к Duet AI для Google Cloud, включая функции, такие как помощь в кодировании, чат-помощь и Duet AI для AppSheet.
Новые объявления о аппаратном обеспечении
Переходя к аппаратному обеспечению, Google представила смартфон Pixel 7a с диагональю 6,1 дюйма, оснащенный более крупным датчиком камеры и чипом ИИ-вычислений Tensor G2. Телефон также включает функцию Call Assist, управляемую ИИ, с функциями, такими как Direct My Call, Call Screen, Hold for Me, Clear Calling (редукция шума) и Wait Times (оценка времени ожидания).
Конференция также стала площадкой для представления долгожданного Pixel Fold, складного смартфона, который превращается в 7,6-дюймовую планшетку при разворачивании. Устройство может выполнять уникальные функции, такие как живой перевод между двумя языками на панелях, обращенных в разные стороны. Предзаказы Pixel Fold также будут поставляться с бесплатным Pixel Watch.
Pixel Fold был центральным в демонстрации проекта Google Universal Translator, концепции, которую Google продвигает в течение многих лет, направленной на облегчение перевода разговора в реальном времени. Кроме того, компания намекнула на выпуск 11-дюймовой планшетки Pixel, способной интегрироваться в системы домашней автоматизации Google.
Генеративный ИИ во всей линейке продуктов
Одной из ключевых тем конференции было применение генеративного ИИ во всей линейке продуктов Google. Например, Google объявила о функции Magic Compose для Android, которая использует генеративный ИИ для предложения ответов на текстовые сообщения. Gmail введет систему оповещений для случаев, когда адрес электронной почты пользователя появляется на темной сети, потенциально указывая на кражу информации или нацеливание на злонамеренных акторов. Кроме того, Google Photos скоро получит Magic Editor для внесения сложных изменений в изображения.
MusicLM, функция, которая может преобразовать текстовые описания музыки в аудио, было еще одним интригующим объявлением. Google также объявила, что автомобили на базе Android скоро смогут запускать популярные приложения, такие как YouTube, Waze, Zoom, Microsoft Teams и Cisco Webex.
Проект Google Starline, новая система 3D-видеоконференций, все еще находится на стадии прототипа, но он был уменьшен до устройства размером с телевизор. Другой новой инициативой является проект Tailwind, приложение для заметок, которое включает чат-бота, способного извлекать информацию из Google Drive, организовывать мысли и цитировать источники.
Объявления на конференции продемонстрировали приверженность Google ИИ, с Сундаром Пичаи, заявившим, что “ИИ не только является рыночным драйвером, но и большим сдвигом платформы”. Это видение было четко отражено в разнообразии ИИ-ориентированных продуктов и функций, представленных в течение дня, указывая на продолжающиеся усилия Google по поддержанию своей позиции как ведущего игрока в области ИИ. По мере того, как технологический гигант продолжает инновации и расширять свои возможности ИИ, потребители и разработчики могут ожидать ряд новых инструментов, предназначенных для оптимизации и улучшения их цифровых trải nghiệm.












