Искусственный интеллект
Введение в Vertex AI

Учитывая стремительное развитие искусственного интеллекта, одной из самых больших проблем, с которыми часто сталкиваются технологические лидеры, является переход от «экспериментального» состояния к «готовому к корпоративному использованию». Хотя чат-боты для потребителей и интерактивные платформы способствуют формированию общественного мнения, бизнес не может добиться успеха, полагаясь только на чат-интерфейс. В эпоху, когда конкуренция стала более агрессивной, чем когда-либо, предприятиям необходима надежная, масштабируемая и безопасная экосистема, и именно это пытается предложить Google. Вершинный ИИ, унифицированная платформа искусственного интеллекта и машинного обучения Google Cloud.
Vertex AI стремится закрепить за собой позицию основы для интеграции генеративного ИИ с современной облачной инфраструктурой, предлагая комплексный набор функций, который устраняет разрыв между базовыми моделями и приложениями производственного уровня. Vertex AI — это не просто оболочка для больших языковых моделей (LLM), а единая экосистема машинного обучения и искусственного интеллекта (ML/AI), которая рассматривает генеративный ИИ как полноправного участника современной облачной инфраструктуры.
В основе Vertex AI лежит... Модельный садЭто централизованная торговая площадка, предоставляющая доступ к более чем 200 тщательно отобранным базовым моделям, включая мощную многомодальную модель Gemini 2.5 Pro с впечатляющим контекстным окном, содержащим 2 миллиона токенов. В этой статье мы разберем архитектуру Vertex AI, рассмотрим, как Model Garden служит своего рода «магазином приложений» для интеллектуальных систем, и изучим технические основы, которые делают эту платформу базой для следующего поколения корпоративного программного обеспечения.
Базовая архитектура: Единая платформа

Vertex AI — это не просто набор слабо связанных инструментов, а единая экосистема данных и ИИ, призванная преодолеть фрагментацию данных, инструментов и команд, которая до сих пор является проблемой машинного обучения. Традиционно разработка ИИ происходит в изолированных средах, а иногда данные разбросаны и хранятся в нескольких хранилищах. Например, организации могут хранить данные о клиентах в хранилищах SQL, в то время как неструктурированные документы выгружаются в озеро данных (Data Lake). Когда данные разрознены, ИИ видит лишь «частичную истину», что приводит к предвзятым результатам или высокой вероятности ложных срабатываний, поскольку ему не хватает полного контекста предприятия.
Vertex AI стремится интегрировать весь жизненный цикл, от загрузки необработанных данных в BigQuery и Cloud Storage до мониторинга производственной среды, по сути, выступая в качестве «связующего звена» между этими разрозненными системами. Vertex AI интегрируется с Cloud Storage и BigQuery нативно, позволяя моделям ИИ извлекать данные без сложных конвейеров извлечения, преобразования и загрузки.
Фонд: гиперкомпьютер Google с искусственным интеллектом
Слой GenAI Вершинный ИИ Он расположен поверх архитектуры гиперкомпьютера искусственного интеллекта Google, интегрированной суперкомпьютерной системы, которая состоит из:
TPU v5p и v5e (блоки обработки тензоров)
Тензорные процессоры Google Это специализированные интегральные схемы специального назначения (ASIC), разработанные специально для матричного умножения, которое является основой глубокого обучения.
- TPU v5p (Производительность): Это флагманский акселератор для масштабного обучения. Каждый модуль TPU v5p может масштабироваться до 8,960 чипов, соединенных высокоскоростным межчиповым соединением (ICI) Google со скоростью 4,800 Гбит/с. Для технологического лидера это означает в 2.8 раза более быстрое обучение модели размером с GPT-3 (175 миллиардов параметров) по сравнению с предыдущим поколением, что значительно сокращает время выхода на рынок.
- TPU v5e (эффективность): Разработанная для «оптимизированной по стоимости» производительности, версия v5e является рабочей лошадкой для обучения в средних масштабах и высокопроизводительного вывода результатов. Она предлагает до 2.5 раз лучшее соотношение цены и производительности, что делает ее идеальным выбором для компаний, которым необходимо круглосуточно запускать вывод результатов без огромных затрат.
Графические процессоры NVIDIA H100/A100 для гибкости
Хотя TPU — это специализированные процессоры, многие команды разработчиков полагаются на экосистему NVIDIA CUDA. Vertex AI обеспечивает первоклассную поддержку новейшего оборудования NVIDIA:
- NVIDIA H100 (Hopper): Идеально подходит для тонкой настройки самых крупных моделей с открытым исходным кодом (таких как Llama 3.1 405B), требующих огромной пропускной способности памяти.
- Jupiter Networking: Чтобы предотвратить «узкое место в сети», Google использует сетевую инфраструктуру своего центра обработки данных Jupiter. Это обеспечивает молниеносную передачу данных между графическими процессорами, поддерживая RDMA (удаленный прямой доступ к памяти), что позволяет обойти накладные расходы ЦП и обеспечить производительность, близкую к локальной, на распределенных узлах.
Динамическая оркестровка
Наиболее важный технический сдвиг в Vertex AI — это Динамическая оркестровкаВ устаревшей среде, если узел с графическим процессором выйдет из строя во время 3-недельного цикла обучения, вся задача может завершиться с ошибкой.
- Автоматизированная отказоустойчивость: Vertex AI, часто работающий на базе Google Kubernetes Engine (GKE) Внутри системы реализована функция «самовосстанавливающихся» узлов. При обнаружении аппаратной неисправности платформа автоматически переносит рабочую нагрузку на исправный узел.
- Динамический планировщик рабочих нагрузок: Этот инструмент позволяет командам запрашивать ресурсы в зависимости от срочности. Вы можете выбрать гибкий старт (более дешевый вариант, запуск происходит при наличии ресурсов) или гарантированный старт для критически важных релизов.
- Обучение бессерверным технологиям: Для команд, которые хотят полностью отказаться от управления инфраструктурой, Vertex AI Serverless Training позволяет отправлять свой код и данные; платформа предоставляет кластер, запускает задачу и удаляет его, взимая плату только за использованные вычислительные секунды.
Три отправные точки: открытие, экспериментирование и автоматизация.
Чтобы удовлетворить потребности различных технических специалистов — от специалистов по анализу данных до разработчиков приложений — Vertex AI предлагает три основных варианта начала работы:
- Модельный сад: Торговая площадка для открытий.
- Студия искусственного интеллекта Vertex: Площадка для экспериментов.
- Конструктор агентов Vertex AIФабрика автоматизации.
«Образцовый сад: рынок открытий»
Vertex AI Model Garden от Google Cloud — это централизованная платформа в Google Cloud для поиска, тестирования, настройки и развертывания широкого спектра собственных, открытых и сторонних моделей ИИ, включая мультимодальные (зрение, текст, код) для различных бизнес-задач, предлагающая бесшовную интеграцию с инструментами Vertex AI для оптимизации MLOps. Она представляет собой всеобъемлющую библиотеку, помогающую разработчикам и компаниям выбирать подходящую модель (от крупных базовых моделей до специализированных) для своих задач, будь то генерация текста, анализ изображений или автозаполнение кода, и эффективно развертывать их в своей среде Google Cloud.

Компания Model Garden разделяет свои более чем 200 моделей на три различных уровня, что позволяет архитекторам найти баланс между производительностью, стоимостью и управляемостью:
- Модели, разработанные самой компанией (Google): Это флагманские мультимодальные модели, доступные в Vertex AI, и Google предлагает их в различных размерах, от Pro с комплексным логическим мышлением до Flash с низкой задержкой и большим объемом данных, что позволяет разработчикам оптимизировать свои модели в соответствии с их задачами.
- Модели сторонних разработчиков (собственные): Благодаря стратегическим партнерствам Vertex AI предлагает доступ к таким гигантам, как Anthropic (Claude 3.5) и Mistral AI, по модели «модель как услуга» (MaaS). Вместо управления отдельными платежными и учетными данными безопасности для пяти разных поставщиков ИИ, команда разработчиков может получить доступ ко всем им через свой существующий проект в Google Cloud, используя единый формат API.
- Модели с открытым исходным кодом и открытыми весами: Этот уровень включает в себя Лама Меты 3.2, Мистральи собственная компания Google. ГеммаЭти решения идеально подходят для организаций, которые хотят самостоятельно развертывать модели в своей собственной виртуальной частной сети (VPC), чтобы обеспечить максимальную изоляцию данных.
В условиях отсутствия унифицированной среды развертывание модели с открытым исходным кодом, такой как Llama, требует настройки среды PyTorch, конфигурации драйверов CUDA и управления оболочкой Flask или FastAPI.
Система Model Garden устраняет этот этап «вырубки» благодаря Единые управляемые конечные точки:
- Развертывание в один клик: Для многих моделей нажатие кнопки «Развернуть» автоматически выделяет необходимые ресурсы TPU/GPU, помещает модель в готовый к использованию в производственной среде контейнер и предоставляет конечную точку REST API.
- Интеграция обнимающего лица: Теперь Vertex AI позволяет разработчикам развертывать модели непосредственно из Hugging Face Hub в конечную точку Vertex, обеспечивая практически безграничное расширение доступных интеллектуальных возможностей.
- Private Service Connect (PSC): Для отраслей с жестким регулированием модели могут быть развернуты с использованием следующих методов: Частная служба Connect, что гарантирует, что конечная точка модели никогда не будет доступна извне, обеспечивая передачу данных исключительно внутри корпоративной сети.
Vertex AI Studio: площадка для экспериментов
Если в этой Модельный сад Речь идёт об отборе, Студия искусственного интеллекта Vertex составляет около точность. Vertex AI Studio можно сравнить с компиляторами и отладчиками, которые встречаются в традиционном мире программного обеспечения. Vertex AI Studio — это рабочее пространство, где исходные модели преобразуются в конкретные бизнес-инструменты благодаря сочетанию оперативной разработки, многомодального тестирования и расширенной настройки гиперпараметров.

Мультимодальное прототипирование: за пределами текста
Одной из выдающихся особенностей Studio является встроенная поддержка... мультимодальностьВ то время как другие платформы требуют сложного программирования для обработки нетекстовых данных, Vertex AI Studio позволяет перетаскивать файлы непосредственно в интерфейс для тестирования. Близнецы 2.5 способности к рассуждению.
- Видео разведка: Вы можете загрузить 45-минутную техническую презентацию и попросить модель «определить каждое упоминание конкретного API и предоставить краткое описание с указанием времени».
- Анализ документов: Вместо простого чтения текста, модель может анализировать визуальный макет Понимание взаимосвязи между диаграммами, таблицами и окружающим текстом в PDF-файле объемом 1,000 страниц.
- Выполнение кода: Студия теперь поддерживает Выполнение кода в песочницеЕсли вы поручите модели решить сложную математическую задачу или проанализировать CSV-файл, модель сможет написать и выполнить код на Python в защищенной изолированной среде, чтобы предоставить проверенный ответ.
Расширенные возможности настройки: Путь тюнинга

Когда возможности оперативного проектирования (с нулевым или малым количеством примеров) достигают предела, Vertex AI Studio предоставляет необходимую сложную рабочую силу: Тюнинг модели.
- Контролируемая тонкая настройка (SFT): Разработчики предоставляют набор данных из пар «Запрос/Ответ» (в идеале более 100 примеров). Это позволяет обучить модель распознавать определенный фирменный стиль, формат вывода (например, специализированный JSON) или специфическую для данной области терминологию.
- Кэширование контекста: Для предприятий, работающих с большими статическими наборами данных (например, юридической библиотекой или кодовой базой), Studio предоставляет следующие возможности: Кэширование контекстаЭто позволяет «предварительно загрузить» миллион токенов данных в память модели, что значительно сокращает задержку и затраты на последующие запросы.
- Дистилляция (учитель-ученик): Это высокоуровневый архитектурный ход. Вы можете использовать массивную модель (Gemini 2.5 Pro) для «обучения» более компактной и быстрой модели (Gemini 2.0 Flash). В результате получается облегченная модель, которая работает на уровне «Pro», но со скоростью и стоимостью «Flash».
Vertex AI Agent Builder: Фабрика автоматизации
Конструктор агентов Vertex AI Это высокоуровневая платформа оркестровки, которая позволяет разработчикам создавать такие агенты, комбинируя базовые модели с корпоративными данными и внешними API.
Архитектура «Истина»: Основа и RAG
Основным техническим препятствием для внедрения ИИ в корпоративной среде является галлюцинацияAgent Builder решает эту проблему с помощью сложного алгоритма. Заземление двигатель.
- Освоение основ поиска Google: Для запросов, требующих информации из реального мира (например, «Какие сейчас ставки по ипотеке в Нью-Йорке?»), агент может выполнить поиск в Google, извлечь необходимые данные и указать источники.
- Vertex AI Search (RAG-as-a-Service): Вместо ручного создания векторной базы данных (Pinecone, Weaviate) разработчики могут использовать Вершинный AI-поиск для индексирования собственных документов (PDF, HTML, BigQuery). Он автоматически обрабатывает этапы «разбивки на фрагменты», «встраивания» и «извлечения», гарантируя, что агент отвечает только на основе вашего внутреннего «Источника достоверной информации».
- Vertex AI RAG Engine: Для масштабных, специализированных реализаций этот управляемый сервис позволяет использовать гибридный поиск (сочетание векторных и ключевых результатов) для повышения точности до На 30% выше стандартных показателей LLM..
Многоагентная оркестровка (протокол A2A)
Сложные корпоративные рабочие процессы часто требуют совместной работы нескольких специализированных агентов. Vertex AI представляет... Протокол «агент-агент» (A2A), открытый стандарт, который позволяет:
- «Турагент» поговорить с «Финансовый агент» чтобы убедиться, что бронирование авиабилета укладывается в корпоративный бюджет.
- совместимость: Благодаря использованию открытого протокола, агенты, созданные на основе Vertex, могут взаимодействовать с агентами, созданными на основе других фреймворков, таких как LangChain или CrewAI.
Стек инструментов разработчика: ADK и Agent Engine
Для аудитории, работающей с «технологическими платформами», Agent Builder предлагает два различных варианта:
- Консоль без кода: Визуальный интерфейс с функцией перетаскивания для быстрого прототипирования и настройки для бизнес-пользователей.
- Комплект для разработки агентов (ADK): Инструментарий Python для инженеров, ориентированный на разработку кода. Он позволяет использовать «подсказки в виде кода», интегрировать системы контроля версий и развертывать приложения. Vertex AI Agent Engine— управляемая среда выполнения, которая автоматически обрабатывает сохранение сессий, масштабирование и управление состоянием.
Заключение: От «Что если» к «Что будет дальше»
Переход от эффектной демонстрации ИИ к готовому корпоративному приложению долгое время считался «провалом смерти» для проектов цифровой трансформации. Как мы уже отмечали, Vertex AI разработан специально для преодоления этого разрыва. Объединяя разрозненные хранилища данных, инфраструктуры и управления моделями, Google Cloud сместил акцент с мощи больших языковых моделей на более сложные задачи. операционная зрелость жизненного цикла ИИ.












