Connect with us

Джереми Келвей, Вице-президент по инженерии для аналитики, данных и ИИ в EDB – Интервью-серия

Интервью

Джереми Келвей, Вице-президент по инженерии для аналитики, данных и ИИ в EDB – Интервью-серия

mm

Джереми (Джефф) Келвей является Вице-президентом по инженерии в EDB, базирующейся в тихоокеанском северо-западе США. Он возглавляет команду, ориентированную на предоставление решений на основе Postgres для аналитики и ИИ. С опытом в управлении Database-as-a-Service (DBaaS), операционным руководством и инновационной поставке технологий, Джефф имеет сильный опыт в продвижении достижений в области новых технологий.

EDB поддерживает PostgreSQL, чтобы соответствовать бизнес-приоритетам, обеспечивая разработку облачных приложений, экономически эффективную миграцию из устаревших баз данных и гибкую развертывание в гибридных средах. С растущим запасом талантов и высокой производительностью, EDB обеспечивает безопасность, надежность и превосходный опыт для критически важных приложений.

Почему Postgres все чаще становится базой данных для построения приложений генеративного ИИ, и какие ключевые функции делают его подходящим для этой эволюционирующей среды?

С почти 75% компаний США, принимающих ИИ, эти компании требуют базовой технологии, которая позволит им быстро и легко получить доступ к их изобилию данных и полностью использовать ИИ. Именно здесь появляется Postgres.

Postgres, возможно, является идеальным техническим примером устойчивой технологии, которая снова обрела популярность с большей актуальностью в эпоху ИИ, чем когда-либо прежде. С прочной архитектурой, родной поддержкой нескольких типов данных и расширяемостью по конструкции, Postgres является основным кандидатом для предприятий, стремящихся использовать ценность своих данных для производственных приложений ИИ в суверенной и безопасной среде.

На протяжении 20 лет существования EDB или более 30 лет существования технологии Postgres, отрасль прошла через эволюции, сдвиги и инновации, и на протяжении всего этого времени пользователи продолжают “просто использовать Postgres”, чтобы решать свои наиболее сложные проблемы с данными.

Как сегодня применяется Retrieval-Augmented Generation (RAG), и как вы видите его влияние на будущее “Интеллектуальной экономики”?

Потоки RAG набирают значительную популярность и импульс, и это имеет веские причины! Когда они рассматриваются в контексте “Интеллектуальной экономики”, потоки RAG обеспечивают доступ к информации способами, которые облегчают человеческий опыт, экономя время за счет автоматизации и фильтрации выходных данных и информации, которые в противном случае потребовали бы значительных ручных усилий и времени для создания. Повышенная точность шага “поиска” (Retrieval) в сочетании с возможностью добавления конкретного контента к более широко обученной модели LLM предлагает множество возможностей для ускорения и улучшения обоснованного принятия решений с помощью актуальных данных. Полезно думать об этом как о том, что у вас есть опытный исследовательский ассистент, который не только находит правильную информацию, но и представляет ее в контексте.

Какие из наиболее значительных проблем сталкиваются организации при внедрении RAG в производство, и какие стратегии могут помочь решить эти проблемы?

На фундаментальном уровне ваша качество данных является вашим дифференциатором ИИ. Точность, и в частности, сгенерированные ответы приложения RAG, всегда будут зависеть от качества данных, используемых для обучения и дополнения выходных данных. Уровень сложности, применяемый генеративной моделью, будет менее полезен, если/где входные данные ошибочны, что приводит к менее подходящим и неожиданным результатам для запроса (часто называемым “галлюцинациями”). Качество ваших источников данных всегда будет ключом к успеху контента, извлекаемого для генеративных шагов – если желаемый выход должен быть максимально точным, контекстные источники данных для LLM должны быть актуальными.

С точки зрения производительности; принятие активной позиции по поводу того, чего пытается достичь ваше приложение RAG, а также когда и где извлекаются данные, позволит вам хорошо понять потенциальные последствия. Например, если ваш поток RAG извлекает данные из транзакционных источников данных (т.е. постоянно обновляемых баз данных, критически важных для вашего бизнеса), мониторинг производительности этих ключевых источников данных, а также приложений, которые извлекают данные из этих источников, обеспечит понимание потенциального воздействия на производительность критически важных транзакционных источников данных. Эти меры являются отличным шагом для управления любыми потенциальными или реальными последствиями для производительности критически важных транзакционных источников данных. Кроме того, эта информация также может обеспечить ценный контекст для настройки приложения RAG для фокусировки на подходящем извлечении данных.

Учитывая рост специализированных векторных баз данных для ИИ, какие преимущества предлагает Postgres по сравнению с этими решениями, особенно для предприятий, стремящихся операционализировать рабочие нагрузки ИИ?

Базы данных векторного типа имеют возможность поддерживать требовательные рабочие нагрузки ИИ, обеспечивая при этом безопасность данных, доступность и гибкость для интеграции с существующими источниками данных и структурированной информацией. Создание решения ИИ/RAG часто использует базу данных векторного типа, поскольку эти приложения включают оценки сходства и рекомендации, которые работают с высокоразмерными данными. Базы данных векторного типа служат эффективным и эффективным источником данных для хранения, управления и извлечения этих критически важных данных.

Как EDB Postgres справляется с сложностями управления векторными данными для ИИ, и какие ключевые преимущества интеграции рабочих нагрузок ИИ в среду Postgres?

Хотя Postgres не имеет родной векторной возможности, pgvector – это расширение, которое позволяет хранить ваши векторные данные вместе с остальными данными в Postgres. Это позволяет предприятиям использовать возможности векторного типа наряду с существующими структурами баз данных, упрощая управление и развертывание приложений ИИ путем снижения необходимости в отдельных хранилищах и сложных передачах данных.

Как Postgres, становясь центральным игроком как в транзакционных, так и в аналитических рабочих нагрузках, помогает организациям оптимизировать свои данные и разблокировать более быстрые идеи без добавления сложности?

Эти данные фактически обеспечивают топливом приложения ИИ. С множеством форматов хранения данных, мест и типов данных, сложности того, как достигается фаза извлечения, быстро становятся ощутимой проблемой, особенно когда приложения ИИ переходят из концепции доказательства в производство.

Расширение EDB Postgres AI Pipelines – это пример того, как Postgres играет ключевую роль в формировании “истории управления данными” для приложений ИИ. Упрощая обработку данных с автоматическими конвейерами для извлечения данных из Postgres или объектного хранилища, генерации векторных вложений как новых данных и запуска обновлений вложений при изменении исходных данных – это означает всегда актуальные данные для запросов и извлечения без утомительного обслуживания.

Какие инновации или разработки можно ожидать от Postgres в ближайшем будущем, особенно поскольку ИИ продолжает эволюционировать и требовать больше от инфраструктуры данных?

База данных векторного типа далеко не законченная статья, дальнейшее развитие и совершенствование ожидается по мере роста использования и зависимости от технологии базы данных векторного типа. Сообщество PostgreSQL продолжает инновации в этой области, ищет методы для улучшения индексирования, чтобы разрешить более сложные критерии поиска, а также прогресс расширения pgvector.

Как Postgres, особенно с предложениями EDB, поддерживает необходимость в многооблачных и гибридных облачных развертываниях, и почему эта гибкость важна для предприятий, управляемых ИИ?

Недавнее исследование EDB показывает, что 56% предприятий сейчас развертывают критически важные рабочие нагрузки в гибридной модели, подчеркивая необходимость решений, которые поддерживают как гибкость, так и суверенитет данных. Postgres, с улучшениями EDB, обеспечивает необходимую гибкость для многооблачных и гибридных облачных сред, наделяя предприятия, управляемые ИИ, возможностью управлять своими данными как с гибкостью, так и с контролем.

EDB Postgres AI обеспечивает облачную гибкость и наблюдаемость в гибридных средах с суверенным контролем. Этот подход позволяет предприятиям контролировать управление моделями ИИ, а также оптимизировать транзакционные, аналитические и рабочие нагрузки ИИ в гибридных или многооблачных средах. Позволяя переносимость данных, контроль TCO и облачный опыт на различных инфраструктурах, EDB поддерживает предприятия, управляемые ИИ, в реализации более быстрых и гибких ответов на сложные требования к данным.

Когда ИИ становится все более встроенным в корпоративные системы, как Postgres поддерживает управление данными, конфиденциальность и безопасность, особенно в контексте обработки чувствительных данных для моделей ИИ?

Когда ИИ становится как операционным краеугольным камнем, так и конкурентным дифференциатором, предприятия сталкиваются с возрастающим давлением, чтобы защитить целостность данных и соблюдать строгие стандарты соответствия. Эта эволюционирующая среда ставит суверенитет данных в центр внимания – где строгое управление, безопасность и прозрачность не являются только приоритетами, но и предпосылками. Бизнесу необходимо знать и быть уверенным в том, где находятся их данные и куда они движутся.

Postgres отлично подходит в качестве основы для среды данных, готовой к ИИ, предлагая передовые возможности для управления чувствительными данными в гибридных и многооблачных средах. Его открытая основа означает, что предприятия получают выгоду от постоянных инноваций, а улучшения EDB обеспечивают соблюдение стандартов безопасности предприятия, гранулярный контроль доступа и глубокую наблюдаемость – ключевые для ответственного управления данными ИИ. Возможности EDB по суверенитету ИИ строятся на этом положении, сосредотачиваясь на привлечении возможностей ИИ к данным, тем самым облегчая контроль над тем, куда движутся эти данные, и откуда они берутся.

Что делает EDB Postgres уникально способным масштабировать рабочие нагрузки ИИ, сохраняя при этом высокую доступность и производительность, особенно для критически важных приложений?

EDB Postgres AI помогает повысить инфраструктуру данных до стратегического технологического актива, приближая аналитические и системы ИИ к операционным и транзакционным данным клиентов – все это управляется через Postgres. Он обеспечивает основу платформы данных для приложений ИИ, снижая сложность инфраструктуры, оптимизируя эффективность затрат и удовлетворяя требованиям предприятия к суверенитету данных, производительности и безопасности.

Элегантная платформа данных для современных операторов, разработчиков, инженеров данных и создателей приложений ИИ, которым требуется проверенное решение для своих критически важных рабочих нагрузок, позволяющее получить доступ к аналитике и возможностям ИИ, используя основную операционную систему базы данных предприятия.

Благодарим за отличное интервью, читатели, которые хотят узнать больше, должны посетить EDB.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.