Phỏng vấn
Dominic Sartorio, Phó Chủ tịch Tiếp thị Sản phẩm tại Denodo – Loạt Phỏng vấn

Dominic Sartorio là Phó Chủ tịch Tiếp thị Sản phẩm tại Denodo. Dominic có hơn 20 năm kinh nghiệm trong lĩnh vực quản lý và quản trị dữ liệu, từng nắm giữ các vị trí lãnh đạo sản phẩm và tiếp thị tại Informatica, Protegrity, cùng các nhà cung cấp hàng đầu khác.
Denodo là một nhà lãnh đạo toàn cầu trong lĩnh vực quản lý dữ liệu, cung cấp các đại lý AI và ứng dụng đáng tin cậy. Nền tảng Denodo, một giải pháp quản lý dữ liệu logic được giải thưởng, biến đổi dữ liệu doanh nghiệp thành thông tin đáng tin cậy cho AI, phân tích và các sáng kiến tự phục vụ. Các tổ chức trên toàn thế giới sử dụng Denodo để cung cấp dữ liệu sẵn sàng cho AI, sẵn sàng cho doanh nghiệp trong một phần nhỏ thời gian so với các nhà kho dữ liệu truyền thống, đạt được thời gian nhận thức nhanh hơn 4 lần, ROI 345% và hiệu suất tốt hơn 10 lần. Dựa trên thông tin từ 850 nhà lãnh đạo doanh nghiệp, Báo cáo Khe hở Tin cậy AI của Denodo tiết lộ lý do tại sao nhiều dự án AI gặp khó khăn khi chuyển sang giai đoạn sản xuất và những gì các tổ chức phải làm để xây dựng AI đáng tin cậy, sẵn sàng cho sản xuất.
Bạn đã nắm giữ các vị trí lãnh đạo cấp cao tại các công ty như Informatica, Protegrity, Infoworks và hiện tại là Denodo, tất cả đều tập trung vào các lớp khác nhau của cơ sở hạ tầng dữ liệu doanh nghiệp. Quan điểm của bạn về “dữ liệu đáng tin cậy” đã thay đổi như thế nào khi AI chuyển từ phân tích sang các hệ thống tự động và đại lý?
Trong giai đoạn đầu của sự nghiệp, dữ liệu đáng tin cậy chủ yếu liên quan đến độ chính xác, nguồn gốc, bảo mật và cung cấp sự tự tin cho các nhà phân tích trong bảng điều khiển và báo cáo. Với các hệ thống AI tự động, rủi ro trở nên cao hơn vì các hệ thống không chỉ giải thích dữ liệu; chúng có thể hoạt động tự động, kích hoạt các quy trình kinh doanh hoặc đưa ra quyết định có tác động thực tế. Điều đó có nghĩa là dữ liệu đáng tin cậy hiện phải bao gồm cả ngữ cảnh hoạt động trực tiếp, ý nghĩa kinh doanh nhất quán và các rào cản được áp dụng để đảm bảo rằng các đại lý hoạt động chính xác và an toàn.
Báo cáo Khe hở Tin cậy AI của Denodo cho thấy 66% các tổ chức cho rằng dữ liệu AI phải là thời gian thực hoặc gần thời gian thực để được coi là đáng tin cậy. Bạn nghĩ tại sao nhiều doanh nghiệp vẫn gặp khó khăn trong việc cung cấp dữ liệu hoạt động trực tiếp cho các hệ thống AI?
Hầu hết các doanh nghiệp không được thiết kế để đáp ứng các đại lý AI cần nhận thức trực tiếp về tình huống trên nhiều hệ thống. Dữ liệu của họ được phân散 trên các ứng dụng, đám mây, kho dữ liệu, hồ dữ liệu, hệ thống cũ và các nền tảng hoạt động khác. Họ có thể sao chép dữ liệu này vào một kho trung tâm hoặc hồ dữ liệu cho phân tích và BI, nhưng điều này không phù hợp cho các đại lý AI cần nhận thức trực tiếp về tình huống. Một khi dữ liệu được sao chép, nó không còn trực tiếp. Có thể truyền trực tiếp trong thời gian thực, nhưng điều này trở nên rất tốn kém rất nhanh. Đây chính xác là nơi tiếp cận quản lý dữ liệu logic của Denodo trở nên quan trọng, vì nó cung cấp cho các hệ thống AI quyền truy cập được quản lý vào dữ liệu trực tiếp mà không yêu cầu các doanh nghiệp phải liên tục sao chép và tái nền tảng hóa mọi thứ.
Một trong những phát hiện đáng chú ý nhất trong báo cáo là các sáng kiến AI của doanh nghiệp hiện đang thu thập từ hàng trăm nguồn dữ liệu, với một số tổ chức truy cập hơn 1.000 nguồn. Mức độ phân mảnh này làm thay đổi cách các doanh nghiệp nên suy nghĩ về kiến trúc AI như thế nào?
Ở mức độ phân mảnh đó, kiến trúc không thể dựa vào việc hợp nhất vật lý tất cả các nguồn trước khi AI có thể sử dụng chúng. Các doanh nghiệp cần một lớp trừu tượng có thể khám phá, tích hợp, quản lý và cung cấp dữ liệu trên thực tế phân tán mà họ đã có. Theo quan điểm của tôi, kiến trúc dữ liệu phải trở nên logic hơn, dựa trên siêu dữ liệu và ngữ nghĩa, để các đại lý có thể tìm thấy dữ liệu đúng trong ngữ cảnh mà không bị ràng buộc chặt với các hệ thống cơ sở.
Báo cáo cho rằng nhiều thất bại của AI thực tế là “thất bại kiến trúc dữ liệu” hơn là thất bại của mô hình. Bạn có nghĩ rằng ngành công nghiệp đã dành quá nhiều thời gian để ám ảnh các mô hình trong khi đánh giá thấp tầm quan trọng của cơ sở hạ tầng dữ liệu?
Có. Các mô hình quan trọng,当然, nhưng nhiều dự án AI thất bại không phải vì mô hình không có khả năng; chúng thất bại vì mô hình hoạt động với dữ liệu không đầy đủ, lỗi thời, không nhất quán hoặc quản lý kém. Mô hình hoạt động tuyệt vời trong giai đoạn thử nghiệm, sử dụng một tập dữ liệu được xác định rõ và được quản lý, nhưng một khi được triển khai trong “thế giới thực” với sự phức tạp phân tán, AI thất bại trong việc sản xuất kết quả đáng tin cậy. Kinh nghiệm của tôi cho thấy các doanh nghiệp đạt được kết quả AI tốt hơn khi họ coi lớp dữ liệu là một phần quan trọng của kiến trúc AI, không phải là một ý tưởng sau cùng.
Denodo thường nói về tính nhất quán ngữ nghĩa và tầm quan trọng của một lớp ngữ nghĩa phổ quát. Khi các đại lý AI bắt đầu đưa ra quyết định tự động, làm thế nào để sự nhất quán ngữ nghĩa trở nên quan trọng trong việc ngăn chặn các hành động không chính xác hoặc logic kinh doanh bị ảo hóa?
Sự nhất quán ngữ nghĩa trở nên tuyệt đối quan trọng. Nếu một hệ thống định nghĩa “khách hàng”, “doanh thu”, “rủi ro” hoặc “tỷ lệ rời bỏ” khác với hệ thống khác, một đại lý AI có thể sản xuất một câu trả lời kỹ thuật hợp lý nhưng vẫn sai trong ngữ cảnh kinh doanh cho trước. Một lớp ngữ nghĩa phổ quát giúp đảm bảo rằng các đại lý hoạt động với ý nghĩa kinh doanh nhất quán, không chỉ truy cập dữ liệu thô.
Buổi hội thảo của bạn tại AI & Big Data Expo tập trung vào việc chuyển từ các thử nghiệm AI sang sản xuất. Trong kinh nghiệm của bạn, những lý do lớn nhất khiến các doanh nghiệp bị kẹt trong “giai đoạn thử nghiệm” và không thể mở rộng AI thành các hệ thống hoạt động thực sự là gì?
Các thử nghiệm thường hoạt động vì chúng hẹp, được quản lý thủ công và cách ly với sự phức tạp đầy đủ của doanh nghiệp. AI sản xuất phải đối mặt với dữ liệu trực tiếp từ nhiều nguồn, bảo mật, quản lý, hiệu suất, khả năng kiểm toán, các quy tắc kinh doanh thay đổi và tích hợp vào các quy trình làm việc thực. Nhiều tổ chức bị kẹt vì họ xây dựng một bản demo ấn tượng, nhưng không phải là nền tảng dữ liệu được quản lý cần thiết để vận hành AI một cách đáng tin cậy và có quy mô.
Báo cáo trích dẫn dự đoán rằng một tỷ lệ đáng kể các dự án AI đại lý có thể bị hủy bỏ trong vài năm tới do chi phí tăng cao, giá trị không rõ ràng hoặc kiểm soát rủi ro không đầy đủ. Bạn có nghĩ rằng ngành công nghiệp đang bước vào một giai đoạn mà các doanh nghiệp sẽ trở nên chọn lọc hơn về các dự án AI nào sẽ tồn tại?
Có, và tôi nghĩ rằng điều đó là lành mạnh. Làn sóng đầu tiên của thử nghiệm AI là về khả năng; làn sóng tiếp theo sẽ là về giá trị hoạt động, kỷ luật chi phí và tin cậy. Các dự án sẽ tồn tại là những dự án gắn liền với kết quả kinh doanh có thể đo lường và được hỗ trợ bởi dữ liệu, quản lý và kiến trúc phù hợp.
Bảo mật và quản lý xuất hiện xuyên suốt báo cáo như những chủ đề lặp lại, đặc biệt là về “rào cản” cho AI đại lý. Làm thế nào các tổ chức nên cân bằng khả năng AI tự động với nhu cầu kiểm soát truy cập nghiêm ngặt và khả năng kiểm toán?
Chìa khóa là không coi quản lý như một thứ gì đó được gắn vào sau khi hệ thống AI được xây dựng. Kiểm soát truy cập, thực thi chính sách, nguồn gốc và khả năng kiểm toán cần được nhúng vào chính lớp truy cập dữ liệu, để các đại lý AI chỉ thấy và sử dụng dữ liệu mà họ được ủy quyền truy cập. Với Denodo, các chính sách quản lý相同 có thể được áp dụng nhất quán trên các nguồn phân tán, điều này là thiết yếu khi AI hoạt động trên các môi trường đám mây lai và đa đám mây.
Denodo định vị quản lý dữ liệu logic như một cách để thống nhất truy cập trên các môi trường đám mây lai và đa đám mây mà không cần di chuyển dữ liệu liên tục. Khi các doanh nghiệp ngày càng áp dụng các kiến trúc AI dựa trên truy xuất, bạn có thấy “không sao chép” hoặc kiến trúc logic đầu tiên trở thành hướng đi lâu dài cho AI doanh nghiệp?
Có. AI dựa trên truy xuất phụ thuộc vào việc nhận được dữ liệu đúng vào đúng thời điểm, không nhất thiết phải di chuyển mọi tập dữ liệu vào một kho lưu trữ trước. Một cách tiếp cận logic đầu tiên, không sao chép là phù hợp hơn với cách các doanh nghiệp hoạt động thực sự: dữ liệu vẫn phân tán, nhưng AI có thể truy cập nó thông qua một lớp được quản lý, ngữ nghĩa và thời gian thực. Đó là hướng đi mà tôi tin rằng AI doanh nghiệp phải đi.
Nhìn về tương lai trong ba đến năm năm tới, bạn nghĩ sẽ là gì để phân biệt các tổ chức thành công trong việc triển khai AI đáng tin cậy với những tổ chức vẫn còn mắc kẹt trong chế độ thử nghiệm?
Người chiến thắng sẽ là những tổ chức nhận ra rằng AI không chỉ là chiến lược mô hình; nó là chiến lược dữ liệu, chiến lược quản lý và chiến lược mô hình hoạt động. Họ sẽ đầu tư vào truy cập dữ liệu trực tiếp, tính nhất quán ngữ nghĩa, quản lý có thể tái sử dụng và các kiến trúc có thể bao quát toàn bộ doanh nghiệp. Những tổ chức tiếp tục xây dựng các thử nghiệm bị cô lập trên dữ liệu phân mảnh hoặc lỗi thời sẽ gặp khó khăn trong việc chuyển sang giai đoạn sản xuất.
Cảm ơn bạn vì cuộc phỏng vấn tuyệt vời, độc giả muốn tìm hiểu thêm có thể truy cập Denodo hoặc tải xuống Báo cáo Khe hở Tin cậy AI của Denodo












