Lãnh đạo tư tưởng
Sáng kiến AI không cần dữ liệu hoàn hảo: Quan điểm của người thực dụng về AI doanh nghiệp

Thị trường AI doanh nghiệp sẽ đạt 204 tỷ đô la vào năm 2030. Chín mươi hai phần trăm các tổ chức dự định tăng đầu tư AI trong ba năm tới. Tuy nhiên, nghiên cứu của MIT cho thấy 90% dự án AI không thể vượt qua giai đoạn thử nghiệm. Và nguyên nhân chính không phải là sự tinh vi của mô hình; mà là chất lượng dữ liệu.
Các phòng họp tranh luận về ChatGPT so với Claude. Họ đang đặt câu hỏi sai. Vấn đề thực sự là liệu dữ liệu tổ chức có sẵn sàng cho bất kỳ triển khai AI nào hay không. Hầu hết các công ty xây dựng các khả năng AI tinh vi trên nền tảng dữ liệu bị phân mảnh, không nhất quán, thiếu ngữ cảnh.
Điều này tạo ra thất bại tốn kém. Các tổ chức tài chính triển khai các rô-bốt trò chuyện tạo ra các con số doanh thu. Các nhà bán lẻ triển khai các động cơ khuyến nghị gợi ý sản phẩm đã ngừng sản xuất. Các nhà sản xuất đầu tư vào phân tích dự đoán không thể trả lời các câu hỏi hoạt động cơ bản. Những thất bại này xuất phát từ việc vội vàng triển khai các mô hình tiên tiến trong khi bỏ qua việc chuẩn bị dữ liệu cơ bản.
Hiểu về thách thức phức tạp của dữ liệu
Dữ liệu doanh nghiệp tồn tại trong ba loại. Mỗi loại yêu cầu các phương pháp chuẩn bị khác nhau. Việc hiểu các sự khác biệt này quyết định thành công của AI.
Dữ liệu có cấu trúc trông quen thuộc. Thông tin nằm trong các cơ sở dữ liệu và bảng tính với các hàng và cột rõ ràng. Nhiều tổ chức cho rằng các hệ thống giao dịch được tổ chức tốt có nghĩa là sẵn sàng cho AI. Giả định này tạo ra vấn đề. Các hệ thống AI gặp khó khăn với dữ liệu có cấu trúc không phải vì sự không tổ chức, mà vì khoảng trống ngữ cảnh. Khi AI gặp các trường “ProductID” trên nhiều bảng cơ sở dữ liệu, nó không thể hiểu các mối quan hệ này mà không có hướng dẫn rõ ràng. Kết quả là AI truy cập dữ liệu nhưng không thể phân tích nó một cách có ý nghĩa.
Dữ liệu không có cấu trúc trình bày các thách thức và cơ hội đối lập. Loại này bao gồm email, tài liệu, bài thuyết trình, video và các nội dung do con người tạo khác nơi hầu hết kiến thức tổ chức sống. Các công cụ phân tích truyền thống gặp khó khăn với dữ liệu không có cấu trúc. Các hệ thống AI hiện đại được thiết kế để xử lý nó. Thành công đòi hỏi sự chuẩn bị có hệ thống. Các tổ chức không thể tải lên hàng nghìn tệp PDF và mong đợi thông tin có ý nghĩa. Việc triển khai hiệu quả đòi hỏi phân đoạn nội dung, tạo siêu dữ liệu và tối ưu hóa tìm kiếm.
Dữ liệu bán cấu trúc chiếm vị trí trung gian phức tạp. Các tệp JSON, nhật ký hệ thống và báo cáo kết hợp các yếu tố được tổ chức với nội dung tường thuật. Sai lầm phổ biến là xử lý các nguồn này như thuần túy không có cấu trúc, điều này làm mất đi các thành phần được tổ chức có giá trị. Việc triển khai AI thành công đòi hỏi phải phân tích các yếu tố có cấu trúc trong khi vẫn giữ nguyên các thông tin không có cấu trúc, sau đó kết hợp chúng lại để phân tích toàn diện.
Mỗi loại dữ liệu đòi hỏi các chiến lược chuẩn bị cụ thể. Các hệ thống AI phải được cấu hình để xử lý sự phức tạp này. Các tổ chức xử lý tất cả dữ liệu một cách đồng nhất tạo ra các triển khai AI mà vượt trội với một loại dữ liệu nhưng thất bại với những loại khác.
Khoảng trống ngữ cảnh làm tê liệt hiệu suất AI
Ngữ cảnh là yếu tố quan trọng nhất trong thành công của AI. Đây cũng là yếu tố thường bị bỏ qua nhất. Các nhà phân tích con người mang lại nhiều thập kỷ kiến thức kinh doanh để giải thích dữ liệu. Khi xem xét các báo cáo hàng quý, họ hiểu rằng “Doanh thu” đại diện cho doanh thu sau thuế của Mỹ tính bằng đô la. Các hệ thống AI không có sự hiểu biết như vậy. Nếu không có ngữ cảnh rõ ràng, AI có thể giải thích “47%” là một con số doanh thu khi giá trị thực tế là 4,7 triệu đô la. Điều này dẫn đến các khuyến nghị kinh doanh cơ bản bị lỗi.
Khoảng trống ngữ cảnh vượt ra ngoài việc giải thích dữ liệu cơ bản. Mỗi tổ chức phát triển các định nghĩa duy nhất cho các chỉ số chung. “Chi phí thu hút khách hàng” có nghĩa là một điều gì đó hoàn toàn khác tại một công ty khởi nghiệp so với một doanh nghiệp thành lập. “Tỷ lệ luân chuyển” tính toán khác nhau đáng kể trên các ngành và công ty. Các hệ thống AI đòi hỏi hướng dẫn rõ ràng về những sắc thái tổ chức này để cung cấp thông tin có ý nghĩa.
Các phương pháp tài liệu truyền thống không thành công trong việc triển khai AI. Các từ điển dữ liệu tĩnh được lưu trữ trên máy chủ vẫn vô hình đối với các hệ thống AI và nhanh chóng trở nên lỗi thời. Các tổ chức thành công tạo ra tài liệu sống mà AI có thể tham khảo tích cực. Điều này cập nhật tự động khi các quy tắc kinh doanh phát triển.
Sự cân bằng giữa tự động hóa và đầu vào của con người trở nên quan trọng ở đây. Máy móc vượt trội trong việc xác định các mối quan hệ kỹ thuật. Chúng nhận ra rằng Cột A kết nối với Bảng B trên các hệ thống cơ sở dữ liệu. Chỉ kiến thức chuyên môn của con người cung cấp ngữ cảnh kinh doanh. Con người giải thích tại sao một số chỉ số nhất định quan trọng, cách chúng được tính toán và những gì cấu thành phạm vi hiệu suất bình thường so với phạm vi đáng lo ngại. Việc triển khai AI hiệu quả kết hợp việc khám phá tự động với việc kiểm tra kiến thức của con người.
Rủi ro tăng cao trong kỷ nguyên AI
Việc triển khai AI làm tăng các vấn đề dữ liệu hiện có với tốc độ và quy mô chưa từng có. Các thách thức quản trị dữ liệu truyền thống trở nên phức tạp hơn nhiều khi các hệ thống AI truy cập, xử lý và chia sẻ thông tin trên các ranh giới tổ chức.
Các cơ chế kiểm soát truy cập được thiết kế cho người dùng chứng tỏ không đủ cho các hệ thống AI. Các mô hình bảo mật truyền thống có thể cấp quyền truy cập cho các nhà phân tích bán hàng vào các thư mục cụ thể. Nhưng các trợ lý AI có thể vô tình tiết lộ thông tin nhạy cảm cho người dùng không được ủy quyền thông qua các truy vấn vô hại. Một AI dịch vụ khách hàng có thể truy cập dữ liệu giá của đối thủ cạnh tranh và chia sẻ nó trong các cuộc liên lạc với khách hàng. Các tổ chức cần các khuôn khổ bảo mật đủ tinh vi để hiểu những gì AI có thể và không thể chia sẻ trong các ngữ cảnh khác nhau.
Các yêu cầu tuân thủ trở nên phức tạp hơn nhiều khi các hệ thống AI đưa ra quyết định ảnh hưởng đến các cá nhân. Việc tuân thủ GDPR đã là một thách thức khi con người đưa ra quyết định dựa trên dữ liệu. Giờ đây, các tổ chức phải giải thích cách các thuật toán AI đã đưa ra các kết luận cụ thể. Họ phải duy trì các đường mòn kiểm toán cho các quyết định tự động. Họ phải đảm bảo rằng dữ liệu đào tạo AI tuân thủ các quy định về quyền riêng tư. “Quyền được giải thích” mang một ý nghĩa mới khi người quyết định là một hệ thống thuật toán chứ không phải một nhà phân tích con người.
Xây dựng niềm tin đòi hỏi các phương pháp kiểm tra và giám sát mới. Kiểm tra chất lượng truyền thống tập trung vào việc liệu hệ thống có hoạt động chính xác trong các điều kiện dự kiến hay không. Các hệ thống AI đòi hỏi giám sát liên tục để phát hiện khi chúng thất bại, mức độ nghiêm trọng và lý do. Các tổ chức phải triển khai giám sát thời gian thực cho mọi quyết định AI, không chỉ các chỉ số hiệu suất hệ thống.
Vòng phản hồi trở nên quan trọng cho sự cải thiện. Khi người dùng sửa các phản hồi AI, sự sửa đổi đó đại diện cho dữ liệu đào tạo có giá trị. Nhưng chỉ khi các tổ chức thu thập và kết hợp chúng một cách có hệ thống. Điều này đòi hỏi các quy trình để thu thập phản hồi của người dùng, xác thực các sửa đổi và cập nhật hành vi AI tương ứng.
Định hướng quyết định Xây dựng so với Mua
Các tổ chức phải đối mặt với việc lựa chọn giữa phát triển các khả năng AI nội bộ hoặc hợp tác với các nền tảng bên ngoài. Mỗi phương pháp đều có những lợi thế và thách thức riêng biệt phải phù hợp với khả năng và mục tiêu chiến lược của tổ chức.
Phát triển các khả năng AI nội bộ cung cấp sự kiểm soát và tùy chỉnh tối đa. Các tổ chức có thể phát triển các hệ thống được điều chỉnh chính xác cho các yêu cầu duy nhất của họ. Họ duy trì quyền sở hữu hoàn toàn đối với dữ liệu và thuật toán của mình. Tuy nhiên, các yêu cầu về tài nguyên là đáng kể. Phát triển nội bộ thành công thường đòi hỏi các nhóm kỹ sư dữ liệu, chuyên gia AI và chuyên gia lĩnh vực. Phát triển mất 12-24 tháng. Các chi phí ẩn bao gồm việc cập nhật các công nghệ AI đang phát triển nhanh chóng, duy trì hệ thống quanh đồng hồ và giải thích sự chậm trễ về thời gian cho lãnh đạo điều hành.
Các giải pháp nền tảng hứa hẹn việc triển khai nhanh hơn và giảm thiểu các chi phí kỹ thuật. Các tổ chức có thể tải lên dữ liệu, cấu hình các cài đặt cơ bản và bắt đầu tạo ra các thông tin AI. Tuy nhiên, các tổ chức phải đánh giá cẩn thận các khả năng của nền tảng so với các yêu cầu cụ thể của họ. Các yếu tố quan trọng cần xem xét bao gồm khả năng tương thích định dạng dữ liệu, hiểu biết về ngành, bảo vệ quyền riêng tư và bảo mật dữ liệu, cũng như khả năng tích hợp với các hệ thống hiện có.
Một phương pháp tiếp cận kết hợp thường hoạt động tốt nhất cho nhiều tổ chức. Bắt đầu với các giải pháp nền tảng cho phép các công ty chứng minh giá trị AI một cách nhanh chóng trong khi tìm hiểu về các yêu cầu cụ thể của họ. Một khi các tổ chức hiểu những gì hoạt động, họ có thể đưa ra các quyết định sáng suốt về những khả năng nào xứng đáng với sự phát triển nội bộ so với việc tiếp tục sử dụng nền tảng.
Một khuôn khổ thực tế để tiến bước
Việc triển khai AI thành công bắt đầu bằng việc đánh giá thực tế chứ không phải kế hoạch đầy tham vọng. Các tổ chức nên bắt đầu bằng việc kiểm kê các tài sản dữ liệu hiện có. Quá trình này thường tiết lộ nhiều phức tạp và không nhất quán hơn dự kiến. Thay vì cố gắng biến đổi AI toàn diện, các công ty thành công xác định các vấn đề cụ thể, có thể đo lường được mà AI có thể cung cấp giá trị rõ ràng.
Công việc nền tảng đòi hỏi nỗ lực đáng kể nhưng vẫn thiết yếu. Điều này bao gồm việc làm sạch dữ liệu, ghi tài liệu ngữ cảnh, triển khai kiểm soát truy cập và thử nghiệm phi công với các chỉ số thành công được định nghĩa rõ ràng. Các tổ chức nên lên kế hoạch cho các khung thời gian thực tế. Nghĩ về các tháng hoặc năm chứ không phải tuần. Xây dựng các khả năng một cách tăng dần.
Các công ty hoàn thành công việc nền tảng này trong khi các đối thủ cạnh tranh vẫn tập trung vào việc chọn các mô hình AI sẽ có được lợi thế đáng kể. Việc lựa chọn công nghệ quan trọng ít hơn so với việc chuẩn bị cho phép bất kỳ hệ thống AI nào thành công.
Chi phí của việc chờ đợi
Cuộc cách mạng AI tiếp tục bất kể sự sẵn sàng của tổ chức. Các công ty có thể chọn đầu tư vào việc chuẩn bị dữ liệu đúng cách ngay bây giờ. Hoặc họ có thể cố gắng sửa đổi các giải pháp sau này với chi phí và sự phức tạp cao hơn. Các công ty nổi lên như những người lãnh đạo AI sẽ nhận ra sớm rằng thành công không phụ thuộc vào việc chọn các mô hình tinh vi nhất, mà là xây dựng các nền tảng dữ liệu cho phép bất kỳ hệ thống AI nào cung cấp giá trị kinh doanh có ý nghĩa.
Câu hỏi mà các nhà lãnh đạo doanh nghiệp phải đối mặt không phải là công nghệ AI nào để triển khai. Đó là liệu tổ chức của họ đã hoàn thành công việc khó khăn cần thiết để làm cho bất kỳ triển khai AI nào thành công hay không. Các khả năng AI phát triển hàng tháng. Lợi thế cạnh tranh bền vững thuộc về các công ty có nền tảng dữ liệu đủ mạnh để hỗ trợ bất kỳ sự phát triển công nghệ nào xuất hiện tiếp theo.












