Kết nối với chúng tôi

Các sáng kiến AI không cần dữ liệu hoàn hảo: Quan điểm thực dụng về AI doanh nghiệp

Lãnh đạo tư tưởng

Các sáng kiến AI không cần dữ liệu hoàn hảo: Quan điểm thực dụng về AI doanh nghiệp

mm

Thị trường AI doanh nghiệp sẽ đạt tới $ 204 tỷ bởi 203090% các tổ chức có kế hoạch tăng đầu tư vào AI trong ba năm tới. Tuy nhiên, nghiên cứu của MIT cho thấy XNUMX% các dự án AI không thể vượt qua giai đoạn thí điểm. Và nguyên nhân chính không phải là sự tinh vi của mô hình; mà là chất lượng dữ liệu.

Các phòng họp đang tranh luận về ChatGPT so với Claude. Họ đang đặt sai câu hỏi. Vấn đề thực sự là liệu dữ liệu của tổ chức đã sẵn sàng cho bất kỳ triển khai AI nào hay chưa. Hầu hết các công ty đều xây dựng các năng lực AI phức tạp trên nền tảng dữ liệu rời rạc, không nhất quán và thiếu ngữ cảnh.

Điều này thật không may lại dẫn đến những thất bại tốn kém. Các tổ chức tài chính triển khai chatbot ảo hóa số liệu doanh thu. Các nhà bán lẻ triển khai công cụ đề xuất gợi ý các sản phẩm đã ngừng sản xuất. Các nhà sản xuất đầu tư vào phân tích dự đoán nhưng lại không thể trả lời các câu hỏi vận hành cơ bản. Những thất bại này xuất phát từ việc vội vàng triển khai các mô hình tiên tiến mà bỏ qua khâu chuẩn bị dữ liệu nền tảng.

Hiểu về thách thức về độ phức tạp của dữ liệu

Dữ liệu doanh nghiệp tồn tại dưới ba dạng. Mỗi loại yêu cầu các phương pháp chuẩn bị khác nhau. Hiểu được những khác biệt này sẽ quyết định sự thành công của AI.

Dữ liệu có cấu trúc trông quen thuộc. Thông tin nằm trong cơ sở dữ liệu và bảng tính với các hàng và cột rõ ràng. Nhiều tổ chức cho rằng hệ thống giao dịch được tổ chức tốt đồng nghĩa với việc sẵn sàng cho AI. Giả định này gây ra nhiều vấn đề. Hệ thống AI gặp khó khăn với dữ liệu có cấu trúc không phải do sự thiếu tổ chức, mà là do khoảng cách ngữ cảnh. Khi AI gặp các trường "ProductID" trên nhiều bảng cơ sở dữ liệu, nó không thể hiểu các mối quan hệ này nếu không có hướng dẫn rõ ràng. Kết quả là AI truy cập dữ liệu nhưng không thể phân tích dữ liệu một cách có ý nghĩa.

Dữ liệu phi cấu trúc mang đến những thách thức và cơ hội trái ngược. Danh mục này bao gồm email, tài liệu, bài thuyết trình, video và các nội dung khác do con người tạo ra, nơi lưu trữ phần lớn kiến thức của tổ chức. Các công cụ phân tích truyền thống gặp khó khăn với dữ liệu phi cấu trúc. Các hệ thống AI hiện đại được thiết kế để xử lý dữ liệu này. Thành công đòi hỏi sự chuẩn bị có hệ thống. Các tổ chức không thể tải lên hàng nghìn tệp PDF và mong đợi những thông tin chi tiết có ý nghĩa. Việc triển khai hiệu quả đòi hỏi phân khúc nội dung, tạo siêu dữ liệu và tối ưu hóa tìm kiếm.

Dữ liệu bán cấu trúc chiếm vị trí trung gian phức tạp. Tệp JSON, nhật ký hệ thống và báo cáo kết hợp các thành phần được sắp xếp với nội dung tường thuật. Sai lầm phổ biến là xử lý các nguồn này hoàn toàn phi cấu trúc, làm mất đi các thành phần được sắp xếp có giá trị. Việc triển khai AI thành công đòi hỏi phải phân tích cú pháp các thành phần có cấu trúc trong khi vẫn giữ lại các thông tin chi tiết phi cấu trúc, sau đó kết hợp chúng lại để phân tích toàn diện.

Mỗi loại dữ liệu đòi hỏi các chiến lược chuẩn bị riêng. Hệ thống AI phải được cấu hình để xử lý sự phức tạp này. Các tổ chức xử lý tất cả dữ liệu một cách đồng nhất sẽ tạo ra các triển khai AI vượt trội với một loại dữ liệu nhưng lại kém hiệu quả với các loại dữ liệu khác.

Khoảng cách bối cảnh làm suy yếu hiệu suất của AI

Bối cảnh là yếu tố quan trọng nhất quyết định thành công của AI. Nhưng nó cũng là yếu tố thường bị bỏ qua nhất. Các nhà phân tích con người vận dụng hàng thập kỷ kiến ​​thức kinh doanh vào việc diễn giải dữ liệu. Khi xem xét các báo cáo quý, họ hiểu rằng "Doanh thu" thể hiện doanh số sau thuế của Hoa Kỳ tính bằng đô la. Hệ thống AI không có sự hiểu biết như vậy. Nếu không có ngữ cảnh rõ ràng, AI có thể hiểu "47%" là con số doanh thu trong khi giá trị thực tế là 4.7 triệu đô la. Điều này dẫn đến những khuyến nghị kinh doanh sai lầm về cơ bản.

Khoảng cách ngữ cảnh vượt ra ngoài phạm vi diễn giải dữ liệu cơ bản. Mỗi tổ chức đều xây dựng những định nghĩa riêng cho các số liệu chung. "Chi phí thu hút khách hàng" mang ý nghĩa hoàn toàn khác nhau ở một công ty khởi nghiệp so với một doanh nghiệp đã thành lập. Các phép tính "tỷ lệ khách hàng rời bỏ" rất khác nhau giữa các ngành và công ty. Các hệ thống AI cần được hướng dẫn rõ ràng về những sắc thái tổ chức này để cung cấp những thông tin chi tiết có ý nghĩa.

Các phương pháp ghi chép tài liệu truyền thống không đáp ứng được việc triển khai AI. Từ điển dữ liệu tĩnh được lưu trữ trên máy chủ không thể bị hệ thống AI phát hiện và nhanh chóng trở nên lỗi thời. Các tổ chức thành công tạo ra tài liệu trực tiếp mà AI có thể chủ động tham chiếu. Tài liệu này tự động cập nhật khi các quy tắc kinh doanh phát triển.

Sự cân bằng giữa tự động hóa và đầu vào của con người trở nên rất quan trọng ở đây. Máy móc rất giỏi trong việc xác định các mối quan hệ kỹ thuật. Chúng nhận ra Cột A kết nối với Bảng B trên các hệ thống cơ sở dữ liệu. Chỉ có chuyên môn của con người mới cung cấp bối cảnh kinh doanh. Con người giải thích tại sao một số chỉ số nhất định lại quan trọng, cách tính toán chúng và điều gì cấu thành nên phạm vi hiệu suất bình thường so với đáng lo ngại. Việc triển khai AI hiệu quả kết hợp khám phá tự động với việc quản lý kiến ​​thức của con người.

Rủi ro gia tăng trong kỷ nguyên AI

Việc triển khai AI làm trầm trọng thêm các vấn đề dữ liệu hiện có ở quy mô và tốc độ chưa từng có. Các thách thức quản trị dữ liệu truyền thống trở nên phức tạp hơn gấp bội khi các hệ thống AI truy cập, xử lý và chia sẻ thông tin xuyên biên giới tổ chức.

Các cơ chế kiểm soát truy cập được thiết kế cho người dùng thực tế tỏ ra không đủ hiệu quả với hệ thống AI. Các mô hình bảo mật truyền thống có thể cấp cho các nhà phân tích bán hàng quyền truy cập vào các thư mục cụ thể. Tuy nhiên, trợ lý AI có thể vô tình tiết lộ thông tin nhạy cảm cho người dùng trái phép thông qua các truy vấn tưởng chừng như vô hại. Một AI dịch vụ khách hàng có thể truy cập dữ liệu giá của đối thủ cạnh tranh và chia sẻ thông tin đó trong các giao tiếp với khách hàng. Các tổ chức cần các khuôn khổ bảo mật đủ tinh vi để hiểu những gì AI có thể và không thể chia sẻ trong các bối cảnh khác nhau.

Các yêu cầu tuân thủ trở nên phức tạp hơn đáng kể khi hệ thống AI đưa ra quyết định ảnh hưởng đến cá nhân. Việc tuân thủ GDPR đã gặp nhiều thách thức khi con người đưa ra quyết định dựa trên dữ liệu. Giờ đây, các tổ chức phải giải thích cách các thuật toán AI đạt được kết luận cụ thể. Họ phải duy trì dấu vết kiểm toán cho các quyết định tự động. Họ phải đảm bảo dữ liệu đào tạo AI tuân thủ các quy định về quyền riêng tư. "Quyền được giải thích" mang một ý nghĩa mới khi người ra quyết định là một hệ thống thuật toán chứ không phải là một nhà phân tích con người.

Xây dựng niềm tin đòi hỏi những cách tiếp cận mới trong việc kiểm tra và giám sát. Đảm bảo chất lượng truyền thống tập trung vào việc hệ thống có hoạt động chính xác trong điều kiện dự kiến hay không. Hệ thống AI cần được giám sát liên tục để phát hiện lỗi khi nào, mức độ nghiêm trọng và lý do. Các tổ chức phải triển khai giám sát theo thời gian thực cho mọi quyết định của AI, chứ không chỉ riêng các số liệu hiệu suất hệ thống.

Vòng phản hồi trở nên quan trọng cho việc cải tiến. Khi người dùng sửa lỗi phản hồi của AI, việc sửa lỗi đó sẽ mang lại dữ liệu đào tạo có giá trị. Nhưng điều này chỉ đúng khi các tổ chức nắm bắt và kết hợp nó một cách có hệ thống. Điều này đòi hỏi các quy trình thu thập phản hồi của người dùng, xác thực các sửa lỗi và cập nhật hành vi của AI cho phù hợp.

Điều hướng quyết định xây dựng so với mua

Các tổ chức phải đối mặt với sự lựa chọn giữa việc phát triển năng lực AI nội bộ hoặc hợp tác với các nền tảng bên ngoài. Mỗi phương pháp đều có những ưu điểm và thách thức riêng biệt, phải phù hợp với năng lực và mục tiêu chiến lược của tổ chức.

Xây dựng năng lực AI nội bộ mang lại khả năng kiểm soát và tùy chỉnh tối đa. Các tổ chức có thể phát triển các hệ thống được thiết kế riêng theo yêu cầu riêng của mình. Họ nắm giữ toàn quyền sở hữu dữ liệu và thuật toán. Tuy nhiên, yêu cầu về nguồn lực rất lớn. Việc phát triển nội bộ thành công thường đòi hỏi đội ngũ kỹ sư dữ liệu, chuyên gia AI và chuyên gia trong lĩnh vực. Quá trình phát triển mất 12-24 tháng. Chi phí ẩn bao gồm việc cập nhật các công nghệ AI đang phát triển nhanh chóng, bảo trì hệ thống XNUMX/XNUMX và giải thích các vấn đề chậm trễ về tiến độ cho ban lãnh đạo điều hành.

Các giải pháp nền tảng hứa hẹn triển khai nhanh hơn và giảm thiểu chi phí kỹ thuật. Các tổ chức có thể tải dữ liệu lên, cấu hình các thiết lập cơ bản và bắt đầu tạo ra các thông tin chi tiết về AI. Tuy nhiên, các tổ chức phải đánh giá cẩn thận khả năng của nền tảng dựa trên các yêu cầu cụ thể của mình. Những cân nhắc quan trọng bao gồm khả năng tương thích định dạng dữ liệu, hiểu biết chuyên sâu về ngành, bảo mật dữ liệu và bảo vệ quyền riêng tư, cũng như khả năng tích hợp với các hệ thống hiện có.

Phương pháp tiếp cận kết hợp thường hiệu quả nhất với nhiều tổ chức. Bắt đầu với các giải pháp nền tảng cho phép các công ty nhanh chóng chứng minh giá trị của AI, đồng thời tìm hiểu các yêu cầu cụ thể của họ. Khi các tổ chức hiểu rõ giải pháp nào hiệu quả, họ có thể đưa ra quyết định sáng suốt về việc nên phát triển nội bộ hay tiếp tục sử dụng nền tảng.

Một khuôn khổ thực tế để tiến về phía trước

Việc triển khai AI thành công bắt đầu bằng việc đánh giá trung thực thay vì lập kế hoạch đầy tham vọng. Các tổ chức nên bắt đầu bằng việc kiểm kê các tài sản dữ liệu hiện có. Quá trình này thường bộc lộ nhiều sự phức tạp và thiếu nhất quán hơn dự kiến ban đầu. Thay vì cố gắng chuyển đổi AI toàn diện, các công ty thành công xác định các vấn đề cụ thể, có thể đo lường được mà AI có thể mang lại giá trị rõ ràng.

Công tác nền tảng đòi hỏi nỗ lực đáng kể nhưng vẫn rất cần thiết. Điều này bao gồm việc dọn dẹp dữ liệu, ghi chép bối cảnh, triển khai kiểm soát truy cập và thử nghiệm thí điểm với các chỉ số thành công được xác định rõ ràng. Các tổ chức nên lập kế hoạch cho các mốc thời gian thực tế. Hãy nghĩ đến hàng tháng hoặc hàng năm thay vì hàng tuần. Xây dựng năng lực theo từng bước.

Các công ty hoàn thành công việc nền tảng này trong khi đối thủ cạnh tranh vẫn tập trung vào việc lựa chọn mô hình AI sẽ có được lợi thế đáng kể. Việc lựa chọn công nghệ ít quan trọng hơn nhiều so với sự chuẩn bị cần thiết để bất kỳ hệ thống AI nào thành công.

Cái giá của sự chờ đợi

Cuộc cách mạng AI vẫn tiếp diễn bất kể sự sẵn sàng của tổ chức. Các công ty có thể lựa chọn đầu tư vào việc chuẩn bị dữ liệu phù hợp ngay từ bây giờ. Hoặc họ có thể thử nghiệm cải tiến các giải pháp sau này với chi phí và độ phức tạp cao hơn đáng kể. Các tổ chức tiên phong trong lĩnh vực AI sẽ sớm nhận ra rằng thành công không phụ thuộc vào việc lựa chọn các mô hình tinh vi nhất, mà phụ thuộc vào việc xây dựng nền tảng dữ liệu cho phép bất kỳ hệ thống AI nào mang lại giá trị kinh doanh có ý nghĩa.

Câu hỏi mà các nhà lãnh đạo doanh nghiệp phải đối mặt không phải là nên triển khai công nghệ AI nào. Mà là liệu tổ chức của họ đã thực hiện những công việc khó khăn cần thiết để đảm bảo việc triển khai AI thành công hay chưa. Năng lực AI liên tục được cải thiện hàng tháng. Lợi thế cạnh tranh bền vững thuộc về các công ty có nền tảng dữ liệu đủ mạnh để hỗ trợ bất kỳ phát triển công nghệ nào tiếp theo.

Soham Mazumdar là Đồng sáng lập và Giám đốc điều hành của Trí tuệAI, một công ty tiên phong trong các giải pháp AI. Trước khi thành lập WisdomAI vào năm 2023, ông là Đồng sáng lập và Kiến trúc sư trưởng tại Rubrik, nơi ông đóng vai trò quan trọng trong việc mở rộng quy mô công ty trong suốt 9 năm. Soham trước đây từng đảm nhiệm các vị trí lãnh đạo kỹ thuật tại Facebook và Google, nơi ông đã đóng góp vào cơ sở hạ tầng tìm kiếm cốt lõi và được ghi nhận với Giải thưởng Nhà sáng lập Google. Ông cũng đồng sáng lập Tagtile, một nền tảng tích điểm khách hàng thân thiết trên thiết bị di động đã được Facebook mua lại. Với hai thập kỷ kinh nghiệm trong lĩnh vực kiến trúc phần mềm và đổi mới AI, Soham là một doanh nhân và chuyên gia công nghệ dày dạn kinh nghiệm, hiện đang làm việc tại Khu vực Vịnh San Francisco.