Trí tuệ nhân tạo
Làm thế nào trí tuệ nhân tạo nguyên nhân cuối cùng đang xây dựng các mô hình AI có thể lý luận, không chỉ phản ứng

Trong nhiều thập kỷ, trí tuệ nhân tạo đã excelled tại việc phát hiện ra các mẫu trong dữ liệu. Các mô hình học máy có thể dự đoán hành vi của khách hàng, dự báo xu hướng thị trường hoặc xác định rủi ro y tế với độ chính xác cao. Nhưng những hệ thống này thường không thể giải thích tại sao các sự kiện xảy ra. Chúng dựa vào mối tương quan, không thể phân biệt giữa nguyên nhân thực sự và sự trùng hợp. Giới hạn này giữ cho AI phản ứng, không thể thích nghi khi điều kiện thay đổi hoặc lý luận về các can thiệp. Trí tuệ nhân tạo nguyên nhân giải quyết khoảng trống này. Nó cho phép máy móc hiểu nguyên nhân và kết quả, điều này rất quan trọng để máy móc có khả năng lý luận thực sự. Khả năng này cho phép hệ thống mô phỏng các kịch bản “giả sử”, đánh giá các giả định và cung cấp quyết định có thể giải thích. Khi các tổ chức yêu cầu AI đáng tin cậy hơn, các phương pháp nguyên nhân đang trở nên phổ biến trên nhiều ngành công nghiệp.
Cạm bẫy tương quan
Học máy truyền thống hoạt động bằng cách tìm kiếm các liên kết thống kê trong dữ liệu. Nếu bệnh nhân dùng một loại thuốc nhất định phục hồi nhanh hơn, thuật toán học được mối liên hệ đó. Mặc dù cách tiếp cận này đã đạt được những tiến bộ đáng kể trong nhận dạng hình ảnh, dịch ngôn ngữ và hệ thống khuyến nghị, nhưng nó có một điểm yếu chí tử. Nó không thể phân biệt giữa nguyên nhân và trùng hợp. Sự không thể này tạo ra một điểm mù nguy hiểm về cách cơ chế cơ bản thực sự hoạt động. Ví dụ, một thuật toán được thiết kế để xác định bệnh nhân cần chăm sóc thêm đã học rằng chi tiêu y tế dự đoán nhu cầu y tế. Tuy nhiên, khi phân tích dữ liệu của 200 triệu người Mỹ, người ta phát hiện ra rằng mối tương quan này đã bỏ qua các偏见 hệ thống. Chi tiêu y tế cho người Mỹ gốc Phi thấp hơn so với người Mỹ da trắng có điều kiện tương tự do các yếu tố hệ thống. Thuật toán, mù đối với yếu tố này, đã đánh giá thấp nhu cầu chăm sóc của bệnh nhân da đen. Những thất bại tương tự xảy ra trong các lĩnh vực khác. Trong công lý hình sự, thuật toán COMPAS tương quan chủng tộc với nguy cơ tái phạm, dẫn đến việc tuyên án thiên vị. Trong nông nghiệp, một AI có thể tương quan độ ẩm của đất với những ngày nóng và khuyên không nên tưới nước trong thời kỳ nóng, điều này có thể là một đề xuất thảm hại. Trong y tế, các hệ thống AI có thể học rằng bệnh nhân hen suyễn phục hồi nhanh hơn nếu họ cũng bị viêm phổi. Tuy nhiên, mẫu này bỏ qua nguyên nhân thực sự là những bệnh nhân này nhận được điều trị tích cực hơn vì họ được coi là có nguy cơ cao, không phải vì hen suyễn giúp họ trong quá trình phục hồi.
Thang nguyên nhân của Pearl
Judea Pearl, người tiên phong trong lĩnh vực suy luận nguyên nhân và là người nhận giải thưởng Turing, đã định khung trí tuệ nhân tạo nguyên nhân thông qua Thang nguyên nhân của mình. Thang này phác thảo ba cấp độ lý luận khác nhau. Rungs đầu tiên là liên kết. Đây là nơi AI truyền thống hoạt động bằng cách quan sát các mẫu hoặc mối tương quan từ dữ liệu. Nó trả lời các câu hỏi như “Những triệu chứng nào liên quan đến một bệnh?” Rungs thứ hai là can thiệp. Nó hỏi, “Điều gì xảy ra nếu tôi làm X?” Điều này đòi hỏi phải hiểu cách thay đổi một biến số chủ động ảnh hưởng đến các biến số khác. Đó là sự khác biệt giữa quan sát rằng khách hàng nhận được email mua nhiều hơn và biết liệu email có gây ra việc mua hàng. Rungs cao nhất là lý luận phản thực tế. Nó liên quan đến việc hỏi, “Điều gì sẽ xảy ra nếu tôi đã làm điều gì khác?” Điều này đòi hỏi phải tưởng tượng các kịch bản thay thế và là điều cần thiết cho trách nhiệm và học tập, chẳng hạn như xác định xem một phương pháp điều trị khác có thể cứu sống một bệnh nhân. Trí tuệ nhân tạo nguyên nhân hoạt động trên tất cả三个 rungs. Nó xây dựng các mô hình không chỉ đại diện cho các mẫu trong dữ liệu mà còn đại diện cho các cơ chế nguyên nhân cơ bản tạo ra các mẫu đó.
Làm thế nào trí tuệ nhân tạo nguyên nhân xây dựng các mô hình có thể lý luận
Việc thực hiện trí tuệ nhân tạo nguyên nhân liên quan đến ba thành phần chính:
Mô hình nguyên nhân cấu trúc (SCMs): Những mô hình này dựa vào các phương trình để mô tả các cơ chế nguyên nhân tạo ra dữ liệu. Cách tiếp cận này cho phép AI mô hình hóa quá trình tạo dữ liệu cơ bản thay vì học các mẫu bề mặt.
Đồ thị Acyclic có hướng (DAGs): Những biểu diễn trực quan này sử dụng các nút và mũi tên để định nghĩa rõ ràng các giả định nguyên nhân. Chúng giúp các chuyên gia xác định các biến số gây nhiễu và xác thực logic của mô hình.
“Do”-Calculus: Toán tử toán học này, được tiên phong bởi Pearl, chính thức phân biệt giữa quan sát P (Y|X) và can thiệp P (Y| do(X)). Nó cung cấp máy móc để trả lời các câu hỏi “giả sử” bằng cách sử dụng dữ liệu.
Khung này cho phép các hệ thống AI mô phỏng các can thiệp trước khi chúng xảy ra và lý luận về các giả định. Nó định nghĩa lại AI từ một công cụ quan sát thế giới thành một công cụ giúp chúng ta hiểu nó.
Các công cụ đang trưởng thành
Sự phát triển của các công cụ phần mềm có thể tiếp cận cũng đang đóng vai trò quan trọng trong việc tăng tốc Trí tuệ nhân tạo nguyên nhân. Khung DoWhy của Microsoft là một thư viện Python mã nguồn mở thực hiện một quy trình công việc bốn bước có nguyên tắc bao gồm các công cụ để mô hình hóa các mối quan hệ nguyên nhân, xác định hiệu ứng nguyên nhân, ước tính hiệu ứng và bác bỏ các giả định để kiểm tra độ bền. Cách tiếp cận có cấu trúc này giải quyết một thách thức chính: các nhà nghiên cứu khác nhau có thể đưa ra các giả định nguyên nhân khác nhau. DoWhy giúp định nghĩa các giả định này thông qua các đồ thị nguyên nhân và cung cấp các công cụ để kiểm tra độ nhạy của các kết luận.
Sự trưởng thành của Trí tuệ nhân tạo nguyên nhân có thể được quan sát từ sự tăng trưởng thị trường nhanh chóng của nó. Các nhà phân tích dự đoán rằng thị trường Trí tuệ nhân tạo nguyên nhân toàn cầu sẽ tăng từ khoảng 63 triệu đô la vào năm 2025 lên hơn 1,6 tỷ đô la vào năm 2035, với tốc độ tăng trưởng hàng năm kép vượt quá 38%. Sự tăng trưởng này được thúc đẩy bởi việc nhận ra rằng hiểu nguyên nhân và kết quả mang lại lợi thế cạnh tranh. Sự tăng trưởng nhu cầu về AI giải thích (XAI) cũng là một yếu tố chính. Các quy định như Đạo luật AI của EU yêu cầu các giải thích minh bạch cho các quyết định. Các mô hình nguyên nhân cung cấp điều này một cách tự nhiên bằng cách nêu rõ không chỉ quyết định được đưa ra mà còn tại sao nó được đưa ra, thông qua các con đường nguyên nhân rõ ràng.
Điểm mấu chốt: Tính bền vững và niềm tin
Một lợi thế chính của Trí tuệ nhân tạo nguyên nhân là tính bền vững của nó đối với các điều kiện thay đổi. Khi môi trường thay đổi từ đào tạo đến triển khai, các mô hình truyền thống thường thất bại thảm hại vì các mối tương quan đã học bị phá vỡ. Một mô hình dựa trên mối tương quan cho năng suất cây trồng có thể học rằng độ ẩm của đất dự đoán năng suất cao. Nhưng nếu mối tương quan này bị che khuất bởi các thực hành tưới tiêu trong dữ liệu đào tạo, mô hình sẽ thất bại khi được triển khai ở một khu vực mới.
Các mô hình nguyên nhân khác. Bằng cách học các cơ chế cơ bản, chúng xác định các mối quan hệ ổn định tồn tại trên các môi trường. Chúng hiểu tại sao độ ẩm quan trọng, không chỉ là mối tương quan với năng suất. Nghiên cứu cho thấy rằng trên các tập dữ liệu có sự thay đổi phân phối, các mô hình nguyên nhân duy trì hiệu suất trong khi các mô hình truyền thống có thể thấy độ chính xác giảm hơn 20 điểm phần trăm.
Hơn nữa, Trí tuệ nhân tạo nguyên nhân giải quyết vấn đề hộp đen. Không giống như các mạng nơ-ron không rõ ràng, các đồ thị nguyên nhân và con đường cung cấp các giải thích rõ ràng: “Thay đổi X gây ra Y thông qua Z.” Khả năng này rất quan trọng để triển khai AI trong các lĩnh vực quan trọng, một yêu cầu hiện đã được quy định trong các quy định như Đạo luật AI của EU. Trí tuệ nhân tạo nguyên nhân cũng giúp giảm thiểu thiên vị bằng cách tách các mối tương quan giả (ví dụ: chủng tộc và kết quả) khỏi các nguyên nhân phân biệt đối xử.
Tác động thực tế trên nhiều ngành công nghiệp
Sự chuyển đổi sang lý luận nguyên nhân đã mang lại giá trị trên nhiều ngành công nghiệp. Trong y tế, Kaiser Permanente sử dụng trí tuệ nhân tạo nguyên nhân để xác định nguyên nhân gốc rễ của việc tái nhập viện của bệnh nhân, cho phép can thiệp nhắm vào như lời nhắc về đơn thuốc cá nhân hóa đã cải thiện đáng kể tỷ lệ tuân thủ. Trong dược phẩm, các công ty sử dụng trí tuệ nhân tạo nguyên nhân để xác định các mục tiêu phân tử thực sự gây ra sự tiến triển của bệnh, không chỉ là những mục tiêu tương quan với nó. Điều này tăng tốc phát hiện thuốc bằng cách mô phỏng các can thiệp trước khi thử nghiệm lâm sàng tốn kém. Trong sản xuất, các mô hình nguyên nhân thực hiện phân tích nguyên nhân gốc rễ trên các dây chuyền sản xuất. Khi chất lượng giảm, hệ thống theo dõi xem nguyên nhân nằm ở cài đặt máy, khuyết tật vật liệu hay quá trình dòng lên, cung cấp cho các kỹ sư những thông tin hành động. Trong tài chính, các ngân hàng triển khai suy luận nguyên nhân để hiểu các yếu tố thực sự thúc đẩy việc vỡ nợ tín dụng, không chỉ là các mối tương quan. Điều này cho phép họ thiết kế các can thiệp như lịch trình thanh toán điều chỉnh để giải quyết các nguyên nhân gốc rễ của khó khăn tài chính.
Xe tự hành là một trong những ứng dụng đòi hỏi nhất của trí tuệ nhân tạo nguyên nhân. Trong khi các hệ thống dựa trên mối tương quan có thể nhận ra một người đi bộ, các mô hình nguyên nhân có thể suy luận tại sao họ có thể băng qua đường, đuổi theo một quả bóng hoặc tránh một chướng ngại vật. Sự hiểu biết về ý định và nguyên nhân này rất quan trọng để điều hướng an toàn trong các môi trường động.
Kết luận
Kỷ nguyên của AI dựa vào mối tương quan đang kết thúc. Bằng cách xây dựng các mô hình hiểu tại sao các sự kiện xảy ra, Trí tuệ nhân tạo nguyên nhân cung cấp năng lực lý luận cần thiết cho phân tích “giả sử” đáng tin cậy, khả năng chống lại các điều kiện thay đổi và khả năng giải thích được yêu cầu bởi kinh doanh và quy định hiện đại.












