AI 101

Explainable AI là gì?

Published October 24, 2022

Updated April 28, 2026

Alex McFarland

Khi trí tuệ nhân tạo (AI) trở nên phức tạp và được áp dụng rộng rãi trên toàn xã hội, một trong những tập hợp các quy trình và phương pháp quan trọng nhất là giải thích được (AI), đôi khi được gọi là XAI.

Trí tuệ nhân tạo giải thích được có thể được định nghĩa là:

Một tập hợp các quy trình và phương pháp giúp người dùng hiểu và tin tưởng vào kết quả của các thuật toán học máy.

Như bạn có thể đoán, sự giải thích này vô cùng quan trọng khi các thuật toán AI kiểm soát nhiều lĩnh vực, điều này đi kèm với rủi ro về sự thiên vị, thuật toán lỗi và các vấn đề khác. Bằng cách đạt được tính minh bạch với sự giải thích, thế giới có thể tận dụng真正 sức mạnh của AI.

Trí tuệ nhân tạo giải thích được, như tên gọi của nó, giúp mô tả một mô hình AI, tác động và sự thiên vị tiềm năng. Nó cũng đóng vai trò trong việc mô tả độ chính xác của mô hình, công bằng, minh bạch và kết quả trong các quy trình ra quyết định được hỗ trợ bởi AI.

Các tổ chức được thúc đẩy bởi AI ngày nay nên luôn áp dụng các quy trình AI giải thích được để giúp xây dựng niềm tin và sự tự tin vào các mô hình AI trong sản xuất. Trí tuệ nhân tạo giải thích được cũng là chìa khóa để trở thành một công ty có trách nhiệm trong môi trường AI ngày nay.

Bởi vì các hệ thống AI ngày nay rất tiên tiến, con người thường thực hiện một quá trình tính toán để theo dõi lại cách thuật toán đạt được kết quả của nó. Quá trình này trở thành một “hộp đen”, nghĩa là không thể hiểu được. Khi các mô hình không thể giải thích được này được phát triển trực tiếp từ dữ liệu, không ai có thể hiểu được điều gì đang xảy ra bên trong chúng.

Bằng cách hiểu cách các hệ thống AI hoạt động thông qua AI giải thích được, các nhà phát triển có thể đảm bảo rằng hệ thống hoạt động như nó nên. Nó cũng có thể giúp đảm bảo rằng mô hình đáp ứng các tiêu chuẩn quy định và nó cung cấp cơ hội cho mô hình được thách thức hoặc thay đổi.

Hình ảnh: Dr. Matt Turek/DARPA

Sự khác biệt giữa AI và XAI

Một số sự khác biệt chính giúp phân biệt “AI thông thường” với AI giải thích được, nhưng quan trọng nhất, XAI triển khai các kỹ thuật và phương pháp cụ thể giúp đảm bảo mỗi quyết định trong quy trình ML là có thể theo dõi và giải thích được. So với AI thông thường, nó thường đạt được kết quả bằng cách sử dụng thuật toán ML, nhưng không thể hiểu đầy đủ cách thuật toán đạt được kết quả. Trong trường hợp của AI thông thường, rất khó để kiểm tra độ chính xác, dẫn đến mất kiểm soát, trách nhiệm và khả năng kiểm toán.

Lợi ích của Trí tuệ nhân tạo giải thích được

Có nhiều lợi ích cho bất kỳ tổ chức nào muốn áp dụng trí tuệ nhân tạo giải thích được, chẳng hạn như:

Kết quả nhanh hơn: Trí tuệ nhân tạo giải thích được cho phép các tổ chức theo dõi và quản lý mô hình một cách hệ thống để tối ưu hóa kết quả kinh doanh. Có thể liên tục đánh giá và cải thiện hiệu suất mô hình và tinh chỉnh phát triển mô hình.
Giảm thiểu rủi ro: Bằng cách áp dụng các quy trình AI giải thích được, bạn đảm bảo rằng các mô hình AI của mình là giải thích được và minh bạch. Bạn có thể quản lý các rủi ro, tuân thủ, rủi ro và các yêu cầu khác trong khi giảm thiểu chi phí kiểm tra thủ công. Tất cả điều này cũng giúp giảm thiểu rủi ro về sự thiên vị không chủ ý.
Xây dựng niềm tin: Trí tuệ nhân tạo giải thích được giúp thiết lập niềm tin trong AI sản xuất. Các mô hình AI có thể nhanh chóng được đưa vào sản xuất, bạn có thể đảm bảo khả năng giải thích và giải thích, và quy trình đánh giá mô hình có thể được đơn giản hóa và minh bạch hơn.

Kỹ thuật cho Trí tuệ nhân tạo giải thích được

Có một số kỹ thuật XAI mà tất cả các tổ chức nên xem xét, và chúng bao gồm ba phương pháp chính: độ chính xác của dự đoán, khả năng theo dõi, và hiểu quyết định.

Phương pháp đầu tiên trong ba phương pháp, độ chính xác của dự đoán, là điều cần thiết để sử dụng AI thành công trong các hoạt động hàng ngày. Các mô phỏng có thể được thực hiện, và đầu ra XAI có thể được so sánh với kết quả trong tập dữ liệu đào tạo, giúp xác định độ chính xác của dự đoán. Một trong những kỹ thuật phổ biến nhất để đạt được điều này được gọi là Giải thích Mô hình Địa phương Có thể Giải thích được (LIME), một kỹ thuật giải thích dự đoán của các phân loại器 bằng thuật toán học máy.

Phương pháp thứ hai là khả năng theo dõi, được thực hiện bằng cách giới hạn cách các quyết định có thể được thực hiện, cũng như thiết lập một phạm vi hẹp hơn cho các quy tắc và tính năng học máy. Một trong những kỹ thuật theo dõi phổ biến nhất là DeepLIFT, hoặc Deep Learning Important FeaTures. DeepLIFT so sánh sự kích hoạt của mỗi nơ-ron với nơ-ron tham chiếu của nó trong khi thể hiện một liên kết có thể theo dõi giữa mỗi nơ-ron được kích hoạt. Nó cũng hiển thị sự phụ thuộc giữa chúng.

Phương pháp thứ ba và cuối cùng là hiểu quyết định, là tập trung vào con người, không giống như hai phương pháp khác. Hiểu quyết định liên quan đến việc giáo dục tổ chức, đặc biệt là nhóm làm việc với AI, để cho phép họ hiểu cách và tại sao AI đưa ra quyết định. Phương pháp này rất quan trọng để thiết lập niềm tin trong hệ thống.

Nguyên tắc của Trí tuệ nhân tạo giải thích được

Để cung cấp một sự hiểu biết tốt hơn về XAI và các nguyên tắc của nó, Viện Tiêu chuẩn Quốc gia (NIST), là một phần của Bộ Thương mại Hoa Kỳ, cung cấp định nghĩa cho bốn nguyên tắc của trí tuệ nhân tạo giải thích được:

Hệ thống AI nên cung cấp bằng chứng, hỗ trợ hoặc lý do cho mỗi đầu ra.
Hệ thống AI nên cung cấp các giải thích có thể được hiểu bởi người dùng của nó.
Giải thích nên phản ánh chính xác quá trình được sử dụng bởi hệ thống để đạt được đầu ra của nó.
Hệ thống AI chỉ nên hoạt động dưới các điều kiện nó được thiết kế cho, và nó không nên cung cấp đầu ra khi nó thiếu sự tự tin vào kết quả.

Những nguyên tắc này có thể được tổ chức thậm chí còn进一步 vào:

Đáng tin cậy: Để đạt được nguyên tắc đáng tin cậy, người dùng nên hiểu giải thích được cung cấp. Điều này cũng có thể có nghĩa là trong trường hợp một thuật toán AI được sử dụng bởi các loại người dùng khác nhau, có thể có nhiều giải thích. Ví dụ, trong trường hợp của một chiếc xe tự lái, một giải thích có thể là “… AI phân loại túi nhựa trên đường là một viên đá, và do đó đã thực hiện hành động để tránh va chạm với nó.” Mặc dù ví dụ này sẽ hoạt động cho người lái xe, nhưng nó sẽ không rất hữu ích cho một nhà phát triển AI muốn sửa lỗi. Trong trường hợp đó, nhà phát triển phải hiểu tại sao có sự phân loại sai.
Độ chính xác của giải thích: Không giống như độ chính xác của đầu ra, độ chính xác của giải thích liên quan đến thuật toán AI giải thích chính xác cách nó đạt được đầu ra của nó. Ví dụ, nếu một thuật toán phê duyệt khoản vay giải thích quyết định dựa trên thu nhập của ứng dụng khi thực tế, nó dựa trên nơi cư trú của người申请, giải thích sẽ không chính xác.
Giới hạn kiến thức: Giới hạn kiến thức của AI có thể được đạt được theo hai cách, và nó liên quan đến đầu vào nằm ngoài chuyên môn của hệ thống. Ví dụ, nếu một hệ thống được xây dựng để phân loại các loài chim và nó được cung cấp một bức ảnh của một quả táo, nó nên có thể giải thích rằng đầu vào không phải là một con chim. Nếu hệ thống được cung cấp một bức ảnh mờ, nó nên có thể báo cáo rằng nó không thể xác định con chim trong hình ảnh, hoặc thay vào đó, rằng việc xác định của nó có sự tự tin rất thấp.

Vai trò của Dữ liệu trong Trí tuệ nhân tạo giải thích được

Một trong những thành phần quan trọng nhất của trí tuệ nhân tạo giải thích được là dữ liệu.

Theo Google, liên quan đến dữ liệu và trí tuệ nhân tạo giải thích được, “hệ thống AI được hiểu rõ nhất bởi dữ liệu đào tạo cơ bản và quá trình đào tạo, cũng như mô hình AI kết quả.” Sự hiểu biết này phụ thuộc vào khả năng ánh xạ một mô hình AI đào tạo đến chính xác tập dữ liệu được sử dụng để đào tạo nó, cũng như khả năng kiểm tra dữ liệu chặt chẽ.

Để tăng cường khả năng giải thích của một mô hình, điều quan trọng là phải chú ý đến dữ liệu đào tạo. Các nhóm nên xác định nguồn gốc của dữ liệu được sử dụng để đào tạo một thuật toán, tính hợp pháp và đạo đức xung quanh việc thu thập, bất kỳ sự thiên vị tiềm năng trong dữ liệu và những gì có thể được thực hiện để giảm thiểu bất kỳ sự thiên vị nào.

Một khía cạnh quan trọng khác của dữ liệu và XAI là dữ liệu không liên quan đến hệ thống nên được loại trừ. Để đạt được điều này, dữ liệu không liên quan không nên được bao gồm trong tập dữ liệu đào tạo hoặc dữ liệu đầu vào.

Google đã khuyến nghị một tập hợp các thực tiễn để đạt được khả năng giải thích và trách nhiệm:

Lập kế hoạch các lựa chọn để theo đuổi khả năng giải thích
Xử lý khả năng giải thích như một phần cốt lõi của trải nghiệm người dùng
Thiết kế mô hình để nó có thể giải thích được
Chọn các chỉ số để phản ánh mục tiêu cuối cùng và nhiệm vụ cuối cùng
Hiểu mô hình đã đào tạo
Truyền đạt các giải thích cho người dùng mô hình
Thực hiện nhiều thử nghiệm để đảm bảo hệ thống AI đang hoạt động như dự định

Bằng cách tuân theo các thực tiễn khuyến nghị này, tổ chức của bạn có thể đảm bảo rằng nó đạt được trí tuệ nhân tạo giải thích được, điều này là chìa khóa cho bất kỳ tổ chức nào được thúc đẩy bởi AI trong môi trường ngày nay.