Đạo đức
Những gì Tuyên ngôn Quyền lợi Trí tuệ Nhân tạo của Nhà Trắng có nghĩa là đối với Mỹ và phần còn lại của thế giới

Văn phòng Khoa học và Công nghệ của Nhà Trắng (OSTP) gần đây đã phát hành một bản trắng gọi là “Bản thiết kế cho Tuyên ngôn Quyền lợi Trí tuệ Nhân tạo: Làm cho các Hệ thống Tự động Hoạt động vì Người dân Mỹ”. Khung này được phát hành một năm sau khi OSTP tuyên bố khởi động một quá trình để phát triển “một tuyên ngôn quyền lợi cho một thế giới được cung cấp bởi trí tuệ nhân tạo”.
Lời mở đầu trong tuyên ngôn này minh họa rõ ràng rằng Nhà Trắng hiểu được những mối đe dọa sắp tới đối với xã hội mà trí tuệ nhân tạo gây ra. Đây là những gì được tuyên bố trong lời mở đầu:
“Trong số những thách thức lớn đối với nền dân chủ ngày nay là việc sử dụng công nghệ, dữ liệu và hệ thống tự động theo những cách đe dọa đến quyền của công chúng Mỹ. Quá thường xuyên, những công cụ này được sử dụng để hạn chế cơ hội của chúng tôi và ngăn chặn việc tiếp cận các nguồn lực hoặc dịch vụ quan trọng. Những vấn đề này đã được ghi lại rõ ràng. Tại Mỹ và trên toàn thế giới, các hệ thống được cho là giúp chăm sóc bệnh nhân đã chứng minh là không an toàn, không hiệu quả hoặc bị thiên vị. Các thuật toán được sử dụng trong việc tuyển dụng và quyết định tín dụng đã được phát hiện là phản ánh và nhân rộng những bất bình đẳng không mong muốn hoặc nhúng các thiên vị và phân biệt đối xử có hại mới. Việc thu thập dữ liệu trên các phương tiện truyền thông xã hội không được kiểm soát đã được sử dụng để đe dọa cơ hội của mọi người, xâm phạm quyền riêng tư của họ hoặc theo dõi hoạt động của họ một cách phổ biến – thường mà không có kiến thức hoặc sự đồng ý của họ.”
Những gì Tuyên ngôn Quyền lợi này và khung nó đề xuất sẽ có nghĩa là cho tương lai của trí tuệ nhân tạo vẫn còn phải được xem. Những gì chúng ta biết là các phát triển mới đang xuất hiện với tốc độ cấp số nhân. Những gì từng được coi là không thể, dịch ngôn ngữ tức thời bây giờ là một thực tế, và cùng lúc đó chúng ta có một cuộc cách mạng trong việc hiểu ngôn ngữ tự nhiên (NLU) được dẫn dắt bởi OpenAI và nền tảng nổi tiếng của họ GPT-3.
Kể từ đó, chúng ta đã thấy sự tạo ra hình ảnh tức thời thông qua một kỹ thuật gọi là Stable Diffusion có thể sớm trở thành một sản phẩm tiêu dùng chính thống. Về bản chất, với công nghệ này, người dùng có thể nhập bất kỳ truy vấn nào họ có thể tưởng tượng, và như魔法, trí tuệ nhân tạo sẽ tạo ra một hình ảnh phù hợp với truy vấn.
Khi tính đến sự tăng trưởng cấp số nhân và Luật về Sự quay trở lại Tăng tốc, sẽ sớm có một thời điểm khi trí tuệ nhân tạo đã chiếm lĩnh mọi khía cạnh của cuộc sống hàng ngày. Những cá nhân và công ty biết điều này và tận dụng sự thay đổi này sẽ có lợi. Thật không may, một phân khúc lớn của xã hội có thể trở thành nạn nhân của cả những hậu quả không mong muốn và cố ý của trí tuệ nhân tạo.
Tuyên ngôn Quyền lợi Trí tuệ Nhân tạo được thiết kế để hỗ trợ việc phát triển các chính sách và thực tiễn bảo vệ quyền dân sự và thúc đẩy các giá trị dân chủ trong việc xây dựng, triển khai và quản lý các hệ thống tự động. Cách thức tuyên ngôn này so sánh với cách tiếp cận của Trung Quốc vẫn còn phải được xem, nhưng đây là một tuyên ngôn quyền lợi có tiềm năng thay đổi cảnh quan trí tuệ nhân tạo, và nó có khả năng được các đồng minh như Úc, Canada và EU áp dụng.
Điều đó được nói, Tuyên ngôn Quyền lợi Trí tuệ Nhân tạo là không có tính ràng buộc và không cấu thành chính sách của chính phủ Mỹ. Nó không thay thế, sửa đổi hoặc chỉ đạo việc giải thích của bất kỳ luật, quy định, chính sách hoặc công cụ quốc tế nào hiện có. Điều này có nghĩa là nó sẽ phụ thuộc vào các doanh nghiệp và chính phủ tuân thủ các chính sách được nêu trong bản trắng này.
Tuyên ngôn này đã xác định năm nguyên tắc nên hướng dẫn việc thiết kế, sử dụng và triển khai các hệ thống tự động để bảo vệ công chúng Mỹ trong thời đại trí tuệ nhân tạo, dưới đây chúng tôi sẽ nêu ra 5 nguyên tắc:
1. Hệ thống An toàn và Hiệu quả
Có một mối nguy hiểm rõ ràng và hiện tại đối với xã hội bởi các hệ thống trí tuệ nhân tạo lạm dụng, đặc biệt là những hệ thống dựa trên học sâu. Điều này được cố gắng giải quyết bằng các nguyên tắc:
“Bạn nên được bảo vệ khỏi các hệ thống không an toàn hoặc không hiệu quả. Các hệ thống tự động nên được phát triển với sự tư vấn từ các cộng đồng, bên liên quan và chuyên gia lĩnh vực để xác định các mối quan ngại, rủi ro và tác động tiềm năng của hệ thống. Các hệ thống nên trải qua thử nghiệm trước khi triển khai, xác định và giảm thiểu rủi ro, và giám sát liên tục chứng minh rằng chúng an toàn và hiệu quả dựa trên mục đích sử dụng dự kiến, giảm thiểu các kết quả không an toàn bao gồm cả những kết quả ngoài mục đích sử dụng, và tuân thủ các tiêu chuẩn cụ thể của lĩnh vực. Kết quả của các biện pháp bảo vệ này nên bao gồm khả năng không triển khai hệ thống hoặc loại bỏ hệ thống khỏi sử dụng. Các hệ thống tự động không nên được thiết kế với ý định hoặc khả năng dự kiến sẽ gây nguy hiểm cho sự an toàn của bạn hoặc sự an toàn của cộng đồng của bạn. Chúng nên được thiết kế để chủ động bảo vệ bạn khỏi các tác hại phát sinh từ việc sử dụng không dự kiến hoặc tác động của các hệ thống tự động. Bạn nên được bảo vệ khỏi việc sử dụng dữ liệu không phù hợp hoặc không liên quan trong thiết kế, phát triển và triển khai các hệ thống tự động, và khỏi tác hại cộng dồn của việc tái sử dụng dữ liệu. Đánh giá và báo cáo độc lập xác nhận rằng hệ thống là an toàn và hiệu quả, bao gồm cả việc báo cáo các bước được thực hiện để giảm thiểu các tác hại tiềm ẩn, nên được thực hiện và kết quả được công bố bất cứ khi nào có thể.”
2. Bảo vệ Phân biệt đối xử Thuật toán
Những chính sách này giải quyết một số vấn đề quan trọng khi các doanh nghiệp lạm dụng các cá nhân.
Một vấn đề phổ biến khi tuyển dụng nhân viên sử dụng hệ thống trí tuệ nhân tạo là hệ thống học sâu sẽ thường đào tạo trên dữ liệu thiên vị để đạt được kết luận tuyển dụng. Điều này cơ bản có nghĩa là các thực tiễn tuyển dụng kém trong quá khứ sẽ dẫn đến phân biệt đối xử về giới tính hoặc chủng tộc bởi một đại lý tuyển dụng. Một nghiên cứu cho thấy khó khăn khi cố gắng loại bỏ giới tính khỏi dữ liệu đào tạo.
Một vấn đề cốt lõi khác với dữ liệu thiên vị của chính phủ là rủi ro bị bắt giữ sai, hoặc thậm chí thuật toán dự đoán tội phạm cung cấp các câu dài hơn cho các nhóm thiểu số.
“Bạn không nên đối mặt với phân biệt đối xử bởi các thuật toán và hệ thống nên được sử dụng và thiết kế theo cách công bằng. Phân biệt đối xử thuật toán xảy ra khi các hệ thống tự động góp phần vào việc đối xử khác biệt không được biện minh hoặc tác động không thuận lợi cho mọi người dựa trên chủng tộc, màu da, dân tộc, giới tính (bao gồm cả thai sản, sinh con và các điều kiện y tế liên quan, định hướng giới tính, tình trạng liên giới tính và khuynh hướng tình dục) tôn giáo, tuổi tác, quốc gia, khuyết tật, tình trạng cựu chiến binh, thông tin di truyền hoặc bất kỳ phân loại nào khác được pháp luật bảo vệ. Tùy thuộc vào hoàn cảnh cụ thể, phân biệt đối xử thuật toán như vậy có thể vi phạm các bảo vệ pháp lý. Các nhà thiết kế, nhà phát triển và người triển khai các hệ thống tự động nên thực hiện các biện pháp chủ động và liên tục để bảo vệ các cá nhân và cộng đồng khỏi phân biệt đối xử thuật toán và sử dụng và thiết kế hệ thống theo cách công bằng. Sự bảo vệ này nên bao gồm đánh giá công bằng chủ động như một phần của thiết kế hệ thống, sử dụng dữ liệu đại diện và bảo vệ chống lại các đại diện cho các đặc điểm dân tộc, đảm bảo khả năng tiếp cận cho người khuyết tật trong thiết kế và phát triển, thử nghiệm và giảm thiểu sự chênh lệch trước và sau khi triển khai, và giám sát tổ chức rõ ràng. Đánh giá và báo cáo độc lập bằng ngôn ngữ đơn giản, bao gồm cả kết quả thử nghiệm chênh lệch và thông tin giảm thiểu, nên được thực hiện và công bố bất cứ khi nào có thể để xác nhận những bảo vệ này.”
Nên lưu ý rằng Mỹ đã thực hiện một cách tiếp cận rất minh bạch khi nói đến trí tuệ nhân tạo, những chính sách này được thiết kế để bảo vệ công chúng nói chung, một sự tương phản rõ ràng với cách tiếp cận trí tuệ nhân tạo của Trung Quốc.
3. Quyền riêng tư Dữ liệu
Nguyên tắc quyền riêng tư dữ liệu này là nguyên tắc có khả năng ảnh hưởng đến phân khúc lớn nhất của dân số. Phần đầu tiên của nguyên tắc dường như quan tâm đến việc thu thập dữ liệu, đặc biệt là với dữ liệu thu thập qua internet, một vấn đề nổi tiếng đặc biệt là trên các nền tảng truyền thông xã hội. Dữ liệu này sau đó có thể được sử dụng để bán quảng cáo, hoặc thậm chí tồi tệ hơn để thao túng quan điểm công chúng và ảnh hưởng đến các cuộc bầu cử.
“Bạn nên được bảo vệ khỏi các hành vi lạm dụng dữ liệu thông qua các biện pháp bảo vệ tích hợp và bạn nên có quyền kiểm soát cách dữ liệu về bạn được sử dụng. Bạn nên được bảo vệ khỏi việc vi phạm quyền riêng tư thông qua các lựa chọn thiết kế đảm bảo rằng các biện pháp bảo vệ này được bao gồm theo mặc định, bao gồm đảm bảo rằng việc thu thập dữ liệu phù hợp với các kỳ vọng hợp lý, và chỉ dữ liệu cần thiết cho ngữ cảnh cụ thể được thu thập. Các nhà thiết kế, nhà phát triển và người triển khai các hệ thống tự động nên tìm kiếm sự cho phép của bạn và tôn trọng các quyết định của bạn liên quan đến việc thu thập, sử dụng, truy cập, chuyển giao và xóa dữ liệu của bạn theo cách phù hợp và đến mức độ lớn nhất có thể; khi không thể, các biện pháp bảo vệ quyền riêng tư thay thế nên được sử dụng. Các hệ thống không nên sử dụng các quyết định thiết kế và trải nghiệm người dùng che giấu sự lựa chọn của người dùng hoặc gánh nặng cho người dùng với các thiết lập mặc định xâm phạm quyền riêng tư. Sự đồng ý chỉ nên được sử dụng để chứng minh việc thu thập dữ liệu trong các trường hợp mà nó có thể được đưa ra một cách phù hợp và có ý nghĩa; bất kỳ yêu cầu đồng ý nào nên ngắn gọn, dễ hiểu và đưa ra cho bạn quyền kiểm soát việc thu thập dữ liệu và ngữ cảnh cụ thể của việc sử dụng; các thực tiễn thông báo và lựa chọn hiện tại khó hiểu cho việc sử dụng rộng rãi dữ liệu nên được thay đổi.”
Phần thứ hai của Nguyên tắc Quyền riêng tư Dữ liệu dường như quan tâm đến việc giám sát từ cả chính phủ và doanh nghiệp.
Hiện tại, các doanh nghiệp có thể theo dõi và gián điệp nhân viên, trong một số trường hợp có thể là để cải thiện an toàn nơi làm việc, trong thời kỳ đại dịch COVID-19 là để thực thi việc đeo khẩu trang, nhưng thường chỉ đơn giản là để theo dõi cách thời gian làm việc được sử dụng. Trong nhiều trường hợp này, nhân viên cảm thấy như họ đang bị theo dõi và kiểm soát vượt quá mức độ chấp nhận được.
“Các biện pháp bảo vệ và hạn chế tăng cường cho dữ liệu và suy luận liên quan đến các lĩnh vực nhạy cảm, bao gồm sức khỏe, công việc, giáo dục, tư pháp hình sự và tài chính, và cho dữ liệu liên quan đến thanh niên nên đặt bạn lên hàng đầu. Trong các lĩnh vực nhạy cảm, dữ liệu và suy luận của bạn chỉ nên được sử dụng cho các chức năng cần thiết, và bạn nên được bảo vệ bởi đánh giá đạo đức và cấm sử dụng. Bạn và cộng đồng của bạn nên được tự do khỏi việc giám sát không được kiểm soát; các công nghệ giám sát nên được đặt dưới sự giám sát tăng cường bao gồm ít nhất đánh giá trước khi triển khai về các tác hại tiềm ẩn và giới hạn phạm vi để bảo vệ quyền riêng tư và tự do dân sự. Giám sát và theo dõi liên tục không nên được sử dụng trong giáo dục, công việc, nhà ở hoặc trong các ngữ cảnh khác nơi việc sử dụng các công nghệ giám sát như vậy có khả năng hạn chế quyền, cơ hội hoặc tiếp cận. Bất cứ khi nào có thể, bạn nên có quyền truy cập vào báo cáo xác nhận rằng quyết định dữ liệu của bạn đã được tôn trọng và cung cấp đánh giá về tác động tiềm ẩn của các công nghệ giám sát đối với quyền, cơ hội hoặc tiếp cận của bạn.”
Nên lưu ý rằng trí tuệ nhân tạo có thể được sử dụng vì lợi ích để bảo vệ quyền riêng tư của mọi người.
4. Thông báo và Giải thích
Điều này nên là cuộc gọi đến các doanh nghiệp để triển khai hội đồng tư vấn Đạo đức Trí tuệ Nhân tạo, cũng như đẩy mạnh để tăng tốc phát triển trí tuệ nhân tạo có thể giải thích. Trí tuệ nhân tạo có thể giải thích là cần thiết trong trường hợp một mô hình trí tuệ nhân tạo mắc lỗi, việc hiểu cách trí tuệ nhân tạo hoạt động cho phép chẩn đoán dễ dàng vấn đề.
Trí tuệ nhân tạo có thể giải thích cũng sẽ cho phép chia sẻ thông tin minh bạch về cách dữ liệu được sử dụng và tại sao một quyết định được đưa ra bởi trí tuệ nhân tạo. Không có trí tuệ nhân tạo có thể giải thích, sẽ không thể tuân thủ các chính sách này do vấn đề hộp đen của học sâu.
Các doanh nghiệp tập trung vào việc cải thiện các hệ thống này cũng sẽ nhận được lợi ích tích cực từ việc hiểu các sắc thái và phức tạp đằng sau lý do tại sao một thuật toán học sâu đưa ra một quyết định cụ thể.
“Bạn nên biết rằng một hệ thống tự động đang được sử dụng và hiểu cách và tại sao nó góp phần vào các kết quả ảnh hưởng đến bạn. Các nhà thiết kế, nhà phát triển và người triển khai các hệ thống tự động nên cung cấp tài liệu bằng ngôn ngữ đơn giản và dễ hiểu, bao gồm cả mô tả rõ ràng về chức năng của hệ thống tổng thể và vai trò của tự động hóa, thông báo rằng các hệ thống như vậy đang được sử dụng, cá nhân hoặc tổ chức chịu trách nhiệm về hệ thống, và giải thích về các kết quả rõ ràng, kịp thời và dễ tiếp cận. Thông báo như vậy nên được giữ cập nhật và những người bị ảnh hưởng bởi hệ thống nên được thông báo về các thay đổi sử dụng hoặc chức năng chính. Bạn nên biết cách và tại sao một kết quả ảnh hưởng đến bạn được xác định bởi một hệ thống tự động, bao gồm cả khi hệ thống tự động không phải là đầu vào duy nhất xác định kết quả. Các hệ thống tự động nên cung cấp giải thích hợp lệ về mặt kỹ thuật, có ý nghĩa và hữu ích cho bạn và cho bất kỳ nhà điều hành hoặc người khác cần hiểu hệ thống, và được hiệu chỉnh dựa trên mức độ rủi ro. Báo cáo bao gồm thông tin tóm tắt về các hệ thống tự động bằng ngôn ngữ đơn giản và đánh giá về độ rõ ràng và chất lượng của thông báo và giải thích nên được công bố bất cứ khi nào có thể.”
5. Sự thay thế Con người, Xem xét và Dự phòng
Không giống như hầu hết các nguyên tắc trên, nguyên tắc này áp dụng nhiều nhất cho các thực thể chính phủ hoặc các tổ chức tư nhân hoạt động thay mặt cho chính phủ.
Ngay cả với hội đồng tư vấn Đạo đức Trí tuệ Nhân tạo và trí tuệ nhân tạo có thể giải thích, điều quan trọng là phải dựa vào đánh giá của con người khi tính mạng bị đe dọa. Luôn có khả năng xảy ra lỗi, và việc có một đánh giá của con người khi được yêu cầu có thể tránh được một kịch bản như trí tuệ nhân tạo gửi sai người đến tù.
Hệ thống tư pháp và hình sự có nhiều khả năng gây ra thiệt hại không thể khắc phục cho các thành viên bị thiệt thòi của xã hội và nên đặc biệt chú ý đến nguyên tắc này.
“Bạn nên có thể chọn không tham gia, khi phù hợp, và có quyền truy cập vào một người có thể nhanh chóng xem xét và giải quyết các vấn đề bạn gặp phải. Bạn nên có thể chọn không tham gia từ các hệ thống tự động để ủng hộ một lựa chọn thay thế của con người, khi phù hợp. Sự phù hợp nên được xác định dựa trên các kỳ vọng hợp lý trong một ngữ cảnh nhất định và tập trung vào việc đảm bảo khả năng tiếp cận rộng rãi và bảo vệ công chúng khỏi các tác động có hại đặc biệt. Trong một số trường hợp, một lựa chọn thay thế của con người có thể được yêu cầu bởi luật. Bạn nên có quyền truy cập vào việc xem xét và giải quyết vấn đề của con người kịp thời nếu một hệ thống tự động bị lỗi, nó tạo ra một lỗi hoặc bạn muốn kháng cáo hoặc tranh chấp tác động của nó đối với bạn. Việc xem xét và giải quyết vấn đề của con người nên được tiếp cận, công bằng, hiệu quả, duy trì, đi kèm với đào tạo vận hành phù hợp và không nên đặt gánh nặng không hợp lý lên công chúng. Các hệ thống tự động có mục đích sử dụng trong các lĩnh vực nhạy cảm, bao gồm cả hệ thống tư pháp hình sự, việc làm, giáo dục và sức khỏe, nên được thiết kế riêng cho mục đích, cung cấp quyền truy cập có ý nghĩa vào việc giám sát, bao gồm đào tạo cho bất kỳ ai tương tác với hệ thống và kết hợp việc xem xét của con người cho các quyết định bất lợi hoặc có rủi ro cao. Báo cáo bao gồm mô tả về các quy trình quản trị của con người và đánh giá về tính kịp thời, khả năng tiếp cận, kết quả và hiệu quả của chúng nên được công bố bất cứ khi nào có thể.”
Tóm tắt
OSTP nên được tín nhiệm vì đã cố gắng giới thiệu một khung giúp kết nối các giao thức an toàn cần thiết cho xã hội, mà không giới thiệu các chính sách hà khắc có thể cản trở tiến bộ trong việc phát triển học máy.
Sau khi các nguyên tắc được phác thảo, tuyên ngôn tiếp tục bằng cách cung cấp một người bạn đồng hành kỹ thuật cho các vấn đề được thảo luận cũng như thông tin chi tiết về từng nguyên tắc và cách tốt nhất để tiến hành thực hiện các nguyên tắc này.
Các chủ sở hữu doanh nghiệp thông minh và các doanh nghiệp nên chú ý đến việc nghiên cứu tuyên ngôn này, vì nó chỉ có thể có lợi khi thực hiện các chính sách này càng sớm càng tốt.
Trí tuệ nhân tạo có thể giải thích sẽ tiếp tục thống trị về tầm quan trọng, như có thể thấy từ trích dẫn này từ tuyên ngôn.
“Khắp chính phủ liên bang, các cơ quan đang tiến hành và hỗ trợ nghiên cứu về các hệ thống trí tuệ nhân tạo có thể giải thích. NIST đang tiến hành nghiên cứu cơ bản về khả năng giải thích của các hệ thống trí tuệ nhân tạo. Một đội nghiên cứu đa ngành đang phát triển các phương pháp đo lường và thực hành tốt nhất để hỗ trợ việc thực hiện các nguyên tắc cốt lõi của trí tuệ nhân tạo có thể giải thích. Cơ quan Nghiên cứu và Phát triển Quốc phòng Tiên tiến có một chương trình về Trí tuệ Nhân tạo có thể Giải thích nhằm tạo ra một bộ các kỹ thuật học máy sản xuất các mô hình có thể giải thích hơn, đồng thời duy trì mức độ hiệu suất học hỏi cao (độ chính xác dự đoán), và cho phép người dùng hiểu, tin tưởng một cách phù hợp và quản lý hiệu quả thế hệ mới của các đối tác trí tuệ nhân tạo. Chương trình của Quỹ Khoa học Quốc gia về Công bằng trong Trí tuệ Nhân tạo cũng bao gồm một lợi ích cụ thể trong nghiên cứu cơ bản về trí tuệ nhân tạo có thể giải thích.”
Điều không nên bị bỏ qua là cuối cùng, các nguyên tắc được nêu trong đây sẽ trở thành tiêu chuẩn mới.












