Lãnh đạo tư tưởng

Phát hiện Ra Sự Th偏 Trong Trí Tuệ Nhân Tạo: Thử Thách và Giải Pháp

mm

Sự phát triển gần đây của trí tuệ nhân tạo sinh đã thấy sự tăng trưởng mạnh mẽ trong các ứng dụng doanh nghiệp trên nhiều ngành công nghiệp, bao gồm tài chính, chăm sóc sức khỏe, vận tải. Sự phát triển của công nghệ này cũng sẽ dẫn đến các công nghệ mới nổi khác như công nghệ phòng thủ mạng, tiến bộ trong tính toán lượng tử và kỹ thuật truyền thông không dây đột phá. Tuy nhiên, sự bùng nổ của các công nghệ thế hệ mới này cũng đi kèm với những thách thức riêng.

Ví dụ, việc áp dụng trí tuệ nhân tạo có thể cho phép thực hiện các cuộc tấn công mạng tinh vi hơn, các vấn đề về bộ nhớ và lưu trữ do sự tăng trưởng của sức mạnh tính toán và các vấn đề về đạo đức liên quan đến sự thiên vị của các mô hình trí tuệ nhân tạo. Tin tốt là NTT Research đã đề xuất một cách để vượt qua sự thiên vị trong các mạng nơ-ron sâu (DNN), một loại trí tuệ nhân tạo.

Nghiên cứu này là một bước đột phá quan trọng vì các mô hình trí tuệ nhân tạo không bị thiên vị sẽ đóng góp vào việc tuyển dụng, hệ thống tư pháp hình sự và chăm sóc sức khỏe khi chúng không bị ảnh hưởng bởi các đặc điểm như chủng tộc, giới tính. Trong tương lai, sự phân biệt đối xử có thể được loại bỏ bằng cách sử dụng các hệ thống tự động này, do đó cải thiện các sáng kiến kinh doanh về đa dạng và hòa nhập trên toàn ngành. Cuối cùng, các mô hình trí tuệ nhân tạo có kết quả không bị thiên vị sẽ cải thiện năng suất và giảm thời gian thực hiện các nhiệm vụ này. Tuy nhiên, một số doanh nghiệp đã buộc phải ngừng các chương trình được tạo bởi trí tuệ nhân tạo do các giải pháp thiên vị của công nghệ này.

Ví dụ, Amazon đã ngừng sử dụng một thuật toán tuyển dụng khi phát hiện ra rằng thuật toán này thể hiện sự ưu tiên cho các ứng viên sử dụng các từ như “đã thực hiện” hoặc “đã bắt” thường xuyên hơn, những từ này thường được sử dụng nhiều hơn trong hồ sơ của nam giới. Một ví dụ khác về sự thiên vị đến từ Joy Buolamwini, một trong những người có ảnh hưởng nhất trong lĩnh vực trí tuệ nhân tạo năm 2023 theo TIME, trong sự hợp tác với Timnit Gebru tại MIT, đã tiết lộ rằng các công nghệ phân tích khuôn mặt đã thể hiện tỷ lệ lỗi cao hơn khi đánh giá các nhóm thiểu số, đặc biệt là phụ nữ thiểu số, có thể do dữ liệu đào tạo không đủ đại diện.

Gần đây, các mạng nơ-ron sâu đã trở nên phổ biến trong khoa học, kỹ thuật và kinh doanh, và thậm chí trong các ứng dụng phổ biến, nhưng chúng đôi khi dựa vào các thuộc tính không cần thiết có thể truyền tải sự thiên vị. Theo một nghiên cứu của MIT trong những năm gần đây, các nhà khoa học đã phát triển các mạng nơ-ron sâu có khả năng phân tích lượng lớn đầu vào, bao gồm âm thanh và hình ảnh. Những mạng này có thể xác định các đặc điểm chung, cho phép chúng phân loại các từ hoặc đối tượng mục tiêu. Hiện tại, những mô hình này đứng ở vị trí hàng đầu trong lĩnh vực này như các mô hình chính để sao chép các hệ thống cảm giác sinh học.

NTT Research Senior Scientist và Associate tại Trung tâm Khoa học Não bộ Harvard Hidenori Tanaka và ba nhà khoa học khác đã đề xuất vượt qua các hạn chế của việc tinh chỉnh đơn giản, phương pháp hiện tại để giảm thiểu lỗi hoặc “mất mát” của một DNN, với một thuật toán mới giảm sự phụ thuộc của mô hình vào các thuộc tính dễ bị thiên vị.

Họ đã nghiên cứu các cảnh quan mất mát của mạng nơ-ron thông qua ống kính kết nối chế độ, quan sát rằng các cực tiểu của mạng nơ-ron thu được thông qua việc đào tạo trên một tập dữ liệu được kết nối bởi các đường dẫn đơn giản có mất mát thấp. Cụ thể, họ đã đặt câu hỏi sau: liệu các cực tiểu phụ thuộc vào các cơ chế khác nhau để đưa ra dự đoán có được kết nối bởi các đường dẫn đơn giản có mất mát thấp không?

Họ đã phát hiện ra rằng việc tinh chỉnh đơn giản không thể thay đổi cơ bản cơ chế ra quyết định của một mô hình vì nó đòi hỏi phải di chuyển đến một thung lũng khác trên cảnh quan mất mát. Thay vào đó, bạn cần phải đưa mô hình vượt qua các rào cản ngăn cách các “chậu” hoặc “thung lũng” có mất mát thấp. Các tác giả gọi thuật toán sửa này là Tinh chỉnh dựa trên Kết nối (CBFT).

Trước khi có sự phát triển này, một DNN, phân loại hình ảnh như một hình ảnh cá (một hình minh họa được sử dụng trong nghiên cứu này) sử dụng cả hình dạng và nền làm tham số đầu vào cho dự đoán. Các đường dẫn giảm thiểu mất mát của nó sẽ hoạt động trong các chế độ cơ chế khác nhau: một dựa trên thuộc tính hợp pháp của hình dạng và một dựa trên thuộc tính không cần thiết của màu nền. Do đó, những chế độ này sẽ thiếu kết nối tuyến tính, hoặc một đường dẫn đơn giản có mất mát thấp.

Đội nghiên cứu hiểu về ống kính cơ chế trên kết nối chế độ bằng cách xem xét hai tập hợp tham số giảm thiểu mất mát sử dụng nền và hình dạng làm thuộc tính đầu vào cho dự đoán, tương ứng. Và sau đó họ tự hỏi, liệu những cực tiểu cơ chế khác nhau này có được kết nối bởi các đường dẫn có mất mát thấp trong cảnh quan không? Liệu sự khác biệt của những cơ chế này có ảnh hưởng đến sự đơn giản của các đường dẫn kết nối của chúng không? Chúng ta có thể khai thác kết nối này để chuyển đổi giữa các cực tiểu sử dụng các cơ chế mong muốn không?

Nghĩa là, các mạng nơ-ron sâu, tùy thuộc vào những gì chúng đã thu được trong quá trình đào tạo trên một tập dữ liệu cụ thể, có thể hành xử rất khác nhau khi bạn kiểm tra chúng trên một tập dữ liệu khác. Đề xuất của đội nghiên cứu tập trung vào khái niệm về sự tương đồng chung. Nó xây dựng trên ý tưởng trước đó về kết nối chế độ nhưng với một sự thay đổi – nó xem xét cách các cơ chế tương tự hoạt động. Nghiên cứu của họ đã dẫn đến những phát hiện đầy thú vị sau:

  • các cực tiểu có cơ chế khác nhau có thể được kết nối theo một cách phức tạp, không tuyến tính
  • khi hai cực tiểu được kết nối tuyến tính, nó gắn liền với sự tương đồng của các mô hình về mặt cơ chế
  • việc tinh chỉnh đơn giản có thể không đủ để loại bỏ các đặc điểm không mong muốn được thu thập trong quá trình đào tạo trước đó
  • nếu bạn tìm thấy các khu vực không được kết nối tuyến tính trong cảnh quan, bạn có thể thực hiện các thay đổi hiệu quả đối với hoạt động nội bộ của mô hình.

Mặc dù nghiên cứu này là một bước tiến quan trọng trong việc khai thác toàn bộ tiềm năng của trí tuệ nhân tạo, nhưng các vấn đề về đạo đức xung quanh trí tuệ nhân tạo vẫn có thể là một cuộc chiến khó khăn. Các technologist và nhà nghiên cứu đang làm việc để chống lại các điểm yếu về đạo đức khác trong trí tuệ nhân tạo và các mô hình ngôn ngữ lớn khác như quyền riêng tư, tự chủ, trách nhiệm.

Trí tuệ nhân tạo có thể được sử dụng để thu thập và xử lý lượng lớn dữ liệu cá nhân. Việc sử dụng không được ủy quyền hoặc không đạo đức dữ liệu này có thể làm tổn hại đến quyền riêng tư của các cá nhân, dẫn đến các vấn đề về giám sát, vi phạm dữ liệu và đánh cắp danh tính. Trí tuệ nhân tạo cũng có thể gây ra mối đe dọa khi nói đến trách nhiệm của các ứng dụng tự động như xe tự lái. Việc thiết lập các khuôn khổ pháp lý và tiêu chuẩn đạo đức cho trách nhiệm và trách nhiệm sẽ là điều cần thiết trong những năm tới.

Tổng kết lại, sự phát triển nhanh chóng của công nghệ trí tuệ nhân tạo sinh mang lại nhiều hứa hẹn cho các ngành công nghiệp khác nhau, từ tài chính và chăm sóc sức khỏe đến vận tải. Mặc dù những phát triển đầy hứa hẹn này, nhưng các vấn đề về đạo đức xung quanh trí tuệ nhân tạo vẫn còn đáng kể. Khi chúng ta bước vào kỷ nguyên chuyển đổi này của trí tuệ nhân tạo, điều quan trọng là các technologist, nhà nghiên cứu và nhà hoạch định chính sách phải làm việc cùng nhau để thiết lập các khuôn khổ pháp lý và tiêu chuẩn đạo đức sẽ đảm bảo việc sử dụng có trách nhiệm và có lợi của công nghệ trí tuệ nhân tạo trong những năm tới. Các nhà khoa học tại NTT Research và Đại học Michigan đang một bước đi trước trong trò chơi với đề xuất của họ về một thuật toán có thể loại bỏ sự thiên vị trong trí tuệ nhân tạo.

Tại cốt lõi, Chris là một người kể chuyện tin rằng sự sáng tạo giúp chúng ta tiến bước. Sự nghiệp tiếp thị của anh bắt đầu tại một công ty nhỏ ở California sử dụng máy tính mainframe của IBM để đọc dữ liệu điện tâm đồ qua điện thoại, một sự đổi mới cực kỳ táo bạo vào thời điểm đó. Sau đó, Chris đã viết cho một chương trình trò chơi truyền hình trước khi quay lại thế giới quảng cáo, viết kịch bản thương mại cho một công ty khởi nghiệp phần mềm. Công việc đó đã mang lại cho anh giải thưởng Effie vàng đầu tiên, một giải thưởng danh giá của ngành công nghiệp công nhận hiệu quả của một chiến dịch. Khi đảm nhận vai trò giám đốc sáng tạo, Chris sau đó đã dẫn dắt một trong những thương hiệu nổi tiếng nhất thế giới: Coca-Cola. Vào thời điểm đó, Chris và đội của anh đã sử dụng công nghệ phổ biến của ngày hôm đó, hộp thư thoại, để tạo ra những gì có thể được gọi là mạng xã hội đầu tiên trên thế giới. Năm 2005, Chris đã ra mắt cơ quan của mình. Luôn tìm kiếm những cách mới để kể chuyện, Central Coast Agency đã chấp nhận không gian kỹ thuật số và là một trong những người ủng hộ sớm nhất cho tiếp thị nội dung. Trong 14 năm tiếp theo, Central Coast là cơ quan ghi chép cho tiếp thị truyền thông xã hội toàn cầu của NTT Communications. Trong thế giới đó, Chris đã chạm vào nhiều khía cạnh của kinh doanh toàn cầu của NTT. Khi NTT Research tiếp cận anh để lãnh đạo nỗ lực tiếp thị cho một cơ sở nghiên cứu mới theo phong cách Bell Labs, Chris nhanh chóng nhận ra rằng cơ hội này vượt quá phạm vi quảng cáo. Với tư cách là người đứng đầu tiếp thị của NTT Research, anh là một phần của điều gì đó phi thường. Với những nhà tư tưởng hàng đầu thế giới trong các lĩnh vực Vật lý, Mã hóa và Y học cùng nhau thực hiện nghiên cứu cơ bản sẽ cải thiện và thậm chí kéo dài cuộc sống con người, đây là một câu chuyện Chris sẵn sàng kể.