Phỏng vấn

Dr. Judith Bishop, Giám đốc cấp cao của Chuyên gia AI tại Appen – Loạt phỏng vấn

Published May 20, 2021

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Dr. Judith Bishop, là Giám đốc cấp cao của Chuyên gia AI cho khu vực APAC / Mỹ tại Appen. Cô đang dẫn đầu và phát triển một đội ngũ chuyên gia ngôn ngữ, ngôn ngữ học tính toán và chuyên gia trong tất cả các hình thức giao tiếp của con người (nói, viết và cử chỉ), để cung cấp dữ liệu đào tạo AI với sự kết hợp chất lượng và tốc độ không thể sánh kịp.

Điều gì ban đầu thu hút bạn đến với ngôn ngữ học?

Tôi lần đầu tiên nghe về ngôn ngữ học từ một giáo viên tiếng Anh yêu thích của tôi ở trường trung học. Tôi là một trong những đứa trẻ bị thu hút đồng đều bởi các ngôn ngữ nước ngoài và khoa học nhân văn, và các môn toán và khoa học. Ngôn ngữ học là khoa học về cách ngôn ngữ hoạt động, vì vậy nó đã kết hợp những lợi ích của tôi. Giống như nhiều người, một khi tôi đã học về nó, tôi hoàn toàn bị thu hút. Điều gì có thể thú vị hơn cách chúng ta giao tiếp suy nghĩ và cảm xúc của mình với nhau? Ngôn ngữ học khám phá các cấu trúc ngôn ngữ mà, dù có sự khác biệt về âm thanh và hệ thống chữ viết, thường tương tự nhau dưới bề mặt, vì tất cả đều là sản phẩm cuối cùng của sự tồn tại của con người.

Bạn có thể chia sẻ câu chuyện về cách bạn tìm thấy mình đang làm việc trong AI?

Tôi đã làm việc tại Appen từ năm 2004 để hỗ trợ phát triển các sản phẩm và dịch vụ công nghệ ngôn ngữ. Trong thời gian này, AI đã xuất hiện như một khuôn khổ, sứ mệnh và tầm nhìn toàn diện cho công nghệ để bắt chước và mở rộng khả năng giao tiếp, lý luận và nhận thức của con người. Vào năm 2019, đội của tôi đã đổi thương hiệu thành Chuyên gia AI, nhận ra rằng kiến thức ngôn ngữ và ngôn ngữ của chúng tôi là rất quan trọng đối với doanh nghiệp AI. Dữ liệu được chú thích của chúng tôi cung cấp hỗ trợ thiết yếu cho sự thành công của các tương tác của con người với các sản phẩm và dịch vụ AI.

Bạn đã làm việc trong AI trong hơn 16 năm, một số thay đổi lớn nhất mà bạn đã thấy là gì?

Sự thay đổi lớn nhất là sự đa dạng hóa trọng tâm từ phát triển công nghệ cốt lõi sang các trường hợp sử dụng và ứng dụng dài. Trong hầu hết sự nghiệp của tôi, trọng tâm của AI dựa trên ngôn ngữ đã là phát triển và tinh chỉnh một tập hợp cốt lõi các mô hình bắt chước nhận thức và sản xuất giọng nói của con người, cụ thể là nhận dạng giọng nói, tổng hợp giọng nói và xử lý ngôn ngữ tự nhiên. Các tập dữ liệu thường tuân theo các tiêu chuẩn và quy ước lấy mẫu dữ liệu chung, chẳng hạn như những tiêu chuẩn được phát triển bởi liên minh Speecon (Giao diện điều khiển bằng giọng nói cho Thiết bị Tiêu dùng). Những tiêu chuẩn này đã cho phép các nhà phát triển công nghệ cốt lõi đánh giá hiệu suất của họ trên các cấu trúc dữ liệu chung và hỗ trợ sự tiến hóa nhanh chóng của AI.

Tuy nhiên, sự mở rộng phổ biến của các trường hợp sử dụng AI trong những năm gần đây đã mang lại sự nhận ra rằng các mô hình AI cốt lõi chung được xây dựng với dữ liệu này không hoạt động đủ tốt trên các loại dữ liệu chuyên dụng mà không cần điều chỉnh thêm. Hơn nữa, vì đã được phát triển trên dữ liệu được cố ý làm sạch và “tiêu chuẩn”, những mô hình này hiện phải được đào tạo hoặc cập nhật để hiểu và phản hồi tất cả sự đa dạng của đầu vào của con người: tất cả các phương ngữ, tất cả các giọng, tất cả các dân tộc, tất cả các giới tính và tất cả các chiều khác của sự khác biệt của con người.

Bạn có thể thảo luận về tầm quan trọng của dữ liệu không thiên vị trong học máy?

Các mô hình học máy, cho dù là học có giám sát, không giám sát hay học tăng cường, sẽ phản ánh các thiên vị hiện có trong dữ liệu mà chúng được đào tạo. Alyssa Simpson Rochwerger và Wilson Pang cung cấp một số ví dụ tuyệt vời về vấn đề này trong cuốn sách gần đây của họ, AI Thế giới thực. Nếu không có đủ dữ liệu đào tạo cho một phân khúc dân số, mô hình AI sẽ ít chính xác hơn cho phân khúc đó.

Trong một trường hợp phổ biến khác, đại diện của dân số có thể đủ, nhưng nếu dữ liệu đào tạo chứa các mối tương quan giữa các điểm dữ liệu phản ánh các điều kiện thực tế nhưng không mong muốn trong thế giới (chẳng hạn như tỷ lệ việc làm đầy đủ thấp hơn cho phụ nữ, hoặc tỷ lệ giam giữ cao hơn cho người Mỹ gốc Phi), các ứng dụng AI kết quả có thể củng cố và duy trì những điều kiện đó.

Các mối liên hệ hiện diện trong ngôn ngữ nói chung có thể tạo ra thiên vị trong các ứng dụng NLP, những ứng dụng này dựa trên các mối quan hệ thống kê được gọi là word embeddings. Nếu “cô” và “y tá” thường được liên kết hơn “họ” hoặc “anh” và “y tá” trong dữ liệu đào tạo được chọn, thì ứng dụng kết quả sẽ sử dụng “cô” khi buộc phải chọn một đại từ nhân xưng đơn số để chỉ một y tá. Để giải quyết vấn đề cụ thể này, các nhà nghiên cứu gần đây đã phát triển một biến thể trung lập về giới của thuật toán word embeddings phổ biến, GN-GloVe.

Trong các ứng dụng nhạy cảm, các vấn đề thiên vị như những vấn đề này có thể có tác động tàn phá đối với người dùng và có thể xóa bỏ khoản đầu tư kinh doanh. Tin tốt là, ngoài việc phát triển các tập dữ liệu mới, minh bạch và bao gồm hơn, ngày càng nhiều ứng dụng khoa học dữ liệu đang được phát triển để kiểm tra sự hiện diện của thiên vị trong các tập dữ liệu đào tạo và ứng dụng AI hiện có.

Appen gần đây đã ra mắt các tập dữ liệu đào tạo đa dạng mới cho các sáng kiến Xử lý ngôn ngữ tự nhiên (NLP). Bạn có thể chia sẻ một số chi tiết về cách các tập dữ liệu này sẽ cho phép người dùng cuối nhận được cùng một trải nghiệm bất kể phương ngữ, giọng, ethnolect, giọng, chủng tộc hoặc giới tính?

Vì những lý do được đề cập ở trên, các tập dữ liệu là cần thiết để sửa chữa các thiên vị hiện có trong các hệ thống sản xuất AI, ngoài các tập dữ liệu bao gồm hơn để đào tạo các hệ thống trong tương lai. Các tập dữ liệu Appen mà bạn đề cập sẽ hỗ trợ việc sửa chữa các thiên vị liên quan đến dân tộc và các ethnolect liên quan, chẳng hạn như Tiếng Anh Phiên bản Mỹ châu Phi. Chúng sẽ cung cấp dữ liệu đào tạo bổ sung để tăng cường đại diện của dân số này trong các mô hình ngôn ngữ AI.

Dân tộc đang nổi lên như một chiều dân số quan trọng cho việc ghi nhãn rõ ràng trong dữ liệu AI. Các nhà ngôn ngữ học gọi các phương ngữ ngôn ngữ liên quan đến các dân tộc cụ thể là “ethnolects”. Các nhà cung cấp dữ liệu AI như Appen hiện nhận ra rằng trừ khi các dân tộc và thiểu số quan trọng được đại diện rõ ràng trong các tập dữ liệu đào tạo AI, chúng ta không thể đảm bảo rằng các hệ thống kết quả hoạt động tốt như nhau cho những dân số này.

Hiệu suất như nhau có nghĩa là hệ thống nhận ra với độ chính xác như nhau từ và ý định của người dùng (ý nghĩa của họ, hoặc hành động họ muốn thực hiện) và trong một số trường hợp, cảm xúc; và nó phản hồi theo cách thỏa mãn nhu cầu của người dùng như nhau và không tạo ra tác động tiêu cực hơn đối với một dân số người dùng cụ thể, либо về mặt thực tế hay tâm lý.

Một cách tiếp cận thu thập dữ liệu lâu dài đã là tập trung vào lấy mẫu địa lý và phương ngữ đại diện trong các cơ sở dữ liệu – giả định rằng điều này sẽ đảm bảo công nghệ sẽ khái quát hóa cho toàn bộ dân số của người nói ngôn ngữ. Tuy nhiên, hiệu suất kém hơn gần đây của các công nghệ ngôn ngữ được ghi nhận cho người nói Tiếng Anh Phiên bản Mỹ châu Phi đã chỉ ra rằng điều này không phải như vậy. Các dân số đa dạng về dân tộc, chủng tộc, giới tính và giọng, trong số các chiều khác, cần được tích cực đưa vào các tập dữ liệu đào tạo để đảm bảo tiếng nói của họ được nghe và hiểu bởi các sản phẩm và dịch vụ AI. Các tập dữ liệu đào tạo AI đa dạng của Appen giải quyết nhu cầu này.

Ngoài AI, bạn cũng là một nhà thơ với một số bài thơ của bạn đã giành được các giải thưởng khác nhau trong ngành. Quan điểm của bạn về AI trong tương lai thể hiện sự sáng tạo này, bao gồm cả việc viết thơ?

Đó là một câu hỏi thú vị. Thơ ca và các hình thức sáng tạo của con người khác dựa trên tất cả các nguồn lực của con người về ký ức, nhận thức, cảm giác và cảm xúc, cũng như các cấu trúc và sắc thái của ngôn ngữ và hình ảnh, để tạo ra những nhận thức phù hợp với các mối quan tâm đương đại. Emily Dickinson đã viết, “Nếu tôi đọc một cuốn sách và nó làm cho toàn bộ cơ thể tôi lạnh đến nỗi không có lửa nào có thể làm tôi ấm, tôi biết rằng đó là thơ. Nếu tôi cảm thấy về mặt thể chất như thể đỉnh đầu tôi bị cắt bỏ, tôi biết rằng đó là thơ.” Phải có một yếu tố nhận thức, cảm giác hoặc cảm xúc, nhưng cũng có sự ngạc nhiên thực sự.

Các mô hình AI tiên tiến như GPT-3 mô hình thống kê sự xuất hiện của các từ cùng nhau trong các thể loại khác nhau, bao gồm thơ ca. Điều này có nghĩa là chúng có thể tạo ra thứ mà chúng ta nhận ra là “ngôn ngữ thơ”, chẳng hạn như sử dụng từ vựng cao, vần và sự kết hợp từ không mong muốn hoặc siêu thực. Nhưng những mô hình ngôn ngữ tạo ra này thiếu hầu hết các nguồn lực được đề cập ở trên, cần thiết để tạo ra một tác phẩm nghệ thuật chiếu sáng những gì nó có nghĩa là để trở thành con người trong thời gian hiện tại.

Điều mà tôi thấy hấp dẫn về AI trong một bối cảnh sáng tạo là tiềm năng của nó để tạo ra những nhận thức hoàn toàn mới – những nhận thức khác nhau về loại và vượt ra ngoài tầm với của bất kỳ tâm trí con người nào, thậm chí là tâm trí đa tài hoặc sâu sắc và giàu kinh nghiệm nhất. Một khi AI có quyền truy cập nhất quán vào dữ liệu cảm giác và nhận thức để phân tích trên một loạt các lĩnh vực của con người (thị giác, xúc giác, thính giác, sinh lý, cảm xúc) thì không có gì biết được chúng ta sẽ học được gì về chính mình và thế giới. Khả năng phân tích của AI có thể tạo ra những vùng đất sáng tạo mới cho con người khám phá.

Bạn đã có một sự nghiệp đáng kinh ngạc cho đến nay, theo quan điểm của bạn, điều gì đang cản trở nhiều phụ nữ tham gia STEM và cụ thể là AI?

Sự thiếu hụt các mô hình vai trò có thể là một yếu tố mạnh mẽ (và một vòng tròn luẩn quẩn). Có một khó khăn thực sự – văn hóa, xã hội và thực tế – trong việc phá vỡ các lĩnh vực mà phụ nữ, và những người thuộc các giới tính đa dạng khác, chưa có sự hiện diện sâu sắc, và nơi sự tôn trọng những gì chúng tôi có thể đóng góp thường thiếu. Kinh nghiệm lãnh đạo của tôi đã cho tôi thấy lại và lại rằng các đội ngũ có thể mạnh mẽ, sáng tạo và thành công như thế nào khi chúng bao gồm các kinh nghiệm và quan điểm đa dạng. Các nhà lãnh đạo cần phải mạo hiểm trong việc tuyển dụng và can đảm trong sự tự tin rằng họ có thể xử lý những thách thức đối với cách suy nghĩ của họ mà các quan điểm đa dạng mang lại, biết rằng sự can đảm này cũng đã được chứng minh là có mối tương quan mạnh mẽ với thành công tài chính và doanh nghiệp.

Có điều gì khác mà bạn muốn chia sẻ về Appen hoặc AI nói chung?

Các nhà cung cấp dữ liệu như Appen có tiềm năng mạnh mẽ để ảnh hưởng đến kết quả AI theo hướng tốt hơn bằng cách cung cấp dữ liệu đào tạo bao gồm.

Tuy nhiên, để đạt được mục tiêu AI bao gồm, mọi người sẽ phải tham gia. Người mua dữ liệu cũng phải nhận ra trách nhiệm của mình trong việc yêu cầu – và trả tiền – cho dữ liệu bao gồm sẽ đảm bảo hiệu suất tối ưu của hệ thống của họ cho tất cả người dùng trong thế giới thực. Và những người từ các cộng đồng đa dạng cung cấp dữ liệu của họ cho sự phát triển AI phải có thể tin tưởng vào việc sử dụng dữ liệu đó. Xây dựng niềm tin đó sẽ đòi hỏi sự minh bạch và thực hành đạo đức mạnh mẽ từ tất cả những người xử lý dữ liệu nhạy cảm.

Cảm ơn bạn vì cuộc phỏng vấn tuyệt vời, tôi đã thích tìm hiểu thêm về quan điểm của bạn về AI và ngôn ngữ học. Những người đọc muốn tìm hiểu thêm nên truy cập Appen.

Antoine Tardif, CEO & Founder of Unite.AI

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.

Unite.AI

Dr. Judith Bishop, Giám đốc cấp cao của Chuyên gia AI tại Appen – Loạt phỏng vấn

You may like