Trí tuệ nhân tạo

Human-in-the-loop (HITL) là gì?

cập nhật on 9 Tháng mười hai, 2022

Ảnh của Drew Dizzy Graham trên Bapt

Một trong những thuật ngữ bạn có thể gặp khi làm việc với trí tuệ nhân tạo (AI) và học máy (ML) là con người trong vòng lặp (HITL). Nó giống như âm thanh của nó. HITL là một nhánh của AI dựa vào cả trí thông minh của con người và máy móc trong việc tạo ra các mô hình học máy.

Cách tiếp cận con người trong vòng lặp có nghĩa là mọi người tham gia vào chu trình đào tạo, điều chỉnh và thử nghiệm thuật toán.

Dữ liệu nhãn đầu tiên của con người, giúp mô hình đạt được dữ liệu đào tạo chất lượng cao và số lượng lớn. Sau đó, thuật toán máy học sẽ học cách đưa ra quyết định dựa trên dữ liệu trước khi con người bắt đầu tinh chỉnh mô hình.

Sau đó, mô hình có thể được kiểm tra và xác nhận bởi con người thông qua việc chấm điểm các kết quả đầu ra của nó. Quá trình này đặc biệt hữu ích trong trường hợp thuật toán không tự tin về một phán đoán hoặc mặt khác, khi thuật toán quá tự tin về một quyết định không chính xác.

Quy trình HITL là một vòng phản hồi liên tục, nghĩa là mỗi tác vụ đào tạo, điều chỉnh và kiểm tra đều được đưa trở lại thuật toán. Quá trình này cho phép thuật toán trở nên hiệu quả và chính xác hơn theo thời gian, điều này đặc biệt hữu ích để tạo số lượng lớn dữ liệu đào tạo có độ chính xác cao cho các trường hợp sử dụng cụ thể. Thông tin chi tiết về con người giúp điều chỉnh và thử nghiệm mô hình để tổ chức có thể đưa ra quyết định chính xác và khả thi nhất.

Hình ảnh: Đại học Stanford

Tầm quan trọng của học máy HITL

HITL là một nhánh cực kỳ quan trọng của AI vì các mô hình máy học thông thường yêu cầu một số lượng lớn các điểm dữ liệu được dán nhãn để đạt được dự đoán chính xác. Khi thiếu dữ liệu, các mô hình học máy không hữu ích.

Lấy việc học ngôn ngữ làm ví dụ. Nếu bạn có một ngôn ngữ chỉ được vài nghìn người sử dụng và bạn muốn hiểu rõ hơn về ngôn ngữ đó thông qua học máy, thì có thể khó tìm đủ ví dụ để mô hình học hỏi. Với cách tiếp cận HITL, bạn có thể đảm bảo tính chính xác của các bộ dữ liệu này.

Ngành chăm sóc sức khỏe cũng là một trong những ngành quan trọng nhất đối với hệ thống HITL. Một nghiên cứu năm 2018 của Stanford đã phát hiện ra rằng mô hình HITL hoạt động tốt hơn AI hoặc con người.

Các hệ thống HITL cải thiện độ chính xác đồng thời duy trì các tiêu chuẩn ở cấp độ con người, điều này rất quan trọng đối với nhiều ngành công nghiệp trên toàn cầu.

Khi nào nên sử dụng hệ thống HITL

Có một vài thời điểm cụ thể trong vòng đời của AI khi nên sử dụng máy học theo vòng lặp của con người:

Hội thảo: Vị trí phổ biến nhất mà các nhà khoa học dữ liệu sử dụng HITL là trong các giai đoạn đào tạo, nơi con người cung cấp dữ liệu được gắn nhãn để đào tạo mô hình.
Điều chỉnh và thử nghiệm: Thời gian chính khác mà HITL được sử dụng là trong giai đoạn điều chỉnh và thử nghiệm. Con người điều chỉnh các mô hình để có độ chính xác cao hơn, điều này đặc biệt quan trọng khi mô hình không chắc chắn.

Điều quan trọng cần lưu ý là phương pháp HITL không phù hợp với mọi dự án máy học. Nó chủ yếu được sử dụng khi không có nhiều dữ liệu có sẵn.

Học sâu theo vòng lặp của con người được sử dụng khi con người và các quy trình máy học tương tác trong các tình huống nhất định, chẳng hạn như: thuật toán không hiểu đầu vào; dữ liệu đầu vào được giải thích không chính xác; các thuật toán không biết cách thực hiện một nhiệm vụ cụ thể; mô hình học máy cần chính xác hơn; thành phần con người cần hiệu quả và chính xác hơn; chi phí lỗi quá cao trong quá trình phát triển ML; và dữ liệu mong muốn không có sẵn.

Các loại ghi nhãn dữ liệu cho HITL

Cách tiếp cận HITL có thể được sử dụng cho các loại ghi nhãn dữ liệu khác nhau tùy thuộc vào loại tập dữ liệu nào được yêu cầu. Ví dụ: nếu máy cần học cách nhận dạng các hình dạng cụ thể, các hộp giới hạn sẽ được sử dụng. Nhưng nếu mô hình cần phân loại từng phần của hình ảnh, thì phân đoạn được ưu tiên hơn. Khi nói đến bộ dữ liệu nhận dạng khuôn mặt, dấu hiệu khuôn mặt thường được sử dụng.

Một ứng dụng chính khác là phân tích văn bản, cho phép máy hiểu những gì con người nói hoặc viết. Bởi vì mọi người sử dụng các từ khác nhau để diễn đạt cùng một ý nghĩa, hệ thống AI phải biết các biến thể khác nhau. Đi xa hơn nữa, phân tích tình cảm có thể nhận ra giọng điệu của một từ hoặc cụm từ cụ thể. Những ví dụ này chứng minh lý do tại sao việc sử dụng phương pháp tiếp cận con người trong vòng lặp lại quan trọng đến vậy.

Tại sao công ty của bạn nên triển khai HITL

Nếu doanh nghiệp của bạn đang tìm cách cài đặt hệ thống HITL, một trong những cách phổ biến nhất để thực hiện việc này là sử dụng phần mềm tự động hóa. Có rất nhiều phần mềm tự động hóa đã được xây dựng dựa trên phương pháp HITL, nghĩa là nó đã có quy trình được đưa vào.

Những hệ thống như thế này cho phép công ty đạt được hiệu suất cao ngay lập tức và đạt được những hiểu biết sâu sắc. Các hệ thống máy học đã được triển khai trong hầu hết mọi ngành, nghĩa là các nhà phát triển phải đảm bảo rằng các hệ thống hoạt động tốt với việc thay đổi dữ liệu.

Có nhiều lợi thế khi triển khai hệ thống HITL vào công ty của bạn:

Cải thiện quy trình ra quyết định: Hệ thống HITL cải thiện quy trình ra quyết định của một công ty bằng cách cung cấp tính minh bạch và nhất quán. Nó cũng bảo vệ chống lại sự thiên vị bằng cách bao gồm phản hồi của con người trong quá trình đào tạo.
Hiệu quả hơn: Các hệ thống HITL thường được coi là hiệu quả hơn các hệ thống máy học truyền thống. Chúng cần ít thời gian hơn để đào tạo và điều chỉnh, nghĩa là chúng tạo ra thông tin chuyên sâu nhanh hơn.
Minh bạch: Các hệ thống con người trong vòng lặp cung cấp tính minh bạch cao hơn cho mô hình máy học, cách thức hoạt động và lý do khiến mô hình này đi đến một quyết định nhất định. Khả năng giải thích và trách nhiệm giải trình là nền tảng cho các hệ thống AI ngày nay và phương pháp HITL sẽ giúp ích rất nhiều.

Những thách thức của hệ thống HITL

Các hệ thống con người trong vòng lặp cũng đưa ra một số thách thức cụ thể cần được giải quyết. Đầu tiên, con người phạm sai lầm, vì vậy bất kỳ hệ thống nào có con người đều có nguy cơ mắc sai lầm. Điều này có thể có tác động lớn đến hiệu quả của hệ thống. Ví dụ: nếu một người mắc lỗi khi dán nhãn dữ liệu, thì lỗi tương tự đó sẽ ảnh hưởng đến toàn bộ hệ thống và có thể gây ra các sự cố trong tương lai.

Hệ thống HITL cũng có thể chậm do con người tham gia vào quá trình ra quyết định. Một trong những lý do lớn nhất đằng sau sự phát triển của AI và ML là do máy móc nhanh hơn con người một cách đáng kinh ngạc, nhưng tốc độ này thường thấy trong các hệ thống ML truyền thống không phải lúc nào cũng chuyển thành các hệ thống HITL.

Một thách thức nữa của các hệ thống HITL là chúng có thể tốn kém để xây dựng và bảo trì. Bên cạnh các chi phí liên quan đến máy móc, doanh nghiệp cũng phải lập ngân sách cho lao động của con người.

Gần gũi hơn với việc học tập trên thiết bị suốt đời với kỹ thuật đào tạo mới

Đừng bỏ lỡ

Python được sử dụng để làm gì? (Hướng dẫn cho người mới bắt đầu)

Alex McFarland

Alex McFarland là một nhà báo và nhà văn về AI đang khám phá những phát triển mới nhất về trí tuệ nhân tạo. Anh ấy đã cộng tác với nhiều công ty khởi nghiệp và ấn phẩm về AI trên toàn thế giới.