Connect with us

Trí tuệ nhân tạo

Human-in-the-loop (HITL) là gì?

mm

Một trong những thuật ngữ bạn có thể gặp phải khi làm việc với trí tuệ nhân tạo (AI) và học máy (ML) là Human-in-the-loop (HITL). Nó giống như nó có vẻ. HITL là một nhánh của AI dựa trên cả trí tuệ con người và máy móc trong việc tạo ra các mô hình học máy.

Một cách tiếp cận Human-in-the-loop có nghĩa là con người tham gia vào chu kỳ thuật toán của việc đào tạo, điều chỉnh và kiểm tra.

Con người đầu tiên gắn nhãn dữ liệu, điều này giúp mô hình đạt được chất lượng và số lượng dữ liệu đào tạo cao. Một thuật toán học máy sau đó học cách đưa ra quyết định dựa trên dữ liệu trước khi con người bắt đầu tinh chỉnh mô hình.

Mô hình sau đó có thể được kiểm tra và xác thực bởi con người thông qua việc chấm điểm đầu ra của nó. Quá trình này đặc biệt hữu ích trong các trường hợp mà thuật toán không chắc chắn về một phán đoán, hoặc ở phía ngược lại, nơi thuật toán quá tự tin về một quyết định sai.

Quá trình HITL là một vòng phản hồi liên tục, có nghĩa là mỗi một trong các nhiệm vụ đào tạo, điều chỉnh và kiểm tra được đưa trở lại vào thuật toán. Quá trình này cho phép thuật toán trở nên hiệu quả và chính xác hơn theo thời gian, điều này đặc biệt hữu ích cho việc tạo ra các dữ liệu đào tạo chính xác và lớn cho các trường hợp sử dụng cụ thể. Sự hiểu biết của con người giúp tinh chỉnh và kiểm tra mô hình để tổ chức có thể đạt được quyết định chính xác và có thể hành động nhất.

Hình ảnh: Stanford University

Tầm quan trọng của HITL Machine Learning

HITL là một nhánh cực kỳ quan trọng của AI vì các mô hình học máy thông thường đòi hỏi một số lượng lớn các điểm dữ liệu đã được gắn nhãn để đạt được dự đoán chính xác. Khi không có đủ dữ liệu, các mô hình học máy không hữu ích.

Lấy việc học ngôn ngữ làm ví dụ. Nếu bạn có một ngôn ngữ chỉ được nói bởi vài nghìn người, và bạn muốn đạt được hiểu biết về ngôn ngữ đó thông qua học máy, có thể sẽ khó tìm đủ ví dụ cho mô hình để học. Với cách tiếp cận HITL, bạn có thể đảm bảo độ chính xác của các tập dữ liệu này.

Ngành chăm sóc sức khỏe cũng là một trong những ngành quan trọng nhất đối với các hệ thống HITL. Một nghiên cứu năm 2018 của Stanford đã phát hiện ra rằng một mô hình HITL hoạt động tốt hơn cả AI và con người riêng lẻ.

Các hệ thống HITL cải thiện độ chính xác đồng thời duy trì các tiêu chuẩn của con người, điều này rất quan trọng đối với nhiều ngành công nghiệp trên toàn cầu.

Khi nào nên sử dụng Hệ thống HITL

Có một số thời điểm cụ thể trong chu kỳ AI khi học máy Human-in-the-loop nên được sử dụng:

  • Đào tạo: Nơi phổ biến nhất mà các nhà khoa học dữ liệu sử dụng HITL là trong các giai đoạn đào tạo, nơi con người cung cấp dữ liệu đã được gắn nhãn cho việc đào tạo mô hình.

  • Điều chỉnh và Kiểm tra: Thời điểm chính khác mà HITL được sử dụng là trong các giai đoạn điều chỉnh và kiểm tra. Con người tinh chỉnh mô hình để có độ chính xác cao hơn, điều này đặc biệt quan trọng khi mô hình không chắc chắn.

Điều quan trọng cần lưu ý là cách tiếp cận HITL không phù hợp cho mọi dự án học máy. Nó chủ yếu được sử dụng khi không có nhiều dữ liệu có sẵn.

Học sâu Human-in-the-loop được sử dụng khi con người và các quá trình học máy tương tác trong các kịch bản nhất định, chẳng hạn như: thuật toán không hiểu đầu vào; dữ liệu đầu vào được giải thích sai; thuật toán không biết cách thực hiện một nhiệm vụ cụ thể; mô hình học máy cần phải chính xác hơn; thành phần con người cần phải hiệu quả và chính xác hơn; chi phí của các lỗi quá cao trong phát triển ML; và dữ liệu mong muốn không có sẵn.

Các loại Gán nhãn Dữ liệu cho HITL

Cách tiếp cận HITL có thể được sử dụng cho các loại gán nhãn dữ liệu khác nhau tùy thuộc vào loại tập dữ liệu nào được yêu cầu. Ví dụ, nếu máy cần học cách nhận dạng các hình dạng cụ thể, các hộp giới hạn được sử dụng. Nhưng nếu mô hình cần phân loại từng phần của một hình ảnh, phân đoạn được ưu tiên. Khi nói đến các tập dữ liệu nhận dạng khuôn mặt, các dấu khuôn mặt thường được sử dụng.

Một ứng dụng chính khác là phân tích văn bản, cho phép máy hiểu những gì được nói hoặc viết bởi con người. Bởi vì mọi người sử dụng các từ khác nhau để thể hiện cùng một ý nghĩa, các hệ thống AI phải biết các biến thể khác nhau. Đưa mọi thứ xa hơn, phân tích cảm xúc có thể nhận ra giọng điệu của một từ hoặc cụm từ cụ thể. Những ví dụ này chứng minh tại sao cách tiếp cận Human-in-the-loop lại quan trọng như vậy.

Tại sao Công ty của bạn Nên Thực hiện HITL

Nếu doanh nghiệp của bạn đang tìm cách cài đặt một hệ thống HITL, một trong những cách phổ biến nhất để làm điều này là bằng cách sử dụng phần mềm tự động hóa. Có rất nhiều phần mềm tự động hóa đã được xây dựng xung quanh cách tiếp cận HITL, có nghĩa là nó đã có quá trình này được tính đến.

Các hệ thống như vậy cho phép công ty đạt được hiệu suất cấp cao ngay từ đầu và đạt được hiểu biết. Các hệ thống học máy đã được triển khai trên gần như mọi ngành công nghiệp, có nghĩa là các nhà phát triển phải đảm bảo rằng các hệ thống hoạt động tốt với dữ liệu thay đổi.

Có nhiều lợi thế khi triển khai một hệ thống HITL vào công ty của bạn:

  • Cải thiện Quá trình Ra quyết định: Một hệ thống HITL cải thiện quá trình ra quyết định của một công ty bằng cách cung cấp minh bạch và nhất quán. Nó cũng bảo vệ chống lại sự thiên vị bằng cách bao gồm phản hồi của con người trong quá trình đào tạo.

  • Hiệu quả hơn: Các hệ thống HITL thường được coi là hiệu quả hơn các hệ thống học máy truyền thống. Chúng yêu cầu ít thời gian hơn cho việc đào tạo và tinh chỉnh, có nghĩa là chúng tạo ra hiểu biết nhanh hơn.

  • Minh bạch: Các hệ thống Human-in-the-loop cung cấp sự minh bạch lớn hơn vào mô hình học máy, cách nó hoạt động và tại sao nó đi đến một quyết định cụ thể. Khả năng giải thích và trách nhiệm giải trình là những điều cơ bản đối với các hệ thống AI ngày nay, và cách tiếp cận HITL giúp rất nhiều.

Thử thách của Hệ thống HITL

Các hệ thống Human-in-the-loop cũng đưa ra một số thử thách cụ thể mà nên được giải quyết. Một mặt, con người mắc lỗi, vì vậy bất kỳ hệ thống nào có con người đều có nguy cơ sai. Điều này có thể có tác động lớn đến hiệu quả của hệ thống. Ví dụ, nếu một con người mắc lỗi khi gắn nhãn dữ liệu, cùng một lỗi sẽ đi qua toàn bộ hệ thống và có thể gây ra vấn đề trong tương lai.

Các hệ thống HITL cũng có thể chậm vì con người tham gia vào quá trình ra quyết định. Một trong những lý do lớn nhất đằng sau sự phát triển của AI và ML là máy móc nhanh hơn con người rất nhiều, nhưng tốc độ này thường thấy trong các hệ thống ML truyền thống sẽ không luôn dịch sang các hệ thống HITL.

Một thử thách nữa của các hệ thống HITL là chúng có thể tốn kém để xây dựng và duy trì. Ngoài chi phí liên quan đến máy móc, doanh nghiệp phải dự toán cho lao động của con người.

Alex McFarland là một nhà báo và nhà văn về trí tuệ nhân tạo, khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Ông đã hợp tác với nhiều công ty khởi nghiệp và xuất bản về trí tuệ nhân tạo trên toàn thế giới.