AI 101
Federated Learning là gì?

Federated Learning là gì?
Phương pháp truyền thống để đào tạo các mô hình AI liên quan đến việc thiết lập các máy chủ nơi các mô hình được đào tạo trên dữ liệu, thường thông qua việc sử dụng một nền tảng tính toán dựa trên đám mây. Tuy nhiên, trong những năm qua, một hình thức tạo mô hình thay thế đã xuất hiện, được gọi là học liên kết. Học liên kết mang các mô hình học máy đến nguồn dữ liệu, thay vì mang dữ liệu đến mô hình. Học liên kết liên kết nhiều thiết bị tính toán vào một hệ thống phân tán cho phép các thiết bị riêng lẻ thu thập dữ liệu để hỗ trợ đào tạo mô hình.
Trong một hệ thống học liên kết, các thiết bị khác nhau là một phần của mạng học tập mỗi có một bản sao của mô hình trên thiết bị. Các thiết bị/khách hàng khác nhau đào tạo bản sao mô hình của riêng họ bằng cách sử dụng dữ liệu cục bộ của khách hàng, sau đó các tham số/trọng số từ các mô hình riêng lẻ được gửi đến một thiết bị chính/máy chủ tổng hợp các tham số và cập nhật mô hình toàn cầu. Quá trình đào tạo này có thể được lặp lại cho đến khi đạt được mức độ chính xác mong muốn. Tóm lại, ý tưởng đằng sau học liên kết là không có dữ liệu đào tạo nào được truyền giữa các thiết bị hoặc giữa các bên, chỉ có các bản cập nhật liên quan đến mô hình được truyền.
Học liên kết có thể được chia thành ba bước hoặc giai đoạn khác nhau. Học liên kết thường bắt đầu với một mô hình chung hoạt động như một đường cơ sở và được đào tạo trên một máy chủ trung tâm. Trong bước đầu tiên, mô hình chung này được gửi đến các khách hàng của ứng dụng. Các bản sao cục bộ sau đó được đào tạo trên dữ liệu được tạo bởi các hệ thống khách hàng, học hỏi và cải thiện hiệu suất của chúng.
Trong bước thứ hai, các khách hàng gửi các tham số mô hình đã học của họ đến máy chủ trung tâm. Điều này xảy ra định kỳ, trên một lịch trình cố định.
Trong bước thứ ba, máy chủ tổng hợp các tham số đã học khi nhận được chúng. Sau khi các tham số được tổng hợp, mô hình trung tâm được cập nhật và chia sẻ lại với các khách hàng. Toàn bộ quá trình sau đó được lặp lại.
Lợi ích của việc có một bản sao của mô hình trên các thiết bị khác nhau là độ trễ mạng được giảm hoặc loại bỏ. Chi phí liên quan đến việc chia sẻ dữ liệu với máy chủ cũng được loại bỏ. Các lợi ích khác của phương pháp học liên kết bao gồm việc các mô hình học liên kết được bảo tồn quyền riêng tư và các phản hồi mô hình được cá nhân hóa cho người dùng thiết bị.
Các ví dụ về mô hình học liên kết bao gồm các công cụ đề xuất, mô hình phát hiện gian lận và mô hình y tế. Các công cụ đề xuất truyền thông, loại được sử dụng bởi Netflix hoặc Amazon, có thể được đào tạo trên dữ liệu thu thập từ hàng nghìn người dùng. Các thiết bị khách hàng sẽ đào tạo các mô hình riêng biệt của riêng họ và mô hình trung tâm sẽ học cách đưa ra dự đoán tốt hơn, ngay cả khi các điểm dữ liệu riêng lẻ là duy nhất đối với các người dùng khác nhau. Tương tự, các mô hình phát hiện gian lận được sử dụng bởi các ngân hàng có thể được đào tạo trên các mẫu hoạt động từ nhiều thiết bị khác nhau và một số ngân hàng khác nhau có thể hợp tác để đào tạo một mô hình chung. Về mô hình học liên kết y tế, nhiều bệnh viện có thể hợp tác để đào tạo một mô hình chung có thể nhận ra các khối u tiềm năng thông qua các cuộc quét y tế.
Loại học liên kết
Các lược đồ học liên kết thường rơi vào một trong hai lớp khác nhau: hệ thống đa bên và hệ thống đơn bên. Hệ thống học liên kết đơn bên được gọi là “đơn bên” vì chỉ có một thực thể chịu trách nhiệm giám sát việc thu thập và luồng dữ liệu trên tất cả các thiết bị khách hàng trong mạng học tập. Các mô hình tồn tại trên các thiết bị khách hàng được đào tạo trên dữ liệu có cấu trúc giống nhau, mặc dù các điểm dữ liệu thường là duy nhất đối với các người dùng và thiết bị khác nhau.
Ngược lại với các hệ thống đơn bên, các hệ thống đa bên được quản lý bởi hai hoặc nhiều thực thể. Các thực thể này hợp tác để đào tạo một mô hình chung bằng cách sử dụng các thiết bị và tập dữ liệu mà chúng có quyền truy cập. Các tham số và cấu trúc dữ liệu thường tương tự trên các thiết bị thuộc các thực thể khác nhau, nhưng chúng không cần phải giống hệt nhau. Thay vào đó, việc tiền xử lý được thực hiện để tiêu chuẩn hóa các đầu vào của mô hình. Một thực thể trung lập có thể được sử dụng để tổng hợp các trọng số được thiết lập bởi các thiết bị duy nhất cho các thực thể khác nhau.
Các khung học liên kết
Các khung phổ biến được sử dụng cho học liên kết bao gồm Tensorflow Federated, Federated AI Technology Enabler (FATE) và PySyft. PySyft là một thư viện học liên kết mã nguồn mở dựa trên thư viện học sâu PyTorch. PySyft旨在 đảm bảo học sâu riêng tư và an toàn trên các máy chủ và tác nhân bằng cách sử dụng tính toán mã hóa. Trong khi đó, Tensorflow Federated là một khung mã nguồn mở khác được xây dựng trên nền tảng Tensorflow của Google. Ngoài việc cho phép người dùng tạo các thuật toán của riêng họ, Tensorflow Federated còn cho phép người dùng mô phỏng một số thuật toán học liên kết được bao gồm trên các mô hình và dữ liệu của riêng họ. Cuối cùng, FATE cũng là một khung mã nguồn mở được thiết kế bởi Webank AI và nó旨在 cung cấp cho hệ sinh thái Federated AI một khung tính toán an toàn.
Thử thách học liên kết
Khi học liên kết vẫn còn khá mới, một số thử thách vẫn phải được đàm phán để nó đạt được tiềm năng đầy đủ. Khả năng đào tạo của các thiết bị biên, dán nhãn dữ liệu và tiêu chuẩn hóa, và hội tụ mô hình là những chướng ngại vật tiềm năng cho các phương pháp học liên kết.
Khả năng tính toán của các thiết bị biên, khi nói đến đào tạo cục bộ, cần được xem xét khi thiết kế các phương pháp học liên kết. Trong khi hầu hết các điện thoại thông minh, máy tính bảng và các thiết bị IoT tương thích khác có khả năng đào tạo các mô hình học máy, điều này thường làm giảm hiệu suất của thiết bị. Các thỏa hiệp sẽ phải được thực hiện giữa độ chính xác của mô hình và hiệu suất của thiết bị.
Dán nhãn và tiêu chuẩn hóa dữ liệu là một thử thách khác mà các hệ thống học liên kết phải vượt qua. Các mô hình học có giám sát yêu cầu dữ liệu đào tạo được dán nhãn rõ ràng và nhất quán, điều này có thể khó thực hiện trên nhiều thiết bị khách hàng trong hệ thống. Vì lý do này, điều quan trọng là phải phát triển các đường ống dữ liệu mô hình tự động áp dụng các nhãn theo cách tiêu chuẩn dựa trên các sự kiện và hành động của người dùng.
Thời gian hội tụ mô hình là một thử thách khác cho học liên kết, vì các mô hình học liên kết thường mất nhiều thời gian hơn để hội tụ so với các mô hình được đào tạo cục bộ. Số lượng thiết bị tham gia vào quá trình đào tạo thêm một yếu tố không thể đoán trước vào quá trình đào tạo mô hình, vì các vấn đề kết nối, cập nhật không đều và thậm chí các thời gian sử dụng ứng dụng khác nhau có thể góp phần làm tăng thời gian hội tụ và giảm độ tin cậy. Vì lý do này, các giải pháp học liên kết thường hữu ích nhất khi chúng cung cấp các lợi thế có ý nghĩa so với việc đào tạo một mô hình tập trung, chẳng hạn như các trường hợp dữ liệu rất lớn và phân tán.

Ảnh: Jeromemetronome qua Wikimedia Commons, CC By S.A. 4.0 (https://en.wikipedia.org/wiki/File:Federated_learning_process_central_case.png)












