sơ khai Học máy truyền thống có còn phù hợp không? - Đoàn kết.AI
Kết nối với chúng tôi

Trí tuệ nhân tạo

Học máy truyền thống có còn phù hợp không?

mm

Được phát hành

 on

Học máy truyền thống có còn phù hợp không?

Trong những năm gần đây, Generative AI đã cho thấy những kết quả đầy hứa hẹn trong việc giải quyết các nhiệm vụ AI phức tạp. Các mô hình AI hiện đại như ChatGPT, Thi nhân, cuộc gọi, DALL-E.3SAM đã thể hiện những khả năng vượt trội trong việc giải quyết các vấn đề đa ngành như trả lời câu hỏi trực quan, phân đoạn, lý luận và tạo nội dung.

Hơn thế nữa, AI đa phương thức đã xuất hiện các kỹ thuật có khả năng xử lý nhiều phương thức dữ liệu, tức là văn bản, hình ảnh, âm thanh và video cùng một lúc. Với những tiến bộ này, điều tự nhiên là chúng ta sẽ tự hỏi: Có phải chúng ta đang tiến tới sự kết thúc của học máy truyền thống (ML)?

Trong bài viết này, chúng ta sẽ xem xét bối cảnh học máy truyền thống liên quan đến những đổi mới của AI thế hệ hiện đại.

Học máy truyền thống là gì? – Hạn chế của nó là gì?

Học máy truyền thống là một thuật ngữ rộng bao gồm nhiều loại thuật toán chủ yếu được điều khiển bởi số liệu thống kê. Hai loại thuật toán ML truyền thống chính là được giám sát và không được giám sát. Các thuật toán này được thiết kế để phát triển các mô hình từ bộ dữ liệu có cấu trúc.

Các thuật toán học máy truyền thống tiêu chuẩn bao gồm:

  • Các thuật toán hồi quy như tuyến tính, Lasso và Ridge.
  • K-có nghĩa là phân cụm.
  • Phân tích thành phần chính (PCA).
  • Máy vectơ hỗ trợ (SVM).
  • Các thuật toán dựa trên cây như cây quyết định và rừng ngẫu nhiên.
  • Các mô hình tăng cường như tăng cường độ dốc và XGBoost.

Hạn chế của Machine Learning truyền thống

ML truyền thống có những hạn chế sau:

  1. Khả năng mở rộng hạn chế: Những mô hình này thường cần trợ giúp để mở rộng quy mô với bộ dữ liệu lớn và đa dạng.
  2. Xử lý trước dữ liệu và kỹ thuật tính năng: ML truyền thống yêu cầu tiền xử lý rộng rãi để chuyển đổi tập dữ liệu theo yêu cầu của mô hình. Ngoài ra, kỹ thuật tính năng có thể tốn thời gian và yêu cầu lặp lại nhiều lần để nắm bắt được mối quan hệ phức tạp giữa các tính năng dữ liệu.
  3. Dữ liệu chiều cao và không có cấu trúc: ML truyền thống gặp khó khăn với các loại dữ liệu phức tạp như hình ảnh, âm thanh, video và tài liệu.
  4. Khả năng thích ứng với dữ liệu chưa nhìn thấy: Những mô hình này có thể không thích ứng tốt với dữ liệu trong thế giới thực không phải là một phần của chúng dữ liệu đào tạo.

Mạng lưới thần kinh: Chuyển từ Học máy sang Học sâu và hơn thế nữa

Mạng lưới thần kinh: Chuyển từ Học máy sang Học sâu và hơn thế nữa

Các mô hình mạng thần kinh (NN) phức tạp hơn nhiều so với các mô hình Machine Learning truyền thống. NN đơn giản nhất – Perceptron nhiều lớp (MLP) bao gồm một số tế bào thần kinh được kết nối với nhau để hiểu thông tin và thực hiện các nhiệm vụ, tương tự như cách hoạt động của não người.

Những tiến bộ trong kỹ thuật mạng lưới thần kinh đã hình thành cơ sở cho việc chuyển đổi từ học máy đến học sâu. Ví dụ: NN được sử dụng cho các tác vụ thị giác máy tính (phát hiện đối tượng và phân đoạn hình ảnh) được gọi là mạng nơ-ron phức hợp (CNN), Chẳng hạn như AlexNet, ResNetYolo.

Ngày nay, công nghệ AI tổng quát đang đưa các kỹ thuật mạng thần kinh tiến thêm một bước nữa, cho phép nó vượt trội trong nhiều lĩnh vực AI khác nhau. Ví dụ: mạng nơ-ron được sử dụng cho các tác vụ xử lý ngôn ngữ tự nhiên (như tóm tắt văn bản, trả lời câu hỏi và dịch thuật) được gọi là máy biến áp. Các mẫu máy biến áp nổi bật gồm có Chứng nhận, GPT-4T5. Những mô hình này đang tạo ra tác động đến các ngành từ chăm sóc sức khỏe, bán lẻ, tiếp thị, tài chính, Vv

Chúng ta có còn cần các thuật toán học máy truyền thống không?

Chúng ta có còn cần các thuật toán học máy truyền thống không?

Trong khi mạng lưới thần kinh và các biến thể hiện đại của chúng như máy biến áp đã nhận được nhiều sự chú ý thì các phương pháp ML truyền thống vẫn rất quan trọng. Chúng ta hãy xem tại sao chúng vẫn có liên quan.

1. Yêu cầu dữ liệu đơn giản hơn

Mạng lưới thần kinh yêu cầu các bộ dữ liệu lớn để đào tạo, trong khi các mô hình ML có thể đạt được kết quả đáng kể với các bộ dữ liệu nhỏ hơn và đơn giản hơn. Do đó, ML được ưa chuộng hơn deep learning đối với các tập dữ liệu có cấu trúc nhỏ hơn và ngược lại.

2. Tính đơn giản và dễ hiểu

Các mô hình học máy truyền thống được xây dựng dựa trên các mô hình xác suất và thống kê đơn giản hơn. Ví dụ: một dòng phù hợp nhất trong hồi quy tuyến tính thiết lập mối quan hệ đầu vào-đầu ra bằng phương pháp bình phương tối thiểu, một phép toán thống kê.

Tương tự, cây quyết định sử dụng nguyên tắc xác suất để phân loại dữ liệu. Việc sử dụng các nguyên tắc như vậy mang lại khả năng diễn giải và giúp những người thực hành AI hiểu được hoạt động của thuật toán ML dễ dàng hơn.

Các kiến ​​trúc NN hiện đại như mô hình biến áp và khuếch tán (thường được sử dụng để tạo hình ảnh như Khuếch tán ổn định or midjourney) có cấu trúc mạng nhiều lớp phức tạp. Việc hiểu các mạng như vậy đòi hỏi sự hiểu biết về các khái niệm toán học nâng cao. Đó là lý do tại sao chúng còn được gọi là 'Hộp đen'.

3. Hiệu quả nguồn lực

Các mạng thần kinh hiện đại như Mô hình ngôn ngữ lớn (LLM) được đào tạo trên các cụm GPU đắt tiền theo yêu cầu tính toán của chúng. Ví dụ: GPT4 được cho là đã được đào tạo về 25000 GPU Nvidia trong 90 đến 100 ngày.

Tuy nhiên, phần cứng đắt tiền và thời gian đào tạo kéo dài là không khả thi đối với mọi học viên hoặc nhóm AI. Mặt khác, hiệu quả tính toán của các thuật toán học máy truyền thống cho phép người thực hành đạt được kết quả có ý nghĩa ngay cả với nguồn lực hạn chế.

4. Không phải mọi vấn đề đều cần học sâu

Học kĩ càng không phải là giải pháp tuyệt đối cho mọi vấn đề. Một số trường hợp tồn tại trong đó ML hoạt động tốt hơn học sâu.

Chẳng hạn, trong chẩn đoán y tế và tiên lượng với dữ liệu hạn chế, thuật toán ML cho phát hiện bất thường như REMED mang lại kết quả tốt hơn học sâu. Tương tự, học máy truyền thống rất có ý nghĩa trong các tình huống có khả năng tính toán thấp vì giải pháp linh hoạt và hiệu quả.

Về cơ bản, việc lựa chọn mô hình tốt nhất cho bất kỳ vấn đề nào đều phụ thuộc vào nhu cầu của tổ chức hoặc người thực hiện và bản chất của vấn đề hiện tại.

Học máy vào năm 2023

Học máy vào năm 2023

Hình ảnh được tạo bằng cách sử dụng Leonardo trí tuệ nhân tạo

Vào năm 2023, học máy truyền thống tiếp tục phát triển và đang cạnh tranh với học sâu và AI sáng tạo. Nó có một số ứng dụng trong ngành, đặc biệt khi xử lý các tập dữ liệu có cấu trúc.

Ví dụ, nhiều Hàng tiêu dùng nhanh (FMCG) các công ty xử lý hàng loạt dữ liệu dạng bảng dựa trên thuật toán ML cho các nhiệm vụ quan trọng như đề xuất sản phẩm được cá nhân hóa, tối ưu hóa giá, quản lý hàng tồn kho và tối ưu hóa chuỗi cung ứng.

Hơn nữa, nhiều mô hình tầm nhìn và ngôn ngữ vẫn dựa trên các kỹ thuật truyền thống, đưa ra các giải pháp theo phương pháp lai và các ứng dụng mới nổi. Ví dụ, một nghiên cứu gần đây có tựa đề “Chúng ta có thực sự cần các mô hình học sâu để dự báo chuỗi thời gian không?” đã thảo luận về cách cây hồi quy tăng cường độ dốc (GBRT) hiệu quả hơn cho dự báo chuỗi thời gian hơn mạng lưới thần kinh sâu.

Khả năng diễn giải của ML vẫn có giá trị cao với các kỹ thuật như HÌNH DẠNG (Giải thích phụ gia Shapley) và GIỚI HẠN (Giải thích bất khả tri về mô hình có thể giải thích được tại địa phương). Những kỹ thuật này giải thích các mô hình ML phức tạp và cung cấp thông tin chi tiết về dự đoán của chúng, từ đó giúp những người thực hành ML hiểu rõ hơn về mô hình của chúng.

Cuối cùng, học máy truyền thống vẫn là một giải pháp mạnh mẽ cho các ngành đa dạng nhằm giải quyết các vấn đề về khả năng mở rộng, độ phức tạp của dữ liệu và hạn chế về tài nguyên. Các thuật toán này không thể thay thế được trong phân tích dữ liệu và lập mô hình dự đoán và sẽ tiếp tục là một phần của kho vũ khí của nhà khoa học dữ liệu.

Nếu những chủ đề như thế này khiến bạn tò mò, hãy khám phá Đoàn kết AI để biết thêm thông tin chi tiết.