Trí tuệ nhân tạo
Máy Học Truyền Thống Còn Phù Hợp Hay Không?

Gần đây, Trí Tuệ Nhân Tạo Tạo Sinh đã cho thấy những kết quả đầy hứa hẹn trong việc giải quyết các nhiệm vụ trí tuệ nhân tạo phức tạp. Các mô hình trí tuệ nhân tạo hiện đại như ChatGPT, Bard, LLaMA, DALL-E.3 và SAM đã展示 khả năng đáng kinh ngạc trong việc giải quyết các vấn đề đa lĩnh vực như trả lời câu hỏi hình ảnh, phân đoạn, lý luận và tạo nội dung.
Hơn nữa, Trí Tuệ Nhân Tạo Đa Mô Đun đã xuất hiện, có khả năng xử lý nhiều mô đun dữ liệu đồng thời, tức là văn bản, hình ảnh, âm thanh và video. Với những tiến bộ này, tự nhiên mà chúng ta sẽ thắc mắc: Liệu chúng ta có đang tiến gần đến việc kết thúc máy học truyền thống (ML) không?
Trong bài viết này, chúng ta sẽ xem xét tình hình của máy học truyền thống trong bối cảnh các đổi mới trí tuệ nhân tạo tạo sinh hiện đại.
Máy Học Truyền Thống Là Gì? – Những Giới Hạn Của Nó?
Máy học truyền thống là một thuật ngữ rộng bao gồm nhiều thuật toán chủ yếu được thúc đẩy bởi thống kê. Hai loại thuật toán máy học truyền thống chính là giám sát và không giám sát. Những thuật toán này được thiết kế để phát triển mô hình từ các tập dữ liệu có cấu trúc.
Các thuật toán máy học truyền thống tiêu chuẩn bao gồm:
- Thuật toán hồi quy như tuyến tính, lasso và ridge.
- Phân cụm K-means.
- Phân tích thành phần chính (PCA).
- Máy hỗ trợ vector (SVM).
- Thuật toán dựa trên cây quyết định như cây quyết định và rừng ngẫu nhiên.
- Mô hình tăng cường như tăng cường gradient và XGBoost.
Giới Hạn Của Máy Học Truyền Thống
Máy học truyền thống có những giới hạn sau:
- Khả Năng Tăng Cường Hạn Chế: Những mô hình này thường cần giúp đỡ để tăng cường với các tập dữ liệu lớn và đa dạng.
- Xử Lý Dữ Liệu Và Kỹ Thuật Đặc Trưng: Máy học truyền thống yêu cầu xử lý dữ liệu rộng rãi để chuyển đổi tập dữ liệu theo yêu cầu của mô hình. Ngoài ra, kỹ thuật đặc trưng có thể tốn thời gian và đòi hỏi nhiều lần lặp để nắm bắt các mối quan hệ phức tạp giữa các đặc trưng dữ liệu.
- Dữ Liệu Có Kích Thước Lớn Và Không Có Cấu Trúc: Máy học truyền thống gặp khó khăn với các loại dữ liệu phức tạp như hình ảnh, âm thanh, video và tài liệu.
- Khả Năng Thích Nghi Với Dữ Liệu Chưa Thấy: Những mô hình này có thể không thích nghi tốt với dữ liệu thực tế không nằm trong dữ liệu đào tạo của chúng.
Mạng Nơ-Ron: Chuyển Từ Máy Học Sang Học Sâu & Beyond

Mô hình mạng nơ-ron (NN) phức tạp hơn nhiều so với mô hình máy học truyền thống. Mô hình NN đơn giản nhất – Perceptron đa lớp (MLP) – bao gồm nhiều nơ-ron kết nối với nhau để hiểu thông tin và thực hiện nhiệm vụ, tương tự như cách bộ não con người hoạt động.
Các tiến bộ trong kỹ thuật mạng nơ-ron đã tạo cơ sở cho việc chuyển từ máy học sang học sâu. Ví dụ, NN được sử dụng cho các nhiệm vụ thị giác (phát hiện đối tượng và phân đoạn hình ảnh) được gọi là mạng nơ-ron tích chập (CNNs), như AlexNet, ResNet và YOLO.
Ngày nay, công nghệ trí tuệ nhân tạo tạo sinh đang đưa kỹ thuật mạng nơ-ron lên một bước tiến mới, cho phép nó vượt trội trong nhiều lĩnh vực trí tuệ nhân tạo. Ví dụ, mạng nơ-ron được sử dụng cho các nhiệm vụ xử lý ngôn ngữ tự nhiên (tóm tắt văn bản, trả lời câu hỏi và dịch) được gọi là biến đổi. Các mô hình biến đổi nổi bật bao gồm BERT, GPT-4 và T5. Những mô hình này đang tạo ra tác động trên nhiều ngành công nghiệp, từ y tế, bán lẻ, tiếp thị, tài chính, v.v.
Vẫn Còn Cần Máy Học Truyền Thống Hay Không?

Mặc dù mạng nơ-ron và các biến thể hiện đại của nó đã nhận được nhiều sự chú ý, nhưng các phương pháp máy học truyền thống vẫn còn quan trọng. Hãy cùng xem lý do tại sao chúng vẫn còn phù hợp.
1. Yêu Cầu Dữ Liệu Đơn Giản Hơn
Mạng nơ-ron đòi hỏi các tập dữ liệu lớn để đào tạo, trong khi mô hình máy học có thể đạt được kết quả đáng kể với các tập dữ liệu nhỏ hơn và đơn giản hơn. Do đó, máy học được ưa chuộng hơn học sâu khi đối mặt với các tập dữ liệu cấu trúc nhỏ.
2. Đơn Giản Và Giải Thích
Mô hình máy học truyền thống được xây dựng trên các mô hình thống kê và xác suất đơn giản. Ví dụ, một đường thẳng phù hợp nhất trong hồi quy tuyến tính thiết lập mối quan hệ đầu vào-đầu ra bằng phương pháp least squares, một hoạt động thống kê.
Tương tự, cây quyết định sử dụng các nguyên tắc xác suất để phân loại dữ liệu. Việc sử dụng các nguyên tắc như vậy cung cấp khả năng giải thích và làm cho nó dễ dàng hơn cho các nhà thực hành trí tuệ nhân tạo để hiểu cách thức hoạt động của các thuật toán máy học.
Các kiến trúc mạng nơ-ron hiện đại như biến đổi và mô hình khuếch tán (thường được sử dụng để tạo hình ảnh như Stable Diffusion hoặc Midjourney) có một cấu trúc mạng đa lớp phức tạp. Hiểu các mạng như vậy đòi hỏi sự hiểu biết về các khái niệm toán học tiên tiến. Đó là lý do tại sao chúng cũng được gọi là ‘Hộp Đen.’
3. Hiệu Suất Tài Nguyên
Mạng nơ-ron hiện đại như Mô hình Ngôn ngữ Lớn (LLM) được đào tạo trên các cụm GPU đắt tiền theo yêu cầu tính toán của chúng. Ví dụ, GPT4 được báo cáo là được đào tạo trên 25000 Nvidia GPU trong 90 đến 100 ngày.
Tuy nhiên, phần cứng đắt tiền và thời gian đào tạo dài không phải là khả thi cho mọi nhà thực hành hoặc nhóm trí tuệ nhân tạo. Mặt khác, hiệu suất tính toán của các thuật toán máy học truyền thống cho phép các nhà thực hành đạt được kết quả có ý nghĩa ngay cả với tài nguyên hạn chế.
4. Không Tất Cả Các Vấn Đề Cần Học Sâu
Học Sâu không phải là giải pháp tuyệt đối cho tất cả các vấn đề. Có những tình huống mà máy học vượt trội so với học sâu.
Ví dụ, trong chẩn đoán và dự đoán y tế với dữ liệu hạn chế, một thuật toán máy học cho phát hiện bất thường như REMED mang lại kết quả tốt hơn học sâu. Tương tự, máy học truyền thống quan trọng trong các tình huống có khả năng tính toán thấp như một giải pháp linh hoạt và hiệu quả.
Chủ yếu, việc lựa chọn mô hình tốt nhất cho bất kỳ vấn đề nào phụ thuộc vào nhu cầu của tổ chức hoặc nhà thực hành và bản chất của vấn đề.
Máy Học Trong Năm 2023

Hình Ảnh Được Tạo Bằng Leonardo AI
Trong năm 2023, máy học truyền thống tiếp tục phát triển và đang cạnh tranh với học sâu và trí tuệ nhân tạo tạo sinh. Nó có nhiều ứng dụng trong ngành, đặc biệt là khi đối mặt với các tập dữ liệu cấu trúc.
Ví dụ, nhiều công ty Hàng Tiêu Dùng Nhanh Chuyển (FMCG) phải đối mặt với lượng lớn dữ liệu bảng và dựa vào các thuật toán máy học cho các nhiệm vụ quan trọng như đề xuất sản phẩm cá nhân hóa, tối ưu hóa giá, quản lý hàng tồn kho và tối ưu hóa chuỗi cung ứng.
Thêm vào đó, nhiều mô hình thị giác và ngôn ngữ vẫn dựa trên các kỹ thuật truyền thống, cung cấp giải pháp trong các phương pháp kết hợp và ứng dụng mới nổi. Ví dụ, một nghiên cứu gần đây có tiêu đề “Liệu Chúng Ta Thực Sự Cần Các Mô Hình Học Sâu Cho Dự Báo Chuỗi Thời Gian?” đã thảo luận về cách cây hồi quy tăng cường (GBRTs) hiệu quả hơn dự báo chuỗi thời gian so với mạng nơ-ron sâu.
Khả năng giải thích của máy học vẫn rất quý giá với các kỹ thuật như SHAP (Giải Thích Thêm của Shapley) và LIME (Giải Thích Mô Hình Địa Phương). Những kỹ thuật này giải thích các mô hình máy học phức tạp và cung cấp thông tin về dự đoán của chúng, giúp các nhà thực hành máy học hiểu mô hình của mình tốt hơn.
Cuối cùng, máy học truyền thống vẫn là một giải pháp mạnh mẽ cho nhiều ngành công nghiệp, giải quyết các vấn đề về khả năng mở rộng, phức tạp dữ liệu và hạn chế tài nguyên. Những thuật toán này là không thể thay thế cho phân tích dữ liệu và mô hình hóa dự đoán và sẽ tiếp tục là một phần của vũ khí của nhà khoa học dữ liệu.
Nếu các chủ đề như thế này thu hút bạn, hãy khám phá Unite AI để có thêm thông tin.












