Kecerdasan Buatan
Apakah Pembelajaran Mesin Tradisional Masih Relevan?

Dalam beberapa tahun terakhir, AI Generatif telah menunjukkan hasil yang menjanjikan dalam menyelesaikan tugas-tugas AI yang kompleks. Model AI modern seperti ChatGPT, Penyair, Panggilan, DALL-E.3, dan SAM telah menunjukkan kemampuan luar biasa dalam memecahkan masalah multidisiplin seperti menjawab pertanyaan visual, segmentasi, penalaran, dan pembuatan konten.
Bahkan, AI multimodal teknik telah muncul, mampu memproses berbagai modalitas data, yaitu teks, gambar, audio, dan video secara bersamaan. Dengan kemajuan ini, wajar jika kita bertanya-tanya: Apakah kita sudah mendekati akhir dari krisis ini? pembelajaran mesin tradisional (ML)?
Dalam artikel ini, kita akan melihat kondisi lanskap pembelajaran mesin tradisional terkait inovasi AI generatif modern.
Apa itu Pembelajaran Mesin Tradisional? – Apa Keterbatasannya?
Pembelajaran mesin tradisional adalah istilah luas yang mencakup berbagai macam algoritma yang terutama didorong oleh statistik. Dua jenis utama algoritma ML tradisional adalah diawasi dan tidak diawasi. Algoritme ini dirancang untuk mengembangkan model dari kumpulan data terstruktur.
Algoritme pembelajaran mesin tradisional standar meliputi:
- Algoritma regresi seperti linear, laso, dan ridge.
- Pengelompokan K-means.
- Analisis Komponen Utama (PCA).
- Mendukung Mesin Vektor (SVM).
- Algoritme berbasis pohon seperti pohon keputusan dan hutan acak.
- Meningkatkan model seperti peningkatan gradien dan XGBoost.
Keterbatasan Pembelajaran Mesin Tradisional
ML tradisional memiliki batasan berikut:
- Skalabilitas Terbatas: Model ini sering kali memerlukan bantuan untuk menskalakannya dengan kumpulan data yang besar dan beragam.
- Pemrosesan Awal Data dan Rekayasa Fitur: ML tradisional memerlukan prapemrosesan ekstensif untuk mengubah kumpulan data sesuai kebutuhan model. Selain itu, rekayasa fitur dapat memakan waktu dan memerlukan beberapa iterasi untuk menangkap hubungan kompleks antar fitur data.
- Data Dimensi Tinggi dan Tidak Terstruktur: ML tradisional kesulitan dengan tipe data kompleks seperti gambar, audio, video, dan dokumen.
- Kemampuan Beradaptasi terhadap Data yang Tak Terlihat: Model-model ini mungkin tidak beradaptasi dengan baik terhadap data dunia nyata yang bukan merupakan bagian dari model mereka data pelatihan.
Neural Network: Beralih dari Machine Learning ke Deep Learning & Beyond
Model jaringan saraf (NN) jauh lebih rumit dibandingkan model Machine Learning tradisional. NN paling sederhana – Perceptron multi-lapis (MLP) terdiri dari beberapa neuron yang terhubung bersama untuk memahami informasi dan melakukan tugas, mirip dengan fungsi otak manusia.
Kemajuan dalam teknik jaringan saraf telah menjadi dasar untuk transisi dari pembelajaran mesin hingga pembelajaran mendalam. Misalnya, NN yang digunakan untuk tugas computer vision (deteksi objek dan segmentasi gambar) disebut jaringan saraf konvolusional (CNN), Seperti AlexNet, ResNet, dan YOLO.
Saat ini, teknologi AI generatif membawa teknik jaringan saraf selangkah lebih maju, sehingga memungkinkannya unggul dalam berbagai domain AI. Misalnya, jaringan saraf yang digunakan untuk tugas pemrosesan bahasa alami (seperti peringkasan teks, menjawab pertanyaan, dan terjemahan) dikenal sebagai transformer. Model trafo terkemuka meliputi BERTI, GPT-4, dan T5. Model-model ini menciptakan dampak pada industri mulai dari layanan kesehatan, ritel, pemasaran, keuangan, Dll
Apakah Kita Masih Membutuhkan Algoritma Machine Learning Tradisional?
Meskipun jaringan neural dan varian modernnya seperti transformator telah mendapat banyak perhatian, metode ML tradisional tetap penting. Mari kita lihat mengapa hal tersebut masih relevan.
1. Persyaratan Data yang Lebih Sederhana
Jaringan neural memerlukan kumpulan data yang besar untuk pelatihan, sedangkan model ML dapat mencapai hasil yang signifikan dengan kumpulan data yang lebih kecil dan sederhana. Oleh karena itu, ML lebih disukai dibandingkan pembelajaran mendalam untuk kumpulan data terstruktur yang lebih kecil dan sebaliknya.
2. Kesederhanaan dan Interpretabilitas
Model pembelajaran mesin tradisional dibuat berdasarkan model statistik dan probabilitas yang lebih sederhana. Misalnya, jalur yang paling sesuai regresi linier menetapkan hubungan input-output menggunakan metode kuadrat terkecil, sebuah operasi statistik.
Demikian pula, pohon keputusan menggunakan prinsip probabilistik untuk mengklasifikasikan data. Penggunaan prinsip-prinsip tersebut menawarkan interpretabilitas dan memudahkan praktisi AI untuk memahami cara kerja algoritma ML.
Arsitektur NN modern seperti model transformator dan difusi (biasanya digunakan untuk pembuatan gambar seperti Difusi Stabil or tengah perjalanan) memiliki struktur jaringan berlapis-lapis yang kompleks. Memahami jaringan seperti itu memerlukan pemahaman tentang konsep matematika tingkat lanjut. Itu sebabnya mereka juga disebut sebagai 'Kotak Hitam'.
3. Efisiensi Sumber Daya
Jaringan saraf modern seperti Model Bahasa Besar (LLM) dilatih pada kelompok GPU yang mahal sesuai kebutuhan komputasinya. Misalnya, GPT4 dilaporkan dilatih 25000 GPU Nvidia selama 90 sampai 100 hari.
Namun, perangkat keras yang mahal dan waktu pelatihan yang lama tidak dapat dilakukan oleh setiap praktisi atau tim AI. Di sisi lain, efisiensi komputasi algoritma pembelajaran mesin tradisional memungkinkan praktisi mencapai hasil yang berarti bahkan dengan sumber daya yang terbatas.
4. Tidak Semua Masalah Perlu Pembelajaran Mendalam
Belajar mendalam bukanlah solusi mutlak untuk semua permasalahan. Ada skenario tertentu ketika ML mengungguli pembelajaran mendalam.
Misalnya, di diagnosis dan prognosis medis dengan data terbatas, algoritma ML untuk deteksi anomali seperti REMED memberikan hasil yang lebih baik daripada pembelajaran mendalam. Demikian pula, pembelajaran mesin tradisional sangat penting dalam skenario dengan kapasitas komputasi yang rendah solusi yang fleksibel dan efisien.
Pada dasarnya, pemilihan model terbaik untuk setiap permasalahan bergantung pada kebutuhan organisasi atau praktisi dan sifat permasalahan yang dihadapi.
Pembelajaran Mesin pada tahun 2023
Gambar Dihasilkan Menggunakan Leonardo A.I.
Pada tahun 2023, pembelajaran mesin tradisional terus berkembang dan bersaing dengan pembelajaran mendalam dan AI generatif. Ini memiliki beberapa kegunaan dalam industri, terutama ketika berhadapan dengan kumpulan data terstruktur.
Misalnya, banyak Barang Konsumen yang Bergerak Cepat (FMCG) perusahaan menangani sebagian besar data tabular yang mengandalkan algoritme ML untuk tugas-tugas penting seperti rekomendasi produk yang dipersonalisasi, pengoptimalan harga, manajemen inventaris, dan pengoptimalan rantai pasokan.
Lebih jauh lagi, banyak model visi dan bahasa masih didasarkan pada teknik tradisional, menawarkan solusi dalam pendekatan hibrida dan aplikasi yang baru muncul. Misalnya, sebuah studi baru-baru ini berjudul “Apakah Kita Benar-Benar Membutuhkan Model Pembelajaran Mendalam untuk Peramalan Deret Waktu?” telah membahas bagaimana pohon regresi penguat gradien (GBRT) lebih efisien untuk peramalan seri waktu daripada jaringan saraf dalam.
Interpretabilitas ML tetap sangat berharga dengan teknik seperti itu BENTUK (Penjelasan Aditif Shapley) dan JERUK NIPIS (Penjelasan Model-agnostik Lokal yang Dapat Ditafsirkan). Teknik-teknik ini menjelaskan model ML yang kompleks dan memberikan wawasan tentang prediksinya, sehingga membantu praktisi ML memahami model mereka dengan lebih baik.
Terakhir, pembelajaran mesin tradisional tetap menjadi solusi tangguh bagi beragam industri dalam mengatasi skalabilitas, kompleksitas data, dan keterbatasan sumber daya. Algoritme ini tidak tergantikan untuk analisis data dan pemodelan prediktif dan akan terus menjadi bagian dari a gudang ilmuwan data.
Jika topik seperti ini membuat Anda penasaran, jelajahi Satukan AI untuk wawasan lebih lanjut.