potongan Apa itu Pembelajaran Mendalam? (2024) - Bersatu.AI
Terhubung dengan kami

AI 101

Apa itu Deep Learning?

mm
Updated on

Pembelajaran mendalam adalah salah satu bidang kecerdasan buatan yang paling berpengaruh dan paling cepat berkembang. Namun, mendapatkan pemahaman intuitif tentang pembelajaran mendalam bisa jadi sulit karena istilah pembelajaran mendalam mencakup berbagai algoritma dan teknik yang berbeda. Pembelajaran mendalam juga merupakan subdisiplin pembelajaran mesin secara umum, jadi penting untuk memahami apa itu pembelajaran mesin agar dapat memahami pembelajaran mendalam.

Apa itu Pembelajaran Mesin?

Belajar mendalam adalah perluasan dari beberapa konsep yang berasal dari pembelajaran mesin, oleh karena itu, mari luangkan waktu sejenak untuk menjelaskan apa itu pembelajaran mesin.

Sederhananya, pembelajaran mesin adalah metode yang memungkinkan komputer melakukan tugas tertentu tanpa secara eksplisit mengkodekan setiap baris algoritme yang digunakan untuk menyelesaikan tugas tersebut. Ada banyak algoritma pembelajaran mesin yang berbeda, tetapi salah satu algoritma yang paling umum digunakan adalah a perceptron berlapis-lapis. Perceptron multilayer juga disebut sebagai jaringan saraf, dan terdiri dari serangkaian node / neuron yang dihubungkan bersama. Ada tiga lapisan yang berbeda dalam perceptron multilayer: lapisan input, lapisan tersembunyi, dan lapisan output.

Lapisan input membawa data ke dalam jaringan, di mana data tersebut dimanipulasi oleh node di lapisan tengah/tersembunyi. Simpul di lapisan tersembunyi adalah fungsi matematika yang dapat memanipulasi data yang berasal dari lapisan input, mengekstraksi pola yang relevan dari data input. Beginilah cara jaringan saraf "belajar". Jaringan saraf mendapatkan namanya dari fakta bahwa mereka terinspirasi oleh struktur dan fungsi otak manusia.

Hubungan antar node dalam jaringan memiliki nilai yang disebut bobot. Nilai-nilai ini pada dasarnya adalah asumsi tentang bagaimana data dalam satu lapisan terkait dengan data di lapisan berikutnya. Saat jaringan melatih, bobot disesuaikan, dan tujuannya adalah agar bobot/asumsi tentang data pada akhirnya akan menyatu pada nilai yang secara akurat mewakili pola bermakna dalam data.

Fungsi aktivasi hadir di node jaringan, dan fungsi aktivasi ini mengubah data secara non-linier, memungkinkan jaringan untuk mempelajari representasi data yang kompleks. Fungsi aktivasi mengalikan nilai input dengan nilai bobot dan menambahkan istilah bias.

Apa itu Deep Learning?

Pembelajaran mendalam adalah istilah yang diberikan untuk arsitektur pembelajaran mesin yang menggabungkan banyak perceptron multilayer bersama-sama, sehingga tidak hanya ada satu lapisan tersembunyi tetapi banyak lapisan tersembunyi. Semakin "dalam" jaringan saraf dalam, semakin canggih pola yang dapat dipelajari jaringan.

Jaringan lapisan dalam yang terdiri dari neuron kadang-kadang disebut sebagai jaringan yang terhubung sepenuhnya atau lapisan yang terhubung sepenuhnya, merujuk pada fakta bahwa neuron tertentu mempertahankan koneksi ke semua neuron yang mengelilinginya. Jaringan yang terhubung sepenuhnya dapat digabungkan dengan fungsi pembelajaran mesin lainnya untuk membuat arsitektur pembelajaran mendalam yang berbeda.

Berbagai Jenis Pembelajaran Mendalam

Ada berbagai arsitektur pembelajaran mendalam yang digunakan oleh para peneliti dan insinyur, dan masing-masing arsitektur yang berbeda memiliki kasus penggunaan khusus.

Jaringan Saraf Konvolusional

Jaringan saraf convolutional, atau CNN, adalah arsitektur jaringan saraf yang biasa digunakan dalam pembuatan sistem visi komputer. Struktur jaringan saraf konvolusional memungkinkan mereka menafsirkan data gambar, mengubahnya menjadi angka-angka yang dapat diinterpretasikan oleh jaringan yang terhubung sepenuhnya. CNN memiliki empat komponen utama:

  • Lapisan konvolusional
  • Lapisan subsampling/pooling
  • Fungsi aktivasi
  • Lapisan yang terhubung sepenuhnya

Lapisan konvolusional adalah apa yang mengambil gambar sebagai masukan ke dalam jaringan, menganalisis gambar dan mendapatkan nilai piksel. Subsampling atau pooling adalah tempat nilai citra dikonversi/dikurangi untuk menyederhanakan representasi citra dan mengurangi sensitivitas filter citra terhadap noise. Fungsi aktivasi mengontrol bagaimana data mengalir dari satu lapisan ke lapisan berikutnya, dan lapisan yang terhubung sepenuhnya adalah yang menganalisis nilai yang mewakili gambar dan mempelajari pola yang ada pada nilai tersebut.

RNN/LSTM

Jaringan saraf berulang, atau RNN, populer untuk tugas-tugas yang mengutamakan urutan data, dan jaringan harus mempelajari urutan data. RNN biasanya diterapkan pada masalah seperti pemrosesan bahasa alami, karena urutan kata penting saat menguraikan makna sebuah kalimat. Bagian "berulang" dari istilah Jaringan Syaraf Berulang berasal dari fakta bahwa keluaran untuk elemen tertentu dalam suatu urutan bergantung pada penghitungan sebelumnya dan juga penghitungan saat ini. Tidak seperti bentuk jaringan saraf dalam lainnya, RNN memiliki “memori”, dan informasi yang dihitung pada langkah waktu berbeda dalam rangkaian digunakan untuk menghitung nilai akhir.

Ada beberapa jenis RNN, termasuk RNN ​​dua arah, yang memperhitungkan item masa depan dalam urutan, selain item sebelumnya, saat menghitung nilai item. Jenis RNN lainnya adalah a Memori Jangka Pendek Panjang, atau LSTM, jaringan. LSTM adalah jenis RNN yang dapat menangani rangkaian data yang panjang. RNN biasa mungkin menjadi korban dari sesuatu yang disebut "masalah gradien yang meledak". Masalah ini terjadi ketika rangkaian input data menjadi sangat panjang, tetapi LSTM memiliki teknik untuk mengatasi masalah ini.

Autoencoder

Sebagian besar arsitektur pembelajaran mendalam yang disebutkan sejauh ini diterapkan pada masalah pembelajaran yang diawasi, bukan tugas pembelajaran tanpa pengawasan. Autoencoder mampu mengubah data yang tidak diawasi menjadi format yang diawasi, sehingga memungkinkan jaringan saraf digunakan untuk mengatasi masalah tersebut.

Autoencoder sering digunakan untuk mendeteksi anomali dalam kumpulan data, contoh pembelajaran tanpa pengawasan karena sifat anomali tidak diketahui. Contoh deteksi anomali tersebut termasuk deteksi penipuan untuk lembaga keuangan. Dalam konteks ini, tujuan autoencoder adalah untuk menentukan garis dasar pola reguler dalam data dan mengidentifikasi anomali atau outlier.

Struktur autoencoder seringkali simetris, dengan lapisan-lapisan tersembunyi disusun sedemikian rupa sehingga keluaran jaringan menyerupai masukan. Empat jenis autoencoder yang sering digunakan adalah:

  • Autoencoder biasa/biasa
  • Encoder multilayer
  • Encoder konvolusional
  • Pembuat enkode reguler

Autoencoder biasa/polos hanyalah jaringan saraf dengan satu lapisan tersembunyi, sedangkan autoencoder multilayer adalah jaringan dalam dengan lebih dari satu lapisan tersembunyi. Autoencoder konvolusional menggunakan lapisan konvolusional alih-alih, atau sebagai tambahan, lapisan yang terhubung sepenuhnya. Autoencoder terregulasi menggunakan jenis fungsi kerugian tertentu yang memungkinkan jaringan neural melakukan fungsi yang lebih kompleks, fungsi selain hanya menyalin input ke output.

Jaringan Adversarial Generatif

Jaringan Permusuhan Generatif (GAN) sebenarnya adalah beberapa jaringan saraf yang dalam, bukan hanya satu jaringan. Dua model deep learning dilatih pada saat yang sama, dan keluarannya disalurkan ke jaringan lain. Jaringan bersaing satu sama lain, dan karena mereka mendapatkan akses ke data keluaran masing-masing, keduanya belajar dari data ini dan berkembang. Kedua jaringan tersebut pada dasarnya memainkan permainan pemalsuan dan deteksi, di mana model generatif mencoba membuat contoh baru yang akan menipu model detektif/diskriminator. GAN telah menjadi populer di bidang visi komputer.

Ringkasan Pembelajaran Mendalam

Pembelajaran mendalam memperluas prinsip jaringan saraf untuk membuat model canggih yang dapat mempelajari pola kompleks dan menggeneralisasi pola tersebut ke kumpulan data di masa mendatang. Jaringan saraf convolutional digunakan untuk menginterpretasikan gambar, sedangkan RNNs/LSTMs digunakan untuk menginterpretasikan data sekuensial. Autoencoder dapat mengubah tugas pembelajaran tanpa pengawasan menjadi tugas pembelajaran yang diawasi. Terakhir, GAN adalah beberapa jaringan yang diadu satu sama lain yang sangat berguna untuk tugas visi komputer.

Blogger dan programmer dengan spesialisasi di Pembelajaran mesin dan Belajar mendalam topik. Daniel berharap dapat membantu orang lain menggunakan kekuatan AI untuk kebaikan sosial.