Etika

Peneliti Mencari Bantuan dari Neurosaintis untuk Mengatasi Bias Dataset

Published March 4, 2022

Updated April 28, 2026

Alex McFarland

Sebuah tim peneliti di MIT, Harvard University, dan Fujitsu, Ltd. mencari cara untuk mengatasi bias dataset pada model machine learning. Mereka menggunakan pendekatan neurosains untuk mempelajari bagaimana data pelatihan mempengaruhi kemampuan jaringan neural buatan untuk mengenali objek yang belum pernah dilihat sebelumnya.

Penelitian ini dipublikasikan di Nature Machine Intelligence.

Keanekaragaman Data Pelatihan

Hasil penelitian menunjukkan bahwa keanekaragaman data pelatihan mempengaruhi kemampuan jaringan neural untuk mengatasi bias. Namun, keanekaragaman data juga dapat memiliki dampak negatif pada kinerja jaringan. Peneliti juga menunjukkan bahwa cara jaringan neural dilatih juga dapat mempengaruhi kemampuan untuk mengatasi dataset yang bias.

Xavier Boix adalah ilmuwan peneliti di Departemen Otak dan Ilmu Kognitif (BCS) dan Pusat untuk Otak, Pikiran, dan Mesin (CBMM). Ia juga merupakan penulis senior dari makalah tersebut.

“Jaringan neural dapat mengatasi bias dataset, yang sangat menggembirakan. Namun, kesimpulan utama di sini adalah bahwa kita perlu mempertimbangkan keanekaragaman data. Kita perlu berhenti berpikir bahwa jika kita hanya mengumpulkan sejumlah besar data mentah, itu akan membawa kita ke suatu tempat. Kita perlu sangat berhati-hati tentang bagaimana kita merancang dataset dari awal,” kata Boix.

Tim tersebut menerima pendekatan neurosains untuk mengembangkan pendekatan baru. Menurut Boix, sangat umum untuk menggunakan dataset yang terkendali dalam eksperimen, sehingga tim tersebut membangun dataset yang berisi gambar objek yang berbeda dalam berbagai pose. Mereka kemudian mengendalikan kombinasi sehingga beberapa dataset lebih beragam daripada yang lain. Dataset dengan lebih banyak gambar yang menunjukkan objek dari satu sudut pandang saja kurang beragam, sedangkan dataset dengan lebih banyak gambar yang menunjukkan objek dari beberapa sudut pandang lebih beragam.

Peneliti tersebut mengambil dataset tersebut dan menggunakan untuk melatih jaringan neural untuk klasifikasi gambar. Mereka kemudian mempelajari seberapa baik jaringan tersebut dalam mengidentifikasi objek dari sudut pandang yang tidak dilihat selama pelatihan.

Mereka menemukan bahwa dataset yang lebih beragam memungkinkan jaringan untuk lebih baik menggeneralisasi gambar atau sudut pandang baru, dan ini sangat penting untuk mengatasi bias.

“Namun, bukan berarti lebih banyak keanekaragaman data selalu lebih baik; ada ketegangan di sini. Ketika jaringan neural menjadi lebih baik dalam mengenali hal-hal baru yang belum pernah dilihat, maka akan menjadi lebih sulit bagi jaringan untuk mengenali hal-hal yang sudah dilihat sebelumnya,” kata Boix.

Metode Pelatihan Jaringan Neural

Tim tersebut juga menemukan bahwa model yang dilatih secara terpisah untuk setiap tugas lebih baik dalam mengatasi bias dibandingkan dengan model yang dilatih untuk kedua tugas secara bersamaan.

“Hasilnya sangat mengejutkan. Bahkan, pertama kali kami melakukan eksperimen ini, kami pikir itu adalah kesalahan. Butuh beberapa minggu bagi kami untuk menyadari bahwa itu adalah hasil yang nyata karena sangat tidak terduga,” lanjut Boix.

Analisis yang lebih dalam menunjukkan bahwa spesialisasi neuron terlibat dalam proses ini. Ketika jaringan neural dilatih untuk mengenali objek dalam gambar, dua jenis neuron muncul. Satu neuron berspesialisasi dalam mengenali kategori objek, sedangkan neuron lainnya berspesialisasi dalam mengenali sudut pandang.

Neuron yang berspesialisasi menjadi lebih menonjol ketika jaringan dilatih untuk melakukan tugas secara terpisah. Namun, ketika jaringan dilatih untuk menyelesaikan kedua tugas secara bersamaan, beberapa neuron menjadi kurang spesifik. Ini berarti mereka tidak berspesialisasi dalam satu tugas, dan mereka lebih rentan untuk menjadi bingung.

“Namun, pertanyaan berikutnya sekarang adalah, bagaimana neuron tersebut muncul? Anda melatih jaringan neural dan mereka muncul dari proses pembelajaran. Tidak ada yang mengatakan kepada jaringan untuk memasukkan jenis neuron ini dalam arsitektur. Itu adalah hal yang sangat menarik,” kata Boix.

Peneliti tersebut akan mencari untuk menjelajahi pertanyaan ini dalam pekerjaan mereka di masa depan, serta menerapkan pendekatan baru untuk tugas yang lebih kompleks.

Alex McFarland

Alex McFarland adalah seorang jurnalis dan penulis AI yang menjelajahi perkembangan terbaru dalam kecerdasan buatan. Ia telah berkolaborasi dengan berbagai startup dan publikasi AI di seluruh dunia.

Unite.AI

Peneliti Mencari Bantuan dari Neurosaintis untuk Mengatasi Bias Dataset

Keanekaragaman Data Pelatihan

Metode Pelatihan Jaringan Neural

You may like