Connect with us

Kecerdasan buatan

Apa itu Privasi Diferensial?

mm

Kita hidup di era big data, yang telah memfokuskan perhatian lebih banyak pada topik privasi data. Manusia menghasilkan jumlah data yang luar biasa setiap detik, dan perusahaan menggunakan data ini untuk berbagai aplikasi. Dengan penyimpanan dan berbagi data pada kecepatan yang belum pernah terjadi sebelumnya, harus ada lebih banyak teknik perlindungan privasi. 

Privasi diferensial adalah salah satu pendekatan untuk melindungi data pribadi, dan telah terbukti lebih efektif daripada banyak metode tradisional kita. Ini dapat didefinisikan sebagai sistem untuk berbagi informasi tentang dataset secara publik dengan menggambarkan pola kelompok dalam dataset sambil menyembunyikan informasi tentang individu dalam dataset. 

Privasi diferensial memungkinkan peneliti dan analis database untuk mendapatkan informasi berharga dari database tanpa mengungkapkan informasi identifikasi pribadi tentang individu. Ini sangat penting karena banyak database mengandung berbagai informasi pribadi. 

Cara lain untuk melihat privasi diferensial adalah bahwa itu menciptakan data anonim dengan menyuntikkan noise ke dalam dataset. Noise yang dimasukkan membantu melindungi privasi sambil tetap membatasi sehingga analis dapat menggunakan data dengan andal. 

Anda dapat memiliki dua dataset yang hampir identik. Satu dengan informasi pribadi Anda dan satu tanpa itu. Dengan privasi diferensial, Anda dapat memastikan bahwa probabilitas bahwa kueri statistik akan menghasilkan hasil tertentu adalah sama terlepas dari database mana yang digunakan.

Bagaimana Privasi Diferensial Bekerja? 

Cara privasi diferensial bekerja adalah dengan memperkenalkan parameter kerugian privasi atau anggaran privasi, yang sering ditunjukkan sebagai epsilon (ε), ke dataset. Parameter ini mengontrol seberapa banyak noise atau keacakan yang ditambahkan ke dataset mentah. 

Misalnya, bayangkan Anda memiliki kolom dalam dataset dengan jawaban “Ya” / “Tidak” dari individu. 

Sekarang, anggaplah Anda membalik koin untuk setiap individu: 

  • Mata Uang: jawaban dibiarkan apa adanya.
  • Ekor: Anda membalik koin kedua, merekam jawaban sebagai “Ya” jika mata uang dan “Tidak” jika ekor, terlepas dari jawaban sebenarnya. 

Dengan menggunakan proses ini, Anda menambahkan keacakan ke data. Dengan jumlah data yang besar dan informasi dari mekanisme penambahan noise, dataset akan tetap akurat dalam hal pengukuran agregat. Privasi datang dengan memungkinkan setiap individu untuk menyangkal jawaban sebenarnya berkat proses randomisasi. 

Meskipun ini adalah contoh sederhana dari privasi diferensial, ini menyediakan pemahaman dasar. Dalam aplikasi dunia nyata, algoritma lebih kompleks. 

Juga penting untuk dicatat bahwa privasi diferensial dapat diimplementasikan secara lokal, di mana noise ditambahkan ke data individu sebelum disentralisasi dalam database, atau secara global, di mana noise ditambahkan ke data mentah setelah dikumpulkan dari individu. 

Contoh Privasi Diferensial

Privasi diferensial diterapkan di berbagai aplikasi seperti sistem rekomendasi, jaringan sosial, dan layanan berbasis lokasi. 

Berikut beberapa contoh tentang bagaimana perusahaan besar menggunakan privasi diferensial: 

  • Apple menggunakan metode ini untuk mengumpulkan wawasan penggunaan anonim dari perangkat seperti iPhone dan Mac.

  • Facebook menggunakan privasi diferensial untuk mengumpulkan data perilaku yang dapat digunakan untuk kampanye iklan yang ditargetkan.

  • Amazon mengandalkan teknik ini untuk mendapatkan wawasan tentang preferensi belanja pribadi sambil menyembunyikan informasi sensitif. 

Apple telah sangat transparan tentang penggunaan privasi diferensial untuk mendapatkan wawasan tentang pengguna sambil menjaga privasi mereka. 

“Apple telah mengadopsi dan lebih mengembangkan teknik yang dikenal di dunia akademis sebagai privasi diferensial lokal untuk melakukan sesuatu yang sangat menarik: mendapatkan wawasan tentang apa yang dilakukan banyak pengguna Apple, sambil membantu menjaga privasi pengguna individu. Ini adalah teknik yang memungkinkan Apple untuk mempelajari tentang komunitas pengguna tanpa mempelajari tentang individu dalam komunitas. Privasi diferensial mengubah informasi yang dibagikan dengan Apple sebelum meninggalkan perangkat pengguna sehingga Apple tidak pernah dapat mereproduksi data sebenarnya.”

 – Ringkasan Privasi Diferensial Apple 

Aplikasi Privasi Diferensial

Karena kita hidup di era big data, ada banyak pelanggaran data yang mengancam pemerintah, organisasi, dan perusahaan. Pada saat yang sama, aplikasi pembelajaran mesin saat ini bergantung pada teknik pembelajaran yang memerlukan sejumlah besar data pelatihan, sering berasal dari individu. Lembaga penelitian juga menggunakan dan berbagi data dengan informasi rahasia. Pengungkapan data yang tidak tepat dengan cara apa pun dapat menyebabkan banyak masalah bagi individu dan organisasi, dan dalam kasus yang parah, dapat menyebabkan tanggung jawab sipil. 

Model privasi formal seperti privasi diferensial menangani semua masalah ini. Mereka digunakan untuk melindungi informasi pribadi, lokasi waktu nyata, dan lain-lain. 

Dengan menggunakan privasi diferensial, perusahaan dapat mengakses sejumlah besar data sensitif untuk penelitian atau bisnis tanpa mengompromikan data. Lembaga penelitian juga dapat mengembangkan teknologi privasi diferensial khusus untuk mengotomatisasi proses privasi di komunitas berbagi cloud, yang semakin populer. 

Mengapa Menggunakan Privasi Diferensial? 

Privasi diferensial menawarkan beberapa properti utama yang membuatnya menjadi kerangka yang sangat baik untuk menganalisis data pribadi sambil memastikan privasi: 

  • Kuantifikasi Kerugian Privasi: Mekanisme dan algoritma privasi diferensial dapat mengukur kerugian privasi, yang memungkinkan untuk dibandingkan dengan teknik lain.

  • Komposisi: Karena Anda dapat mengukur kerugian privasi, Anda juga dapat menganalisis dan mengontrolnya selama beberapa perhitungan, memungkinkan pengembangan algoritma yang berbeda.

  • Privasi Kelompok: Selain tingkat individu, privasi diferensial memungkinkan Anda untuk menganalisis dan mengontrol kerugian privasi di antara kelompok yang lebih besar.

  • Aman dalam Pascaproses: Privasi diferensial tidak dapat dirugikan oleh pascaproses. Misalnya, analis data tidak dapat menghitung fungsi dari output algoritma privasi diferensial dan membuatnya kurang privasi diferensial. 

Manfaat Privasi Diferensial

Seperti yang kita sebutkan sebelumnya, privasi diferensial lebih baik daripada banyak teknik privasi tradisional. Misalnya, jika semua informasi yang tersedia adalah informasi yang diidentifikasi, privasi diferensial membuatnya lebih mudah untuk mengidentifikasi semua elemen data. Ini juga tahan terhadap serangan privasi berbasis informasi tambahan, mencegah serangan yang dapat dilakukan pada data yang diidentifikasi. 

Salah satu manfaat terbesar dari privasi diferensial adalah bahwa itu komposisional, yang berarti Anda dapat menghitung kerugian privasi dari melakukan dua analisis privasi diferensial atas data yang sama. Ini dilakukan dengan menjumlahkan kerugian privasi individu untuk kedua analisis. 

Meskipun privasi diferensial adalah alat baru dan dapat sulit untuk dicapai di luar komunitas penelitian, solusi yang mudah diimplementasikan untuk privasi data menjadi lebih mudah diakses. Di masa depan, kita harus melihat peningkatan jumlah solusi ini tersedia untuk masyarakat yang lebih luas. 

Alex McFarland adalah seorang jurnalis dan penulis AI yang menjelajahi perkembangan terbaru dalam kecerdasan buatan. Ia telah berkolaborasi dengan berbagai startup dan publikasi AI di seluruh dunia.