Kecerdasan buatan

Apa itu Privasi Diferensial?

Diterbitkan 29 November 2022

Diperbarui 23 Mei 2026

Oleh

Alex McFarland

Kami sedang hidup di era big data, yang telah memfokuskan perhatian lebih banyak pada topik privasi data. Manusia menghasilkan jumlah data yang luar biasa setiap detik, dan perusahaan menggunakan data ini untuk berbagai aplikasi. Dengan penyimpanan dan berbagi data pada tingkat yang belum pernah terjadi sebelumnya, harus ada lebih banyak teknik perlindungan privasi.

Privasi diferensial adalah salah satu pendekatan untuk melindungi data pribadi, dan telah terbukti lebih efektif daripada banyak metode tradisional kita. Ini dapat didefinisikan sebagai sistem untuk berbagi informasi tentang dataset secara publik dengan menggambarkan pola kelompok dalam dataset sambil menyembunyikan informasi tentang individu dalam dataset.

Privasi diferensial memungkinkan peneliti dan analis database untuk mendapatkan informasi berharga dari database tanpa mengungkapkan informasi identifikasi pribadi tentang individu. Ini sangat penting karena banyak database mengandung berbagai informasi pribadi.

Cara lain untuk memandang privasi diferensial adalah bahwa itu menciptakan data anonim dengan menyuntikkan kebisingan ke dalam dataset. Kebisingan yang disuntikkan membantu melindungi privasi sambil tetap membatasi sehingga analis dapat menggunakan data dengan andal.

Anda dapat memiliki dua dataset yang hampir identik. Satu dengan informasi pribadi Anda dan satu tanpa itu. Dengan privasi diferensial, Anda dapat memastikan bahwa probabilitas bahwa query statistik akan menghasilkan hasil tertentu adalah sama terlepas dari database mana yang digunakan.

Bagaimana Privasi Diferensial Bekerja?

Cara privasi diferensial bekerja adalah dengan memperkenalkan parameter privasi atau anggaran privasi, yang sering ditunjukkan sebagai epsilon (ε), ke dalam dataset. Parameter ini mengontrol seberapa banyak kebisingan atau acak yang ditambahkan ke dataset mentah.

Misalnya, bayangkan Anda memiliki kolom dalam dataset dengan jawaban “Ya” / “Tidak” dari individu.

Sekarang, anggaplah Anda membalik koin untuk setiap individu:

Mata Koin: jawaban dibiarkan apa adanya.
Ekor Koin: Anda membalik koin kedua, merekam jawaban sebagai “Ya” jika mata koin dan “Tidak” jika ekor koin, terlepas dari jawaban sebenarnya.

Dengan menggunakan proses ini, Anda menambahkan kebisingan ke dalam data. Dengan jumlah data yang besar dan informasi dari mekanisme penambahan kebisingan, dataset akan tetap akurat dalam hal pengukuran agregat. Privasi datang dengan memungkinkan setiap individu untuk menyangkal jawaban sebenarnya karena proses randomisasi.

Sementara ini adalah contoh sederhana dari privasi diferensial, ini memberikan pemahaman dasar. Dalam aplikasi dunia nyata, algoritma lebih kompleks.

Juga penting untuk dicatat bahwa privasi diferensial dapat diimplementasikan secara lokal, di mana kebisingan ditambahkan ke data individu sebelum disentralisasi dalam database, atau secara global, di mana kebisingan ditambahkan ke data mentah setelah dikumpulkan dari individu.

Contoh Privasi Diferensial

Privasi diferensial diterapkan di berbagai aplikasi seperti sistem rekomendasi, jaringan sosial, dan layanan berbasis lokasi.

Berikut beberapa contoh bagaimana perusahaan besar mengandalkan privasi diferensial:

Apple menggunakan metode ini untuk mengumpulkan wawasan penggunaan anonim dari perangkat seperti iPhone dan Mac.
Facebook menggunakan privasi diferensial untuk mengumpulkan data perilaku yang dapat digunakan untuk kampanye iklan yang ditargetkan.
Amazon mengandalkan teknik ini untuk memperoleh wawasan tentang preferensi belanja pribadi sambil menyembunyikan informasi sensitif.

Apple telah sangat transparan tentang penggunaan privasi diferensial untuk memperoleh wawasan tentang pengguna sambil menjaga privasi mereka.

“Apple telah mengadopsi dan mengembangkan teknik yang dikenal di dunia akademis sebagai privasi diferensial lokal untuk melakukan sesuatu yang sangat menarik: memperoleh wawasan tentang apa yang dilakukan banyak pengguna Apple, sambil membantu menjaga privasi pengguna individu. Ini adalah teknik yang memungkinkan Apple untuk mempelajari komunitas pengguna tanpa mempelajari individu dalam komunitas. Privasi diferensial mengubah informasi yang dibagikan dengan Apple sebelum meninggalkan perangkat pengguna sehingga Apple tidak pernah dapat mereproduksi data sebenarnya.”

– Ikhtisar Privasi Diferensial Apple

Aplikasi Privasi Diferensial

Karena kita hidup di era big data, ada banyak pelanggaran data yang mengancam pemerintah, organisasi, dan perusahaan. Pada saat yang sama, aplikasi pembelajaran mesin saat ini mengandalkan teknik pembelajaran yang memerlukan sejumlah besar data pelatihan, sering berasal dari individu. Lembaga penelitian juga menggunakan dan berbagi data dengan informasi rahasia. Pengungkapan data yang tidak tepat dapat menyebabkan banyak masalah bagi individu dan organisasi, dan dalam kasus yang parah, dapat menyebabkan tanggung jawab sipil.

Model privasi formal seperti privasi diferensial menangani semua masalah ini. Mereka digunakan untuk melindungi informasi pribadi, lokasi waktu nyata, dan lain-lain.

Dengan menggunakan privasi diferensial, perusahaan dapat mengakses sejumlah besar data sensitif untuk penelitian atau bisnis tanpa mengompromikan data. Lembaga penelitian juga dapat mengembangkan teknologi privasi diferensial khusus untuk mengotomatisasi proses privasi di komunitas berbagi cloud, yang semakin populer.

Mengapa Menggunakan Privasi Diferensial?

Privasi diferensial menawarkan beberapa properti utama yang membuatnya menjadi kerangka kerja yang sangat baik untuk menganalisis data pribadi sambil memastikan privasi:

Kuantifikasi Kerugian Privasi: Mekanisme dan algoritma privasi diferensial dapat mengukur kerugian privasi, yang memungkinkan dibandingkan dengan teknik lain.
Komposisi: Karena Anda dapat mengukur kerugian privasi, Anda juga dapat menganalisis dan mengontrolnya melalui beberapa perhitungan, memungkinkan pengembangan algoritma yang berbeda.
Privasi Kelompok: Selain tingkat individu, privasi diferensial memungkinkan Anda untuk menganalisis dan mengontrol kerugian privasi di antara kelompok yang lebih besar.
Aman dalam Pascapengolahan: Privasi diferensial tidak dapat dirusak oleh pascapengolahan. Misalnya, seorang analis data tidak dapat menghitung fungsi dari output algoritma privasi diferensial dan membuatnya kurang privasi diferensial.

Manfaat Privasi Diferensial

Seperti yang kami sebutkan sebelumnya, privasi diferensial lebih baik daripada banyak teknik privasi tradisional. Misalnya, jika semua informasi yang tersedia adalah informasi yang diidentifikasi, privasi diferensial membuatnya lebih mudah untuk mengidentifikasi semua elemen data. Ini juga tahan terhadap serangan privasi berbasis informasi tambahan, mencegah serangan yang dapat dilakukan pada data yang diidentifikasi.

Salah satu manfaat terbesar dari privasi diferensial adalah bahwa itu komposisional, yang berarti Anda dapat menghitung kerugian privasi dari melakukan dua analisis privasi diferensial di atas data yang sama. Ini dilakukan dengan menjumlahkan kerugian privasi individu untuk kedua analisis.

Sementara privasi diferensial adalah alat baru dan dapat sulit untuk dicapai di luar komunitas penelitian, solusi yang mudah diimplementasikan untuk privasi data menjadi lebih mudah diakses. Di masa depan, kita harus melihat semakin banyak solusi ini tersedia untuk masyarakat yang lebih luas.