Mengulas Tentang Kebenaran tentang data anonim terungkap

Ancaman dunia maya itu nyata
33bits – Mengikuti berita terbaru tentang keamanan siber dan pelanggaran data, tidak mengherankan jika lonceng alarm berbunyi di sekitar keamanan data kita di tangan perusahaan. Pada bulan Juli, seorang peretas memperoleh akses ke informasi pribadi 106 juta pelanggan dan pelamar bank Capital One melalui firewall yang salah konfigurasi. Pada bulan yang sama, pelanggaran data besar-besaran mempengaruhi sebagian besar penduduk Bulgaria. Sesaat sebelum itu, media melaporkan tentang hukuman menyusul pelanggaran data besar-besaran yang mempengaruhi jaringan hotel Marriott dan British Airways masing-masing. Ancaman dunia maya itu nyata dan perusahaan harus melindungi data pelanggan mereka sebelum lebih banyak orang terluka.

Mitos dan fakta tentang anonimisasi data

Mengulas Tentang Kebenaran tentang data anonim terungkap – Sebuah studi berjudul “Memperkirakan keberhasilan identifikasi ulang dalam kumpulan data yang tidak lengkap menggunakan model generatif” menyebabkan kebisingan di sekitar keamanan anonimisasi data. Studi yang diterbitkan di Nature, menunjukkan kekurangan dari apa yang disebut metode anonimisasi data tradisional atau lebih tua. Ini memicu kekhawatiran di media arus utama, dengan berita utama di New York Times, The Guardian dan CNBC, menunjukkan bahwa data anonim akan hancur. Tetapi mereka yang membaca di luar tajuk utama akan mengetahui bahwa menganonimkan data sepenuhnya adalah satu-satunya cara untuk menjaga privasi data saat ini, satu-satunya alternatif adalah tanpa data sama sekali. Tidak ada titik balik.

Mengulas Tentang Kebenaran tentang data anonim terungkap

Mengulas Tentang Kebenaran tentang data anonim terungkap

Studi ini mengajukan pertanyaan apakah data anonim benar-benar anonim, yang menimbulkan kekhawatiran publik seputar perlindungan data dan keamanan data pribadi kami. Kebenaran datang bertiga. Pertama, tidak ada satu solusi untuk anonimisasi data. Kedua, teknik anonimisasi tradisional yang lebih tua sering kali kekurangan keamanan atau utilitas. Akhirnya, ini telah diketahui di antara para peneliti privasi selama 20 tahun, yang telah secara aktif bekerja untuk menemukan metode perlindungan privasi yang lebih baik.

Ada kasus di mana individu telah diidentifikasi setelah data yang dianonimkan telah dipulihkan. Salah satu contohnya adalah kasus Netflix dari tahun 2007, ketika perusahaan streaming itu menerbitkan 10 juta peringkat film sebagai bagian dari tantangan publik, untuk menghasilkan sistem rekomendasi yang lebih baik. Data dianonimkan dengan menghapus detail pribadi dan mengganti nama dengan nomor acak, untuk melindungi privasi 500.000 pelanggan yang mengirimkan rekomendasi mereka. Dua peneliti kemudian membuktikan bahwa mereka dapat menghapus anonim beberapa data Netflix dengan membandingkan peringkat dan stempel waktu dengan informasi publik dari situs web IMDb.

Perusahaan yang berniat untuk berbagi data dengan mitra eksternal atau menggunakan jika untuk tujuan selain yang awalnya dimaksudkan harus waspada terhadap pembatasan hukum yang diajukan oleh undang-undang seperti GDPR dan CCPA. Pertimbangkan skenario berikut: Sebuah bank ingin berbagi data klien dengan perusahaan asuransi, berdasarkan kontrak yang sama untuk rekening bank dan pinjaman pribadi. Menurut GDPR, pemrosesan sekunder ini tidak akan diizinkan tanpa persetujuan eksplisit dari klien, karena tujuannya tidak sama dengan tujuan awal pemrosesan data. Ini adalah salah satu tantangan terbesar bagi perusahaan saat ini, karena hilangnya peluang analisis eksploratif yang disebabkan oleh kumpulan data yang tidak lengkap.

Baca Juga : Kebijakan Privasi Terhadap Data Pribadi

Mengapa nama samaran tidak cukup
Banyak perusahaan masih menerapkan nama samaran untuk perlindungan data, berpikir bahwa mereka melindungi data pelanggan mereka dan bahkan mungkin mereka aman secara hukum. Pseudonimisasi adalah metode tradisional untuk melindungi data yang sama dengan menghapus beberapa data sensitif, seperti nama dan nomor jaminan sosial, tetapi tidak semuanya. Pseudonimisasi tidak menghapus semua informasi yang dapat ditelusuri kembali ke individu tetapi hanya mengurangi risiko keterkaitan yang paling jelas. Data pseudonim dapat diidentifikasi ulang dengan tautan catatan dan oleh karena itu, itu sendiri bukan metode anonimisasi yang memadai menurut GDPR dan kerangka hukum lainnya. Dataset pseudonim membawa risiko identifikasi ulang yang tinggi, karena fakta bahwa mereka dapat dengan mudah dikaitkan dengan sumber data lain yang dapat mengungkapkan informasi tentang seseorang.

Meskipun nama samaran direkomendasikan untuk meminimalkan risiko, GDPR merekomendasikan agar perusahaan yang menangani data pribadi warga negara Uni Eropa, jika memungkinkan, menganonimkan data pelanggan dengan metode de-identifikasi yang sesuai sehingga tidak ada individu yang dapat diidentifikasi ulang. Anonimisasi modern, bertentangan dengan pseudonimisasi, memastikan bahwa data tidak akan pernah dapat diambil dengan cara apa pun. Singkatnya, nama samaran tidak cukup menurut hukum.Kami sebelumnya telah menulis tentang kesalahpahaman seputar data pseudonim versus anonim di sini. Undang-undang modern, seperti GDPR, menetapkan standar baru untuk metode anonimisasi data, yang merupakan langkah ke arah yang benar dalam hal privasi dan utilitas.

GDPR jelas tentang pseudonimisasi data yang tidak menjadi metode anonimisasi yang memadai dan oleh karena itu memerlukan perlindungan yang sama seperti data mentah. Resital 28 menuntut agar nama samaran “tidak dimaksudkan untuk menghalangi tindakan perlindungan data lainnya”. Resital 26 mengutip bahwa “data pribadi yang telah mengalami pseudonimisasi, yang dapat dikaitkan dengan orang alami dengan menggunakan informasi tambahan, harus dianggap sebagai informasi tentang orang alami yang dapat diidentifikasi”. Undang-undang Eropa tentang perlindungan data meminta perusahaan untuk mencari tindakan atau dukungan anonimisasi yang sesuai, untuk memastikan perlindungan data dari data pelanggan yang mereka akses. Sesuai, dalam hal ini, mengacu pada metode anonimisasi modern.

Berbagi data yang menjaga privasi berkembang pesat
Metode anonimisasi data yang buruk, yang dirujuk oleh studi Nature, membawa risiko identifikasi ulang dan rentan terhadap serangan. Sejak 1990-an, peneliti privasi terus membuktikan bahwa data yang telah dide-identifikasi sering kali dapat berhasil diidentifikasi kembali melalui hubungan catatan, misalnya. Pada akhir 1990-an, Dr. Latanya Sweeney dengan terkenal menerapkan serangan linkage pada kumpulan data catatan rumah sakit yang tidak teridentifikasi. Dengan membandingkan kode pos, tanggal lahir dan jenis kelamin pasien dengan catatan pemungutan suara yang tersedia untuk umum, yang juga berisi nama dan alamat di samping informasi yang sama seperti yang disebutkan di atas, individu dalam catatan rumah sakit dapat diidentifikasi ulang. Apa yang penulis studi Nature simpulkan dengan benar adalah bahwa teknik tradisional semacam itu tunduk pada undang-undang modern seperti GDPR. Oleh karena itu, perusahaan harus mengambil langkah-langkah modern untuk memastikan anonimitas data yang terjamin.

Dalam video ini, kami telah meninjau teknik modern untuk berbagi data dan keterbatasannya. Video tersebut menjelaskan mengapa sulit untuk membagikan data yang berguna sambil menjaga privasi dan menunjukkan pendekatan yang menjanjikan yang tersedia saat ini.

Kabar baiknya adalah ada pendekatan untuk menganonimkan data dengan aman, yang sejalan dengan undang-undang perlindungan data modern seperti GDPR. Tetapi pertama-tama, penting untuk diingat bahwa data anonim lebih dari sekadar menghapus nama atau informasi pengenal lainnya. Anonimisasi modern tidak dapat diubah dan karenanya tidak tunduk pada undang-undang seperti GDPR. Berbeda dengan metode anonimisasi tradisional yang dijelaskan di atas, anonimisasi modern berfungsi.

Solusi Statis
Statice, bersama dengan perusahaan seperti Apple dan Google, menerapkan konsep modern yang disebut privasi diferensial — standar analisis matematis yang memungkinkan mendapatkan wawasan dalam data yang menyangkut lebih dari satu orang, tanpa mengungkapkan secara spesifik tentang individu, yang jika tidak, akan membahayakan privasi mereka. Perhitungan pribadi yang berbeda menjamin bahwa outputnya sama dengan atau tanpa input individu tertentu. Ini adalah jaminan privasi.

Di Statice, kami melangkah lebih jauh dengan menghasilkan data sintetis yang melindungi privasi, data buatan baru yang dapat digunakan dan dirilis tanpa pernah mengorbankan privasi pribadi individu mana pun. Berbeda dengan hanya memperlakukan apa yang disebut data sensitif, Statice mengasumsikan bahwa semua atribut data sensitif dan dapat dilacak kembali ke individu. Menggunakan pembelajaran mesin, kumpulan data baru dihasilkan yang berisi nilai statistik dan struktural yang sama dengan data asli, mempertahankan nilai untuk berbagi, dan menggunakan data sintetis yang baru dibuat.

Untuk mengikuti perkembangan, kami tidak hanya menerapkan konsep privasi diferensial saat menghasilkan data sintetis, tetapi kami terus menerapkan penelitian privasi data terbaru untuk meningkatkan produk kami dan hasil akhir untuk klien kami di Statice.Solusi Statice menawarkan privasi demi desain dan privasi data yang terjamin. Data sintetis yang memenuhi jaminan matematis seperti privasi diferensial dapat dianggap sebagai data yang dianonimkan dan karenanya dikeluarkan dari GDPR. Sejujurnya, tidak ada cara mudah untuk menganonimkan data. Tapi ada yang lebih baik. Untuk mempelajari lebih lanjut tentang produk kami, dapatkan demo gratis di sini.