Dasar-dasar Anonimisasi dan Perlindungan Data

33bits – Anonimisasi data adalah proses melindungi informasi pribadi atau sensitif dengan menghapus atau mengenkripsi pengidentifikasi yang menghubungkan individu ke data yang disimpan. Misalnya, Anda dapat menjalankan Personally Identifiable Information (PII) seperti nama, nomor jaminan sosial, dan alamat melalui proses anonimisasi data yang menyimpan data tetapi tetap anonim sumbernya.

Dasar-dasar Anonimisasi dan Perlindungan Data – Namun, bahkan ketika Anda menghapus data pengidentifikasi, penyerang dapat menggunakan metode de-anonimisasi untuk menelusuri kembali proses anonimisasi data. Karena data biasanya melewati banyak sumber, beberapa teknik de anonimisasi yang tersedia untuk publik dapat merujuk silang sumber dan mengungkapkan informasi pribadi.

Dasar-dasar Anonimisasi dan Perlindungan Data

Dasar-dasar Anonimisasi dan Perlindungan Data

Peraturan Perlindungan Data Umum (GDPR) menguraikan serangkaian aturan khusus yang melindungi data pengguna dan menciptakan transparansi. Meskipun GDPR ketat, ini memungkinkan perusahaan untuk mengumpulkan data yang dianonimkan tanpa persetujuan, menggunakannya untuk tujuan apa pun, dan menyimpannya untuk waktu yang tidak terbatas—selama perusahaan menghapus semua pengenal dari data.

Tujuan menganonimkan data terutama berkisar pada perlindungan privasi. Ini adalah praktik umum untuk memanfaatkan mekanisme ini dalam penelitian medis, analisis pasar, dan banyak domain lain di mana data tidak boleh dengan mudah dilacak kembali ke seseorang. Sedangkan sisi hukum dari masalah ini bervariasi menurut yurisdiksi, mengaitkan informasi pribadi dengan seseorang sebagian besar dilarang oleh hukum kecuali orang tersebut secara sadar menyetujuinya. Namun, setelah data dianonimkan, entitas yang memiliki akses ke data tersebut dapat menggunakan rekaman tanpa ikatan.

Mengapa dan Mengapa Data Anonimisasi
Booming Internet of Things (IoT) telah membawa kegiatan pengumpulan data ke tingkat berikutnya. Perangkat yang terhubung mengumpulkan sejumlah besar informasi tentang hampir semua orang, dan sebagian besar berada online. Mantra tentang non-pengungkapan data ini bisa menjadi kenyamanan dingin karena dua alasan. Pertama, ada risiko karyawan menyalahgunakan hak istimewa mereka untuk salah menangani informasi pelanggan. Kedua, penjahat dunia maya meningkatkan upaya mereka untuk mendapatkan data sensitif melalui pelanggaran yang berulang kali menjadi berita utama.

Saat ini, hampir semua yang Anda lakukan meninggalkan jejak data, dan ini melampaui aktivitas online saja. Saat Anda mengunjungi dokter, berinteraksi dengan bisnis di dalam toko dan online, menjelajahi web, atau menggunakan aplikasi desktop dan seluler, ada “remah roti” dari peristiwa ini yang tumpah dalam bentuk data. Jika Anda mengikuti tren teknologi dan tinggal di rumah pintar, maka perangkat berkemampuan internet di sekitar Anda mengetahui dan menyimpan informasi tentang rutinitas Anda sehari-hari, mulai dari waktu rehat kopi hingga pola konsumsi daya keluarga Anda.

Segalanya tidak merepotkan selama semua data ini diperlakukan secara terpisah dari seseorang. Namun, ini adalah skenario ideal yang hampir tidak berfungsi setelah gadget cerdas dan layanan internet masuk. Jenis umum dari data yang diambil termasuk alamat email, alamat IP, nama, dan geolokasi Anda. Dalam banyak kasus, jangkauan informasi identitas pribadi (PII) yang dikumpulkan di belakang Anda lebih luas dari itu.

Praktik Terbaik Perlindungan Data
Salah satu cara paling efektif untuk melindungi rutinitas online Anda dari pengintaian adalah dengan menggunakan solusi Virtual Private Network (VPN) yang akan mengenkripsi lalu lintas saat berjalan bolak-balik. Pendekatan ini mencegah ISP, kumpulan data, dan penjahat dunia maya mengambil data Anda, yang berarti Anda dapat menjelajahi web, menggunakan klien torrent, dan menjalankan aplikasi online dengan tenang.Sebenarnya, kebanyakan orang tidak repot-repot memanfaatkan teknik seperti itu. Bahkan mereka yang berpikiran privasi dan mengikuti kebersihan online yang tepat mungkin gagal menjaga data mereka tetap utuh dalam beberapa situasi. Kebocoran rekam medis seseorang setelah kunjungan ke rumah sakit adalah contoh bagaimana kewaspadaan pribadi bisa menjadi sia-sia karena informasi tersebut disalahgunakan oleh pihak ketiga.

Dalam konteks ini, de-identifikasi adalah pengubah permainan karena membedakan PII dari data lain. Dengan momok wabah malware dan pelanggaran data skala besar yang menghantui berbagai industri berulang kali, pendekatan ini sangat masuk akal.Organisasi mungkin secara resmi diminta untuk melakukan anonimisasi data dalam beberapa kasus. Ini juga bisa menjadi rekomendasi belaka, dan perusahaan dapat memilih untuk mengambil rute ini atau tidak. Ada juga kasus di mana anonimisasi adalah titik poros dari strategi pemasaran bisnis dan stimulus bagi orang untuk mempercayakan data sensitif mereka ke layanan tanpa berpikir dua kali.

Baca Juga : Hubungan Doxing dengan hak asasi manusia dan privasi

Logika Anonimisasi Data
Ada banyak teknik untuk menutupi data. Oleh karena itu, perusahaan tidak perlu menemukan kembali roda ketika mencoba meningkatkan praktik privasi data mereka. Peringatannya adalah bahwa beberapa mekanisme ini memiliki efisiensi yang terbatas. Secara keseluruhan, metode yang paling umum adalah sebagai berikut:

1. Agregasi: Data diakumulasikan dalam bentuk yang tidak dipersonalisasi. Misalnya, usia orang mungkin tidak dicatat seperti itu, tetapi jumlah total individu dari usia tertentu diketahui. Seperti inilah data pribadi yang dijual oleh bisnis sering terlihat.
2. Enkripsi: Meskipun pendekatan ini tidak menghilangkan detail pribadi dari sekumpulan data, ini membuat informasi tidak dapat dibaca tanpa kunci dekripsi. Dengan cara ini, itu tidak dapat disalahgunakan bahkan jika itu berakhir di tangan yang salah.
3. Generalisasi: Contoh teknik ini adalah penggunaan rentang usia daripada usia tertentu atau mempersempit detail nomor telepon ke kode area.
4. Hashing: Seperti halnya enkripsi, yang ini tidak melibatkan penghapusan fragmen data yang dapat sidik jari. Sebaliknya, itu menggantikannya dengan string hash yang tampak acak.
5. Pseudonimisasi: Ide di balik metode ini adalah untuk mengganti elemen entri data yang dapat diidentifikasi secara pribadi dengan catatan buatan yang dikenal sebagai nama samaran. Sedangkan anonimisasi adalah proses ireversibel, pseudonimisasi memungkinkan untuk mengidentifikasi kembali data terselubung melalui petunjuk khusus di kemudian hari.
6. Gangguan: Yang ini sedikit mengubah nilai PII. Ini tidak cocok untuk skenario yang membutuhkan data akurat.
7. Pengacakan: Bidang data pribadi sengaja dimiringkan atau diganti dengan atribut acak.
8. Penindasan: Teknik ini “menghapus” data dengan sepenuhnya menghilangkan nilai-nilai yang dapat diidentifikasi secara pribadi darinya.

Tidak ada teknik satu ukuran untuk semua. Pilihan optimal tergantung pada berbagai faktor, termasuk kekhasan undang-undang setempat, pedoman privasi di tingkat industri, serta jenis dan tujuan penggunaan data yang akan dianonimkan. Beberapa organisasi mengambil jalan pintas dengan mengalihkan tugas ini ke alat anonimisasi yang dibuat khusus seperti IBM Security Guardium atau Oracle Advanced Security.Cara yang cukup sederhana namun efektif untuk menganonimkan data adalah dengan memanfaatkan modul anonimisasi IP yang disediakan oleh Google Analytics. Pemilik situs web dapat memilih instrumen ini untuk menyelaraskan proyek mereka dengan undang-undang privasi seperti GDPR.