Klasifikasi Referensi Anonimisasi Data Penggabungan Pertimbangan Hukum

33bits – Dalam beberapa tahun terakhir, kemajuan teknologi telah memungkinkan penelitian dengan data kesehatan yang berasal dari volume besar catatan kesehatan elektronik (EHR) dan sumber data terkait kesehatan lainnya untuk meningkatkan inovasi dan kualitas dalam kedokteran. Ini juga telah dipercepat melalui upaya nasional dan internasional yang menawarkan akses ke repositori yang berisi peningkatan jumlah pengetahuan klinis dan platform kolaboratif yang menyelaraskan tidak hanya algoritma yang digunakan, tetapi juga ontologi yang memungkinkan interoperabilitas yang lebih baik. Pada saat yang sama ada kekhawatiran yang berkembang bahwa penggunaan data kesehatan untuk penelitian yang didanai publik dapat menyebabkan paparan informasi pribadi pasien, yang berpotensi meningkatkan, antara lain, risiko diskriminasi.

Klasifikasi Referensi Anonimisasi Data Penggabungan Pertimbangan Hukum – Legislator telah mengatasi masalah ini dengan menerapkan peraturan untuk melindungi privasi pasien, seringkali berfokus pada anonimisasi data, yaitu, penghapusan atau penyembunyian informasi yang dapat diidentifikasi. Dalam penelitian ini kami menganalisis, bagaimana peraturan di tiga yurisdiksi (Amerika Serikat, Uni Eropa, Swiss) membedakan antara tingkat anonimisasi data kesehatan yang berbeda, dan menilai apakah dan bagaimana tingkat ini selaras dengan kemajuan teknis.

Klasifikasi Referensi Anonimisasi Data Penggabungan Pertimbangan Hukum

Hukum
Di Uni Eropa (UE) tidak ada regulasi khusus untuk data kesehatan. Peraturan umum, yaitu General Data Protection Regulation (GDPR) mengatur dan melindungi pengumpulan, pemrosesan, pembagian, dan penyimpanan data apa pun mengenai orang yang teridentifikasi atau dapat diidentifikasi. Data dengan nama samaran juga termasuk dalam cakupan GDPR. Data pseudonim adalah data di mana pengidentifikasi yang jelas telah dihapus dan diganti dengan kode. Individu dapat diidentifikasi kembali dengan menggunakan kunci, oleh karena itu, data yang disamarkan juga dianggap sebagai data yang dapat diidentifikasi. Namun, peraturan perlindungan privasi GDPR tidak berlaku untuk informasi anonim atau anonim, yaitu, data di mana tidak hanya pengidentifikasi, tetapi juga kunci telah dihapus sehingga identifikasi individu tidak mungkin lagi (data anonim) atau informasi yang telah dikumpulkan sedemikian rupa sehingga individu tersebut tidak dapat diidentifikasi (data anonim). Apakah data dianggap anonim atau dianonimkan terkait erat dengan perkiraan upaya yang diperlukan untuk mengidentifikasi kembali pasien yang menyediakan data, termasuk, antara lain, biaya, jumlah waktu yang diperlukan, dan teknologi yang tersedia. -identifikasi dapat dianggap sebagai “masuk akal”, data dikualifikasikan sebagai non-anonim atau non-anonim. Apakah upaya untuk reidentifikasi adalah “masuk akal” harus diputuskan berdasarkan kasus per kasus. Karena ada spektrum interpretasi, ini mengarah pada ketidakpastian serius dalam praktiknya.

Juga di Swiss, tidak ada peraturan di tingkat federal yang secara khusus membahas data kesehatan. Seperti di UE, Swiss memiliki undang-undang federal, yang disebut “Undang-Undang Federal tentang Perlindungan Data” (FADP) yang membahas regulasi dan perlindungan data secara umum, termasuk data kesehatan. Undang-undang Swiss membedakan “tingkat anonimisasi” yang sama dengan UE: Data mengenai orang yang teridentifikasi atau dapat diidentifikasi termasuk dalam cakupan FADP, berbeda dengan data yang tidak dapat diidentifikasi. Seperti di UE, data pseudonim dianggap sebagai data yang dapat diidentifikasi, sedangkan data anonim dan anonim dikualifikasikan sebagai data yang tidak dapat diidentifikasi. Definisinya seperti di UE. Data dianggap sebagai anonim atau anonim jika hanya upaya teknis yang tidak masuk akal yang dapat mengidentifikasi ulang data. Juga di bawah hukum Swiss, tidak ada definisi khusus tentang apa yang dimaksud dengan upaya yang tidak masuk akal. Ada ruang lingkup interpretasi dan keputusan dibuat berdasarkan kasus per kasus.

Dalam studi ini kami menganalisis, bagaimana peraturan di tiga yurisdiksi (Amerika Serikat, Uni Eropa, Swiss) membedakan antara berbagai tingkat anonimisasi data kesehatan, dan menilai apakah dan bagaimana tingkat ini selaras dengan kemajuan teknis.

Baca Juga : Jenis, Metode Serta Teknik Yang Terdapat Pada Anilis Data

Berbeda dengan Eropa, Amerika Serikat (AS) memiliki tindakan khusus di tingkat federal yang membahas secara khusus data kesehatan, yang disebut Health Insurance Portability and Accountability Act (HIPAA). Berbeda dengan negara-negara Eropa, AS memiliki pendekatan yang berbeda terhadap definisi “data kesehatan yang dapat diidentifikasi”. Alih-alih menanyakan tentang upaya yang diperlukan untuk reidentifikasi data, HIPAA menetapkan 18 pengidentifikasi misalnya, nama, alamat email, nomor jaminan sosial, atau nomor rekam medis yang perlu dihapus agar data memenuhi syarat sebagai tidak dapat diidentifikasi. Pendekatan ini meninggalkan tidak ada ruang lingkup interpretasi ketika memutuskan apakah data kesehatan harus dikualifikasikan sebagai dapat diidentifikasi atau tidak dan dapat mengurangi ketidakpastian dalam praktik. Namun, penelitian menunjukkan bahwa penghapusan pengidentifikasi ini masih memungkinkan identifikasi ulang individu. Sebagai alternatif, seorang ahli dapat meninjau dan menyatakan kumpulan data sebagai anonim. Tidak ada gelar profesional atau program sertifikasi khusus untuk menunjuk siapa yang ahli dalam memberikan informasi kesehatan yang tidak teridentifikasi. Pakar dapat ditemukan di bidang statistik, ilmu komputer, atau bidang ilmiah lainnya.

Analisis Teknis
Kemajuan teknis baru-baru ini dan munculnya upaya global menuju sumber daya data yang dapat dioperasikan menghasilkan situasi di mana identifikasi ulang data semakin mungkin terjadi, meskipun ada upaya terbaik untuk menghapus informasi yang dapat diidentifikasi. Undang-undang perlindungan data yang ada meninggalkan banyak ketidakpastian tentang apakah kumpulan data yang tidak teridentifikasi berada dalam cakupan undang-undang tersebut. Untuk menghilangkan ketidakpastian tersebut, dan untuk memungkinkan penelitian data besar yang efektif dengan informasi kesehatan, kami mengusulkan langkah menuju definisi hukum yang lebih halus dan klasifikasi langkah-langkah de-identifikasi data.

Mari kita asumsikan kumpulan data hipotetis berikut yang berisi EHR pasien, termasuk pengukuran frekuensi jantung dari waktu ke waktu, gambar klinis, dan data DNA yang diurutkan secara komprehensif. EHR berisi nama pasien, alamat, dan pengidentifikasi jelas lainnya yang memungkinkan identifikasi langsung. Pengidentifikasi yang jelas ini juga mencakup nama dan tanggal lahir yang dicetak, misalnya, pada gambar sinar-x. Jika pengidentifikasi yang jelas ini dihapus dan diganti dengan kode, kumpulan data akan diklasifikasikan sebagai pseudonim di UE dan Swiss, dan tidak dapat diidentifikasi di AS. Salah satu alasan untuk menjaga kode adalah untuk dapat menghubungi pasien, yang telah setuju untuk diberitahu tentang hasil penelitian yang berpotensi berdampak pada kesehatannya.

Hal ini terutama penting dalam kasus temuan insidental yang tidak terkait langsung dengan penelitian yang dilakukan. Penghapusan kode tersebut dari kumpulan data dalam persepsi tradisional akan menjadikannya anonim dalam semua peraturan yang dijelaskan di atas. Namun, ini hanya benar, jika kumpulan data tetap terisolasi dari menghubungkannya ke sumber informasi lain. Inilah sebabnya kami mengusulkan kelas (baru) dari data pseudo-anonim. Misalnya, data longitudinal detak jantung bertindak sebagai sidik jari yang unik untuk dataset lain karena potensi keterkaitan. Ini dimungkinkan untuk sebagian besar nilai pasien yang direkam secara berurutan. Tentu saja kumpulan data lain ini perlu berisi pengukuran frekuensi jantung serupa dari pasien hipotetis dalam contoh kita.

Hal yang sama berlaku untuk data genetik, yang bila diurutkan cukup komprehensif, tidak hanya akan memungkinkan keterkaitan dengan repositori data genomik lainnya, tetapi juga memungkinkan untuk memprediksi sifat, seperti warna rambut dan mata. Juga dalam hal ini, keterkaitan akan membutuhkan keberadaan profil genetika tersebut untuk hadir di dataset lain, begitu juga dengan deskripsi pribadi. Kita dapat mengurangi, tetapi tidak menghilangkan kemungkinan keterkaitan ini dengan menerapkan metode, seperti gangguan data, yang mengaburkan tanda pengenal.

Jika hanya data ringkasan di seluruh pasien yang dirilis, seperti kadar glukosa rata-rata dari waktu ke waktu, ini dapat (masih) dikualifikasikan sebagai kumpulan data anonim yang tidak dapat diubah. Dalam hal ini, informasi yang terkandung dalam kelas ini lagi-lagi bisa substansial, setidaknya pada tingkat kelompok.Secara umum, penting untuk dicatat bahwa sering ada trade-off antara tingkat anonimisasi dan kapasitas untuk melakukan analisis data yang berarti yang dapat mengarah pada kemajuan dalam kedokteran. Oleh karena itu, penerapan anonimisasi yang ketat mungkin tidak selalu membantu.

Sementara mengidentifikasi data memberikan jumlah informasi maksimum, tetapi tidak ada anonimitas, data anonim memberikan tingkat anonimitas maksimum, tetapi jumlah informasi mungkin terbatas. Khususnya dalam bidang penelitian medis, di mana tujuan akhirnya adalah untuk meningkatkan diagnosis, prognosis, dan pengobatan pasien individu, data tingkat pasien sangat diperlukan. Oleh karena itu, tingkat gangguan yang terlalu besar mungkin tidak disarankan, karena tidak hanya akan mengaburkan tanda pengenal, tetapi juga sinyal biologis yang sedang dipelajari. Ini juga berlaku di beberapa pengidentifikasi yang jelas. Misalnya, penghapusan pengidentifikasi yang jelas, seperti kode ZIP, dalam pembuatan data yang dianonimkan secara reversibel menghalangi penelitian tentang masalah kesehatan komparatif di seluruh wilayah geografis.