S piškotki izboljšujemo vašo uporabniško izkušnjo. Z uporabo naših storitev se strinjate z uporabo piškotkov. V redu Piškotki, ki jih uporabljamo Kaj so piškotki?
Domov » Sklopi » Dokumenti » D7.1.4: Priporočilo za anonimizacijo podatkov v e-Zdravju

D7.1.4: Priporočilo za anonimizacijo podatkov v e-Zdravju

Projekt in mejnik izročka: P7, M8

Povzetek

V dokumentu so opisana uporabna orodja in razpoložljive tehnike deidentifikacije osebnih zdravstvenih podatkov v zapisih in podatkovnih skladiščih ter anonimizacije izmenjave podatkov. Najprej so predstavljeni izzivi hranjenja, obdelave, varnosti in anonimizacije podatkov ter zakonodaja na tem področju.

Nato so opisani obstoječi algoritmi za anonimizacijo podatkov ter delo z anonimiziranimi podatki. Predstavljeni so osnovni pojmi in načela deidentifikacije, med drugim tudi dva osnovna modela shranjevanja podatkov v podatkovnih skladiščih (mikro in makro podatki) ter razlike med direktnimi in indirektnimi identifikatorji. Na koncu sta opisani dve metodi za deidentifikacijo: anonimnost reda k in raznolikost reda l.

Razloženi so raznovrstni pristopi k deidentifikaciji. Mikro podatki so lahko deidentificirani z uporabo redukcije podatkov (odstranjevanje direktnih identifikatorjev, podrobnejša redukcija in vzorčenje), preoblikovanja podatkov (dodajanje naključnega šuma podatkom, naključni izbor vrednosti podatkov in zamenjava vrednosti dveh zapisov) ali pa z uporabo nevtraliziranja podatkov. Ti pristopi so  predstavljeni tudi s pomočjo primerov uporabe. Med drugim je opisana tudi razlika med povratno in nepovratno psevdonimizacijo ter dva tipična načina za njeno izvedbo.

Makro podatki imajo svoj pristop k deidentifikaciji; razložene so metode na podlagi omejitev (nevtraliziranje podatkov znotraj celice in spreminjanje sistema klasifikacije). Podani so tudi primeri uporabe.

Našteti so primeri dobrih praks deidentifikacij. Nadalje so opisani tudi načini ravnanja z direktnimi identifikatorji v podatkovnih skladiščih, načini predstavitve datumskih in lokacijskih spremenljivk v podatkovnih nizih ter ravnanje z diagnostičnimi slikovnimi podatki in psevdonimnimi identifikatorji, da se je mogoče izogniti neželenemu povezovanju podatkov različnih podatkovnih nizov. Pomembna so tudi pogodbena določila o uporabi in povezovanju podatkov.

Opisana so orodja, ki so na voljo za deidentifikacijo mikro in makro podatkov. Orodja za ravnanje z direktnimi identifikatorji v mikro podatkih so Oracle Data Masking Pack, Informatica Data Privacy, Data Masker, Camouflage in IBM InfoSphere Optim Data Masking. Orodja za ravnanje z indirektnimi identifikatorji predstavljajo PARAT, µ-Argus in Cornell Anonymization Toolkit. Za ravnanje z makro podatki je opisano orodje τ-Argus.

Na koncu smo se dotaknili anonimizacije izmenjave podatkov. Opisana je zaščita podatkov s kriptografijo z uporabo metode javnih in privatnih ključev; teoretični model omrežja za anonimno izmenjavo podatkov; konkretno uporabo modela omrežij za anonimizacijo podatkov na primeru TOR in I2P omrežij; ter ovrednotena opisana omrežja v smislu primerjave med odprtimi in zaprtimi variantami.