Digi Műhely | Személyazonosság, személyazonosítás online lehetőségei használata
Banki tranzakciók anonimitási kérdései
Készítette: Csarnó Tamás Péter, Gulyás Gábor György
A tranzakciós adatok anonimitási vizsgálatát úgy érdemes végrehajtani, hogy az ilyen adatokat gráfokká konvertáljuk és a vonatkozó de-anonimizációs szakirodalom eljárásait alkalmazzuk. Ehhez kidolgoztunk egy módszertant, ami a GDPR szemüvegén keresztül nyújt segítséget ahhoz, hogy egy bizonyos anonimizálási eljárás hatékonyságát ellenőrizhessük.
A banki tranzakciók megosztása lassan általános jelenséggé válik, s egyre több startup kínál ezek az adatokra épülő szolgáltatásokat. Ezeket az adatokat csak úgy lehet megosztani és feldolgozni, ha az megfelel a hatályos szabályozási környezetnek, többek között az európai Általános Adatvédelmi Rendeletnek (GDPR). Jelen tanulmány fő kérdésköre a tranzakciós adatok anonimitása. A tanulmány első részében bemutattuk a személyes (azonosított) és az anonim adatok közötti ellentétet, és az anonimizálás alapjait tárgyaltuk klasszikus, illetve nagy dimenzionalitású esetben. Erre az alapra építve bevezettük a nagy méretű adatbázisok de-anonimizálási elveit.
Az anonimizálási eljárások hatékonyságát mindig a legkorszerűbb újra-azonosítási eljárásokhoz kell viszonyítani. Ez nem csupán logikus megközelítés, hanem így felelhetünk meg a GDPR elvárásának is: az anonimitási eljárás megválasztásakor „összes objektív tényezőt figyelembe kell venni, így például az azonosítás költségeit és időigényét, számításba véve az adatkezeléskor rendelkezésre álló technológiákat, és a technológia fejlődését” [1] (GDPR, 26. cikk).
Végül megadtuk azokat a technikai eszközöket, amelyek a módszertan végrehajtásához szükségesek: bemutattunk korszerű gráf anonimizálási és újra-azonosítási eljárásokat. Mindezek működését egy esettanulmányon demonstráltuk, ahol egy tranzakciós adatkezelő szerepében azt az anonimizálási eljárást kerestük meg, amelynek a segítségével a tranzakciós adatok használhatók maradnak, de az adatokban lévő rekordok nem lesznek újra azonosíthatók.
Kulcsszavak: anonimizálás; újra-azonosítás, tranzakciós adatok, de-anonimizálás