Verfügbarkeit von personenbezogenen Daten unter dem Aspekt der Anonymisierung
Schlagworte:
Personenbezogene Daten, K-Anonymität, l-Diversity, t-Closeness, Differerntial Privacy, Synthetische Daten, AnonymisierungAbstract
Daten und Analyseverfahren bestimmen zunehmend den heutigen beruflichen sowie privaten Alltag. In den letzten Jahren gewannen besonders personenbezogene Daten immer mehr Relevanz. Während hyper-personalisierte Werbung auf Social Media immer wieder in die Kritik gerät, profitieren auch andere Bereiche von leicht zugänglichen persönlichen Informationen. Die medizinische Forschung oder die Entwicklung künstlicher Intelligenzen hängen enorm von der Verfügbarkeit derartiger Daten ab. Neue Gesetzgebungen und Normen schränken diese aber zunehmend ein und verpflichten die Anonymisierung von personenbezogenen Daten vor deren Verwendung.
In diesem Artikel erfolgen eine Auflistung aktueller Anonymisierungsverfahren sowie eine Analyse ihrer Schwachstellen. Letztere werden kritisch unter dem Risiko der Re-Identifizierung und dem einhergehenden Verlust an Datenqualität beurteilt. Die Untersuchung veranschaulicht, dass alle Verfahren die Aussagekraft von personenbezogenen Daten auf unterschiedliche Art und Weise vermindern. Der Artikel identifiziert dabei drei wichtige Anforderungskriterien an einen anonymen Datensatz und hebt die Bedeutung einer ausführlichen Auseinandersetzung mit diesen Kriterien hervor. So bedarf es möglicherweise der Kombination mehrerer Verfahren, um die Verfügbarkeit zu optimieren. Er schließt mit der These, dass unterschiedliche personenbezogene Attributklassen eine Auswirkung auf die Wahl eines passenden Anonymisierungsverfahrens haben können.
Downloads
Veröffentlicht
Ausgabe
Rubrik
Lizenz
Copyright (c) 2023 Fabian Engl
Dieses Werk steht unter der Lizenz Creative Commons Namensnennung 4.0 International.