Verfügbarkeit von personenbezogenen Daten unter dem Aspekt der Anonymisierung

Autor/innen

  • Fabian Engl OTH Regensburg & Vitesco Technologies

Schlagworte:

Personenbezogene Daten, K-Anonymität, l-Diversity, t-Closeness, Differerntial Privacy, Synthetische Daten, Anonymisierung

Abstract

Daten und Analyseverfahren bestimmen zunehmend den heutigen beruflichen sowie privaten Alltag. In den letzten Jahren gewannen besonders personenbezogene Daten immer mehr Relevanz. Während hyper-personalisierte Werbung auf Social Media immer wieder in die Kritik gerät, profitieren auch andere Bereiche von leicht zugänglichen persönlichen Informationen. Die medizinische Forschung oder die Entwicklung künstlicher Intelligenzen hängen enorm von der Verfügbarkeit derartiger Daten ab. Neue Gesetzgebungen und Normen schränken diese aber zunehmend ein und verpflichten die Anonymisierung von personenbezogenen Daten vor deren Verwendung.

In diesem Artikel erfolgen eine Auflistung aktueller Anonymisierungsverfahren sowie eine Analyse ihrer Schwachstellen. Letztere werden kritisch unter dem Risiko der Re-Identifizierung und dem einhergehenden Verlust an Datenqualität beurteilt. Die Untersuchung veranschaulicht, dass alle Verfahren die Aussagekraft von personenbezogenen Daten auf unterschiedliche Art und Weise vermindern. Der Artikel identifiziert dabei drei wichtige Anforderungskriterien an einen anonymen Datensatz und hebt die Bedeutung einer ausführlichen Auseinandersetzung mit diesen Kriterien hervor. So bedarf es möglicherweise der Kombination mehrerer Verfahren, um die Verfügbarkeit zu optimieren. Er schließt mit der These, dass unterschiedliche personenbezogene Attributklassen eine Auswirkung auf die Wahl eines passenden Anonymisierungsverfahrens haben können.

Downloads

Veröffentlicht

2023-07-25

Ausgabe

Rubrik

Grundlagen