
37414
04.08.2020
Statistiken mit Datenbank erstellen trotz Datenschutz
Hallo,
wir nutzen ein eigens für uns geschriebenes Programm, welches eine SQL-Datenbank nutzt, die auf einem unserer Server liegt.
Diese Datenbank enthält Informationen über Personen (Namen, Adressen, gesundheitliche Daten etc.).
Nun sollen - aus Datenschutzgründen - die Daten, die älter als 10 Jahre sind, anonymisiert werden.
Dennoch soll es möglich sein, am Ende Statistiken zu erstellen, die auch 15 oder 20 Jahre zurück reichen.
Zur Info:
Jede in der Datenbank erfaßte Person besitzt eine ID. Diese ID könnte z.B. in der anonymisierten Datenbank (also die Daten = älter als 10 Jahre) erhalten bleiben.
Dort könnte man z.B. nur die Vor- u. Nachnamen löschen (ggf. noch Geburtsdatum).
Würde man jedoch nun die aktuelle Datenbank mit der anonymisierten Datenbank (älter als 10 Jahre) vereinen, ließe sich ja über die ID wieder ein Personenbezug herstellen, was aus datenschutzrechtlichen Gründen nicht der Fall sein darf...
Das ist nun unser Problem.
Hat jemand von Euch eine Idee, wie man das lösen könnte?
Z.B. dachte ich spontan an ein Programm, welches das kann und welches vielleicht - nur während die Statistik ausgeführt wird - die ID´s kryptisiert und anschließend wieder in den Ausgangszustand versetzt. Das ist aber jetzt eine völlig spontane und laienhafte Idee aus dem Bauch heraus
Bin gespannt auf Eure Ideen und Vorschläge.
Danke & schöne Grüße,
imebro
wir nutzen ein eigens für uns geschriebenes Programm, welches eine SQL-Datenbank nutzt, die auf einem unserer Server liegt.
Diese Datenbank enthält Informationen über Personen (Namen, Adressen, gesundheitliche Daten etc.).
Nun sollen - aus Datenschutzgründen - die Daten, die älter als 10 Jahre sind, anonymisiert werden.
Dennoch soll es möglich sein, am Ende Statistiken zu erstellen, die auch 15 oder 20 Jahre zurück reichen.
Zur Info:
Jede in der Datenbank erfaßte Person besitzt eine ID. Diese ID könnte z.B. in der anonymisierten Datenbank (also die Daten = älter als 10 Jahre) erhalten bleiben.
Dort könnte man z.B. nur die Vor- u. Nachnamen löschen (ggf. noch Geburtsdatum).
Würde man jedoch nun die aktuelle Datenbank mit der anonymisierten Datenbank (älter als 10 Jahre) vereinen, ließe sich ja über die ID wieder ein Personenbezug herstellen, was aus datenschutzrechtlichen Gründen nicht der Fall sein darf...
Das ist nun unser Problem.
Hat jemand von Euch eine Idee, wie man das lösen könnte?
Z.B. dachte ich spontan an ein Programm, welches das kann und welches vielleicht - nur während die Statistik ausgeführt wird - die ID´s kryptisiert und anschließend wieder in den Ausgangszustand versetzt. Das ist aber jetzt eine völlig spontane und laienhafte Idee aus dem Bauch heraus
Bin gespannt auf Eure Ideen und Vorschläge.
Danke & schöne Grüße,
imebro
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 593347
Url: https://administrator.de/forum/statistiken-mit-datenbank-erstellen-trotz-datenschutz-593347.html
Ausgedruckt am: 13.05.2025 um 04:05 Uhr
16 Kommentare
Neuester Kommentar
Hallo,
Um hier genaue Aussagen treffen zu können müsst man die Datenstruktur und die gewünschten Auswertungen kennen.
Zwei Datenbanken bringen dir meiner Meinung nach wenig. Es wird da auch keine fertige Software was bringen
Du brauchst ein Wartungscript das regelmäßig über DB läuft und die Verbindungen entsprechend löscht, abändert das alles seine Richtigkeit hat.
Um hier genaue Aussagen treffen zu können müsst man die Datenstruktur und die gewünschten Auswertungen kennen.
Zwei Datenbanken bringen dir meiner Meinung nach wenig. Es wird da auch keine fertige Software was bringen
Du brauchst ein Wartungscript das regelmäßig über DB läuft und die Verbindungen entsprechend löscht, abändert das alles seine Richtigkeit hat.
Moin,
Erzeuge doch aus den Daten aus der aktuellen DB einen Hash als ID-Ersatz für die "StatistikDB".
Dann kann keine direkt Verbindung aus der Statistik-DB in die produktiv-DB zurückgeführt werden. Um einen zusammenhang zwischen dem Hash und den Benutzerdaten herzustellen, nüßte mann dann alle Hashes neu berechnen lassen.
lks
Erzeuge doch aus den Daten aus der aktuellen DB einen Hash als ID-Ersatz für die "StatistikDB".
Dann kann keine direkt Verbindung aus der Statistik-DB in die produktiv-DB zurückgeführt werden. Um einen zusammenhang zwischen dem Hash und den Benutzerdaten herzustellen, nüßte mann dann alle Hashes neu berechnen lassen.
lks
Zitat von @mbehrens:
Ich lese daraus nicht, dass die Anforderungen an die Pseudonymisierung erfüllt sind.
Ich lese daraus nicht, dass die Anforderungen an die Pseudonymisierung erfüllt sind.
Worauf bezieht sich Dein Kommentar? Auf meinen oder dem des TO?
lks
Hallo,
macht Euch erst mal kundig, wie die Aufbewahrungsregeln tatsächlich sind. Normalerweise gilt: 10 Jahre nach ABSCHLUSS der Behandlung. Demzufolge gäbe es kein Problem mit den IDs. Gilt das nicht, dann dürft Ihr vermutlich die Daten auch nicht für weniger als 10 Jahre aufbewahren weil Euch die Grundlage dafür fehlt.
Grüße
lcer
macht Euch erst mal kundig, wie die Aufbewahrungsregeln tatsächlich sind. Normalerweise gilt: 10 Jahre nach ABSCHLUSS der Behandlung. Demzufolge gäbe es kein Problem mit den IDs. Gilt das nicht, dann dürft Ihr vermutlich die Daten auch nicht für weniger als 10 Jahre aufbewahren weil Euch die Grundlage dafür fehlt.
Grüße
lcer
Hallo,
Ich gehe mal von einer relationalen Datenbank aus. 1 Mensch hat darin n Dateneinträge
Variante: Löschen von Daten, die 10 Jahre oder älter sind:
Du erhältst durch das anonymisieren eines Menschen im schlechtesten Fall einen gesplitteten Datensatz:
- 1 Anonymer Mensch mit n Daten die 10 Jahre oder älter sind
- 1 nicht-Anonymer Mensch mit m Daten die jünger als 10 Jahre sind
Hier würde die ID die Anonymisierung durchbrechen.
Variante: Löschen von Daten von Menschen, die länger als 10 Jahre nicht da waren, bei denen es also keine jüngeren Daten gibt:
- Hier muss der Datensatz nicht gesplittet werden, entweder muss er anonymisiert werden, oder eben nicht.
Bei Gesundheitsdaten gilt oft die Variante 2: "wer länger als 10 Jahre nicht da war...." Falls Die auch für Euch gilt, würde es reichen, die Identifikationsdaten einfach aus der Datenbank zu löschen. Änderungen am Datenbankdesign wären gar nicht nötig. Datenschutzrechtlich bräuchtet Ihr trotzdem eine Genehmigung zu statistischen Auswertung durch den betroffenen. Besprecht das am besten mit Eurem Datenschutzbeauftragten.
Grüße
lcer
Zitat von @37414:
@icer00
Ich habe nicht ganz verstanden, was Du mit "10 Jahre nach ABSCHLUSS der Behandlung" meinst.
Wie ja oben schon geschrieben, gäbe es die beiden Datenbanken (siehe Punkte 1 + 2 in meinem Post an "Lochkartenstanzer").
Und vielleicht kannst Du nochmal erklären, in welchem Fall es keine Probleme mit den IDs geben würde.
@icer00
Ich habe nicht ganz verstanden, was Du mit "10 Jahre nach ABSCHLUSS der Behandlung" meinst.
Wie ja oben schon geschrieben, gäbe es die beiden Datenbanken (siehe Punkte 1 + 2 in meinem Post an "Lochkartenstanzer").
Und vielleicht kannst Du nochmal erklären, in welchem Fall es keine Probleme mit den IDs geben würde.
Ich gehe mal von einer relationalen Datenbank aus. 1 Mensch hat darin n Dateneinträge
Variante: Löschen von Daten, die 10 Jahre oder älter sind:
Du erhältst durch das anonymisieren eines Menschen im schlechtesten Fall einen gesplitteten Datensatz:
- 1 Anonymer Mensch mit n Daten die 10 Jahre oder älter sind
- 1 nicht-Anonymer Mensch mit m Daten die jünger als 10 Jahre sind
Hier würde die ID die Anonymisierung durchbrechen.
Variante: Löschen von Daten von Menschen, die länger als 10 Jahre nicht da waren, bei denen es also keine jüngeren Daten gibt:
- Hier muss der Datensatz nicht gesplittet werden, entweder muss er anonymisiert werden, oder eben nicht.
Bei Gesundheitsdaten gilt oft die Variante 2: "wer länger als 10 Jahre nicht da war...." Falls Die auch für Euch gilt, würde es reichen, die Identifikationsdaten einfach aus der Datenbank zu löschen. Änderungen am Datenbankdesign wären gar nicht nötig. Datenschutzrechtlich bräuchtet Ihr trotzdem eine Genehmigung zu statistischen Auswertung durch den betroffenen. Besprecht das am besten mit Eurem Datenschutzbeauftragten.
Grüße
lcer
Zitat von @37414:
Nun käme die Idee von "Lochkartenstanzer" zum Tragen... nämlich "Hash als ID-Ersatz".
Wenn ich die Idee dahinter richtig verstanden habe, könnte man dadurch dann diese beiden Datenbanken gemeinsam auswerten, indem man daraus eine "Statistik-DB" erstellt mit den "gehashten" IDs. Und am Ende werden (wie auch immer) die Hashes dann wieder entfernt und man hat wieder die ursprünglichen beiden Datenbanken.
Nun käme die Idee von "Lochkartenstanzer" zum Tragen... nämlich "Hash als ID-Ersatz".
Wenn ich die Idee dahinter richtig verstanden habe, könnte man dadurch dann diese beiden Datenbanken gemeinsam auswerten, indem man daraus eine "Statistik-DB" erstellt mit den "gehashten" IDs. Und am Ende werden (wie auch immer) die Hashes dann wieder entfernt und man hat wieder die ursprünglichen beiden Datenbanken.
Meine Idee war, aus der aktuellen Datenbank Daten in die "Statistikdatenbank" zu kopieren und dabei alle Daten zu löschen, die auf die Person schließen lassen und die ID durch eine Hash zu ersetzen.
Für Statistiken nutzt man dann auschließlich die Archivdatenbank, die regelmäßig mit aktuellen Daten "befüllt" wird.
lks
Zitat von @Lochkartenstanzer:
Worauf bezieht sich Dein Kommentar? Auf meinen oder dem des TO?
lks
Zitat von @mbehrens:
Ich lese daraus nicht, dass die Anforderungen an die Pseudonymisierung erfüllt sind.
Ich lese daraus nicht, dass die Anforderungen an die Pseudonymisierung erfüllt sind.
Worauf bezieht sich Dein Kommentar? Auf meinen oder dem des TO?
lks
Tja, einmal nicht den bestehenden Text zitiert
Ich denke, die gemeinsame ID könnte ein Problem sein.
Danach hat man dann 2 Datenbanken, die aber natürlich auch z.T. gleiche Personen enthalten können.
Und genau das wäre nicht nötig, wenn als Regel „10 Jahre nach Ende der Behandlung „ gelten würde. Dann dürften nämlich auch 20 Jahre alte Daten mit Namen aufbewahrt werden, wenn die Person in den letzten 10 Jahren noch einmal da war. Das gilt für jede medizinische Behandlung, ob Ihr darunter fallt, weiß der Datenschutzbeauftragte.
Grüße
lcer
Hallo,
Such raus, auf welcher Grundlage ihr die Daten verwendet. Gibt es eine explizite Einwilligung des Betroffenen, und was umfasst diese? Wenn es keine gibt - welche Gesetzlichen Aufbewahrungsfristen treffen zu? Welche Gesetzlichen Regeln erlaube die Datennutzung.
Wenn klar ist, wie das laufen kann - dann kannst Du hier nochmal nachfragen, wie man das technisch umsetzt.
Sicherheitshalber nochmal im Klartext: Wenn Ihr keine Grundlage für die Datenverarbeitung habt - müsst Ihr sie löschen - egal ob das bedauerlich wäre.
Und eine 2. Klarstellung: Zu Studienzwecken erhobene Daten und zur Krankenbehandlung erhobene Daten sind 2 Paar Schuhe. Krankenbehandlungsdaten darf man nicht ohne weiteres zu Studienzwecken verwenden.
3. Klarstellung: Wenn euer Datenschutzbeauftragte das auf Euch abwälzt, sag Deinem Chef, dass die ganze Datenverarbeitung auf sehr unsicheren Füßen steht, und er sich schon mal einen Plan für den DSGVO-Ernstfall machen soll. Am besten schriftlich, damit Du abgesichert bist, falls was passiert.
Grüße
lcer
Zitat von @37414:
Hallo liebe User,
hat zu diesem Thema nochmal Jemand eine Idee?
na Dein Datenschutzbeauftragter!Hallo liebe User,
hat zu diesem Thema nochmal Jemand eine Idee?
Gibt es da eine Lösung?
Irgendwie muss sowas doch möglich sein.
Es kann ja nicht sein, dass man alle für Statistiken sinnvolle und wichtige Daten <älter als 10 Jahre> löschen muss.
doch, kann sein. Das muss Dein Datenschutzbeauftragter klären. Dazu ist er da. Nicht Du. Du kannst ihm aber helfen:Irgendwie muss sowas doch möglich sein.
Es kann ja nicht sein, dass man alle für Statistiken sinnvolle und wichtige Daten <älter als 10 Jahre> löschen muss.
Such raus, auf welcher Grundlage ihr die Daten verwendet. Gibt es eine explizite Einwilligung des Betroffenen, und was umfasst diese? Wenn es keine gibt - welche Gesetzlichen Aufbewahrungsfristen treffen zu? Welche Gesetzlichen Regeln erlaube die Datennutzung.
Wenn klar ist, wie das laufen kann - dann kannst Du hier nochmal nachfragen, wie man das technisch umsetzt.
Sicherheitshalber nochmal im Klartext: Wenn Ihr keine Grundlage für die Datenverarbeitung habt - müsst Ihr sie löschen - egal ob das bedauerlich wäre.
Und eine 2. Klarstellung: Zu Studienzwecken erhobene Daten und zur Krankenbehandlung erhobene Daten sind 2 Paar Schuhe. Krankenbehandlungsdaten darf man nicht ohne weiteres zu Studienzwecken verwenden.
3. Klarstellung: Wenn euer Datenschutzbeauftragte das auf Euch abwälzt, sag Deinem Chef, dass die ganze Datenverarbeitung auf sehr unsicheren Füßen steht, und er sich schon mal einen Plan für den DSGVO-Ernstfall machen soll. Am besten schriftlich, damit Du abgesichert bist, falls was passiert.
Grüße
lcer