Office: Anonymisierung und Pseudonymisierung von Beispielmappen

Helfe beim Thema Anonymisierung und Pseudonymisierung von Beispielmappen in Microsoft Excel Hilfe um das Problem gemeinsam zu lösen; Hallo jack_D, aber dann hast du ein System dahinter. Das macht Dritte erst recht neugierig, wenn das System erkannt wurde. Andererseits geht es hier... Dieses Thema im Forum "Microsoft Excel Hilfe" wurde erstellt von chris-kaiser, 26. Mai 2015.

  1. Anonymisierung und Pseudonymisierung von Beispielmappen


    Hallo jack_D,

    aber dann hast du ein System dahinter.

    Das macht Dritte erst recht neugierig, wenn das System erkannt wurde.

    Andererseits geht es hier nicht um 'richtige' Verschlüsselung.
     
  2. Hallo xlph

    da hast du natürlich recht. An sowas hab ich nicht gedacht.

    Aber. Ob und wie Weit die Originalen wiederherstellbar sind, wäre zu beweisen.
    Ich denk mal, aufgrund der Randomisierung wird das eher schwer.

    Der Vorteil der Erweiterung wäre natürlich das die Datensatzstruktur erhalten bleibt.
    Als Beispiel wenn es um Formeln mit mehrspaltigen Suchergebnissen geht, dann wäre es blanker Zufall wenn der anonymisierte Datensatz die anbietet.

    Aber ist ja auch kein muss. war ja nur ne Idee =)

    Grüße
     
    jack_D, 29. Mai 2015
    #17
  3. Code:
    Wozu wieder herstellbar? der Fragesteller macht eine Kopie seines Originals
    und stellt es hier anonymisiert ein. Eine Wiederherstellung ist nicht nötig.
    Eine Entschlüsselung wird nicht benötigt.

    Bleibt sie bei unseren Beispielen doch auch. Es werden nur Ziffern und Buchstaben
    bzw. Zeichen nach Zufall getauscht. Satz und Trennzeichen
    werden davon ausgeschlossen.

    Code:
    Es geht hier nur um Konstanten, sozusagen die Rohdaten. Jedes Formelergebnis
    erhält in 1. Ebene die Daten aus Konstanten.
    Und diese gilt es zu manipulieren. Dementsprechend werden auch
    die Formelergebnise andere Werte zurückgeben.

    Problematisch ist es dennoch.
    Öfters wird zu hören sein: 'In der Original-Datei funktioniert es nicht!'
    Da jetzt nicht mit den Original-Daten gearbeitet wird, erschwert die
    Fehlersuche und -beseitigung.

    Nix für Anfänger und zur Pauschal-Anwendung, erschwert uns nur das Leben.

    Wenn wir uns da mal nicht ins eigene Fleisch geschnitten haben.*wink.gif*

    Bsp-Frage:
    In spalte C habe ich 'x'-en stehen, Jetzt möchte ich überall da wo ein 'x'
    steht die Zeile ausblenden.


    Wurde das Blatt anonymisiert so, steht für 'x' ein x-beliebiger kleiner
    Buchstabe, da wird sich der Fragesteller aber freuen und der Antworter
    erst recht.

    Man sollte zumindest die Caesar-Verschlüsselung anwenden.

    Auf jeden Fall muss ein System dahinter.

    Werd mich gleich mal ans umschreiben machen....
     
  4. Anonymisierung und Pseudonymisierung von Beispielmappen

    Wozu wieder herstellbar? der Fragesteller macht eine Kopie seines Originals
    und stellt es hier anonymisiert ein. Eine Wiederherstellung ist nicht nötig.
    Eine Entschlüsselung wird nicht benötigt.

    Okay war blöd formuliert. Das bezog sich auf die Neugier eines Dritten.
    Der kann den Klartext meiner Meinung nach nicht "wieder her stellen" Das es der "Anonymisator" (Was ein geiles Wort) die originale hat, ist klar denk ich. (Wobei wenn man bei deinem Fleisch - Schneiden -Gedanken bleibt, könnte man auch darauf hinweisen. " Meine ganzen Daten sind futsch" *tongue.gif* )




    Aber erst nach der Ergänzung von Haklesoft .. oder?

    Es geht hier nur um Konstanten, sozusagen die Rohdaten. Jedes Formelergebnis
    erhält in 1. Ebene die Daten aus Konstanten.
    Und diese gilt es zu manipulieren. Dementsprechend werden auch
    die Formelergebnise andere Werte zurückgeben.

    Soweit richtig. Allerdings sind es (wenn ich es richtig verstehe) eigentlich "Semi"-Konstanten. Da sie nicht für alle gleich sind
    (Gleicher Ausgangswert Anonymisierungswert [Zufallsbedingt KANN der aber auch gleich sein])

    Das wird vorallem dann auftreten, wenn nicht Zellwerte sondern Zell-Teil-Werte betrachtet werden. Dieses Problem kann man imho nur beheben, wenn man Jedes Zeichen identisch verschlüsselt. Was uns dann zu deinem Cäsar-Verfahren bringt.


    Das problem mit den x-en würde sich mit meiner Ergänzung lösen. Da hier dann zwar kein X steht, aber dennoch ein immergleicher Buchstabe. Bspw. "D

    Das Umschreiben, wenn ich es richtig verstehe ist quasi die Ergänzung meiner Ergänzung. Nur das ich es Stringbezogen gemacht habe und du dann Zeichenbezogen.. right?

    Grüße
     
    Zuletzt von einem Moderator bearbeitet: 12. Januar 2021
    jack_D, 29. Mai 2015
    #19
  5. Nochmal ergänzt (Datum wurde als String ausgespuckt was im weiteren zu fehlern führte)
    und etwas bereinigt unnötige Variablen die ich vorher reingebaut hab wieder weg =)

    Sowie ergänzt um die Textfunktion von Haklesoft (Die fand ich schön) =)

    Code:
     
    jack_D, 29. Mai 2015
    #20
  6. OfficeUser Neuer User
    Hallo zusammen!
    Zunächst mal: Ein dickes Lob für die bisherigen Gedanken!
    Ich befürchte allerdings (wohl mit Recht), dass dies zu einer "Spielwiese" für Kenner und Könner wird.
    Ich meine damit, dass ein geübter Anwender, der sich scheut, Firmendaten preiszugeben, durchaus selbständig nach Aufforderung eine Anonymisierung durchführen kann.
    Der (überforderte) Angestellte, der Angst hat, vielleicht sogar noch nie ein Makro ausgeführt geschweige denn einen "ominösen" Code in den VBA-Editor (wasndasn?) kopiert und ausgeführt hat, wird mit dieser Hilfestellung überfordert sein.

    Deshalb mein Vorschlag:
    Gebt DIESEN Anwendern ein simples Beispiel.
    Es folgt "mein Textbaustein":

    Wichtig bei der Beispieldatei sind Aufbau, Zahlenformate, Formeln und evtl. verbundene Zellen.
    Die Überschriften sollten bestehen bleiben, die "geheimen" Daten (rote Überschrift) können nach folgendem Schema erfolgen:

    *ABCDEFGHI
    1NameVornameStadtGebDatGebJahrGehalt*durchschn. Gehalt des in I2 geborenenGebJahr
    2Name2Vorname2Stadt222.04.201220121.365,00 €*2.291,00 €1965
    3Name3Vorname3Stadt311.05.197619761.474,00 €*2.291,00 €*
    4Name4Vorname4Stadt406.09.196619661.701,00 €*2.291,00 €*
    5Name5Vorname5Stadt525.05.196519651.149,00 €*2.291,00 €*
    6Name6Vorname6Stadt611.12.197519753.061,00 €***
    7Name7Vorname7Stadt713.05.196419643.286,00 €***
    8Name8Vorname8Stadt827.01.201320131.339,00 €***
    9Name9Vorname9Stadt901.03.198619862.494,00 €***
    10Name10Vorname10Stadt1001.12.198919891.160,00 €***
    11Name11Vorname11Stadt1102.04.197719773.302,00 €***
    12Name12Vorname12Stadt1230.05.198619862.350,00 €***
    13Name13Vorname13Stadt1330.09.196519653.433,00 €***
    14Name14Vorname14Stadt1401.10.196119611.813,00 €***
    15Name15Vorname15Stadt1514.04.197019703.648,00 €***
    16Name16Vorname16Stadt1630.09.200220023.780,00 €***
    17Name17Vorname17Stadt1710.09.197319733.017,00 €***
    ZelleFormel
    A2=A&ZEILE()
    B2=B&ZEILE()
    C2=C&ZEILE()
    E2=JAHR(D2)
    H2=SUMMEWENN(E:E;I2;F:F)/ZÄHLENWENN(E:E;I2)
    H3=MITTELWERTWENN(E:E;I2;F:F)
    H4=DBMITTELWERT(A:F;6;I1:I2)
    H5=SUMMENPRODUKT((E2:E17=I2)*(F2:F17))/ZÄHLENWENN(E2:E17;I2)
    Just my two cents,
    Ralf
     
    OfficeUser, 29. Mai 2015
    #21
  7. Hallo,

    nun hier der finale Code.

    Die Ersatzzeichen werden zu Beginn per Zufall getauscht und in ein
    modulweit gültiges Array geschrieben:

    Private mabytASCII_Encrypt(32 To 255) As Byte

    der Original-ASCII-Code ist zugleich der Index des Arrays welches
    den Ersatz-ASCII enthält. Somit ist ein sehr schnelles austauschen der
    Zeichen gegeben.

    (260 Code-Zeilen)

    Code:
     
  8. Anonymisierung und Pseudonymisierung von Beispielmappen

    Hallo xlph,

    Deine Routinen funktionieren gut.

    Bei der Textersetzung bleiben Umlaute aber immer Umlaute, da sie jeweils nur unter sich tauschen. Und das ß ist gar nicht mit berücksichtigt.

    In der Textersetzung würde ich enthaltene Zahlen ebenso wie Sonderzeichen gar nicht umwandeln; - oder zumindest dann nicht, wenn der User das bei der Startfrage verneint.
     
    haklesoft, 3. Juni 2015
    #23
  9. Code:
    Richtig! Das wollte ich so auch haben.

    Code:
    Sonder- und Satzzeichen bleiben erhalten um die Textstruktur zu erkennen.
     
  10. Da habe mich wohl nicht klar genug ausgedrückt. *depressed

    Bisher wird aus diesen Texten:
    Haus 2, Raum 1
    Haus 3, Raum 2
    Haus 4, Raum 1
    Haus 5, Raum 2

    so etwas:
    Hgzv 5, Igzx 9
    Hgzv 4, Igzx 5
    Hgzv 0, Igzx 9
    Hgzv 1, Igzx 5

    Ich fände es besser, wenn in den Texten die Ziffern/Zahlen ggf. nicht verändert würden:
    Hgzv 2, Igzx 1
    Hgzv 3, Igzx 2
    Hgzv 4, Igzx 1
    Hgzv 5, Igzx 2

    In Abhängigkeit von der Frage an den User, ob er Zahlen auch ersetzen will, wären nur geringe Änderungen an Deinem Code erforderlich, um das zu erreichen: Code:
     
    haklesoft, 3. Juni 2015
    #25
  11. Die Ziffern in Texten möchte ich aber umwandeln, wieso eigentlich nicht.

    Die Abfrage nach Zahlen hat mit den Ziffern in Texten nichts zu tun.

    'Tatsächliche' Zahlen werden anders behandelt.

    Und Ziffern in Text sollen umgewandelt werden.
     
  12. Die Ziffern in Texten möchte ich aber umwandeln, wieso eigentlich nicht.
    Es wird schon kryptisch genug, wenn hier nur die Buchstaben verdreht werden:
    "1. Rate", "2. Rate", "3. Rate"
    "Schraube 8 mm", "Schraube 16 mm"
    "Größe 1 bis 15", "Größe 16 bis 31"
    "Maß 100 * 200", "Maß 150 * 250"

    Die Abfrage nach Zahlen hat mit den Ziffern in Texten nichts zu tun.
    Das würde ich als User aber nicht so sehen. Wenn ich die Datum/Zahl-Umwandlungsfrage mit Nein beantworte bin ich doch einigermaßen überrascht, wenn meine Zahlen in den Textfeldnern doch ausgetauscht wurden.

    'Tatsächliche' Zahlen werden anders behandelt.
    Einverstanden.

    Und Ziffern in Text sollen umgewandelt werden.
    Da vertrete ich weiterhin meine abweichende Meinung.
     
    haklesoft, 3. Juni 2015
    #27
  13. Anonymisierung und Pseudonymisierung von Beispielmappen

    Hier dann doch mit Text-Ziffern-Umwandlung-Abfrage.

    Code:
     
  14. Hi,

    schön *Smilie
    ggf. könnte noch ein len eingebaut werden.
    Damit Werte wie X auch X bleiben, wenn ich da an Mappen denke wie Abwesenheiten: suche alle k u usw. und einstellige Angaben sind schon anonym genug oder?

    Gibt es sonst noch Ideen dazu?
    wie wäre es wenn gleich Kopf und Fußzeilen aus allen Tabellen genommen werden?

    usw. usw.

    Code:
     
    chris-kaiser, 9. Juni 2015
    #29
  15. Ja, siehe

    Bisher erkennt der Code als Text formatierte Zahlen immer als IsNumeric=True und setzt sie um, auch wenn beide Abfragen verneint werden.

    Gleiche Inhalte in einer Datei sollten auch gleiche Umsetzungen ergeben. Innerhalb eines Aufrufs ist das mit xlph's Code gegeben. Wenn allerdings ein weiterer Bereich der Datei anonymisiert wird, gibt es andere Ergebnisse. Beibehaltung der Umsetzungstabelle je Datei.
     
    haklesoft, 9. Juni 2015
    #30
Thema:

Anonymisierung und Pseudonymisierung von Beispielmappen

  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Auf dieser Website werden Cookies für die Zugriffsanalyse und Anzeigenmessung verwendet.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden