Name Matching Experiment
(Teil 6)

Eurospider hat mit der beliebten Levenshtein-Distanz ein einfaches Experiment durchgeführt. Mit rund 600 Namen aus den Medien wurden Treffer in einer mehr als 1000 mal grösseren Testdatenbank gesucht. Die Testdatenbank enthält zu jedem der 600 Namen den vollständig korrekten Namen, welcher vom Mediennamen abweicht. Für jeden der 600 Namen wurden die gefunden Namen nach aufsteigender Levenshtein-Distanz rangiert. Schliesslich wurden Ausbeute und Präzision ermittelt für den Fall, dass die ersten n Ränge gesichtet werden. Was kann man daraus lernen?

chart both

Wir sehen, dass je mehr Ränge gesichtet werden, desto mehr korrekte Treffer (True Positives) werden gefunden. Wie erwartet sinkt die Präzision. Das heisst dass je mehr Ränge gesichtet werden, desto mehr falsche Treffer (False Positives) werden gefunden. Das starke Abfallen der Präzisionskurve bedeutet, dass der Verifikationsaufwand signifikant steigt.

Zurück zu Compliance

Name Matching

Totalrevision Datenschutzgesetz

Seit dem 15. September 2017 liegen Botschaft und Entwurf des Bundesrates für ein revidiertes Datenschutzgesetz auf dem Tisch. In einer ersten Etappe nahm das Parlament wichtige Anpassungen ans EU-Recht vor (Weiterentwicklung des Schengen-Besitzstandes). Die zweite, umstrittenere Etappe befindet sich seit September 2019 in den parlamentarischen Beratungen. Mit der Vorlage soll der Datenschutz durch erhöhte Transparenz bei der Datenbearbeitung und mehr Kontrollmöglichkeiten der betroffenen Personen gestärkt werden. Griffige Sanktionen und Handlungspflichten der verantwortlichen Personen sollen die korrekte Umsetzung gewährleisten.

Links: datenrecht.ch

Compliance

Medienanalyse

Wissensmanagement

Name Matching Experiment
(Teil 6)

Resultate

Alle Beiträge

Compliance Blog

Totalrevision Datenschutzgesetz

Compliance

Medienanalyse

Wissensmanagement

Name Matching Experiment(Teil 6)

Resultate

Alle Beiträge

Compliance Blog

Totalrevision Datenschutzgesetz

Name Matching Experiment
(Teil 6)