Name Matching Experiment
(Teil 6)

Eurospider hat mit der beliebten Levenshtein-Distanz ein einfaches Experiment durchgeführt. Mit rund 600 Namen aus den Medien wurden Treffer in einer mehr als 1000 mal grösseren Testdatenbank gesucht. Die Testdatenbank enthält zu jedem der 600 Namen den vollständig korrekten Namen, welcher vom Mediennamen abweicht. Für jeden der 600 Namen wurden die gefunden Namen nach aufsteigender Levenshtein-Distanz rangiert. Schliesslich wurden Ausbeute und Präzision ermittelt für den Fall, dass die ersten n Ränge gesichtet werden. Was kann man daraus lernen?

chart both

Wir sehen, dass je mehr Ränge gesichtet werden, desto mehr korrekte Treffer (True Positives) werden gefunden. Wie erwartet sinkt die Präzision. Das heisst dass je mehr Ränge gesichtet werden, desto mehr falsche Treffer (False Positives) werden gefunden. Das starke Abfallen der Präzisionskurve bedeutet, dass der Verifikationsaufwand signifikant steigt.

Totalrevision Datenschutzgesetz

Seit dem 15. September 2017 liegen Botschaft und Entwurf des Bundes­rates für ein revidiertes Daten­schutz­gesetz auf dem Tisch. In einer ersten Etappe nahm das Parlament wichtige An­passungen ans EU-Recht vor (Weiter­entwicklung des Schengen-Besitz­standes). Die zweite, um­strittenere Etappe befindet sich seit September 2019 in den parlamentarischen Beratungen. Mit der Vorlage soll der Datenschutz durch erhöhte Transparenz bei der Datenbearbeitung und mehr Kontrollmöglichkeiten der betroffenen Personen gestärkt werden. Griffige Sank­tionen und Handlungs­pflichten der ver­ant­wortl­ichen Personen sollen die korrekte Um­setzung gewähr­leisten.

Links: datenrecht.ch

Eurospider Information Technology AG
Winterthurerstrasse 92
8006 Zürich

 

Cookies erleichtern die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies verwenden.
Weitere Informationen Ok Ablehnen