Compliance und Datenqualität

Eine schlechte Qualität der Stammdaten erhöht die Wahrscheinlichkeit, Treffer zu verpassen. Beispielsweise können Codierungsprobleme dazu führen, dass politisch exponierte Personen (PEP) nicht erkannt werden.

 

Bankensysteme stellen Namen als 0/1-Sequenzen dar. Der Vorname "Jim" wird beispielsweise bei der ASCII-Codierung wie folgt dargestellt:

 

"01001010" "01101001" "01101101".

 

Buchstabencodierungen wie ISO-8859-1 und UTF-8 unterscheiden sich, weil ASCII keine Umlaute und andere spezielle Buchstaben nicht darstellen kann.

Betrachten wir als Beispiel den Namen "Jürg Näf", welche in ISO-8859-1 und UTF-8 verschieden dargestellt wird.

 

"01001010" "11111100" "01110010" "01100111"

 

"01001010" "11000011 10111100" "01110010" "01100111"

 

"01001110" "11100100" "01100110"

 

"01001110" "11000011 10100100" "01100110"

Die Buchstabencodierung ist relevant, wenn ein Bankensystem aus historischen Gründen Kundennamen verschieden kodiert. In diesem Fall kann "Jürg Näf" perfekt übereinstimmen. Wenn aber die UTF-8-Codierung fälschlicherweise als ISO-8859-1 angenommen wird, resultiert eine Abweichung von 44% (4 von 9 Bytes).

Möchte man Treffer mit 44% und mehr Abweichungen verifizieren, dann führt dies zu einer hohen Zahl von falschen Alarmen.

 

 

Totalrevision Datenschutzgesetz

Der Vorentwurf des totalrevidierten Datenschutzgesetzes befindet sich derzeit in der Vernehmlassung. Er bezweckt die Stärkung des Datenschutzes durch erhöhte Transparenz bei der Datenbearbeitung und mehr Kontrollmöglichkeiten der betroffenen Personen. Griffige Sanktionen und Handlungspflichten der verantwortlichen Personen sollen dabei die korrekte Umsetzung gewährleisten.

Links: Entwurf, Bericht

Eurospider Information Technology AG
Schaffhauserstrasse 18
8006 Zürich