Behebung von Lücken in der Testlandschaft für die biometrische Erkennung von Gesichtsverletzungen
Artikel
2. Mai, 2024

Behebung von Lücken in der Testlandschaft für die biometrische Erkennung von Gesichtsverletzungen

Serve Legal hat erfolgreich einen Testrahmen entwickelt, der einen sorgfältig und unter ethischen Gesichtspunkten kuratierten Datensatz enthält, um die Genauigkeit und Fairness von Technologien zur biometrischen Altersschätzung im Gesicht zu testen. Die führenden Technologien zur Altersschätzung gehen über die bloße Schätzung des Alters der vorgestellten Person hinaus und umfassen eine Funktion zur Erkennung von Lebendigkeit für zusätzliche Sicherheit.

Serve Legal berät sich mit den Anbietern von Alterssicherungssystemen und digitalen Identitätsnachweisen, um den umfassendsten verfügbaren Test zur Erkennung von Lügen zu entwickeln. Dieser Artikel befasst sich mit der aktuellen Testlandschaft und einigen der Lücken, die geschlossen werden müssen, um die Branchen für Alterssicherung und digitale Identifizierung angemessen zu unterstützen und potenziellen Anwendern dieser Technologien fundierte Vergleiche zu ermöglichen.


Die Aktivitätserkennung ist eine Schlüsselkomponente der biometrischen Alterssicherung und der digitalen ID-Technologie.

Seine Aufgabe ist es, zu überprüfen, ob es sich bei dem, was dem biometrischen System vorgelegt wird, um einen lebenden Menschen und nicht um ein Foto, eine Prothese, ein digital eingespeistes Video oder ein anderes künstliches Artefakt handelt. Diese Überprüfung dient dazu, Missbrauch zu verhindern, z. B. die Vorlage der digitalen ID einer anderen Person oder die Einspeisung eines gefälschten Videos, um die biometrische Analyse zu überlisten.

Die Aktivitätserkennung wird in einer schnell wachsenden Zahl von Anwendungen eingesetzt, z. B. im Bankwesen, bei staatlichen Diensten und im Einzelhandel, um nur einige zu nennen.

Die Techniken zur Erkennung des Vorhandenseins von Liveness lassen sich grob in passive und aktive Techniken einteilen. Passive Erkennung bedeutet, dass der Benutzer keine spezifischen Aktionen ausführen muss, um mit der Schnittstelle zu interagieren, die die Erkennung durchführt. Aktive Erkennung bedeutet, dass der Benutzer Aktionen wie Blinzeln, Drehen des Kopfes oder Anpassen des Abstands der Kamera durchführen muss.

Jede Technik hat Vor- und Nachteile und kann für verschiedene Einsatzbereiche mehr oder weniger geeignet sein. So ist beispielsweise die passive Aktivitätserkennung wahrscheinlich mit weniger Reibungsverlusten für die Benutzer verbunden, da diese keine interaktiven Anweisungen ausführen müssen. Die aktive Aktivitätserkennung führt zu einer gewissen Reibung, aber die Anbieter solcher Technologien sind der Meinung, dass diese Reibung durch die höhere Genauigkeit aufgewogen wird. Mit den unabhängigen Tests, die derzeit für beide Anbieter zur Verfügung stehen, ist es nicht möglich, diese Eigenschaften so zu quantifizieren, dass sie sowohl hinsichtlich der Leistung als auch der Benutzererfahrung verglichen und bewertet werden können.

Dies stellt eine Herausforderung für Unternehmen wie Einzelhändler, Buchmacher, Banken usw. dar, die eine Lösung zur Erkennung von Liveness in ihr System integrieren möchten. Bei der Einführung einer solchen Technologie wird ein Unternehmen wahrscheinlich eine Due-Diligence-Prüfung durchführen, wie z. B.:

  1. Ist die Genauigkeit für den Einsatzkontext ausreichend?
  2. Ist das Benutzererlebnis gut genug, um die Kunden zufrieden zu stellen?
  3. Welche Lösung bietet den besten Kompromiss zwischen Betrugsprävention und Benutzerfreundlichkeit?

Im Bereich der biometrischen Gesichtserkennung ist das NIST (National Institute of Standards and Technology), eine Behörde der US-Regierung, der etablierte Verwalter von Leistungsbenchmarks für Gesichtserkennungs- und Gesichtsanalysealgorithmen. Die Lebendigkeitserkennung gehört jedoch nicht zu den Kernkompetenzen des NIST. Dies liegt daran, dass ihre biometrischen Gesichtstests aufgrund ihres Status als US-Regierungsbehörde durch ihren Zugang zu vorab gesammelten Gesichtsbilddatensätzen aus Fahndungsfotos und Grenzkontrollen erleichtert werden.

Da die Tests des NIST auf statischen Bilddaten basieren, verfügen sie nicht über lebende Testpersonen, die die Systeme zur Erkennung von Liveness testen können.

Die auf dem Markt befindlichen passiven Lösungen zur Erkennung der Echtheit, die die Echtheit auf der Grundlage einer einzigen 2D-Bilderfassung beurteilen, können beim PAD-Programm des NIST zur Bewertung der Gesichtsanalyse-Technologie (FATE) eingereicht werden, wobei PAD für Presentation Attack Detection steht. PAD steht für Presentation Attack Detection (Erkennung von Präsentationsangriffen). Dieser Begriff wird verwendet, um die Wirksamkeit eines Gesichtsanalysewerkzeugs bei der Erkennung eines Spoofs zu beschreiben, d. h. eines bösen Akteurs, der versucht, sich als eine andere Person auszugeben, um eine biometrische Gesichtsprüfung zu überlisten.

Leider verwirrt dies das Wasser, wenn es um Lösungen zur Erkennung von Liveness geht, denn wie das NIST in seinem Bericht "Part 10: Performance of Passive, Software-Based Presentation" deutlich macht

Algorithmen zur Erkennung von Angriffen (PAD):"In diesem Test haben wir passive PAD-Ansätze bewertet, die auf zuvor gesammelten Bildern ohne jegliche Benutzerinteraktion arbeiten. PAD-Ansätze, die eine Benutzerinteraktion erfordern, sind für FATE PAD nicht geeignet."(Lesen Sie hier mehr)

Die Semantik in dieser Aussage ist wichtig. Die Bewertung von "passiven PAD-Ansätzen" durch das NIST ist keine Bewertung von passiven Liveness-Ansätzen. Zur Veranschaulichung: Die Bewertung eines passiven PAD-Angriffs könnte darin bestehen, ein Selfie von jemandem zu machen, der eine fachmännisch angefertigte und teure Prothesenmaske trägt. Das mit dem Selfie aufgenommene 2D-Bild könnte anschließend zur Auswertung an ein biometrisches System weitergeleitet werden. Wenn die PAD-Auswertung das Bild zurückweist, wurde der Angriff korrekt als Fälschung identifiziert und der Test war bestanden. Ein passiver Lebendigkeitstest erfordert zwar keine spezifischen Aktionen des Benutzers, aber dennoch eine Live-Interaktion und nicht nur ein vorab erfasstes 2D-Bild. Das System könnte zum Beispiel dynamische Beleuchtungseinstellungen auf dem Gerät verwenden, während das Selfie aufgenommen wird, wobei die resultierende Bildaufnahme in Echtzeit ausgewertet wird, um zu beurteilen, ob die dynamische Beleuchtung auf menschlicher Haut/Augen wie erwartet erscheint, im Gegensatz zu Latex, Silikon oder sogar Glas im Falle der Videowiedergabe.

Daher ist Vorsicht geboten, wenn die Leistung eines passiven Liveness-Tools auf der Grundlage dieser PAD-Bewertung beurteilt wird. Während ein Algorithmus, der in diesem PAD-Test eine hohe Punktzahl für die Sicherheit erzielt, als sehr leistungsfähig bei der Erkennung von Angriffen wie 2D-Bildern von Personen mit Masken oder dem Hochhalten von Fotos angesehen werden kann, ist dies nicht gleichbedeutend mit der Prüfung, ob der Benutzer zum Zeitpunkt der Präsentation physisch anwesend ist, und könnte daher als schwächerer Leistungstest angesehen werden.

Eine hohe Punktzahl für Komfort bedeutet, dass der Algorithmus eine niedrige Falscherkennungsrate hat. Dies ist eine wichtige Kennzahl, aber diese Art von Komfort unterscheidet sich deutlich von der Benutzererfahrung, die man beim Vergleich von aktiven und passiven Lösungen zur Erkennung von Liveness bewerten möchte.

Glücklicherweise bietet die Norm ISO 30107-3:2023 einen Rahmen für PAD-Tests, der auch die Erkennung von Liveness abdeckt. Leider weisen die nach dieser Norm verfügbaren Tests Schwachstellen auf, so dass die Branchen für Alterssicherung und digitale Identifizierung robustere, unabhängige und vergleichbare Tests von Systemen zur Erkennung von Echtheit benötigen.

Die Industrie hat insbesondere Bedenken, dass die Tests zu leicht zu bestehen sind, dass sie von Hersteller zu Hersteller unterschiedlich sind und dass sie keine digitalen Injektionsangriffe berücksichtigen.

Weitere Unzulänglichkeiten bestehen in der Testlandschaft, wenn es darum geht, sicherzustellen, dass die Systeme in Übereinstimmung mit ethischen Best Practices entwickelt werden. So sollten beispielsweise Tests mit einer ausreichenden Stichprobengröße und einer angemessenen Diversität durchgeführt werden, um signifikante Diskrepanzen in der Bona Fide Presentation Classification Error Rate (BPCER) zwischen demografischen Gruppen zu erkennen. Eine solche Fairness-Metrik ist für die Anwender dieser Technologien, seien es Banken, Supermärkte oder andere, unerlässlich, um sicher zu sein, dass sie nicht gegen die Gleichstellungsgesetzgebung verstoßen, indem sie ein System zur Erkennung von Lebendigkeit einsetzen, das bei der Erkennung von Lebendigkeit für bestimmte demografische Gruppen eine Verzerrung aufweist.

Darüber hinaus fehlt es den Anwendern dieser Technologien an unabhängig geprüften Messgrößen, die es ihnen ermöglichen, risikobasierte Bewertungen darüber vorzunehmen, welches System in Anbetracht des Kontexts, in dem es eingesetzt werden soll, das optimale Gleichgewicht zwischen Genauigkeit und Benutzererfahrung bietet.

Und schließlich gibt es keine Metrik, die den Vergleich der Betriebskosten der verschiedenen Lösungen erleichtert. So ist es beispielsweise möglich und vielleicht sogar wahrscheinlich, dass einige Ansätze deutlich mehr Rechenressourcen benötigen als andere, um eine Lebensdauerkontrolle durchzuführen. Wenn diese Kosten insgesamt beträchtlich sind, könnten sie sich auch auf die risikobasierte Entscheidungsfindung von Unternehmen auswirken, die Liveness Detection integrieren müssen.

Wenn Sie ein Anbieter von Liveness Detection sind, setzen Sie sich bitte mit unserem Team für Gesichtsbiometrie in Verbindung, das gerne Ihre Herausforderungen in Bezug auf die unabhängige Überprüfung der Leistung, Fairness, Effizienz und mehr Ihres Tools erkunden wird.

Graham Roberts
Graham Roberts ist der Chief Technology Officer (CTO) von Serve Legal. Grahams Arbeit ist entscheidend dafür, dass Serve Legal seine Position an der Spitze der Compliance-Branche hält, insbesondere in Bereichen wie KI, Datenmanagement und Systemeffizienz. Seine Führung stellt sicher, dass die technologische Infrastruktur des Unternehmens nahtlose Abläufe unterstützt und genaue, zeitnahe Prüfungsergebnisse für Kunden liefert.

Abonnieren Sie unseren Newsletter

männlicher-Barista-mit-Mitnahme-Kaffee-min
home-hero
4

Bleiben Sie den Änderungen der Vorschriften voraus.

Setzen Sie sich mit einem Mitglied des Serve Legal Teams in Verbindung, um zu besprechen, wie wir Ihr Unternehmen unterstützen können.