Zum Inhalt

WRITE

IT unterstützte Suche und Vergleich von Handschriften

Programm / Ausschreibung KIRAS, Kooperative F&E-Projekte, KIRAS Kooperative F&E-Projekte 2019 Status abgeschlossen
Projektstart 01.10.2020 Projektende 31.03.2023
Zeitraum 2020 - 2023 Projektlaufzeit 30 Monate
Keywords Forensik, AI, Deep Learning, Handschriftensuche

Projektbeschreibung

Strafverfolgungsbehörden besitzen umfangreiche Sammlungen von Handschriften, wie zum Beispiel handschriftliche Dokumente von ungeklärten Straftaten und Schriftproben von Tatverdächtigen und Strafgefangenen. Diese Sammlungen sind jedoch derzeit nur eingeschränkt nutzbar, da für die Identifizierung eines unbekannten Schreibers alle entsprechenden Dokumente von Handschriftexperten manuell beurteilt werden müssen.
Ziel von WRITE ist die Schaffung einer IT basierten leistungsfähige Suche nach ähnlichen Handschriften. Damit soll eine Identifizierung unbekannter Schreiber durch Handschriftexperten beschleunigt werden, da nur noch ähnliche Schriften manuell verglichen werden müssen. Dabei soll die Suche, im Gegensatz zu derzeitigen Lösungen am Markt, ohne umständliche subjektive Klassifizierung der Handschrift durch Experten auskommen, da dies bei großen Mengen von handschriftlichen Dokumenten keine effektive Lösung darstellt. Solche Verfahren sind einerseits sehr zeitintensiv und andererseits auch fehleranfällig, da sie von der subjektiven Klassifizierung der einzelnen Experten abhängen. Idealerweise soll bei WRITE nur ein Einscannen der handschriftlichen Dokumente notwendig sein um diese für eine Suche zur Verfügung zu stellen. Damit ist auch eine Rückerfassung schon vorhandener Handschriften relativ leicht durchführbar und bestehende Datenbanken mit handschriftlichen Dokumenten erhalten einen erheblichen zusätzlichen präventiven Charakter.
Das technisch-wissenschaftliche Ziel von WRITE ist die Entwicklung einer auf künstlicher Intelligenz bzw. maschinellem Lernen basierten Suche, die so leistungsfähig ist, dass allfällige Schriften vom selben Schreiber mit einer Wahrscheinlichkeit von mehr als 80% in einer Hitliste enthalten sind, die kleiner als 2% der durchsuchten Datensammlung ist. Das Referat Urkunden- & Handschriftenuntersuchung im Büro für Kriminaltechnik des Bundeskriminalamts (BK) im Bundesministerium für Inneres (BMI) besitzt dabei umfangreiche Sammlungen von Handschriften, die die Datengrundlage für eine solche Entwicklung bieten. Diese Daten dienen auch dem GSK Partner als Basis bei der Erörterung der Individualität und relativer Konstanz der persönlichen Handschrift, die wiederum in die Entwicklung der Methodik miteinfließt.

Abstract

Law enforcement agencies possess an extensive collection of handwritten documents. This includes for example documents belonging to open cases and reference samples from suspects and prisoners. Yet, these collections of documents can only be utilized to a limited extend, since for an identification of an unknown writer all documents have to be compared manually by handwriting experts.
WRITE aims to solve this problem by developing an IT based solution which allows for the search of similar handwritings. In this way, the identification of unknown writers by handwriting experts can be expedited, since only a small number of documents with similar handwritings have to be compared manually. In contrast to currently available commercial solutions, with the proposed system no manual classification of the handwritings needs to be performed beforehand. This is on the one hand time consuming and on the other hand error prone, since it depends on the subjective opinion of the individual expert. Ideally, it is only required to digitize the handwritten documents using an image scanner to utilize the proposed system. This also provides an effortless way to utilize already existing databases with handwritten documents and, as a consequence, these databases would gain a significant preventive character.
The scientific-technical goal of WRITE is the development of a retrieval system based on artificial intelligence/machine learning that is accurate enough to list documents from the same writer in the top 2% of the retrieved sorted list in 80% of the cases. The Referat Urkunden- & Handschriftenuntersuchung im Büro für Kriminaltechnik des Bundeskriminalamts in the Federal Ministry of the Interior (BMI) possesses a comprehensive collection of handwritten documents essential for such a development. These data will also provide the basis for the research on the individuality and variability of handwriting that will be conducted by the GSK partner, which will in turn support the development of the methodology.