LLEA
LLM-basierte Methoden zur Datenanalyse in der Strafverfolgung
Programm / Ausschreibung | KIRAS, Kooperative F&E-Projekte, KIRAS-Kybernet-Pass CS Kooperative F&E Projekte (CS KFE_2024) | Status | laufend |
---|---|---|---|
Projektstart | 01.10.2025 | Projektende | 30.09.2027 |
Zeitraum | 2025 - 2027 | Projektlaufzeit | 24 Monate |
Keywords | LLMs, Cybercrime, Digitale Forensik |
Projektbeschreibung
Die jüngsten Fortschritte in generativer KI, insbesondere bei Large Language Models (LLMs), eröffnen erhebliche Innovationspotenziale zur Effizienzsteigerung. Sie ermöglichen die Analyse großer Datenmengen, unterstützen Entscheidungsprozesse und automatisieren Berichtspflichten – auch für Strafverfolgungsbehörden. Gleichzeitig bleiben jedoch zentrale Herausforderungen bestehen, darunter die Anfälligkeit für fehlerhafte oder nicht nachvollziehbare Ergebnisse, der Schutz sensibler Daten sowie ethische, soziale und regulatorische Fragen – insbesondere im Hinblick auf den EU AI Act.
Das LLEA-Projekt entwickelt und evaluiert LLM-basierte Methoden zur Datenanalyse in der Strafverfolgung. Es konzentriert sich auf drei zentrale Anwendungsfälle: (i) Transkription und Übersetzung, (ii) Analyse großer, heterogener Datenmengen und (iii) Identifikation betrügerischer Investment-Plattformen. Neben technischen Aspekten wie Genauigkeit und Skalierbarkeit werden auch regulatorische Anforderungen, Bias, Nachvollziehbarkeit, soziale Kosten und organisatorische Veränderungen berücksichtigt, um fundierte Handlungsempfehlungen abzuleiten.
Die erwarteten Projektergebnisse lassen sich in vier zentrale Bereiche gliedern. Erstens wird eine umfassende Analyse regulatorischer, ethischer und sozialer Rahmenbedingungen durchgeführt. Zweitens werden LLM-basierte Methoden für spezifische Anwendungsfälle entwickelt, optimiert und in einen durchgängigen Workflow integriert. Drittens erfolgt eine systematische Validierung in einer Proof-of-Concept-Umgebung anhand technischer und nicht-technischer Kriterien. Abschließend werden praxisorientierte Schulungen für Ermittler und Analysten etabliert und langfristig in die Weiterbildungsprogramme der Bedarfsträger integriert.
Die am LLEA-Projekt beteiligten Bedarfsträger (BMI, BMF, FMA, ZCB) profitieren von wissenschaftlich fundierten, maßgeschneiderten Lösungsansätzen für reale Herausforderungen sowie deren systematischer Validierung. Die beteiligten KMUs (m2n, IKNAIO) können auf Basis der Projektergebnisse neue Produkte und Dienstleistungen zur forensischen Analyse von Massendaten entwickeln und in ihre Geschäftsmodelle integrieren. Insgesamt schaffen die Projektpartner eine Grundlage für weitere thematisch verwandte Initiativen auf europäischer und internationaler Ebene.
Abstract
Recent advances in generative AI, particularly in Large Language Models (LLMs), offer significant potential for efficiency gains. These technologies enable the analysis of large datasets, support decision-making processes, and automate reporting obligations—including in law enforcement. At the same time, key challenges remain, such as susceptibility to inaccurate or non-transparent results, the protection of sensitive data, and ethical, social, and regulatory concerns, particularly in the context of the EU AI Act.
The LLEA project develops and evaluates LLM-based methods for data analysis in law enforcement. It focuses on three key use cases: (i) transcription and translation, (ii) analysis of large, heterogeneous datasets, and (iii) identification of fraudulent investment platforms. In addition to technical aspects such as accuracy and scalability, the project also considers regulatory requirements, bias, transparency, social costs, and organizational changes to derive well-founded recommendations.
The expected project outcomes are structured into four main areas. First, a comprehensive analysis of regulatory, ethical, and social frameworks will be conducted. Second, LLM-based methods for specific use cases will be developed, optimized, and integrated into a seamless workflow. Third, a systematic validation will be carried out in a proof-of-concept environment based on both technical and non-technical criteria. Finally, practice-oriented training programs for investigators and analysts will be established and integrated into the long-term training curricula of stakeholders.
The stakeholders involved in the LLEA project (BMI, BMF, FMA, ZCB) will benefit from scientifically grounded, tailored solutions to real-world challenges, along with their systematic validation. The participating SMEs (m2n, IKNAIO) will leverage the project outcomes to develop and integrate new products and services for forensic analysis of large-scale data. Overall, the project partners will lay the foundation for further related initiatives at the European and international levels.