Zum Inhalt

Trusted AI One-Pager

Prädiktive & halluzinationssichere One-Pager-Reports – KI-generiert durch Meta-Zusammenfassungen von aktuellen Headlines

Programm / Ausschreibung IWI, IWI, Basisprogramm Ausschreibung 2023 Status laufend
Projektstart 02.05.2023 Projektende 31.05.2024
Zeitraum 2023 - 2024 Projektlaufzeit 13 Monate
Keywords

Projektbeschreibung

Das übergeordnete Ziel ist die Entwicklung und Integration eines Verfahrens für die Generierung von automatisiert validierten & damit vertrauenswürdigen One-Pager-Reports auf Basis aktueller Nachrichtendaten aus dem firmeneigenen Media-Intelligence-System "HeadlineHunter". Die One-Pager-Reports werden durch Integration & Feintuning eines möglichst aktuellen Sprachmodells der GPT-Familie die Kernaussagen der zugrundeliegenden Headlines in Form von natürlichsprachlichen Fließtexten komprimiert zusammenfassen. Da Headlines bereits selbst sehr oft zusammenfassenden Charakter haben, sprechen wir hierbei vom neuartigen Anwendungsfall der „abstractive meta-summarization“.

Um den hohen Qualitätsanforderungen für diesen Reporting-Use-Case gerecht werden zu können, soll die Wahrscheinlichkeit der semantischen Übereinstimmung der Kerninhalte aller generierten Meta-Zusammenfassungen mit den Input-Daten bei mind. 90% liegen. Dies wird durch einen neuentwickelten Algorithmus - basierend u.a. auf Kosinus-Ähnlichkeit und Named-Entity-Informationen - gemessen. Dadurch kann der problematischen "Halluzination" von generativen KI-Modellen entgegengewirkt werden.

Die den aktuellen technologischen Fortschritten angemessene Neuentwicklung des Reporting-Systems ist wesentlich für die langfristige Sicherung & den Ausbau der Marktposition des Antragstellers. Das übergeordnete Ziel lässt sich in folgende Subziele unterteilen:

1. Implementierung einer Pre-Processing-Pipeline zum Splitting des für den jeweiligen Report bestimmten Eingabekorpus in zumindest 5 Subkorpora, gruppiert nach den enthaltenen Schlüsselkonzepten
2. Feintuning eines möglichst aktuellen Sprachmodells aus der GPT-Familie & Schnittstelle zum Output des Pre-Processings
3. Ermittlung adäquater Eingabe-Prompts
4. Automatisierte Validierung der semantischen Korrektheit der Ausgabedaten zur Sicherung der notwendigen hohen Qualität für den Reporting-Use-Case („Halluzinations-Scoring“)
5. Darstellung der Output-Daten in einem One-Pager-Report im PDF-Format und Integration in das bestehende System HeadlineHunter