Zum Inhalt

capito automatisiert

Automatisierte Textvereinfachung mit künstlicher Intelligenz für das Deutsche

Programm / Ausschreibung BASIS, Basisprogramm, Budgetjahr 2020 Status abgeschlossen
Projektstart 02.06.2020 Projektende 30.06.2021
Zeitraum 2020 - 2021 Projektlaufzeit 13 Monate
Keywords

Projektbeschreibung

Erstmalige Entwicklung eines Systems zur KI-basierten automatischen Vereinfachung von deutschen Texten. CFS verfügt über eine einzigartig große Datenbank von 50.000 deutschsprachigen Textpaaren auf unterschiedlichen Sprachniveaus. Dank eines neuartigen Ansatzes der Universität Zürich ist diese Datenmenge ausreichend, um eine KI zu entwickeln und anzulernen, die aus komplizierten Texten (C1/C2) einfache Sprache macht.

Die Software wird in der Lage sein, die Sprachstufe (A1 - B1) der Translation zu evaluieren. Der Postprocessing Prozess durch die User soll um 50-90% abgekürzt werden. Dadurch kann der Preis pro Normseite auf 10-40% der derzeit üblichen Kosten gesenkt werden.
Herausfordernd ist, dass bisher nur im Englischen ansatzweise eine automatische Sprachvereinfachung realisiert wurde. Das deutlich kompliziertere Deutsche und der neuartige Lösungsansatz bilden das Hauptrisiko. Zusätzlich wird hier weltweit erstmals zielgenau auf ein normiertes Sprachniveau vereinfacht.