capito automatisiert
Automatisierte Textvereinfachung mit künstlicher Intelligenz für das Deutsche
Programm / Ausschreibung | BASIS, Basisprogramm, Budgetjahr 2020 | Status | abgeschlossen |
---|---|---|---|
Projektstart | 02.06.2020 | Projektende | 30.06.2021 |
Zeitraum | 2020 - 2021 | Projektlaufzeit | 13 Monate |
Keywords |
Projektbeschreibung
Erstmalige Entwicklung eines Systems zur KI-basierten automatischen Vereinfachung von deutschen Texten. CFS verfügt über eine einzigartig große Datenbank von 50.000 deutschsprachigen Textpaaren auf unterschiedlichen Sprachniveaus. Dank eines neuartigen Ansatzes der Universität Zürich ist diese Datenmenge ausreichend, um eine KI zu entwickeln und anzulernen, die aus komplizierten Texten (C1/C2) einfache Sprache macht.
Die Software wird in der Lage sein, die Sprachstufe (A1 - B1) der Translation zu evaluieren. Der Postprocessing Prozess durch die User soll um 50-90% abgekürzt werden. Dadurch kann der Preis pro Normseite auf 10-40% der derzeit üblichen Kosten gesenkt werden.
Herausfordernd ist, dass bisher nur im Englischen ansatzweise eine automatische Sprachvereinfachung realisiert wurde. Das deutlich kompliziertere Deutsche und der neuartige Lösungsansatz bilden das Hauptrisiko. Zusätzlich wird hier weltweit erstmals zielgenau auf ein normiertes Sprachniveau vereinfacht.