KI Stimmen
Künstlich generierte Stimmen mittels KITechnologien, spezialisiert auf die Deutsche Sprache und ihren Nuancen
| Programm / Ausschreibung | IWI 24/26, IWI 24/26, Basisprogramm Ausschreibung 2024 | Status | laufend |
|---|---|---|---|
| Projektstart | 01.03.2024 | Projektende | 30.11.2025 |
| Zeitraum | 2024 - 2025 | Projektlaufzeit | 21 Monate |
| Keywords | |||
Projektbeschreibung
Unser Forschungsprojekt entwickelt eine Plattform für den deutschsprachigen Raum, die Texte in KI-generierte Audio-Dateien umwandelt, wobei besonderer Wert auf verschiedene deutsche und österreichische Dialekte gelegt wird. Hauptziele sind die Schaffung authentischer Audioinhalte, die Entwicklung präziser KI-Modelle und die Gewährleistung von Datenschutz. Durch diese Initiative adressieren wir eine bisher vernachlässigte Marktnische und bieten eine innovative Lösung für die audiovisuelle Inhaltsproduktion.
Endberichtkurzfassung
Im Projekt „KI Stimmen“ wurde erstmals die technische Machbarkeit einer KI-basierten Sprachsynthese für österreichische Dialekte untersucht und ein prototypisches System entwickelt. Durch innovative Ansätze wie Transfer Learning und synthetische Datenaugmentation gelang es, trotz begrenzter Daten- und Ressourcenbasis, wichtige Grundlagen für die automatisierte Erzeugung dialektaler Sprache aus Text zu schaffen.
Besonders hervorzuheben sind die erfolgreiche Integration regionaler Dialektproben aus Vorarlberg sowie die Zusammenarbeit mit lokalen Partnern zur Sammlung und Dokumentation von Sprachvarianten. Das Projekt hat damit einen entscheidenden Beitrag zur Bewahrung regionaler Sprachkultur geleistet.
Der entwickelte Prototyp zeigt die grundsätzliche Funktionsfähigkeit der Dialektsynthese, auch wenn die Qualitätsanforderungen für eine breite Anwendung noch weiterentwickelt werden müssen. Die Ergebnisse bilden eine solide Basis für zukünftige Innovationen und weiterführende Forschungsprojekte im Bereich KI-Sprachtechnologie und kultureller Digitalisierung.