Zum Inhalt

KI Stimmen

Künstlich generierte Stimmen mittels KITechnologien, spezialisiert auf die Deutsche Sprache und ihren Nuancen

Programm / Ausschreibung IWI 24/26, IWI 24/26, Basisprogramm Ausschreibung 2024 Status laufend
Projektstart 01.03.2024 Projektende 30.11.2025
Zeitraum 2024 - 2025 Projektlaufzeit 21 Monate
Keywords

Projektbeschreibung

Unser Forschungsprojekt entwickelt eine Plattform für den deutschsprachigen Raum, die Texte in KI-generierte Audio-Dateien umwandelt, wobei besonderer Wert auf verschiedene deutsche und österreichische Dialekte gelegt wird. Hauptziele sind die Schaffung authentischer Audioinhalte, die Entwicklung präziser KI-Modelle und die Gewährleistung von Datenschutz. Durch diese Initiative adressieren wir eine bisher vernachlässigte Marktnische und bieten eine innovative Lösung für die audiovisuelle Inhaltsproduktion.

Endberichtkurzfassung

Im Projekt „KI Stimmen“ wurde erstmals die technische Machbarkeit einer KI-basierten Sprachsynthese für österreichische Dialekte untersucht und ein prototypisches System entwickelt. Durch innovative Ansätze wie Transfer Learning und synthetische Datenaugmentation gelang es, trotz begrenzter Daten- und Ressourcenbasis, wichtige Grundlagen für die automatisierte Erzeugung dialektaler Sprache aus Text zu schaffen.

Besonders hervorzuheben sind die erfolgreiche Integration regionaler Dialektproben aus Vorarlberg sowie die Zusammenarbeit mit lokalen Partnern zur Sammlung und Dokumentation von Sprachvarianten. Das Projekt hat damit einen entscheidenden Beitrag zur Bewahrung regionaler Sprachkultur geleistet.

Der entwickelte Prototyp zeigt die grundsätzliche Funktionsfähigkeit der Dialektsynthese, auch wenn die Qualitätsanforderungen für eine breite Anwendung noch weiterentwickelt werden müssen. Die Ergebnisse bilden eine solide Basis für zukünftige Innovationen und weiterführende Forschungsprojekte im Bereich KI-Sprachtechnologie und kultureller Digitalisierung.