KI gibt Menschen ihre Stimme zurück?
Stell dir vor, du könntest nicht mehr sprechen – sei es aufgrund einer Krankheit, eines Unfalls oder einer Behinderung. Für viele Menschen ist das traurige Realität.
Sich frei und ungehindert auszudrücken ist für die meisten Menschen eine Selbstverständlichkeit. Doch für jene Menschen mit einer kleinen oder grösseren Spracheinschränkungen stellt die Kommunikation oft eine grosse Hürde dar.
Doch es gibt Hoffnung: Künstliche Intelligenz (KI) macht es möglich, deine eigene Stimme digital nachzubilden und so deine Sprachfähigkeit wiederzuerlangen.
KI hilft Sprachstörung nach Hirnschädigung
ASA-KI ist so ein Projekt zur automatischen Sprachbewertung bei Aphasie (Sprachstörung nach Hirnschädigung) mithilfe von KI. Ziel ist ein System, das Rückmeldung auf die Sprachproduktion geben kann, um das Eigentraining zu Hause zu unterstützen.
Das ASA-KI Projekt zielt darauf ab, ein bahnbrechendes KI-System zur automatischen Sprachbewertung und Rückmeldung für Menschen mit Aphasie zu entwickeln.
Aphasie ist eine Sprachstörung, die häufig nach einer Hirnschädigung wie einem Schlaganfall auftritt und die Kommunikationsfähigkeit erheblich beeinträchtigt.
Das interdisziplinäre Projektteam aus Sprachtherapeuten und Ingenieuren arbeitet an einer innovativen Lösung, die mithilfe von Spracherkennungs- und KI-Technologien eine zuverlässige und motivierende Rückmeldung auf die mündliche Sprachproduktion der Patienten geben kann.
Eines der Hauptziele ist es, das digitale Eigentraining zu Hause zusätzlich zur Logopädie-Therapie zu unterstützen. Dabei müssen Herausforderungen wie die sehr diversen und nicht vorhersagbaren Sprachproduktionsfehler bei Aphasie sowie die Entwicklung einer leicht verständlichen Rückmeldung gemeistert werden.
Menschen mit Aphasie werden in Anwendungstests einbezogen, um die Entwicklung nutzerzentriert zu gestalten. Insgesamt verspricht das ASA-KI System, die Möglichkeiten des digitalen Eigentrainings für Aphasiepatienten zu revolutionieren und ihre Rehabilitation durch automatisches, individuelles Feedback zu verbessern.
Die Macht deiner Stimme
Deine Stimme ist ein wichtiger Teil deiner Identität und ermöglicht es dir, mit anderen zu kommunizieren, Gefühle auszudrücken und am sozialen Leben teilzunehmen.
Der Verlust deiner Stimme kann daher eine enorme Belastung sein und zu Isolation und Frustration führen. Genau hier setzen innovative europäische Unternehmen und Forschungseinrichtungen an, um mithilfe von KI Lösungen für dich zu entwickeln.
Eine vielversprechende Technik ist das sogenannte "Voice Cloning". Dabei wird deine individuelle Stimme mithilfe von Sprachaufnahmen und Machine Learning Algorithmen digital nachgebildet.
Neben der Nachbildung deiner spezifischen Stimme arbeiten Firmen wie die belgische Acapela Group und das schottisch-deutsche Cereproc an Sprachsynthese-Systemen, die insgesamt natürlicher und menschenähnlicher klingen. Statt monotoner Computerstimmen werden Aufnahmen realer Stimmen zerlegt und neu zusammengesetzt, um eine flüssige Sprachausgabe für dich zu erzeugen.
Forschung und Entwicklung in Europa
Die Entwicklung solch fortschrittlicher Sprachsynthese erfordert das Zusammenspiel verschiedener Disziplinen wie Informatik, Linguistik und Medizin. Einrichtungen wie das deutsche Fraunhofer IAIS forschen an Dialogsystemen, die natürliche Sprache verstehen und generieren können. So entstehen in Europa zukunftsweisende Lösungen, die dir helfen können.
Die europäische KI-Forschung ist führend bei der Entwicklung solcher Lösungen, die ganz auf deine Bedürfnisse zugeschnitten sind.
Das niederländische Start-up Whispp und das europäische Unternehmen ElevenLabs sind Vorreiter auf diesem Gebiet. Sie trainieren KI-Modelle mit deiner Stimme, um dann beliebige Texte in deinem charakteristischen Klang auszugeben.
ElevenLabs (Niederlande/Polen)
Das europäische Start-up ElevenLabs aus den Niederlanden hat eine KI entwickelt, die synthetische Stimmen in hoher Qualität erzeugen und sogar existierende menschliche Stimmen nahezu perfekt nachahmen (klonen) kann. Ihre Technologie soll es ermöglichen, Filme, Spiele, Hörbücher etc. einfach in verschiedene Sprachen und mit beliebigen Stimmen zu vertonen. Auch meine Stimme habe ich dort geklont.
Acapela Group (Belgien)
Die Acapela Group aus Belgien ist ein führender Anbieter von Text-to-Speech Lösungen und arbeitet an personalisierten Stimmen für verschiedene Anwendungen. Sie kooperieren oft mit Forschungseinrichtungen.
Fraunhofer IAIS (Deutschland)
Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS) in Deutschland entwickelt Sprachassistenzsysteme und Dialogsysteme, die unter anderem Sprachsynthese mit natürlichen Stimmen nutzen.
CereProc (Schottland/Deutschland)
Das schottische Unternehmen CereProc mit einem deutschen Partner Aristech arbeitet an fortschrittlichen Text-to-Speech Systemen mit natürlich klingenden Stimmen.
Neben diesen spezialisierten Firmen arbeiten auch grosse Technologieunternehmen wie Google, Amazon, Microsoft und Apple an Lösungen für Sprachsynthese und Voice Cloning.
Whispp: Flüstern wird zur klaren Sprache
Eine bemerkenswerte Lösung ist die App Whispp des niederländischen Startups gleichen Namens. Sie verwandelt ein geflüstertes Wort in eine natürlich klingende, künstliche Stimme in normaler Lautstärke. Hier ist der Ablauf:
- Nutzer:Innen sprechen einen Satz in die App ein.
- Die App verarbeitet den Satz in der Cloud und lässt ihn dem Gesprächspartner mit einer KI-generierten Stimme vorsprechen.
- Die Verzögerung beträgt nur 200-250 Millisekunden.
- Theoretisch kann jeder seine eigene KI-Stimme generieren, indem er oder sie ca. 2 Minuten Sprachmaterial zur Verfügung stellt. Alternativ kann die Stimme auch anhand alter Aufnahmen nachgebildet werden.
Hinweis: Whispp funktioniert nach einem Abomodell und kostet monatlich 19,99 Euro für 60 Minuten Gespräche an Mobil- und Festnetzanschlüsse, plus 360 Minuten für App-Telefonie.
SamsungAi: Sprachbarrieren überwinden
Eine weitere innovative Funktion ist die Live-Übersetzung beim Telefonieren von SamsungAi (Samsung Advanced Intelligence). Die App kann Sprache in über 90 Sprachen in Echtzeit übersetzen und benötigt einen Samsung Account sowie ein KI basiertes GalaxyAi Smartphone der neusten Generation.
Beim Telefonieren wird die Stimme des Gesprächspartners übersetzt und als Text oder Sprachausgabe ausgegeben. Umgekehrt kann der Nutzer die Nuzterin in der eigenen Sprache sprechen und der Text wird für den Gesprächspartner übersetzt. Diese Funktion erleichtert die Kommunikation über Sprach- und Kulturbarrieren hinweg enorm.
Doch damit nicht genug - es gibt noch viele andere spannende KI-Anwendungen für Menschen mit Spracheinschränkungen:
Project Relate von Google ist eine Android-App, die Sprache in Echtzeit transkribiert, wiederholt was gesagt wurde und die Interaktion mit dem Google Assistant ermöglicht.
Microsoft arbeitet daran, KI-Systeme inklusiver zu gestalten, indem mehr Daten von Menschen mit Einschränkungen in die Modelle einfliessen. So sollen sie nicht mehr als "Ausreisser" behandelt, sondern von Anfang an berücksichtigt werden.
Die Stimme mit Sicherheit im Blick
So faszinierend die Möglichkeiten der Stimmsynthese für dich sind, so wichtig ist auch der verantwortungsvolle Umgang damit. Die täuschend echte Nachahmung deiner Stimme birgt Potenzial für Missbrauch. Dem stellen sich die europäischen Akteure mit technischen Sicherheitsvorkehrungen, ethischen Richtlinien und Aufklärung entgegen, um deine Daten und Privatsphäre zu schützen.
Trotz dieser Herausforderungen überwiegen die positiven Perspektiven. KI-gestützte Sprachsynthese kann dir, wenn du deine Stimme verloren hast, ein Stück Lebensqualität und Selbstbestimmung zurückgeben. In Zukunft werden die Systeme noch besser darin, deine Stimme, deinen Tonfall und deine Emotionen realistisch wiederzugeben. Auch die Integration in deine Geräte wie Smartphones oder Sprachcomputer wird die Technologie für dich alltagstauglicher machen.
Letztlich zeigt die Entwicklung, welch grosses Potenzial in der Verschmelzung von Mensch und Maschine liegt - mit direktem Nutzen für dich. KI ist hier nicht nur Werkzeug, sondern Befähigung und Brückenbauer:In.
Sie gibt dir buchstäblich eine Stimme. Damit steht sie exemplarisch für eine Technologie, die dein Leben auf positive und inklusive Weise verbessern kann.
Bei Fragen? #fragRoger
Willst du mehr wissen? Sehr gerne komme ich auch bei Dir, bei deiner Firma, deiner ERFA Gruppe oder deinem Verband vorbei und helfe mit einem Workshop oder Input Referat.
Lass uns gerne mal unverbindlich sprechen. Also wenn ich helfen kann, wende dich gerne an mich #fragRoger
Disclaimer: dieser Artikel wurde mit PerplexityPro und Google recherchiert, mit Deepl Write verbessert und stellenweise mit Claude3 Opus zusammen gefasst und vereinfacht. Das Bild stammt von Dalle3.
Quellen
[...] https://www.iais.fraunhofer.de/de/geschaeftsfelder/speech-technologies.html
[...] https://www.interaktive-technologien.de/projekte/asa-ki
[...] https://www.ftd.de/wissen/technik/als-und-schlaganfall-ki-bringt-sprache-zurueck/
[...] https://www.ng-it.de/mwc-whispp-ki-gibt-menschen-mit-spracheinschraenkung-wieder-eine-stimme/
[...] https://www.netdoktor.de/magazin/ki-gibt-gelaehmter-frau-ihre-stimme-zurueck/