Wie kann Künstliche Intelligenz alltägliche Dinge für Gehörlose vereinfachen?

TLDR: Taube und schwerhörige Menschen stossen im Alltag auf viele Kommunikationsbarrieren, doch KI-gestützte Gebärdensprachsysteme revolutionieren die Barrierefreiheit. Virtuelle Avatare ermöglichen die Echtzeit-Übersetzung in Gebärdensprache in öffentlichen Räumen, während die Integration von KI-Avataren die automatische Übersetzung von Online-Inhalten in Gebärdensprache ermöglicht. Gehörlose können durch Gebärdensprach-Apps mit KI-Übersetzung unabhängig kommunizieren. Obwohl es noch Grenzen in Genauigkeit und Natürlichkeit gibt, bieten diese Systeme als Ergänzung zu menschlichen Dolmetschern ein enormes Potenzial.
Achtest du auf Details?
In der Ferienzeit erscheint es für die meisten von uns selbstverständlich, den Durchsagen an Bahnhöfen oder Flughäfen zu folgen, Filme im Kino zu geniessen, oder unsere Beschwerden beim Arzt präzise zu artikulieren. Wir bewegen uns nahezu mühelos durch eine Welt, die vorrangig auf gesprochener Sprache beruht. Doch für viele taube und schwerhörige Menschen erweisen sich die täglichen Interaktion in dieser ausgerichteten Gesellschaft oft als Herausforderung.
Gehörlose Menschen sehen sich in einer von Lautsprache dominierten Gesellschaft mit zahlreichen Barrieren konfrontiert: Sie verpassen wichtige Durchsagen, viele Bildungsangebote und Unterhaltungsmedien bleiben ihnen verschlossen, wenn keine Übersetzung in Gebärdensprache angeboten wird. Auch Behördengänge und Arztbesuche können ohne die Unterstützung von Dolmetscher:innen oder spezieller Technologie zur Herausforderung werden. Selbst alltägliche Interaktionen mit Freunden und Familie können schwierig sein, wenn diese die Gebärdensprache nicht beherrschen.
Stellen wir uns eine Welt vor, in der Kommunikation für alle selbstverständlich ist. Doch für viele taube und schwerhörige Menschen ist diese Vision noch weit entfernt. In einer lautsprachlich dominierten Gesellschaft stossen Gehörlose im Alltag auf unzählige Barrieren.
KI ermöglicht Gebärdensprache in Echtzeit
Stellen wir uns aber mal vor, wir betreten einen Bahnhof oder Flughafen und werden sofort von einem virtuellen Avatar begrüsst, der wichtige Informationen in Gebärdensprache übersetzt. Dank KI-gestützter Echtzeit-Übersetzung gehören die Zeiten, in denen gehörlose Reisende aufgrund verpasster Ansagen wichtige Informationen über Verspätungen oder Gleisänderungen nicht mitbekommen haben, bald der Vergangenheit an.
Diese Avatare fungieren als digitale Dolmetscher:Innenund nutzen modernste Computer-Vision- und Machine-Learning-Algorithmen, um gesprochene Sprache und Text in Sekundenschnelle in flüssige Gebärdensprache zu übersetzen. Dabei erkennen tiefe neuronale Netze nicht nur einzelne Gebärden, sondern ganze Sätze in Gebärdensprache mit beeindruckender Genauigkeit.
In Deutschland nutzen bereits über 80 Städte diese Angebote.

Barrierefreier Zugang zu Online-Inhalten
Doch die Anwendungsmöglichkeiten gehen weit über den öffentlichen Raum hinaus. Durch die Integration von KI-Gebärdensprach-Avataren auf Websites können wir Textinhalte automatisch in Gebärdensprachvideos übersetzen. Dies eröffnet gehörlosen Menschen, deren Hauptsprache die Gebärdensprache ist, einen barrierefreien Zugang zu Online-Informationen und -Diensten.
Egal ob Bildungsvideos, Werbeclips oder Unterhaltung - dank KI-gestützter Übersetzung von Sprache oder Untertiteln in Gebärdensprache können wir jedes beliebige Video ohne die üblichen Verzögerungen durch menschliche Dolmetscher inklusiv gestalten. Die fotorealistischen Avatare machen die Inhalte dabei nicht nur zugänglich, sondern auch ansprechend und leicht verständlich.
KI kann unabhängige Kommunikation ermöglichen
Mit Gebärdensprach-Apps auf dem Smartphone ausgestattet, können taube und schwerhörige Mitbürger:Innen in Geschäften, Arztpraxen oder Ämtern unabhängig von einem persönlich anwesenden Dolmetscher mit uns kommunizieren. Die KI übersetzt in Echtzeit zwischen Gebärden und Lautsprache oder Text und ermöglicht so einen fliessenden Dialog.
Die stille Revolution der Gebärdensprache hat gerade erst begonnen.
Insbesondere in Notsituationen wie bei medizinischen Notfällen oder in der Katastrophenhilfe können KI-gestützte Gebärdensprachtools auf Smartphones oder öffentlichen Bildschirmen dazu beitragen, dass wir gehörlosen Menschen auch bei Nichtverfügbarkeit eines Dolmetschers schnell kritische Informationen vermitteln können. Und davon gibt es derzeit einiges:
Lenovo:
- Lenovo hat in Zusammenarbeit mit dem brasilianischen Innovationszentrum CESAR ein KI-System entwickelt, das brasilianische Gebärdensprache (Libras) nahezu in Echtzeit in gesprochenes Portugiesisch übersetzt.
- Das System nutzt Computer Vision und maschinelles Lernen, um Handpositionen, Fingerbewegungen und Gesichtsausdrücke zu erkennen und daraus ganze Sätze in Gebärdensprache zu interpretieren.
- Lenovo plant, die Technologie bis 2024/25 auf andere Gebärdensprachen auszuweiten, zunächst in Lateinamerika und den USA. Ziel ist der Einsatz in verschiedenen Bereichen wie Einzelhandel, Bankwesen und öffentlichen Diensten.
BIGEKO:
- BIGEKO ist ein Verbundprojekt, das ein bidirektionales Echtzeit-Übersetzungssystem zwischen Gebärdensprache und gesprochener Sprache entwickelt, insbesondere für Notfall- und Hilfesituationen.
- Gehörlose sollen damit per Gebärdensprache direkt mit Polizei oder Rettungsdiensten kommunizieren können, z.B. um einen Unfall zu melden. Das System übersetzt dazu Gebärden in Sprache und umgekehrt.
- Neben der Erkennung von Gesten soll das System auch die in Gebärden ausgedrückten Emotionen interpretieren, um Einsatzkräften zusätzliche Informationen zu liefern.
- Ziel ist ein interaktiver Webservice, der Vertrauen und Sicherheit stärkt sowie die Lebensqualität Gehörloser verbessert.
EASIER (CORDIS):
- EASIER ist ein von der EU im Rahmen von Horizon 2020 gefördertes Projekt zur Entwicklung eines Systems für die mehrsprachige maschinelle Übersetzung zwischen Gebärden- und Lautsprachen.
- Ziel ist eine barrierefreie Kommunikationsplattform, auf der gehörlose und hörende Nutzer in ihrer bevorzugten Sprache interagieren können.
- Dazu kombiniert EASIER Technologien zur Gebärdenspracherkennung, Avatare die Grammatik und Prosodie von Gebärdensprachen korrekt darstellen, und maschinelle Übersetzung mit und ohne annotierte Daten.
- Gehörlose werden eng in Design, Entwicklung und Evaluation der Plattform eingebunden, um eine hohe Benutzerfreundlichkeit zu erreichen.
Charamel GmbH:
- Die Charamel GmbH leitet das BMBF-geförderte Projekt AVASAG zur Entwicklung eines KI-basierten 3D-Gebärdensprach-Avatars, der deutsche Texte automatisch in Gebärdensprache übersetzt.
- Durch Kombination von Machine Learning und regelbasierten Methoden sollen Texte in qualitativ hochwertige Gebärdenanimationen umgewandelt werden.
- Der fotorealistische Avatar soll eine barrierefreie digitale Kommunikation ermöglichen und so die Teilhabe Gehörloser an der digitalen Gesellschaft verbessern.
- Als Anwendungsbeispiel dient die automatisierte Übersetzung von Reiseinformationen mit Fokus auf Verkehr und Tourismus.
- Charamel entwickelt zudem eine Plattform, mit der Kommunen ihre Webinhalte automatisiert in Gebärdensprache übersetzen können, um mehr digitale Barrierefreiheit zu bieten.
Es gibt auch Grenzen
Natürlich hat die Technologie auch ihre Grenzen. Noch kämpfen KI-Systeme damit, die volle sprachliche Komplexität und Nuancen von Gebärdensprachen im uneingeschränkten Einsatz zu verstehen. Feinheiten in Mimik, Körpersprache und kulturellen Implikationen entgehen den Algorithmen oft. Hier haben menschliche Dolmetscher noch klar die Nase vorn.
Auch wird vielen Projekten vorgeworfen, dass zu wenig die betroffenen Personen einbezogen wurden bei der Entwicklung.
Zudem können die standardisierten Avatare regionale Variationen und persönliche Vorlieben in der Gebärdensprache nicht ausreichend abbilden. Manche Nutzer:Innen empfinden die computergenerierten Figuren im Vergleich zu Videos echter Gebärdensprachler auch als unnatürlich.
Dennoch bietet die rasante Entwicklung im Bereich der KI-generierten Gebärdensprache eine enorme Chance, Kommunikationsbarrieren abzubauen. In Kombination mit menschlichen Dolmetschern als ergänzendes Werkzeug eingesetzt, kann die Technologie eine nie dagewesene Verfügbarkeit von Gebärdensprachdiensten in der Öffentlichkeit ermöglichen.
Entscheidend wird wohl sein, dass wir die Systeme gemeinsam mit der Gehörlosengemeinschaft an deren Bedürfnisse und Werte anpassen können. Denn letztlich geht es darum, echte Teilhabe und ein besseres Nutzererlebnis für taube und schwerhörige Menschen zu schaffen.
Fragen zu KI und Digitalen Geschäftsmodellen? #fragRoger
Willst du mehr wissen? Sehr gerne komme ich auch bei Dir, bei deiner Firma, deiner ERFA Gruppe oder deinem Verband vorbei und helfe mit einem Workshop oder Input Referat.
Lass uns gerne mal unverbindlich sprechen. Also wenn ich helfen kann, wende dich gerne an mich #fragRoger und abonnier meinen offiziellen Newsletter.
Disclaimer: dieser Artikel wurde nach meiner Recherchen mit KI (Perplexity und Gemini) selbst geschrieben, mit Deepl Write verbessert und Mistral zusammen gefasst und vereinfacht. Das Bild stammt von Ideogram und ist selbst erstellt. Dieser Artikel ist rein edukativ und erhebt keinen Anspruch auf Vollständigkeit. Bitte melde dich, wenn Du Ungenauigkeiten feststellst, danke.
Quellen:
[...] https://nagish.com/post/ai-generated-sign-language
[...] https://www.signapse.ai/post/the-importance-of-accessible-sign-language-in-public-spaces
[...] https://cordis.europa.eu/article/id/450232-ai-solutions-for-the-deaf-and-hard-of-hearing/de
[...] https://blog.ovhcloud.com/create-your-solution-for-sign-language-recognition-with-ovhcloud-ai-tools/
[...] https://slator.com/why-sign-language-translation-poses-a-puzzle-for-ai/
[...] https://www.signapse.ai
[...] https://nagish.com/post/ai-generated-sign-language
[...] https://www.swr.de/wissen/ki-projekte-barrierefreiheit-gebaerdensprache-100.html
[...] https://news.lenovo.com/ai-powered-sign-language-translation-solution-hearing-brazil/
[...] https://www.uni-augsburg.de/de/fakultaet/fai/informatik/prof/hcm/forschung/bigeko/
[...] https://cordis.europa.eu/project/id/101016982/de