030 814593270

Was ist Sprachsynthese?

Sprachsynthese ist eine Methode zur künstlichen Erzeugung von Sprache. Zum Einsatz kommt dabei ein Text-to-Speech-System (TTS), also ein Gerät oder Computerprogramm, das geschriebenen Text in akustische Signale umwandelt. Sprachsynthese wird unter anderem genutzt, um sehbehinderte Menschen bei der Kommunikation zu unterstützen.

Übersetzung benötigt?

Die Entwicklung der Sprachsynthese

Schon Ende des 18. Jahrhunderts versuchten Forschende, die menschliche Sprache maschinell nachzubilden. 1937 gelang es dem US-Amerikaner Domer Dudley erstmals, gesprochene Äußerungen elektronisch mithilfe eines Vocoders zu rekonstruieren. Synthese-Systeme mit Lautschrifteingabe wurden in den frühen 50er Jahren entwickelt. Etwa 20 Jahre später standen die ersten vollständig textgesteuerten Systeme zur Verfügung. Seither wurden die Technologien stetig weiterentwickelt, wobei ein besonderer Fokus auf der Optimierung der Systemstruktur und der Ausgabequalität lag.

Text-to-Speech (TTS) Programme

In erster Linie wurden Text to Speech Systeme entwickelt, um Menschen mit Beeinträchtigungen den Alltag zu erleichtern. Synthetisierte Geräte wie Computer, Uhren oder Wörterbücher ermöglichen Menschen mit Seh- oder Leseschwierigkeiten Zugang zu Inhalten, auf die sie sonst nicht zugreifen könnten. Sprechbehinderten kann ein Sprachsynthese-System eine künstliche Stimme verleihen. Auch finden TTS-Systeme Anwendung auf Kundenportalen, beim Infotainment oder in der Interaktion mit Maschinen oder Robotern.

Wie funktionieren TTS-Systeme?

Ein Text to Speech System wandelt einen geschriebenen Text in einem zweistufigen Prozess in Sprache um. Für eine korrekte Aussprache analysiert das Programm den Eingabetext im ersten Schritt unter linguistischen Gesichtspunkten, ehe der Inhalt im zweiten Schritt in ein synthetisches Sprachsignal umgesetzt wird. Software, die zur Umwandlung von Schrift in Sprache verwendet wird, wird als Sprachsynthesizer bezeichnet.

Mehr laden

FAQ: Weitere Fragen zu Sprachsynthese

Was versteht man unter TTS?

Als Text To Speech (kurz: TTS) bezeichnet man eine Methode zur Umwandlung von geschriebenem Text in Sprache. Es handelt sich dabei um eine Form der Sprachsynthese.

Was bedeutet Sprachsynthese?

Sprachsynthese ist die künstliche Erzeugung der menschlichen Sprache. Dabei können verschiedene Geräte und Programme zum Einsatz kommen, zum Beispiel TTS-Software.

Welche Ansätze zur Sprachsynthese gibt es?

Zur Erzeugung von Sprachsignalen unterscheidet man zwischen zwei Ansätzen, dem regelbasierten und dem lexikonbasierten Ansatz, die bei den meisten Text to Speech Systemen kombiniert angewendet werden.

Was ist die neuronale Sprachsynthese?

Die neuronale Sprachsynthese bezeichnet eine Form der Spracherzeugung, die durch maschinelles Lernen stetig verbessert wird. Dafür wird ein künstliches neuronales Netz erzeugt, das lernt, die Phonetik der menschlichen Sprache vorherzusagen. Das Ergebnis ist eine flüssigere und natürlich klingendere Stimme.

Wo wird Text-to-Speech eingesetzt?

Wurde Text to Speech zunächst hauptsächlich dafür verwendet, Menschen mit Behinderungen bei der Kommunikation zu unterstützen oder ihnen barrierefreien Zugang zu Inhalten zu ermöglichen, so kann sie heute überall da einsetzt werden, wo Text in Sprache umgewandelt werden soll, z.B. in Kundendenservice-Portalen oder bei der Nutzung von smarten Geräten.

This site is registered on wpml.org as a development site.