Copyright © 2004-2005 Gary R. Cramblitt
Es ist erlaubt, dieses Dokument zu kopieren, zu vertreiben und/oder zu ändern gemäß den Bedingungen der GNU Free Documentation Licence, Version 1.1 oder irgend einer späteren Version, wie sie von der Free Software Foundation veröffentlicht wurde; ohne die invarianten Abschnitte, ohne Texte auf der vorderen Umschlagseite, und ohne Texte auf der hinteren Umschlagseite. Eine Kopie der Lizenz findet sich im Abschnitt "GNU Free Documentation License".
KTTS - das Sprachausgabe-System von KDE - ist ein aus Modulen bestehender Dienst, der es jeder Anwendung ermöglicht, Text über die DCOP-Schnittstelle vorzulesen.
KTTS ist die praktische KDE-Anwendung der KDE-Sprachausgabe API.
Inhaltsverzeichnis
KTTS ist ein Teilsystem in KDE zur Sprachausgabe (TTS). Es stellt eine gemeinsame Anwendungsschnittstelle für KDE-Programmierer bereit, mit der deren Anwendungen mit TTS-Fähigkeiten ausgestattet werden können. Auch den Benutzern bietet es interessante Möglichkeiten.
Eigenschaften für Benutzer:
Vorlesen des Inhalts einer Textdatei.
Vorlesen von KDE-Nachrichten (KNotify).
Vorlesen der Texte (oder Teilen davon) einer Webseite in Konqueror.
Vorlesen von Texten (oder Teilen davon) im Texteditor Kate, auch wenn Kate in andere KDE-Anwendungen eingebettet ist.
Ein langer Text wird in einzelne Sätze zerlegt. Der Benutzer kann satz- oder absatzweise zurückgehen, wiederholen lassen, die Ausgabe anhalten oder abbrechen.
Audioausgabe über aRts, ALSA, GStreamer (Version 0.8.7 oder neuer) oder aKode.
Einstellbare Filter, um falsch ausgesprochene Worte zu ersetzen, Sprachsynthesizer auszuwählen und XML-Dokumente umzuwandeln.
Eigenschaften für Programmierer:
Prioritätssystem für die Ausgabe von Screen-Readern, Warnungen und Nachrichten, während andere Texte vorgelesen werden.
Aus Modulen aufgebaute Architektur mit Unterstützung einer großen Anzahl von Sprachsynthesizern und Treibern.
Ermöglicht die Erzeugung von Sprachausgaben auf der Befehlszeile (oder mit Shell-Skripten) über die DCOP-Hilfsprogramme von KDE.
Stellt für Anwendungen eine einfach zu benutzende Schnittstelle für die Sprachausgabe bereit.
Anwendungen müssen keine Einzelheiten über das Sprachausgabegerät wissen.
IN ZUKUNFT: Unterstützung für Speech-Markup-Sprachen wie VoiceXML, Sable, Java™ Speech-Markup-Language (JSML), und Speech-Markup-Meta-Sprache (SMML).
IN ZUKUNFT: Eingeschränkte Unterstützung für eingebettete Sprachlesezeichen.
Asynchron zur Vermeidung von Systemblockaden.
KTTS besteht zur Zeit aus mehreren Programmen:
Der Sprachausgabe-Dienst von KDE, eine Anwendung ohne sichtbare Fenster, die TTS-Dienste über DCOP anbietet.
Eine Anwendung mit GUI zur Konfiguration und Einrichtung von kttsd über kttsmgr in der Systemabschnitt.
Ein Modul für den Webbrowser Konqueror für das Vorlesen der Texte einer Webseite oder Teilen davon.
Ein Modul für den Texteditor Kate, mit dem eine Textdatei ganz oder teilweise vorgelesen werden kann.
Zusätzlich zur Bugzilla-Datenbank von KDE (http://bugs.kde.org/) finden Diskussionen über KTTS in der kde-accessibility Mailingliste statt. Abonnieren können Sie die Liste über https://mail.kde.org/mailman/listinfo/kde-accessibility. Die Entwickler finden Sie auch im IRC (irc.kde.org, Kanal #kde-accessibility).
Ehe Sie KTTS benutzen können, müssen Sie mindestens ein Sprachsynthesizer-System installieren und richtig einstellen. Siehe auch Anhang A, Installation
Zum Start des KTTS-Systems geben Sie folgenden Befehl in einer Konsole ein:
kttsmgr
oder klicken Sie im KDE-Menü auf kttsmgr.
Beim ersten Start von kttsmgr oder solange noch keine Sprecher eingerichtet sind, wird die Karteikarte Sprecher angezeigt. Siehe auch „Einrichtung der Synthesizermodule (Sprecher)“. Wenn Sie mindestens einen Sprecher eingerichtet haben, wird die Karteikarte Allgemein angezeigt. Siehe „Start von KTTSD und allgemeine Einrichtung“.
Die meisten TTS-Synthesizer bieten verschiedene Sprachen und Stimmen an, so auch verschiedene männlich oder weibliche, oder solche, die sich in Lautstärke oder Geschwindigkeit unterscheiden. Sie können auch mehrere Varianten für einen Synthesizer einrichten. Eine so eingerichtete Kombination aus Sprache, Synthesizer, Stimme, Geschlecht, Lautstärke und Geschwindigkeit wird als Sprecher bezeichnet. Sie müssen zumindest einen Sprecher einrichten, bevor Sie KTTS starten können, um Texte vorzulesen.
Verschiedene Sprecher für den selben Synthesizer sind vergleichbar mit mehreren Druckerwarteschlangen für den selben Drucker.
Wenn eine Anwendung Text an KTTS übergibt, kann sie die Eigenschaften des bevorzugten Sprechers für die Ausgabe angeben. So kann einen Anwendung beispielsweise einen weiblichen englischen Sprecher anfordern. Wenn Sie einen Sprecher eingerichtet haben, dessen Sprache Englisch und dessen Geschlecht weiblich ist, wird dieser verwendet, andernfalls wird automatisch der am besten passende Sprecher gewählt. Wenn Sie mehr darüber erfahren wollen, wie KTTS einen Sprecher auswählt, sehen Sie in „Filter (Fortgeschrittene)“ nach.
Wenn Sie auf den Karteikartenreiter Sprecher in kttsmgr klicken, wird die Karteikarte Sprecher angezeigt. Diese erscheint auch dann automatisch, wenn Sie kttsmgr starten und noch kein Sprecher eingerichtet ist.
![]() | Klicken Sie, um einen neuen Sprecher hinzuzufügen. |
![]() | Alle bereits eingerichteten Sprecher erscheinen in dieser Liste. Die bevorzugten Sprecher erscheinen oben in der Liste. Der oberste Sprecher wird für die Sprachausgabe benutzt, wenn eine Anwendung keinen Sprecher vorgibt. |
![]() | Wählen Sie mit einem Mausklick einen Sprecher aus der Liste, und klicken Sie auf diesen Knopf, um den Sprecher aus der Liste zu entfernen. |
![]() | Wählen Sie mit einem Mausklick einen Sprecher aus der Liste, und klicken Sie auf diesen Knopf, um den Einstellungsdialog für das Synthesizermodul zu öffnen. Siehe unten. |
![]() | Wählen Sie mit einem Mausklick einen Sprecher aus der Liste, und klicken Sie auf diesen Knopf, um den Sprecher in der Liste eine Zeile weiter nach unten schieben. Die Reihenfolge der Sprecher in der Liste bestimmt auch ihre Priorität. |
![]() | Klicken Sie auf einen dieser Knöpfe, um Ihre Änderungen auf das laufende KTTS-System anzuwenden. |
Wenn Sie auf klicken, wird die Karteikarte Sprecher hinzufügen angezeigt.
![]() | Sie können ein Sprachsynthesizermodul entweder über den Namen des Synthesizers oder über die unterstütze[n] Sprache[n] auswählen. Beachten Sie die Auswahlknöpfe neben den zugehörigen Auswahlfeldern. Wenn Sprache ausgewählt ist, zeigt das Auswahlfeld Sprache alle Sprachen an, die von den vorhandenen Sprachsynthesizern unterstützt werden, und im Auswahlfeld Synthesizer erscheinen nur die Synthesizer, die auch die gewählte Sprache unterstützen. Wenn Sie Synthesizer wählen, zeigt das Auswahlfeld Synthesizer alle vorhandenen Synthesizer, und im Auswahlfeld Sprache werden nur die Sprachen angezeigt, die auch vom gewählten Synthesizer unterstützt werden. |
![]() | Wählen Sie hier die Sprache und das Synthesizermodul. |
![]() | Wenn Sie hier klicken, werden die meisten Synthesizer automatisch in der Standardeinstellung eingerichtet. Ein neuer Sprecher erscheint auf der Karteikarte Sprecher. Um die Einstellungen dieses Sprechers anzuzeigen oder zu bearbeiten, klicken Sie auf . |
Wenn Sie auf der Karteikarte Sprecher auf klicken, und damit einen Sprecher in die Liste einfügen oder auf klicken, wird die Karteikarte Sprecher-Einrichtung angezeigt. Als Beispiel wird im Folgenden die Einrichtung des Moduls für Festival Interactive gezeigt. Einzelheiten zu den Modulen finden Sie unter „Einrichtung“.
![]() | Geben Sie den Pfad zum ausführbaren Festivalprogramm ein. Wenn der Pfad zu Festival in PATH enthalten ist, müssen Sie nur |
![]() | Klicken Sie für die Suche nach verfügbaren Stimmen. |
![]() | Wählen Sie eine Stimme. |
![]() | Wählen Sie die Zeichenkodierung für Text, der an Festival übergeben wird. Bei Stimmen, die KTTS bekannt sind, wird diese Einstellung automatisch vorgenommen. Allgemein gilt, dass westliche Sprachen ISO 8859-1 verwenden, östliche Sprachen wie Tschechisch oder Slowakisch verwenden ISO 8859-2. |
![]() | Klicken Sie hier zum Testen. Sie sollten die Sprachausgabe eines Testsatzes hören. |
![]() | Mit diesen Schiebereglern stellen Sie Lautstärke, Sprechgeschwindigkeit und Tonhöhe der synthetischen Sprache ein. Wenn Sie einige Regler nicht auswählen können und diese grau angezeigt werden, lässt die von Ihnen gewählte Stimme diese Einstellungen nicht zu. |
![]() | Einige Stimmen wie MultiSyn-Stimmen benötigen aufgrund ihrer Größe mehrere Sekunden um geladen zu werden. Wenn Sie dieses Ankreuzfeld markieren, werden diese Stimmen bereits beim Start von KTTSD geladen, sodass (bei größerem Speicherverbrauch) der erste Satz schneller synthetisiert wird. |
Klicken Sie auf den Knopf , um die Einstellungen des Sprechers zu speichern.
Klicken Sie auf , sonst werden Ihre Änderungen nicht vom laufenden KTTS-System übernommen.
Wenn der Test funktioniert hat, können Sie KTTS schon fast benutzen. Gehen Sie zurück zur Karteikarte Allgemein und überprüfen Sie, ob Sprachausgabe aktivieren (KTTSD) angekreuzt ist, damit der TTS-Dienst von KDE startet. Siehe „Start von KTTSD und allgemeine Einrichtung“. Jetzt können Sie KTTS benutzen, um Text vorlesen zu lassen. Klicken Sie auf die Karteikarte Aufträge, um Textaufträge zu erstellen und zu verwalten. Siehe „Textaufträge verwalten“.
Wenn Sie mindestens einen Sprecher eingerichtet haben, können Sie das Sprachausgabesystem von KDE starten. Klicken Sie auf den Karteikartenreiter Allgemein, um diese Karteikarte zu öffnen. Hier können Sie einige allgemeine Optionen einstellen.
![]() | Markieren Sie dieses Ankreuzfeld, um das KTTS-System zu aktivieren. Dies startet den KDE-TTS-Dienst (KTTSD). Ist dieser Start erfolgreich, wird die Karteikarte Aufträge angezeigt, und Sie können Textaufträge erstellen und vorlesen lassen. Siehe „Textaufträge verwalten“. Entfernen Sie die Markierung, wird KTTSD angehalten und das TTS-System von KDE deaktiviert. AnmerkungWenn dieses Ankreuzfeld nicht ausgewählt werden kann, haben Sie noch keinen Sprecher eingerichtet (oder vergessen auf zu klicken). Siehe „Einrichtung der Synthesizermodule (Sprecher)“. |
![]() | Ist dieses Ankreuzfeld markiert, wird ein Symbol in der Systemleiste angezeigt, wenn kttsmgr läuft. In diesem Fall beendet der Klick auf oder kttsmgr nicht, sondern nur die Oberfläche; kttsmgr läuft weiter in der Systemleiste. Ein Klick auf das Symbol in der Systemleiste zeigt die Karteikarte wieder an. Um kttsmgr zu beenden, klicken Sie mit der rechten Maustaste auf das Symbol und wählen Beenden. Ist das Ankreuzfeld nicht markiert, erscheint auch kein Symbol in der Systemleiste. Dann beendet ein Klick auf oder kttsmgr. AnmerkungWenn kttsmgr beendet wird, läuft KTTS weiter, sofern das Feld Sprachausgabe aktivieren (KTTSD) angekreuzt ist. AnmerkungDiese Option wirkt sich erst beim nächsten Start von kttsmgr aus. AnmerkungDiese Option ist unwirksam, wenn kttsmgr im KDE-Kontrollzentrum läuft. |
![]() | Ist dieses Ankreuzfeld markiert, wird beim Start von kttsmgr das Programmfenster kttsmgr angezeigt. Ansonsten ist nach dem Start nur das Symbol kttsmgr im Systemabschnitt sichtbar, aber nicht das Programmfenster. Klicken Sie auf das Symbol im Systemabschnitt, um das Programmfenster anzuzeigen. |
![]() | Ist dieses Ankreuzfeld markiert und kttsmgr läuft noch nicht, erscheint es im Systembereich, sobald KTTSD einen Text vorliest. Dadurch haben Sie die Möglichkeit das Vorlesen anzuhalten oder anderweitig zu steuern. |
![]() | Ist dieses Ankreuzfeld markiert und kttsmgr erscheint beim Vorlesen automatisch im Systembereich der Kontrollleiste, verschwindet es wieder, sobald das Vorlesen abgeschlossen ist. |
![]() | Klicken Sie hier, um Ihre Einstellungen zu speichern. |
Wenn Sie auf den Karteikartenreiter Aufträge im kttsmgr klicken, wird die Karteikarte Aufträge angezeigt.
![]() | Hier sind alle Aufträge in der Warteschlange aufgeführt, zusammen mit der Anwendung, die den Auftrag eingestellt hat, dem aktuellen Status des Auftrags, der Anzahl der Sätze und dem gerade bearbeiteten Satz. Die Sprecher-ID entspricht der Spalte ID auf der Karteikarte Sprecher. |
![]() | Mit den Knöpfen in dieser Reihe können Sie Textaufträge starten, löschen und anhalten. Wählen Sie einen Auftrag aus der unten angezeigten Liste und klicken Sie auf einen dieser Knöpfe. |
![]() | Mit den Knöpfen in dieser Reihe können Sie satzweise in dem Auftrag, der in der Liste unten ausgewählt ist, vor- oder zurückgehen. (Aber nicht jeder Auftrag besteht aus mehreren Sätzen). |
![]() | Mit den Knöpfen in dieser Reihe können Sie den aktuellen Text in der KDE-Zwischenablage vorlesen lassen oder eine Textdatei zum Vorlesen öffnen. Sie können außerdem die Liste der Textaufträge neu einlesen oder den Sprecher für einen Auftrag wechseln. Siehe auch „Sprecherauswahl (Erweitert)“. |
![]() | Hier erscheint der gerade gesprochene Satz. |
![]() | Mit einem Klick auf werden alle Änderungen der Einstellungen (auch auf den anderen Karteikarten) übernommen und kttsmgr wird zum Symbol im Systemabschnitt verkleinert. Klicken Sie dann auf dieses Symbol, um das Programmfenster wieder anzuzeigen. |
![]() | Ziehen Sie diesen Bereichsteiler, um die Größe der Leisten für die Auftragsliste und den Bereich Aktueller Satz zu ändern. |
Die Karteikarte Aufträge wird nur angezeigt, wenn KTTSD gestartet wurde. Um KTTSD zu starten, klicken Sie auf den Karteikartenreiter Allgemein und kreuzen dort Sprachausgabe aktivieren (KTTSD) an.
Wenn das Soundsystem aRts nicht installiert ist, sondern stattdessen ALSA, GStreamer oder aKode, klicken Sie auf die Karteikarte Audio. Siehe auch „Audio-Einstellungen“.
Hier werden nur Textaufträge aufgeführt und verwaltet. Ausgaben von Screen-Readern, Warnungen und Nachrichten werden nicht angezeigt. Weitere Informationen über die Nachrichtentypen von KTTS finden Sie in „Filter (Fortgeschrittene)“.
Wenn Sie auf den Karteikartenreiter Audio in kttsmgr klicken, wird die Karteikarte Audio angezeigt.
![]() | Wählen Sie hier die Art der Audioausgabe. Wenn eine Komponente nicht ausgewählt werden kann, wurde KTTS entweder ohne Unterstützung für das entsprechende Audiomodul kompiliert oder KTTS kann die notwendigen Bibliotheken nicht laden. |
![]() | Wenn Gstreamer oder aKode für die Audioausgabe benutzt werden soll, wählen Sie hier den Audio-Ausgang. Wenn keine Ausgangsmodule in der Liste angezeigt werden, müssen Sie mindestens ein Modul installieren. Haben Sie ALSA ausgewählt, wählen Sie hier das PCM-Gerät. Siehe auch „Voraussetzungen“ |
![]() | Stellen Sie die Sprechgeschwindigkeit hier ein. 50% entspricht etwa der halben und 200% etwa der doppelten normalen Sprechgeschwindigkeit. Damit diese Einstellungen umgesetzt werden können, muss das Programm sox installiert sein. |
![]() | Wenn Sie dieses Ankreuzfeld markieren, kopiert KTTS temporäre Audiodateien (.wav-Dateien) in den angezeigten Ordner. Wählen Sie dafür einen beliebigen Ordner auf Ihrer Festplatte, für den Sie Schreibberechtigung haben. Damit können Sie Audiodateien mit Texten auch für andere Anwendungen erzeugen. Diese Dateien haben dann Namen wie |
![]() | Klicken Sie auf , um die neuen Einstellungen für das laufende KTTS-System zu übernehmen. |
Es gibt zwei Möglichkeiten, die Sprechgeschwindigkeit in KTTS einzustellen. Viele Sprecher haben eine Einstellung für Geschwindigkeit in ihrem Einstellungsdialog, den Sie mit einem Klick auf auf der Karteikarte Sprecher erreichen. Diese Einstellung der Geschwindigkeit auf der Karteikarte Audio wirkt zusätzlich zur Einstellung der Sprechergeschwindigkeit und kann immer benutzt werden, auch wenn der Sprecher keine Einstellung der Geschwindigkeit zulässt. Damit dies funktioniert, müssen Sie das Programm sox auf Ihrem System installieren (Debian Nutzer: apt-get install sox). Diese Einstellung wird jedoch nicht benutzt, wenn Sie Text mit SSML vorlesen lassen. (Siehe „SSML“)
Die Liste der ALSA-Geräte umfasst alle PCM-Geräte und Module, die in Ihrem System eingerichtet sind. Die meisten davon werden nicht funktionieren. Sie müssen selbst herausfinden, welches Gerät bei Ihnen funktioniert. Im Zweifel wählen Sie Standard.
Wenn Sie auf die Karteikarte Unterbrechung in kttsmgr klicken, öffnet sich die Karteikarte Unterbrechung.
Auf dieser Karteikarte können Sie besondere Aktionen einrichten, die immer dann ausgeführt werden, wenn der Textauftrag von einer Nachricht mit höherer Priorität unterbrochen wird. KTTS verarbeitet vier Arten von Sprachaufträgen:
Normalen Text
Nachrichten
Warnungen
Ausgaben von Screen-Readern
Die Ausgabe von Screen-Readern hat die höchste Priorität. Sie wird allen anderen Aufträgen vorgezogen und hält diese Aufträge an. Nachdem die Ausgabe der Screen-Reader vorgelesen wurde, werden die angehaltenen Aufträge wieder aufgenommen.
Warnungen haben die nächsthöhere Priorität. Diese Stufe ist wichtigen Nachrichten wie z. B. "Prozessor wird zu heiß" vorbehalten. Eine Warnung hält die Ausgabe von Nachrichten und normalem Text an. Diese Aufträge werden nach dem Vorlesen der Warnung wieder fortgesetzt.
Nachrichten haben die nächste Priorität. Eine Nachricht unterbricht normalen Text. KMouth ist ein Beispiel für eine Anwendung, die Nachrichten ausspricht. Wenn Sie z. B. gerade einen langen Text auf einer Webseite vorlesen lassen, können Sie mit KMouth trotzdem jemanden begrüßen, der gerade den Raum betritt.
Alle vier Auftragsarten werden in Warteschlangen abgearbeitet, mit Ausnahme der Ausgabe von Screen-Readern. Wenn eine Anwendung die Ausgabe eines Screen-Readers schickt, während KTTS gerade eine solche vorliest, wird diese Ausgabe angehalten und beendet.
Wird ein Textauftrag durch eine Nachricht, Warnung oder die Ausgabe eines Screen-Readers unterbrochen, fügt KTTS die Audioausgabe in die Warteschlange ein.
![]() | Diese Mitteilung wird vorgelesen, wenn ein normaler Textauftrag unterbrochen wird. |
![]() | Diese Audiodatei wird immer dann abgespielt, wenn ein normaler Textauftrag unterbrochen wird. Wenn sowohl Einleitender Klang als auch Einleitende Nachricht aktiv sind, wird der Einleitende Klang vor der Einleitenden Nachricht abgespielt. |
![]() | Diese Mitteilung wird vorgelesen, wenn ein normaler Textauftrag nach einer Unterbrechung wieder aufgenommen wird. |
![]() | Diese Audiodatei wird abgespielt, wenn ein unterbrochener Textauftrag fortgesetzt wird. |
Die Einstellungen auf dieser Karteikarte gelten nur für normale Textaufträge. Für Nachrichten, Warnungen und die Ausgaben von Screen-Readern gibt es keine besonderen Aktionen, wenn diese durch eine Nachricht mit höherer Priorität unterbrochen werden.
In Konqueror, dem Webbrowser von KDE, können Sie den Text der angezeigten Webseite vorlesen lassen. Überprüfen Sie zuerst, ob KTTS läuft. Markieren Sie dann den Text, der vorgelesen werden soll, und wählen Sie im Hauptmenü ->. Nach kurzer Zeit sollte die Sprachausgabe beginnen.
Es ist fast immer sinnvoll, den gewünschten Text einer Webseite zu markieren. Sie können diesen Schritt auch überspringen, aber dann werden viele HTML-Vorspannzeilen und andere unsichtbare Marken ebenfalls vorgelesen.
In Kate dem erweiterten Texteditor von KDE, können Sie angezeigten Text vorlesen lassen. Überprüfen Sie zuerst, ob KTTS läuft. Markieren Sie dann den Text, der vorgelesen werden soll, und wählen Sie im Hauptmenü ->. Dann sollte die Sprachausgabe beginnen.
Sie müssen nicht unbedingt Text markieren; in diesem Fall wird die ganze Datei vorgelesen.
Dies funktioniert auch, wenn Kate in andere Anwendungen eingebettet ist, wie z. B. in Konqueror oder in Quanta.
KNotify ist das Nachrichtensystem von KDE, das Sie über von Ihnen festgelegte Ereignisse benachrichtigt. Sie können den Text dieser Nachrichten auch von KTTS vorlesen lassen.
In Konversation, dem IRC-Programm von KDE, können Sie verschiedene Arten von Nachrichten einrichten. Sie können Konversation beispielsweise so einrichten, dass Sie benachrichtigt werden, wenn in einem IRC-Kanal eine Nachricht auftaucht, in der Ihr Nickname vorkommt. Mit KTTS können Sie sich dann den IRC-Nachrichtentext vorlesen lassen.
Unterstützt ein KDE-Programm KNotify, erscheint ein Menüeintrag Benachrichtigungen im Menü Einstellungen dieses Programms. Die hier möglichen Einstellungen für KNotify unterscheiden sich je nach Anwendung.
Um mit KTTS KNotify-Nachrichten vorlesen zu lassen, starten Sie kttsmgr und klicken auf Benachrichtigungen. Die Karteikarte Benachrichtigungen erscheint.
![]() | Markieren Sie dieses Ankreuzfeld, um das Vorlesen von KDE-Benachrichtungen einzuschalten. Ist diese Einstellung nicht markiert, sind die übrigen Einstellungen deaktiviert und KTTS liest keine Benachrichtigungen vor. |
![]() | Ist diese Einstellung markiert, werden Benachrichtigungen, bei denen ein Klang abgespielt wird, von KTTS nicht vorgelesen. |
![]() | Verwenden Sie diese Knöpfe, um Ereignisse zur Liste hinzuzufügen oder daraus zu löschen. Wenn Sie auf den Knopf klicken, erscheint ein Dialog, in dem Sie die Anwendung und das Ereignis auswählen können, das Sie zur Liste hinzufügen wollen. |
![]() | Dieses Ereignis liest die Nachricht vor, die Konversation verschickt, wenn jemand in einer IRC-Nachricht Ihren Nicknamen erwähnt. |
![]() | Alle anderen Ereignisse, die von Konversation verschickt werden, werden von KTTS ignoriert. |
![]() | Alle Ereignisse, für die in der Liste nichts anderes angegeben ist, werden von KTTS ignoriert. |
![]() | Verwenden Sie dieses Auswahlfeld, um festzulegen, was KTTS tun soll, wenn ein Ereignis eintrifft. Sie haben folgende Auswahlmöglichkeiten:
|
![]() | Wenn Sie Benutzerdefinierten Text vorlesen ausgewählt haben, geben Sie den gewünschten Text ein. Sie können dabei die folgenden Platzhalter verwenden:
|
![]() | Testen Sie die Nachricht, in dem Sie hier klicken. |
![]() | Sie können hier die Eigenschaften des gewünschten Sprechers eingeben. |
Beachten Sie, dass es drei Ebenen für Ereignisse gibt. Ist für ein bestimmtes Ereignis einer bestimmten Anwendung eine Aktion festgelegt, wird diese ausgeführt. Andernfalls wird die Aktion für alle anderen Ereignisse der bestimmten Anwendung ausgeführt. Als letzte Möglichkeit kommt die Aktion zum Tragen, die unter Standard (alle anderen Ereignisse) festgelegt wurde.
Das Ereignis Alle Benachrichtungen für die Anwendung Standard (alle anderen Ereignisse kann nicht aus der Liste gelöscht werden. Hierfür können Sie die vorzulesenden Benachrichtigungen wie folgt festlegen:
Kein Ereignis wird vorgelesen.
Vorgelesen werden Benachrichtigungen, die eine Bestätigung erwarten.
Benachrichtigungen, die einen passiven Dialog anzeigen, der automatisch geschlossen wird, werden vorgelesen.
Benachrichtigungen, die auf dem Bildschirm angezeigt werden, passiv oder nicht, werden vorgelesen.
Alle Benachrichtungen, egal ob Sie auf dem Bildschirm angezeigt werden oder nicht, werden vorgelesen.
Filter zur Zeichenkettenersetzung bieten eine gute Möglichkeit in KTTS falsch betonte oder fehlerhaft ausgesprochene Nachrichten zu korrigieren. Die Datei kmail.xml
, die zum Lieferumfang von KTTS gehört, ist ein gutes Beispiel. Sie entfernt die Tags br und b aus den Nachrichten, die KMail versendet, und zudem den Ausdruck /local/inbox, da dieser in den meisten Fälle als vorausgesetzt angenommen werden kann. Lesen Sie dazu auch „Einrichtung der Zeichenkettenersetzungsfilter“.
Verwenden Sie den Knopf , um die Einstellungen für die Benachrichtigungen in eine Datei zu speichern. Verwenden Sie den Knopf , um gespeicherte Einstellungen aus einer Datei zu laden. Die geladenen Ereignisse werden mit den Ereignissen in der Liste zusammengeführt. Wenn Sie mit einer leeren Liste beginnen wollen, klicken Sie auf . Alle Einträge außer Alle Benachrichtungen werden gelöscht.
Klicken Sie auf oder , um die neuen Einstellungen zu übernehmen.
Die Speech Synthesis Markup Language (SSML) ist ein W3C-Standard, um Text für eine Sprachausgabe zu markieren. Dieser Standard enthält Marken für die Steuerung von Stimmen, der Sprechgeschwindigkeit, der Lautstärke, des Geschlechts der Stimme und der Tonhöhe. Außerdem Marken für die Steuerung der Aussprache von zum Beispiel Abkürzungen. SSML ist ein Teil der VoiceXML-Spezifikation, einem weiteren W3C-Standard.
Zur Zeit unterstützt KTTS SSML nur teilweise und nur in den Grundfunktionen. Folgende Einschränkungen sind vorhanden:
Arbeitet nur mit Sprechern von Festival Interactive und Hadifix.
Sie müssen die rab_diphone Stimme (britisch männlich) installieren, da dies die Standardstimme ist, die Festival bei der Ausgabe von SSML benutzt.
Die Einstellung Geschwindigkeit auf der Karteikarte Audio wird nicht berücksichtigt, wenn Sie Text mit SSML vorlesen lassen.
Wenn die Einstellungen für Geschwindigkeit oder Tonlage im Festival-Konfigurationsdialog nicht auf 100% eingestellt ist, wird SSML-Text üblicherweise sehr monoton gesprochen.
Mit dem folgenden Beispieltext können Sie mit SSML experimentieren.
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE speak PUBLIC "-//W3C//DTD SYNTHESIS 1.0//EN" "http://www.w3.org/TR/speech-synthesis/synthesis.dtd"> <speak version="1.0" xml:lang="de-DE"> <prosody pitch="low"> Wer hat in meinem Bett geschlafen? </prosody> fragte Papa Bär. <prosody pitch="medium"> Wer hat in meinem Bett geschlafen? </prosody> fragte Mama Bär. <prosody pitch="high"> Wer hat in meinem Bett geschlafen? </prosody> fragte das Bärenkind. </speak>
Ein bessere Unterstützung von SSML ist für die nächsten Versionen von KTTS geplant.
Filter sind eine der fortgeschrittenen Fähigkeiten von KTTS. Für die normale Arbeit mit KTTS sind Filter nicht erforderlich.
In Filtern wird Text bearbeitet, ehe er zum Sprachsynthesizer geschickt wird. Sie sind nützlich für die Verbesserung der Aussprache, um falsch gesprochene Worte oder Abkürzungen zu ersetzen, eine passende Sprache und Sprecher auszuwählen oder um bestimmte Mängel von Sprachsynthesizern und deren Stimmen zu umgehen.
Um die Arbeitsweise von Filtern zu verstehen, ist es wichtig zu wissen, wie KTTS mit einem Text arbeitet. KTTS unterscheidet vier Arten von Texten.
Ausgaben von Screen-Readern
Warnungen
Nachrichten
Textaufträge
Der Typ wird von der Anwendungen festgelegt, die eine Nachricht an KTTS verschickt.
Die Ausgabe von Screen-Readern hat die höchste Priorität. Sie wird allen anderen Aufträgen vorgezogen und hält diese Aufträge an. Wenn die Ausgabe der Screen-Reader vorgelesen ist, werden die angehaltenen Aufträge wieder fortgesetzt.
Warnungen haben die nächste Priorität. Diese Stufe ist wichtigen Nachrichten wie z. B. "Prozessor wird zu heiß" vorbehalten. Eine Warnung hat Vorrang und hält die Ausgabe von Nachrichten und normalem Text an. Diese Aufträge werden nach der Ausgabe der Warnung wieder fortgesetzt.
Nachrichten haben die nächsthöchste Priorität. Eine Nachricht unterbricht normalen Text. KMouth ist ein Beispiel für eine Anwendung, die Nachrichten verwendet. Während Sie z. B. einen langen Text auf einer Webseite vorlesen lassen, können Sie mit KMouth jemanden begrüßen, der gerade den Raum betritt. KDE-Benachrichtigungen sind ebenfalls Nachrichten. Lesen Sie dazu „Vorlesen von Nachrichten (Knotify)“.
Der Rest sind einfache Textaufträge. Jeder Auftrag, den Sie von der Karteikarte Aufträge anstoßen, ist ein Textauftrag. KSayit ist ein Beispiel für eine Anwendungen, die Textaufträge verwendet. Textaufträge sind für die Ausgabe längerer Texte gedacht, die keine besondere Dringlichkeit besitzen.
Alle vier Auftragsarten werden in Warteschlangen abgearbeitet, mit Ausnahme der Ausgabe von Screen-Readern. Wenn eine Anwendung die Ausgabe eines Screen-Readers schickt, während KTTS gerade eine solche vorliest, wird diese Ausgabe angehalten und beendet.
Zuerst müssen Sie wissen, dass Filter nie auf die Ausgabe von Screen-Readern angewendet werden. Sie werden auf normale Warnungen, Nachrichten und Textaufträge sowie auf KDE-Nachrichten angewendet.
Es gibt zwei Arten von Filtern - normale Filter und Satzgrenzenerkennungsfilter (SDB-Filter). SBDs unterteilen Text in einzelne Sätze. Dadurch kann KTTS schneller mit dem Vorlesen beginnen, da nur der erste Satz synthetisiert werden muss, nicht der ganze Textauftrag. Damit können Sie außerdem auf der Karteikarte Aufträge satzweise vor- oder zurückspringen oder anhalten und abbrechen, auch wenn der Sprachsynthesizer dies nicht direkt unterstützt.
Normale Filter bearbeiten den Text und geben ihn an den nächsten Filter weiter. Zur Zeit gibt es drei Arten von normalen Filtern.
Zeichenkettenersetzer
XML-Umformer
Sprecherauswahl
Filter sind als Module ausgeführt. In Zukunft kann es noch weiter Arten von Filtern geben.
Zeichenkettenersetzer ersetzen Teile eines Textes durch anderen Text. Die zu ersetzenden Teile können Sie entweder als Worte oder als reguläre Ausdrücke angeben. KTTS wird mit vordefinierten Zeichenkettenersetzerfiltern ausgeliefert, die das Ersetzen von Chat-Emoticons wie ":-)" durch Text oder für die Umformatierung von Nachrichten aus Konversation oder KMail in eine besser verständliche Form ermöglichen.
XML-Umformer verwenden eine XSLT-Datei (XML Style Language - Transforms) um XML von einem Format in ein anderes Format umzuwandeln. Im Lieferumfang von KTTS sind einige XSLT-Dateien zur Übersetzung von XHTML in SSML enthalten.
Mit Sprecherauswahlfiltern können Sie Aufträge abhängig vom Inhalt des Textes oder abhängig von dem Programm, das den Text an KTTS geschickt hat, an einen Sprecher schicken. Wenn Sie zum Beispiel auf der Karteikarte Sprecher eine weibliche Stimme eingestellt haben, können Sie Text von KDE-Nachrichten darüber vorlesen lassen. Siehe „Einrichtung der Synthesizermodule (Sprecher)“.
Jeder dieser verschiedenen Filter hat einstellbare Regeln, nach denen er für eine Sprachausgabe angewendet wird. Wenn der Filter feststellt, dass seine Regeln nicht zutreffen, gibt er den Text unverändert an den nächsten Filter weiter.
Wenn ein Textauftrag, eine Nachricht, eine Warnung oder eine KDE-Nachricht an KTTS geschickt wird, durchläuft der Text alle aktiven Filter, die auf der unten gezeigten Karteikarte eingerichtet wurden. Die Filter werden in der Reihenfolge von oben nach unten abgearbeitet. Danach gehen nur Textaufträge weiter zu den Satzgrenzenerkennungsfiltern (SBD), KDE-Nachrichten jedoch nicht. Anders als bei normalen Filtern beendet der erste SBD-Filter, der den Text ändert, die weitere Bearbeitung durch andere Filter.
Klicken Sie auf den Karteikartenreiter Filter in kttsmgr, um Filter einzurichten.
![]() | Dies zeigt die Liste der eingerichteten normalen Filter. Ist ein Filter nicht angekreuzt, ist er nicht aktiviert und wird nicht benutzt. Filter werden der Reihe nach von oben nach unten abgearbeitet. |
![]() | Klicken Sie hier, um einen neuen Filter einzufügen. Wählen Sie die Art des Filters aus, und es werden die weiter unten folgenden Einrichtungsdialoge angezeigt. |
![]() | Klicken Sie hier, um einen Filter zu entfernen. |
![]() | Um die Einstellungen für einen Filter zu ändern, klicken Sie hier. Es werden die weiter unten folgenden Einrichtungsdialoge angezeigt. |
![]() | Mit einem Klick auf diese Knöpfe können Sie einen Filter in der Liste nach oben oder unten verschieben. |
![]() | Hier sehen Sie die Satzgrenzenerkennungsfilter. Beim ersten Start von KTTS wird als Vorgabe ein Satzgrenzenerkennungsfilter automatisch eingerichtet. Sie können dessen Einstellungen verändern oder weitere Satzgrenzenerkennungsfilter hinzufügen, Anfängern wird aber davon abgeraten. |
![]() | Mit diesem Knopf können Sie Satzgrenzenerkennungsfilter hinzufügen, entfernen, bearbeiten, oder ihre Reihenfolge ändern. |
![]() | Klicken Sie hier, sonst werden Ihre Einstellungen nicht übernommen. |
Für die Einrichtung von Zeichenkettenersetzungsfiltern müssen Sie eine Liste von Worten oder regulären Ausdrücken als Vergleichsmuster eingeben. Werden diese Muster im Text gefunden, dann wird der Text gegen den zugehörigen Ersatztext ausgetauscht. Groß- und Kleinschreibung wird beim Vergleich nicht beachtet.
![]() | Geben Sie für Ihren Filter einen Namen ein. Diesen Namen können Sie beliebig wählen, er muss sich nur von den Namen der anderen Filter unterscheiden. |
![]() | Dies ist die Liste der Worte und regulären Ausdrücke. Der Filter vergleicht den Text mit den Zeichenketten in der Spalte Übereinstimmung und ersetzt ihn bei Übereinstimmung mit der Zeichenkette aus der Spalte Ersetzen durch. Die Liste wird in der angezeigten Reihenfolge von oben nach unten abgearbeitet. |
![]() | Klicken Sie hier, um ein anderes Wort oder einen regulären Ausdruck in die Liste einzufügen. |
![]() | Klicken Sie hier, um das markierte Wort oder den regulären Ausdruck in der Liste zu verschieben. |
![]() | Klicken Sie hier, um ein vorhandenes Wort oder einen regulären Ausdruck in der Liste zu ändern. |
![]() | Klicken Sie hier, um das markierte Wort oder den regulären Ausdruck aus der Liste zu entfernen. |
![]() | Mit diesen Knöpfen können Sie eine Liste von Worten oder regulären Ausdrücken aus einer Datei laden, die aktuelle Liste speichern oder löschen. Laden Sie eine Liste aus einer Datei, werden die Einträge aus der Datei an die vorhandene Liste angehängt. |
![]() | Ist hier eine Sprache eingetragen, wird der Filter nur angewendet, wenn der Sprecher für den Textauftrag eine der hier eingetragenen Sprachen spricht. Klicken Sie auf den Knopf, um eine Liste der Sprachen anzeigen zu lassen. Sie können auch mehrere Sprachen auswählen, wenn Sie beim Mausklick die Strg-Taste gedrückt halten. |
![]() | Ist hier ein Wert eingetragen, wird der Filter nur angewendet, wenn der Text von einer der angegebenen Anwendungen kommt. Sie können mehrere Programme getrennt durch Kommata eingeben. Beispiel: TippDie Anwendungs-ID laufender Programme erhalten Sie mit dem Programm kdcop. Die DCOP-Nummern müssen Sie weglassen. Wenn zum Beispiel kdcop die Anwendungs-ID kopete-3432 anzeigt, dürfen Sie nur |
Der Zeichenkettenersetzungsfilter wird nur dann auf den Text angewendet, wenn alle Bedingungen mit einem Eintrag im Kasten Diesen Filter anwenden bei übereinstimmen. Sind alle Eingabefelder leer, wird der Filter auf alle Texte angewendet.
Alle Vergleiche beachten Groß- und Kleinschreibung.
Beim Vergleich von Worten benutzt der Zeichenkettenersetzungsfilter reguläre Ausdrücke in der Form \sWort
\s. Die Worte müssen also durch Trennzeichen (Leerzeichen) beidseitig begrenzt sein.
In diesem Handbuch finden Sie keine Anleitung zum Schreiben von regulären Ausdrücken. Wenn Sie aber den KDE-Editor für reguläre Ausdrücke installiert haben, können Sie ihn in den Dialogen Hinzufügen oder Bearbeiten als Hilfe zum Zusammenstellen dieser Ausdrücke aufrufen. Den KDE-Editor für reguläre Ausdrücke finden Sie im Paket kdeutils.
Im Lieferumfang von KTTS sind einige Dateien mit Wortlisten enthalten; unter anderem eine Liste mit Emoticons wie ":-)", einige Abkürzungen für IRC oder Messaging-Programme und eine Liste mit weiteren Abkürzungen. Es gibt auch eine Liste mit Sonderzeichen, mit der die aktuelle Version der polnischen Festival-Stimme Probleme hat. Wenn Sie eigene Wortlisten erstellen, können Sie diese mit Speichern in eine Datei schreiben und an das KTTS-Team schicken, das die Listen dann in die nächste Version aufnimmt.
XML-Umformer übersetzen XML mit Hilfe von XSLT-Dateien aus einem Format in ein anderes Format. XSLT (XML Style Language - Transforms) ist ein W3C-Standard für solche Umformungen. Es kann aber nur auf wohlgeformtes XML angewendet werden. Das Hilfsprogramm xsltproc muss auf Ihrem System installiert sein.
![]() | Geben Sie für Ihren Filter einen Namen ein. Diesen Namen können Sie beliebig wählen, er muss sich nur von den Namen der anderen Filter unterscheiden. |
![]() | Geben Sie den vollständigen Pfad zur XSLT-Datei für die Umwandlung ein. |
![]() | Geben Sie den Pfad für das Programm xsltproc ein. Wenn xsltproc über die Umgebungsvariable PATH erreichtbar ist, reicht auch |
![]() | Wenn hier ein Wert angegeben ist, wird der Filter nur auf XML-Dateien mit einer <!DOCTYPE Spezifikation mit dem eingegebenen Text am Anfang angewendet. Zum Beispiel |
![]() | Ist hier ein Wert eingetragen, wird der Filter nur angewendet, wenn der Text von einer der angegebenen Anwendungen kommt. Sie können mehrere Programme getrennt durch Kommata eingeben. Beispiel: TippDie Anwendungs-ID laufender Programme erhalten Sie mit dem Programm kdcop. Die DCOP-Nummern müssen Sie weglassen. Wenn zum Beispiel kdcop die Anwendungs-ID kopete-3432 anzeigt, dürfen Sie nur |
Der XML-Umformerfilter bearbeitet den Text nur dann, wenn das angegebene "root"-Element oder der DOCTYPE übereinstimmen und die Anwendungs-ID mit dem Eintrag in Diesen Filter anwenden, wenn übereinstimmt. Ist hier nichts eingetragen, wird die Prüfung nicht durchgeführt. Ist überhaupt kein Eintrag vorhanden, wird der Filter auf alle Texte angewendet. Sie sollten aber zumindest ein Eingabefeld ausfüllen, da die meisten Textaufträge nicht im XML-Format übermittelt werden.
Mit dem Sprecherauswahlfilter können Sie Texte an einen bestimmten Sprecher schicken, der auf der Karteikarte Sprecher eingerichtet ist, oder an einen Sprecher mit bestimmten Eigenschaften. Sie können zum Beispiel festlegen, dass Texte von kmail von einer weiblichen Stimme vorgelesen werden sollen. Siehe „Einrichtung der Synthesizermodule (Sprecher)“
Bevor KTTS einen Text an die Filter übergibt, sucht es einen Sprecher für den Text. Der Sprecher wird anhand der Sprecher-Eigenschaften, die das Programm vorgibt, das den Text an KTTS schickt, und den Eigenschaften der auf der Karteikarte Sprecher eingerichteten Sprecher ausgewählt. Mit dem Sprecherauswahlfilter können Sie den gewählten Sprecher überschreiben.
![]() | Geben Sie für Ihren Filter einen Namen ein. Diesen Namen können Sie beliebig wählen, er muss sich nur von den Namen der anderen Filter unterscheiden. |
![]() | Ist hier ein Wert eingetragen, wird der Filter angewendet, falls der Text den eingegebenen regulären Ausdruck enthält. Ist auf Ihrem System der KDE-Editor für reguläre Ausdrücke installiert, können Sie diesen mit einem Klick auf den Knopf aufrufen, um Hilfe bei der Eingabe zu erhalten. TippUm eine schnellere Verarbeitung zu erzielen, sollten Sie versuchen, den regulären Ausdruck am Anfang der Zeichenkette zu "verankern", d. h., beginnen Sie den regulären Ausdruck mit |
![]() | Ist hier ein Wert eingetragen, wird der Filter nur angewendet, wenn der Text von einer der angegebenen Anwendungen kommt. Sie können mehrere Programme getrennt durch Kommata eingeben. Beispiel: TippDie Anwendungs-ID laufender Programme erhalten Sie mit dem Programm kdcop. Die DCOP-Nummern müssen Sie weglassen. Wenn zum Beispiel kdcop die Anwendungs-ID kopete-3432 anzeigt, dürfen Sie nur |
![]() | Legen Sie hier die Eigenschaften des von Ihnen gewünschten Sprechers fest. Wenn der Text die oben gezeigten Filterbedingungen erfüllt, wird der Sprecher ausgewählt, der den gewünschten Anforderungen am ehesten entspricht. Klicken Sie auf den Knopf rechts, um den Dialog Sprecherauswahl anzuzeigen. Siehe „Sprecherauswahl (Erweitert)“ |
![]() | Verwenden Sie diese Knöpfe, um Ihre Sprechereinstellungen zu speichern oder zu laden oder alle Einstellungen zu löschen. |
Der Sprecherauswahlfilter wird nur dann auf den Text angewendet, wenn alle Bedingungen mit einem Eintrag im Kasten Diesen Filter anwenden bei zutreffen. Sie müssen mindestens eine Bedingung eintragen.
Am einfachsten lernen Sie die Einrichtung der Sprecherauswahl durch Ausprobieren. Schalten Sie die Sprecherauswahl ab und geben Sie Text zum Vorlesen ein. Überprüfen Sie auf der Karteikarte Aufträge, welchen Sprecher KTTS auswählt. Schalten Sie die Sprecherauswahl wieder ein, ändern Sie einige Eigenschaften und prüfen Sie, wie sich die Auswahl des Sprechers verändert. Dazu müssen Sie natürlich mehr als einen Sprecher eingerichtet haben, sonst ist der Filter unwirksam.
Satzgrenzenerkennungsfilter (SBD) unterteilen Text in einzelne Sätze. Das ist wichtig, weil
KTTS dann schneller mit dem Vorlesen beginnen kann, da nur der erste Satz verarbeitet werden muss und nicht der ganze Textblock, was sehr lange dauern kann,
Sie dann Texte mit auf der Karteikarte Aufträge satzweise vor- und zurückspulen können
Sie Textaufträge dann auf der Karteikarte Aufträge anhalten oder abbrechen können, auch wenn der Sprachsynthesizer diese Funktion nicht unterstützt.
Aus diesen Gründen wird der normale Satzgrenzenerkennungsfilter automatisch eingerichtet, wenn Sie kttsmgr zum ersten Mal starten. Er kann nicht abgeschaltet, nur entfernt werden. Ändern Sie nichts an diesem Filter, es sei denn, Sie wissen, was Sie tun.
Sie können aber zusätzliche SBD-Filter hinzufügen, um bestimmte Probleme zu lösen. Die polnische Festival-Stimme vom Februar 2005 hat zum Beispiel die lästige Eigenschaft, auch Satzzeichen wie den Punkt am Ende eines Satzes vorzulesen. Dieses Problem können Sie nicht mit einem Zeichenkettenersetzungsfilter zum Löschen der Punkte beheben, da dann der normale SBD-Filter keine Sätze mehr erkennt. Verwenden Sie statt dessen eine geänderte Version des normalen SBD-Filter, die gleichzeitig Satzgrenzen erkennt und entfernt. Dazu fügen Sie einen zusätzlichen SBD-Filter ein und klicken auf Laden, um die mitgelieferte Datei polish_festival_sbdrc
zu laden.
Satzgrenzenerkennungsfilter vergleichen Text mit einem regulären Ausdruck für Satzenden und fügen ein Tabulatorzeichen (Dezimalkode 8) an den Satzgrenzen ein (Tabulatorzeichen werden vor dem Filtern automatisch aus dem Text entfernt). Beachten Sie, dass der Standard-Satzgrenzenerkennungsfilter die Zeichensetzung beibehält.
SBD-Filter werden nie auf KDE-Nachrichten (knotify), Warnungen, Nachrichten oder die Ausgabe von Screen-Readern angewendet.
Wenn Sie aus Versehen den normalen Satzgrenzenerkennungsfilter entfernt haben, können Sie diesen wieder einfügen, indem Sie die in KTTS enthaltene Datei standard_sbdrc
laden.
Auf der Karteikarte Sprecher können Sie eine beliebige Anzahl Sprecher einrichten. Siehe „Einrichtung der Synthesizermodule (Sprecher)“. Sendet eine Anwendung Text an KTTS, kann Sie auch die gewünschten Eigenschaften des Sprechers übergeben. KTTS wählt aus den eingerichteten Sprechern den passendsten aus, um den Wünschen der Anwendung zu entsprechen. So kann eine Anwendung beispielsweise für den Text eine weibliche englische Stimme anfordern. Ist ein englischer Sprecher mit weiblicher Stimme eingerichtet, wird dieser verwendet. Sind nur männliche Sprecher für die englische Sprache installiert, wird einer von diesen ausgewählt. Übermittelt die Anwendung keine gewünschten Eigenschaften, wird der Sprecher ausgewählt, der an erster Stelle in der Liste auf der Karteikarte Sprecher angezeigt wird.
Wenn eine Anwendung die Eigenschaften des gewünschten Sprechers festlegt, kann sie bestimmte Eigenschaften als "vorrangig" markieren. So kann eine Anwendung festlegen, dass eine laute weibliche Stimme gewünscht wird und dabei der Eigenschaft "laut" den Vorrang vor der Eigenschaft "weiblich" geben. Ist eine leise weibliche Stimme und eine laute männliche Stimme eingerichtet, wählt KTTS die laute männliche Stimme aus. Da die Eigenschaft "Sprache" ein kritischer Parameter bei der Verständlichkeit der ausgegebenen Texte ist, gilt diese immer als "vorrangige" Eigenschaft.
Auf der Karteikarte Sprecherauswahl können Sie die Sprechereinstellungen für die Anwendung überschreiben. Die Karteikarte wird angezeigt, wenn
Sie den Knopf auf der Karteikarte Aufträge klicken
Sie den Knopf Sprecher im Dialog Filtereinrichtung für einen Sprachauswahlfilter anklicken
Sie den Knopf Sprecher auf der Karteikarte Benachrichtigungen klicken.
Die Karteikarte bietet drei Möglichkeiten zum Festlegen der gewünschten Sprechereigenschaften:
Verwendung des Standardsprechers (der oberste auf der Karteikarte Sprecher). Mit anderen Worten: Es werden keine Sprechereigenschaften festgelegt.
Verwendung des Sprechers, dessen Eigenschaften am ehesten den angegebenen entsprechen.
Verwendung des passendsten Sprechers, der alle Eigenschaften eines eingerichteten Sprechers aufweist. Wenn Sie die Einstellungen des Sprechers nicht löschen oder bearbeiten, wählt KTTS diesen Sprecher aus. Andernfalls wählt KTTS den Sprecher aus, der am ehesten den ursprünglich eingestellten Eigenschaften entspricht.
![]() | Wählen Sie die Methode zur Eingabe der gewünschten Sprechereigenschaften, indem Sie auf einen der Auswahlknöpfe klicken. |
![]() | Wählen Sie hier die Eigenschaften des gewünschten Sprechers aus. Wenn diese Eigenschaft keine Rolle spielt, geben Sie nichts ein. |
![]() | Markieren Sie dieses Ankreuzfeld, wenn die Eigenschaft "Vorrang" vor anderen Eigenschaften haben soll. Sie können hier auch mehrere Markierungen setzen. |
![]() | Da die Sprache ein kritischer Faktor beim Verstehen der Ausgabe ist, wird diese immer als vorrangige Eigenschaft behandelt. Sie werden diese Eigenschaft selten verwenden. Der einzige Fall, bei dem Sie möglicherweise das Attribut Sprache angeben wollen, liegt vor, wenn Sie wissen, dass eine bestimmte Anwendung Text in einer anderen Sprache als der in der Arbeitsumgebung eingestellten versendet. |
![]() | Dies ist eine Liste der Sprecher, die in KTTS eingerichtet sind. Wenn Sie einen davon auswählen, übernehmen Sie im Prinzip die Eigenschaften dieses Sprechers. Ist dieser Sprecher immer noch eingerichtet, wenn ein Text übergeben wird, kommt es zu einer vollständigen Übereinstimmung und dieser Sprecher wird ausgewählt. Wenn Sie diesen Sprecher später löschen oder seine Einstellungen ändern, kann es sein, dass er nicht mehr ausgewählt wird. Es wird immer der Sprecher ausgewählt, der den ursprünglich festgelegten Eigenschaften am ehesten entspricht. |
Die Eigenschaft Sprache verdient besondere Aufmerksamkeit, weil Text, wenn er von einem Sprecher vorgelesen wird, dessen Sprache von der Sprache des Textes abweicht, wahrscheinlich unverständlich ist. Daher ist Sprache immer eine bevorzugte Eigenschaft. Wenn Sie eine Sprache vorgeben, wird die voreingestellte Sprache überschrieben, ansonsten wird die in KTTS gewählte Sprache benutzt. Wenn eine Anwendung, die Text an KTTS schickt, keine Sprache vorgibt, wählt KTTS die Sprache des ersten Sprechers in der Liste auf der Karteikarte Sprecher. Mit anderen Worten: es wird angenommen, dass der oberste Sprecher in der Liste die Sprache Ihrer Arbeitsumgebung spricht.
Um alle Eigenschaften im Bereich Sprecher verwenden, der am ehesten dem Folgenden entspricht zu löschen, klicken Sie auf den Auswahlknopf Standardsprecher verwenden und dann auf Sprecher verwenden, der am ehesten dem Folgenden entspricht.
KTTS bietet zwei Schnittstellen für Anwendungsprogrammierer (APIs):
Die Sprachausgabe-API, von KDE, mit der Programmierer ihren Anwendungen TTS-Fähigkeiten verleihen können. Anwendungen kommunizieren mit KTTSD über DCOP.
Die KTTSD-Modul-API, mit der Sprachsynthesizer zu KTTSD hinzugefügt werden, sodass KTTS diese Synthesizer benutzen kann.
Der folgende Abschnitt enthält eine kurze Beschreibung der KDE-Schnittstelle der Sprachausgabe-API von KDE. Die vollständige Dokumentation für beide APIs finden Sie auf der KDE Accessibility Webseite (http://accessibility.kde.org).
Anwendungen fordern Sprachausgabedienste über die DCOP-Schnittstelle von KDE vom Programm kttsd über das Objekt KSpeech an.
Geben Sie die folgende Befehle in einer Konsole ein:
Wenn KTTSD noch nicht gestartet wurde
kttsd
Um einen Textauftrag in die Warteschlange zu stellen
dcop kttsd KSpeech setText "
Text
" "Sprecher
"
dabei ist
der Text zum Vorlesen und Text
ein Sprachcode wie z. B. Sprecher
, en
usw. Dieser Befehl liest den Text nicht direkt vor, sondern stellt ihn als Textauftrag in die Warteschlange.de
Beispiel:
dcop kttsd KSpeech setText "Dies ist ein Test." "de"
Um den letzten Textauftrag aus der Warteschlange vorzulesen
dcop kttsd KSpeech startText
0
In diesem Fall steht 0
für den letzten Textauftrag in der Warteschlange. Sie können auch eine Auftragsnummer angeben. (Ohne Auftragsnummer ist die Eingabe 0
erforderlich).
Um den gerade gesprochenen Textauftrag anzuhalten
dcop kttsd KSpeech stopText 0
Es hängt vom benutzten Sprachmodul ab, ob die Ausgabe sofort anhält.
Es gibt noch mehr Befehle, die Sie einsetzen können. Für eine Liste aller Befehle geben Sie
dcop kttsd KSpeech
ein oder lesen Sie die KDE Sprachausgabe-API.
Berichten Sie über Probleme und Wünsche auf der Internetseite http://bugs.kde.org.
Dieses Dokument wurde seit der Installation möglicherweise bearbeitet. Etwaige neuere Versionen dieser Dokumentation finden Sie unter http://docs.kde.org/.
5.1. | kttsmgr stürzt sofort ab, wenn es gestartet wird. Ich habe Debug-Unterstützung einkompiliert, aber ich bekomme keine Rückverfolgung. |
GStreamer ist abgestürzt und KTTS wurde dabei beendet. Wahrscheinlich müssen Sie GStreamer noch "registrieren". Bei GStreamer 0.8.x lautet der Befehl gst-register-0.8. Wenn das Problem dadurch nicht gelöst ist, ist möglicherweise eine nicht kompatible Version von GStreamer installiert. Sie können versuchen GStreamer zu aktualisieren oder zu deinstallieren. | |
5.2. | Die Audioausgabe über ALSA funktioniert nicht, wenn ich gleichzeitig mit einer anderen Anwendung Musik abspiele. Wenn ich einen Textauftrag anhalte, friert KTTS ein. Auf der Konsole erscheint eine Meldung, die besagt: "unable to open PCM". |
Auf Ihrem System besteht das Problem, dass Konflikte bei ALSA auftreten, die die ein gleichzeitiges Öffnen mehrerer PCM-Geräte verhindern. Hinweise für mögliche Lösungen finden Sie auf der Webseite des ALSA-Projektes (dmix) unter www.alsa-project.org. | |
5.3. | Ich muss noch einmal von vorne anfangen. Wie kann ich KTTS vollständig beenden? |
Geben Sie die folgenden Befehle in einer Konsole ein: killall kttsd killall kttsmgr | |
5.4. | Wie kann ich die Fehlerausgabe von kttsd sehen? |
Öffnen Sie zwei Konsole-Fenster. Starten Sie erst kttsd im einen Fenster, dann kttsmgr im anderen. | |
5.5. | Ich habe eine zusätzliche Stimme für Festival aus dem Internet geladen. Ich habe sie installiert und kann sie in Festival benutzen, aber kttsmgr zeigt diese Stimme nicht an. |
Fügen Sie in der Datei $KDEHOME/share/apps/kttsd/festivalint/voices die neue Stimme hinzu. Als Anleitung können Ihnen dabei die anderen Einträge dienen. Wenn das erfolgreich ist, schicken Sie bitte einen Patch zusammen mit der URL, auf der Sie die Stimme gefunden haben, an die Entwickler. | |
5.6. | Keiner der genannten Sprachsynthesizer unterstützt meine Sprache. Wo kann ich einen Synthesizer für meine Sprache bekommen? |
Suchen Sie bei Google(tm). Diese Verknüpfung könnte auch hilfreich sein. Wenn Sie einen freien Synthesizer für Ihre Wunschsprache finden und dafür Unterstützung zu KTTS hinzufügen wollen, setzen Sie sich mit den Entwicklern in Verbindung. Quelloffene Synthesizer werden besonders gesucht. Wenn Sie einen kommerziellen Synthesizer kennen, können Sie versuchen, den Hersteller dazu zu überreden, den Entwicklern eine freie Kopie zu überlassen. Bis dahin können Sie versuchen, den Synthesizer mit dem Befehlmodul zu benutzen. Siehe „Arbeiten mit dem Befehlsmodul“. | |
5.7. | KTTS liest zu langsam vor. Wie kann ich die Geschwindigkeit erhöhen? |
Auf der Karteikarte Audio gibt es eine Einstellung Geschwindigkeit. Damit dies funktioniert, muss das Programm sox installiert und über die Umgebungsvariable PATH auffindbar sein. Einige Synthesizermoduls wie Festival Interactive bieten selbst auf der Karteikarte für Sprechereinrichtung eine Einstellung für Geschwindigkeit an. Abhängig von der gewählten Stimme ist diese aktiv oder inaktiv. | |
5.8. | Das funktioniert bei einigen Sachen, aber Webseiten werden immer noch zu langsam vorgelesen. |
Die Einstellungen für die Sprechgeschwindigkeit werden ignoriert, wenn KTTS HTML vorliest. (Das liegt daran, dass das HTML in SSML umgewandelt wird. SSML verfügt über eigene Tags, mit denen die Geschwindigkeit gesteuert wird.) Deaktivieren Sie entweder den Filter für die Umwandlung von HTML nach XML (siehe „Filter (Fortgeschrittene)“) oder, wenn Sie ganz mutig sind, ändern Sie die .xsl-Datei des HTML-nach-SSML-Umformerfilters, und setzen Sie die Sprechgeschwindigkeit herauf. | |
5.9. | Ich schaffe es nicht, dass Webseiten mit einer weiblichen Stimme vorgelesen werden. Ich habe einen weiblichen Festival-Sprecher eingerichtet, aber KTTS liest die Webseiten mit einer männlichen Stimme vor. |
Bei Festival 1.95 beta scheint das Tag SABLE GENDER nicht zu funktionieren. Damit Festival keine Fehler produziert, verwirft die xsl-Datei zum Umwandeln von SSML nach SABER die GENDER-Tags. Das Gleiche gilt auch für die VOICE-Tags. | |
5.10. | Ich habe den HTML-XML-Umformerfilter eingerichtet, aber bei Verwendung des Moduls für Festival werden Webseiten nicht vorgelesen. |
Bedingt durch einen Fehler in Festival 1.95 beta müssen Sie die (männliche britische) Stimme rab_diphone installieren, damit SABLE überhaupt funktioniert. Das müssen Sie selbst dann tun, wenn Sie diese Stimme nicht zum Vorlesen von Webseiten benutzen. Stellen Sie außerdem sicher, dass das Programm xsltproc installiert und über die Umgebungsvariable PATH zu finden ist. | |
5.11. | Bestimmte Zeichen oder Interpunktionszeichen scheinen Fehler beim Synthesizer zu verursachen, sodass ganze Sätze übersprungen oder nur Kauderwelsch ausgegeben wird. Was kann ich dagegen tun? |
Stellen Sie zunächst sicher, dass die Option Zeichenkodierung auf den richtigen Wert für die entsprechende Sprache eingestellt ist. Gibt es Probleme mit bestimmten Zeichen oder Wörtern, können diese möglicherweise durch einen Zeichenkettenersetzungsfilter behoben werden. Verwirren bestimmte Interpunktionszeichen den Synthesizer, müssen Sie einen Satzgrenzenerkennungsfilter einrichten. Siehe „Filter (Fortgeschrittene)“. | |
5.12. | Ich habe einen eigenen Zeichenkettenersetzungsfilter hinzugefügt und nun kann ich in KTTS nicht mehr satzweise vor- oder zurückgehen. Auf dem Karteireiter Aufträge wird angezeigt, der Auftrag bestehe nur aus einem Satz. Was mache ich falsch? |
Interpunktionszeichen (Punkt, Fragezeichen, Ausrufezeichen, Komma und Semikolon) dürfen Sie nicht ausfiltern. Benutzen Sie für diese Zeichen stattdessen einen Filter zur Satzgrenzenerkennung. |
KTTS
Programm Copyright (c) 2002 José Pablo Ezequiel "Pupeno" Fernández (pupeno AT kde.org)
Aktueller Betreuer: Gary Cramblitt (garycramblitt AT comcast.net)
Mitwirkende:
Olaf Schmidt (ojschmidt AT kde.org)
Gunnar Schmi Dt (gunnar AT schmi-dt.de)
Paul Giannaros (ceruleanblaze AT gmail.com)
Copyright der Dokumentation (c) 2004 Gary R. Cramblitt (garycramblitt AT comcast.net)
Übersetzung Burkhard Lück(lueck AT hube-lueck.de)
Diese Dokumentation ist unter den Bedingungen der GNU Free Documentation License veröffentlicht.
Dieses Programm ist unter den Bedingungen der GNU General Public License veröffentlicht.
Die Sprachsynthesizer, die von KTTS genutzt werden, haben ihre eigene Lizenz, die Sie in der zugehörigen Dokumentation oder auf den betreffenden Webseiten finden. Es gibt auch Stimmen, die eine eigene Lizenz besitzen.
Inhaltsverzeichnis
KTTS ist Teil des KDE-Projekts http://www.kde.org/.
KTTS finden Sie im kdeaccessibility-Paket auf ftp://ftp.kde.org/pub/kde/, dem Haupt-FTP-Server des KDE-Projekts.
(In Zukunft) Debian Installationsbefehl: apt-get install kdeaccessibility
Sie finden Quelltexte und übersetzte Pakete auf der KDE Accessibility Webseite (http://accessibility.kde.org).
Wenn Sie Zugriff auf das KDE Quellcodearchiv haben, können Sie das Paket kdeaccessibility mit KTTS daraus herunterladen. KTTS finden Sie im Ordner kttsd. Außerdem finden Sie den Quellcode von kdeaccessibility unter ftp://ftp.kde.org/pub/kde/.
Unbedingt erforderlich:
KDE Version 3.2 oder neuer.
Ein Sprachsynthesizer. Die folgenden Synthesizer und Sprachen werden zur Zeit unterstützt.
Festival | Amerikanisches Englisch, Britisch, Spanisch, Deutsch, Finnisch, Tschechisch, Polnisch, Russisch, Italienisch, Französisch, Kanadisches Französisch, Kiswahili, Zulu und Ibibio. |
Festival Lite (flite) | Englisch |
Hadifix (MBROLA und txt2pho) | Deutsch, Ungarisch |
Epos | Tschechisch, Slowakisch |
FreeTTS | Englisch |
KTTS arbeitet mit auch mit jedem Sprachsynthesizer, der auf der Befehlszeile in einer Konsole gestartet werden kann.
Die Liste der oben genannten Sprachen kann unvollständig oder veraltet sein. Ziehen Sie daher die Beschreibung der Synthesizer zu den unterstützten Sprachen zu Rate. Schauen Sie auch auf der Webseite von KTTS, nach Informationen, die noch nicht in diesem Handbuch enthalten sind.
KTTS benutzt eine anpassungsfähige Modul-Architektur für Sprachsynthesizer. Wenn Sie KTTS für die Nutzung eines anderen Synthesizers erweitern möchten, setzen Sie sich mit dem Entwicklerteam in Verbindung.
Spezielle Anleitungen zu den verschiedenen Sprachsynthesizern finden Sie in „Einrichtung“.
Zumindest eines der folgenden Audiosysteme:
KDE aRts-Soundsystem. aRts wird normalerweise zusammen mit KDE installiert.
ALSA (Advanced Linux® Sound Architecture). ALSA ist auf den meisten Systemen mit Linux® bereits installiert. (www.alsa-project.org)
GStreamer in der Version 0.8.7 oder neuer. Beachten Sie: Vergewissern Sie sich, dass die Module für GStreamer registriert sind, indem Sie vor der Verwendung von GStreamer in KTTS den Befehl gst-register aufrufen. (http://gstreamer.freedesktop.org)
aKode-Bibliothek. aKode ist eine Dekoderbibliothek, die zu KDE gehört.
Das KDE-Projekt wird die Unterstützung von aRts wahrscheinlich mit der Version 4 von KDE einstellen.
Einige Anwender erleben in Zusammenhang mit ALSA Konflikte bei der Audioausgabe. Wenn Ihr System auch dazu zählt, können Sie nicht gleichzeitig Musik abspielen und einen Text vorlesen lassen. KTTS friert zudem ein, wenn Sie einen Textauftrag anhalten und dann einen weiteren starten. Mögliche Lösungen für dieses Problem finden Sie auf der Webseite von ALSA (dmix).
Mit Stand Juli 2005 unterstützt aKode noch keine echten Pausen. Wenn Sie einen Textauftrag in KTTS anhalten, wird der aktuelle Satz noch zuende vorgelesen.
Zusätzliche Komponenten:
Das Audio-Programm sox wird für die allgemeine Einstellung der Sprechgeschwindigkeit benutzt, ist aber sonst nicht zwingend notwendig. Debian-Nutzer können sox mit dem Befehl apt-get install sox installieren. Das Programm ist auf den meisten Linux®-CDs bereits enthalten.
Das Programm xsltproc wird für die Unterstützung von SSML und für den XML-Umwandlungsfilter benutzt, ist aber nicht zwingend notwendig. Debian-Nutzer können xsltproc mit dem Befehl apt-get install xsltproc installieren.
Um KTTS zu kompilieren, brauchen Sie eine aktuelle Entwicklungsumgebung von KDE (Version 3.4 oder neuer) einschließlich der Pakete kdelibs und arts.
Haben Sie KTTS als tarball (mit tar gepacktes Archiv) heruntergeladen, melden Sie sich als normaler Nutzer an und entpacken den tarball in einen passenden Ordner. Wechseln Sie in diesen Ordner und geben Sie die folgenden Befehle ein:
./configure make
Die folgenden Optionen für configure sind verfügbar:
Standardoption | Beschreibung | Alternative |
--with-arts | Erstellt das Audiomodul für arts. | --without-arts |
--with-alsa=check | Erstellt das Audiomodul für ALSA. | --with-alsa=no |
--with-gstreamer=no | Übergeht das Erstellen des Audiomodul für GStreamer. | --with-gstreamer=check |
--with-akode=no | Übergeht das Erstellen des Audiomoduls für aKode. | --with-akode=check |
In KDE 4 wird das Modul aRts wahrscheinlich entfernt oder zumindest nur noch auf Anforderung erstellt.
Die folgenden Module für Sprachsynthesizer werden standardmäßig erstellt. Einige davon besitzen eine Laufzeitabhängigkeit von nicht-freier Software. (Nicht-frei nach den Richtlinien der Debian-Distribution). Die Spalte "configure-Option zum Abschalten des Erstellens" zeigt den configure-Parameter an, der das Übergehen des Erstellens bewirkt.
Synth | Lizenz | configure-Option zum Abschalten des Erstellens |
Festival | free | --disable-kttsd-festivalint |
Festival Lite | free | --disable-kttsd-flite |
Epos | free | --disable-kttsd-epos |
Befehl | free | --disable-kttsd-command |
Hadifix | nicht-frei | --disable-kttsd-hadifix |
FreeTTS | nicht-frei | --disable-kttsd-freetts |
Als Voreinstellung wird KTTS in /opt/kde3
installiert. Ist dieser Ordner nicht in der Umgebungsvariable $KDEDIRS
aufgeführt, müssen Sie als Option --prefix=
angeben. Zum Beispiel Ziel
./configure --prefix=/usr/local make
Auf Debian-Systemen ist
der richtige Ordner für Programme, die aus den Quellen übersetzt werden. /usr/local
Melden Sie sich als root an und installieren Sie den übersetzten kttsd; mit den folgenden Befehlen:
su make install
Wenn Sie die Quelltexte von KTTS aus dem Quelltextarchiv für kdeaccessibility
beziehen oder den jede Nacht aktuell erstellten Tarball heruntergeladen haben, übersetzen und installieren Sie das Programm mit folgenden Befehlen:
cd kdeaccessibility echo kttsd >inst-apps make -f Makefile.cvs ./configure cd kttsd make su make install
Bevor Sie KTTS benutzen, überprüfen Sie zuerst, ob Ihr Sprachsynthesizer richtig arbeitet. Folgen Sie den Anweisungen, die Sie mit dem Synthesizer erhalten haben.
In einigen Fällen benötigen Sie Schreibzugriffsrechte auf das Audiogerät.
chmod a+rw
/dev/dsp*
Festival ist einer der besten freien TTS-Synthesizer, dessen Quellcode offengelegt ist. Die Qualität der Stimmen ist im Allgemeinen gut, und es werden mehrere Stimmen und Sprachen unterstützt. Bei vielen Stimmen können Sie Lautstärke, Sprechgeschwindigkeit und Tonhöhe mit KTTS einstellen.
Sprachsynthesizer: Festival Interactive
URL: http://www.cstr.ed.ac.uk/projects/festival/
Debian Installationsbefehl: apt-get install festival
Sie müssen mindestens eine Sprache installieren. Hilfe dazu finden Sie in den Anleitungen, die mit Festival geliefert werden. Möchten Sie Webseiten vorlesen lassen, müssen Sie die (männliche britische) Stimme rab_diphone installieren.
Zusätzliche englische Festival Stimmen finden Sie unter
Zusätzliche spanische, englische und deutsche Stimmen finden Sie unter
http://cslu.cse.ogi.edu/tts/download/
Für diese Stimmen müssen Sie ein zusätzliches Modul kompilieren, daher brauchen Sie den Quellcode von Festival. Die deutschen Stimmen unterliegen Einschränkungen bei der Weitergabe.
Eine männliche finnische Stimme finden Sie unter
http://www.ling.helsinki.fi/suopuhe/download/.
Eine männliche polnische Stimme finden Sie unter
http://www.artegence.com/download/voicexml/speech/festival_polish_voice.tgz.
Eine männliche russische Stimme finden Sie unter
http://nshmyrev.narod.ru/festival/festival.html
Diese Stimme setzt Festival 1.95 beta oder neuer voraus. Die Stimme ist immer noch in einem frühen Entwicklungsstadium. Entpacken Sie die Software in festival/lib/voices/russian/
. Wenn Sie die russischen Stimmen einrichten, müssen Sie für die Stimmen msu_ru_nsh_diphone
eingeben. Wählen Sie eine kyrillische (8-Bit-)Kodierung wie zum Beispiel KOI8-R
.
Italienische Stimmen für Festival 1.95 beta sind hier verfügbar:
http://www.csrf.pd.cnr.it/TTS/It-FESTIVAL-download.htm.
Wenn Sie beim Auspacken CRC-Fehler bekommen, versuchen Sie das Herunterladen erneut.
Swahili-, Zulu- und Ibibio-Stimmen für Festival 1.95 beta sind hier verfügbar:
Unglücklicherweise funktioniert die dort ebenso verfügbare Hindi-Stimme nicht mit KTTS.
Kommerziell vertriebene Stimmen, darunter eine Stimme für kanadisches Französisch, können bei Cepstral, LLC erworben werden. Die Adresse lautet:
Die FAQ auf der Supportseite enthält Informationen darüber, wie die angebotenen Stimmen in Festival eingebunden werden.
Festival ist normalerweise in den Linux®-Distributionen enthalten. Suchen Sie Festival daher als erstes auf den CDs Ihrer Distribution.
Wenn Sie die polnischen, ungarischen oder tschechischen Sprachen benutzen wollen, muss die Option Kodierung auf ISO 8859-2
eingestellt werden.
Wenn Sie die russische Stimme benutzen wollen, muss die Option Kodierung auf ein 8-Bit-Kyrillisch wie zum Beispiel KOI8-R
eingestellt werden.
Festival kann gemeinsam mit dem MBROLA-Synthesizer eingesetzt werden. Dann übernimmt Festival die lexikalische Analyse und MBROLA erzeugt daraus die Audioausgabe. Das MBROLA-Programm und die MBROLA-Stimmen können heruntergeladen werden von
Beachten Sie die mitgelieferten Anweisungen in der Datei readme.txt
Beachten Sie, dass MBROLA kein vollständiges Sprachausgabesystem ist. MBROLA generiert Sprache aus Diphon-Dateien. Sie brauchen zusätzliche Software, um diese Diphone zu erstellen. Festival erzeugt diese von MBROLA benötigten Diphone. txt2pho kann auch aus deutschen Texten Diphone erzeugen. Weitere Informationen finden Sie unter „Arbeiten mit Hadifix (MBROLA und txt2pho)“.
Es gibt drei Möglichkeiten, Festival zusammen mit MBROLA zu benutzen.
MBROLA Wrapper. Zur Zeit arbeitet dieses Verfahren nur mit englischen Stimmen.
Bei diesem Verfahren wird zusätzlicher Wrapper-Code zu Festival hinzugefügt, um MBROLA-Stimmen zur Sprachsynthese zu benutzen. Beachten Sie, dass die MBROLA-Stimmendateien nicht im MBROLA-Ordner installiert werden, sondern im Ordner festival/lib/
. Anleitungen finden Sie unter
IMS German Festival ist eine veränderte Version von Festival für deutsche MBROLA-Stimmen. Erforderlich ist entweder Festival Version 1.4.1 oder Festival 2.0 (1.95beta). Zuerst installieren Sie Festival und MBROLA, dann laden Sie MS German Festival von
http://www.ims.uni-stuttgart.de/phonetik/synthesis/festival_opensource.html.
Anweisungen finden Sie in der Datei README
im Paket, das Sie heruntergeladen haben. (Für die Verwendung mit Festival 2.0 ist das Einspielen der Fehlerkorrekturen nicht erforderlich, Sie müssen nur Festival neu übersetzen). Fügen Sie dann folgende Zeilen in die Datei festival/lib/siteinit.scm
ein.
(voice-location "german_de1_os" "/usr/local/mbrola/de1" "German Female, IMS Festival de1") (voice-location "german_de2_os" "/usr/local/mbrola/de2" "German Male, IMS Festival de2") (voice-location "german_de3_os" "/usr/local/mbrola/de3" "German Female, IMS Festival de3")
direkt über der Zeile
(provide 'siteinit)
Auf einigen Systemen müssen Sie die Datei /etc/festival.scm
bearbeiten. Fügen Sie nur die Zeilen für Ihre installierten deutschen Stimmen ein. Ersetzen Sie den richtigen Pfad in
. Zur Zeit der Erstellung dieses Handbuchs funktionieren die deutschen de4, de5, oder de6 Stimmen nicht mit IMS German Festival ./usr/local/mbrola/
Dieses Verfahren benutzt besonderen Code, um die Sprache über Festival mit einer tschechischen MBROLA-Stimme auszugeben. Besorgen und installieren Sie sich zunächst Festival und MBROLA und sorgen Sie dafür, dass beide funktionieren. Dann laden Sie Festival-Czech von
http://www.freebsoft.org/festival-czech
Ersetzen Sie in den folgenden Anweisungen die Ordner durch die entsprechenden Ordner auf Ihrem System.
Entpacken Sie das Programm mit tar in einen passenden Ordner und erzeugen Sie das Lexikon. Die ausführbare Datei Festival muss in Ihrem PATH
liegen.
cd /usr/local tar xvfz festival-czech.tar.gz cd festival-czech make
Laden Sie die Stimmendatei cz2
von der MBROLA-Seite und entpacken sie mit unzip in den MBROLA-Ordner.
cd /usr/local/mbrola mkdir cz2 cd cz2 unzip cz2-001009.zip
Schreiben Sie die folgenden Zeile in die Datei festival/lib/siteinit.scm
.
(set! czech-lexicon-file "/usr/local/festival-czech/czech-lexicon.out") (set! load-path (cons "/usr/local/festival-czech" load-path)) (require 'czech) (set! czech-mbrola_database "/usr/local/mbrola/cz2/cz2") (set! mbrola_progname "/usr/local/mbrola/mbrola") (voice-location "czech_mbrola_cz2" "/usr/local/mbrola/cz2" "Czech Male, MBROLA") (require 'czech-mbrola)
direkt über der Zeile
(provide 'siteinit)
(Auf manchen Systemen finden Sie diese Datei unter /etc/festival.scm
).
Festival Lite ist ein freier, quelloffener Sprachsynthesizer, der zur Zeit nur eine begrenzte Anzahl von Stimmen und Sprachen unterstützt. Er ist ein einfacher Sprachsynthesizer mit noch ausreichender Stimmenqualität. Mit KTTS können Sie bei diesem Sprachsynthesizer weder Tonhöhe, Lautstärke noch Sprechgeschwindigkeit einstellen.
Sprachsynthesizer: Festival Lite (flite)
URL: http://www.speech.cs.cmu.edu/flite/index.html
Debian Installationsbefehl: apt-get install flite
flite ist normalerweise in den Linux®-Distributionen enthalten. Suchen Sie flite daher als erstes auf den CDs Ihrer Distribution.
Kompilieren und installieren Sie flite mit Hilfe der Anweisungen in der mitgelieferten Datei README
.
Hadifix ist ein zweistufiger Sprachsynthesizer, der mit Diphonen arbeitet. Das Programm txt2pho übersetzt Text in Diphone und der MBROLA-Sprachsynthesizer erzeugt daraus den Klang. Die Sprachqualität ist gut, aber die Unterstützung ist zur Zeit auf wenige Sprachen begrenzt. Sie können Stimme, Tonhöhe, Sprechgeschwindigkeit und Lautstärke über kttsmgr einstellen.
Sprachsynthesizer: Hadifix
URL: siehe unten
Debian Installationsbefehl: Keiner
Installieren Sie zuerst Hadifix.
Laden Sie die ausführbare Datei MBROLA von http://festvox.org/mbrola/.
Installieren Sie MBROLA im Ordner /usr/local/mbrola
.
Laden Sie mindestens eine deutsche Sprachdatei von der MBROLA-Seite und entpacken sie mit unzip in den Ordner /usr/local/mbrola
.
txt2pho finden Sie unter
http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html.
Entpacken Sie txt2pho mit unzip nach /usr/local/txt2pho.
Bearbeiten Sie die Datei txt2phorc und geben die richtigen Pfade ein.
Kopieren Sie entweder txt2phorc nach ~/.txt2phorc
oder nach /etc/txt2pho
, hier muss das "rc" am Ende des Dateinamens entfernt werden.
Wählen Sie in kttsmgr die Sprache Deutsch (de), und fügen Hadifix hinzu.
Auf der Karteikarte Einrichtung Sprecherauswahl wählen Sie eine Stimme und stellen die Pfade zu MBROLA und txt2pho richtig ein.
Klicken Sie auf , um die Einstellungen zu überprüfen.
Eine ungarische Implementierung von MBROLA und txt2pho finden Sie auf
Epos ist ein freier, quelloffener Sprachsynthesizer für die tschechische und slowakische Sprache. Er ist ein einfacher Sprachsynthesizer mit noch ausreichender Stimmenqualität. Mit KTTS können Sie bei diesem Sprachsynthesizer nur die Lautstärke einstellen.
Sprachsynthesizer: Epos TTS Synthesis System
Debian Installationsbefehl: apt-get install epos
Starten Sie kttmsgr. Auf der Karteikarte Sprecher klicken Sie auf . Wählen Sie die tschechische oder slowakische Sprache und Epos TTS-Sprachsynthesizer. Wenn die Epos-Programme nicht in Ihrem PATH
stehen, geben Sie den Pfad zu den Programmen auf der Karteikarte Sprecher ein. In den Eingabefeldern können Sie zusätzliche Parameter für die Programme eingeben. Geben Sie in einer Konsole epos -h
oder say -h
, um weitere Informationen zu erhalten.
FreeTTS ist ein freier, quelloffener Sprachsynthesizer, der in Java™ geschrieben wurde, d. h. Sie müssen die Java™ Virtual Machine auf Ihrem System installieren. Mit Java™ können weder Tonhöhe, Lautstärke noch Sprechgeschwindigkeit einstellen.
Sprachsynthesizer: FreeTTS
URL: http://sourceforge.net/projects/freetts/
Debian Installationsbefehl: Keiner
Das Befehlsmodul ermöglicht Ihnen die Benutzung von KTTS mit jedem beliebigen Sprachsynthesizer, der in einer Konsole auf der Befehlszeile angesteuert werden kann.
Sprachsynthesizer: Befehl
URL: keine
Debian Installationsbefehl: Keiner
Am besten benutzen Sie einen Befehl, der die Sprachausgabe in eine temporäre Audiodatei (wav) schreibt, anstatt die Ausgabe direkt zum Audiogerät zu schicken
Wenn sich die erforderliche Kodierung der Texte für den Sprachsynthesizer von der Kodierung Ihrer Arbeitsfläche unterscheidet, müssen Sie die Texte mit dem Parameter %f an den Synthesizer schicken. KTTS schreibt den Text dann in der angegebenen Kodierung in die temporäre Datei. Wenn Sie auf der Befehlszeile Text mit dem Parameter %t an den Synthesizer schicken, wird die Kodierung Ihrer Arbeitsfläche benutzt. Mit der Auswahl von Daten als Standardeingabe schicken können Sie versuchen, dieses Problem zu lösen, wenn der Synthesizer Eingaben von StdIn (Standardeingabekanal) annimmt. Als Beispiel hier ein Befehl, um polnischen Text mit ISO 8859-2 an Festival zu schicken und dabei Satzzeichen auszufiltern.
cat %f | tr '(){}[]"' ' ' | festival --tts --language polish
Would you like to make a comment or contribute an update to this page?
Send feedback to the KDE Docs Team