El manual de &ktts;

KTTS"> MBROLA"> ]> El manual de &ktts; Gary R. Cramblitt garycramblitt@comcast.net

bella5@teleline.es

2004-2005 Gary R. Cramblitt &FDLNotice; 2005-07-31 1.05.00 &ktts; -el sistema text-a-veu de &kde;- és un servei basat en connectors que permet a qualsevol aplicació &kde; (o no &kde;) parlar usant la interfície &DCOP;. &ktts; pretén ser una implementació de l'API Text-to-Speech per al &kde;. KDE accessibilitat tdeaccessibility TTS Text-a-veu KTTSD kttsmgr festival flite hadifix MBROLA freetts epos SSML Introducció &ktts; es un subsistema dins de &kde; per a convertir text-a-veu (Texto-To-Speech en anglès, o TTS). Proveeix una API als programadors de &kde; per a donar capacitats TTS a les seves aplicacions. Proveeix algunes capacitats interessants per als usuaris finals. Característiques per als usuaris: Parla el contingut d'un fitxer de text. Parla les notificacions d'esdeveniment de &kde; (KNotify). Parla tot o part del text d'una pàgina web en &konqueror;. Parla tot o part del text en l'editor de text &kate;, incloguen les instàncies en les que &kate; estigui encastat en una altra aplicació &kde;. El text llarg és dividit en frases. L'usuari pot desar una frase o un paràgraf, repetir, fer una pausa i aturar la reproducció. La sortida d'àudio és mitjançant &arts;, ALSA, GStreamer (versió 0.8.7 o posterior) o aKode. Filtres configurables per l'usuari per a substituir les paraules que no es poden llegir, escollint els sintetitzadors de veu i transforment els documents XHTML/&XML;. Característiques per als programadors: Sistema de prioritats per a la lectura de sortides per pantalla, avisos i missatges, mentre s'estan reproduint texts ordinaris. Arquitectura basada en connectors per al suport d'una llarga varietat de motors de síntesis de veu i controladors. Permet la generació de veu des de la línia de comandaments (o a través d'scripts shell) usant les utilitats &DCOP; de &kde;. Proveeix una interfície lleugera i fàcil d'usar per a que les aplicacions generin sortides de veu. Les aplicacions no necessiten saber com funciona el dispositiu de veu. FUTUR: Proveir suport per a llegir llenguatges de marques, tals com VoiceXML, Sable, &Java; Speech Markup Languaje (JSML), i Speech Markup Meta-language (SMML). FUTUR: Proveir suport limitat per a marques de veu encastades. Asincronisme per a prevenir blocats del sistema. Actualment &ktts; consisteix de diversos programes: kttsd el dimoni text-a-veu de &kde;, que és una aplicació sense interfície gràfica que proveeix serveis TTS a les aplicacions a través de &DCOP;. kttsmgr una aplicació amb interfície gràfica per a configurar i controlar kttsd. kttsmgr s'ubicarà a la safata del sistema. libtdehtmlkttsdplugin Un connector per al fullejador web &konqueror; que us permetrà escoltar tot o una part del text en una pàgina web. tdetexteditor_kttsd Un connector per a l'editor de text &kate; que us permetrà escoltar tot o una part d'un fitxer de text. Suport A més de la base de dades Bugzilla de &kde; (http://bugs.kde.org/ ), és possible seguir les actuals discussions sobre &ktts;; a través de la llista de correu kde-accessibility. Subscriviu-vos a https://mail.kde.org/mailman/listinfo/kde-accessibility. Els desenvolupadors també poden usar l'IRC (irc.kde.org, al canal #kde-accessibility). Usar &ktts; Abans d'usar &ktts; almenys haureu d'instal·lar un motor de síntesis de veu i assegurar-vos de que funciona. Mireu . Iniciar <command>kttsmgr</command> Per a iniciar el sistema &ktts;, escriviu el següent comandament en una &konsole; kttsmgr o feu clic sobre kttsmgr en el menú &kde;. Si és la primera vegada que executeu kttsmgr, o si encara no heu configurat cap parlador, apareixerà la finestra Parladors. Mireu . Si ja en teniu un de configurat, apareixerà la finestra General. Mireu . Configuració dels connectors de síntesis (parladors) La majoria dels sintetitzadors de text-a-veu (TTS) ofereixen múltiples idiomes i veus i poden oferir múltiples gèneres, volums i tons per a parlar. Podeu configurar més d'una instància del sintetitzador. Cada combinació d'idioma, sintetitzador, veu, gènere, volum i to és el que s'anomena un parlador. Al menys haureu de configurar un parlador abans de poder iniciar &ktts; i començar a parlar el text. Tenir múltiples parladors per al mateix sintetitzador és equivalent a tenir múltiples cues de la impressió per a una mateixa impressora física. Quan les aplicacions envien text a &ktts;, han d'especificar els atributs del parlador preferit per a realitzar la síntesis. Per exemple, una aplicació pot requerir un parlador amb veu de dona per a l'idioma anglès. Si heu configurat un parlador amb l'idioma anglès tant per a home com per a dona, s'usarà aquest parlador, d'altra manera s'usarà el més semblant. Per aprendre més sobre com &ktts; escull els parladors mireu . Quan feu clic sobre la pestanya Parladors en kttsmgr, apareixerà la finestra Parladors. Aquesta finestra també apareixerà automàticament si inicia kttsmgr i encara no heu configurat cap parlador. El gestor de text-a-veu de &kde; (pestanya Parladors). El gestor de text-a-veu de &kde; (pestanya Parladors) Feu clic per afegir un nou parlador. Aquí es llistaran tots els Parladors. Els Parladors amb la prioritat més alta es troben al començament. El que estigui a dalt de tot serà l'usat per a parlar quan una aplicació no especifiqui un parlador. Feu clic sobre un parlador de la llista per a ressaltar-lo i a continuació feu clic sobre aquest botó per a eliminar-lo. Feu clic sobre un parlador de la llista per a ressaltar-lo i tot seguit feu clic sobre aquest botó per a mostrar el diàleg de configuració del connector de síntesis. Mireu a continuació. Feu clic sobre un parlador per a ressaltar-lo i tot seguit feu clic sobre aquest botó per a moure'l un lloc cap a amunt en la llista. Contra més avall estigui el parlador en la llista, menor serà la seva prioritat. Feu clic sobre aquest botó per aplicar els canvis realitzats en el sistema &ktts; que s'estigui executant. Quan feu clic sobre el botó Afegeix, apareixerà la finestra Afegeix parlador. Finestra per afegir un parlador. Finestra per afegir un parlador Podeu seleccionar un connector de síntesis de veu, be pel nom del sintetitzador, o be per l'idioma que el sintetitzador pot parlar. Marqueu el botó de ràdio que es troba al costat de la caixa corresponent. Quan estigui marcat el botó de ràdio Idioma, es mostrarà la caixa Idioma amb tots els idiomes suportats, i la caixa Sintetizador tan sols mostrarà aquells sintetitzadors que suporti l'idioma escollit. Quan estigui marcat el botó de ràdio Sintetizador es mostraran tots els sintetitzadors disponibles, i la caixa Idioma tan sols mostrarà els idiomes suportats pel sintetitzador escollit. Aquí s'escull l'idioma i el connector sintetitzador. Quan feu clic aquí, la majoria dels connectors de síntesis es configuraran per si mateixos, escollint una configuració per omissió. Apareixerà un nou parlador en la llista de la pestanya Parladors. Feu clic sobre el botó Edita per a mostrar o editar la configuració del parlador. Quan feu clic sobre el botó Afegeix en la pestanya Parladors per afegir un parlador que no es configuri per si mateix, o feu clic sobre el botó Edita, apareixerà la finestra Configuració del Parlador. Cada connector de síntesis de veu te diferents finestres per a la Configuració del Parlador. El següent és un exemple per a configurar el connector interactiu de Festival. Per a la configuració específica de cada tipus de connector, mireu . Configuració del Parlador Configuració del Parlador Especifiqueu la ruta per a l'executable del programa Festival. Si Festival està a la vostra variable d'entorn PATH, simplement introduïu festival. Feu clic per a cercar les veus disponibles. Seleccioneu una veu. Seleccioneu una codificació de caràcters per al text a enviar al Festival. Per a les veus que siguin conegudes per &ktts;, aquesta configuració serà seleccionada automàticament. En general, els idiomes de l'oest usen ISO 8859-1, els idiomes de l'est d'Europa com el txec o l'eslovac usen ISO 8859-2. Feu clic per a provar. Hauríeu d'escoltar una frase de prova. Useu aquests controls per establir el volum, la velocitat de la parla i el timbre (to) del sintetitzador de veu. Si algun d'aquests estigués deshabilitat (en gris), la veu escollida no suportarà que es canviï aquest paràmetre. Algunes veus, tals com les MultiSyn, són tan grans que requereixen alguns segons per a ser carregades. Marcar aquesta caixa farà que es carregin a l'inici de KTTSD, d'aquesta manera es reduirà el temps (a expenses d'usar més memòria) que tarda en sintetitzar la primera frase. Feu clic sobre el botó Bé per a desar les preferències de configuració del parlador. Assegureu-vos de fer clic sobre el botó Bé, d'altra manera els vostres canvis no tindran efecte en l'execució del sistema &ktts;. Assumint que la prova a funcionat, gairebé estarà llest per a començar a usar &ktts;. Ara aneu a la pestanya General i marqueu la caixa Habilita el sistema text-a-veu (KTTSD). Això iniciarà el dimoni TTS de KDE. Mireu . Ara podeu començar a usar &ktts; per a escoltar text. Feu clic sobre la pestanya Treballs per a crear i gestionar treballs amb text. Mireu . Iniciar KTTSD i configurar les opcions generals Una vegada heu configurat almenys un parlador, podeu iniciar el sistema text-a-veu de &kde;. Feu clic en la pestanya General. Apareixerà la pantalla General. Podreu establir algunes opcions generals en aquesta pantalla. El gestor de text-a-veu de &kde; (pestanya General). El gestor de text-a-veu de &kde; (pestanya General) Marqueu aquesta caixa per a activar el sistema &ktts;. Això inicia el dimoni TTS de &kde; (KTTSD). Si KTTSD s'inicia correctament, apareixerà la pestanya Treballs. Una vegada iniciat KTTSD, es pot començar a crear i parlar treballs de text. Mireu . Desmarcar aquesta caixa aturarà KTTSD i es desactivarà el sistema TTS de &ktts;. Si aquesta caixa està deshabilitada, voldrà dir que encara no hi ha cap parlador configurat (o que us heu oblidat de fer clic sobre el botó Bé). Mireu . Quan es marqui aquesta caixa, apareixerà una icona en la safata del sistema sempre que kttsmgr s'estigui executant. En aquest mode, fent clic a Bé o Cancel·la no es sortirà de kttsmgr. En comptes d'això, la pantalla desapareixerà però kttsmgr es seguirà executant des de la safata del sistema. Feu clic sobre la icona per a restaurar la pantalla. Per a sortir de kttsmgr, feu clic amb el botó dret sobre la icona de la safata del sistema i seleccioneu Abandona. Quan estigui sense marcar no apareixerà cap icona en la safata del sistema. Fent clic a Bé o Cancel·la es sortirà de kttsmgr. Quan es surti de kttsmgr, &ktts; romandrà en execució si la caixa Habilita el sistema text-a-veu (KTTSD) està marcada. Aquesta opció no tindrà efecte fins la següent vegada que s'iniciï kttsmgr. Aquesta opció no tindrà efecte mentre s'estigui executant kttsmgr en el ¢recontrol;. Quan aquesta caixa estigui marcada, apareixerà la pantalla de kttsmgr en iniciar kttsmgr. Si està sense marcar, apareixerà la icona de kttsmgr en la safata del sistema en iniciar kttsmgr, però no apareixerà la seva pantalla. Feu clic sobre la icona de la safata del sistema per a fer que aparegui aquesta pantalla. Quan aquesta caixa estigui marcada, i kttsmgr encara no s'estigui executant, apareixerà en la safata del sistema quan KTTSD estigui parlant. Això us dona l'oportunitat d'aturar o de gestionar la parla. Quan aquesta caixa està marcada, i kttsmgr aparegui automàticament en la safata del sistema al parlar, desapareixerà automàticament quan la parla hagi finalitzat. Assegureu-vos de fer clic aquí per a desar les vostres opcions. Gestionar treballs de text Quan feu clic a la pestanya Treballs en kttsmgr, apareixerà la pantalla Treballs. El gestor de text-a-veu de &kde; (pestanya Treballs). El gestor de text-a-veu de &kde; (pestanya Treballs) Tots els treballs de text que estiguin en la cua són llistats aquí, junt amb l'aplicació que els ha enviat a la cua de treball, el seu estat actual, el número de frases i el número de la frase actual. L'ID del parlador es correspon amb la columna ID de la pantalla Parladors. Els botons en aquesta fila us permetran iniciar, suprimir i fer una pausa als treballs de text. Seleccioneu un treball de la llista superior, llavores feu clic sobre un d'aquests botons. Els botons en aquesta fila us permetran avançar o retrocedir sobre cada frase del treball seleccionat en la llista de a sobre. (No tots els treballs tenen múltiples parts). Els botons en aquesta fila us permetran parlar el text que es trobi actualment en el portapapers de &kde;, o obrir un fitxer de text per a parlar-lo. També podeu refrescar la llista de treballs de text o canviar el parlador per a un treball. Mireu . Aquí es mostra la frase que s'està parlant. Quan feu clic sobre el botó Bé, s'aplicaran tots els canvis a les configuracions sobre les altres pantalles (si n'hi ha cap) i kttsmgr serà minimitzat en la safata del sistema. Feu clic sobre la icona de la safata del sistema per a restaurar la pantalla. Arrossegueu aquest divisor per amidar els plafons amb la llista de treballs i la Frase actual. La pestanya Treballs tan sols apareixerà quan KTTSD s'estigui executant. Si no veieu la pestanya Treballs, feu clic en la pestanya General i marqueu la caixa Habilita text-a-veu (KTTSD). Si no teniu instal·lat el subsistema d'àudio &arts;, però teniu instal·lat GStreamer, feu clic sobre la pestanya Àudio. Mireu . Tan sols els treballs de text són llistats i controlats sobre aquesta pantalla. La lectura de sortides per pantalla, Avisos i Missatges no són mostrats. Per a més informació sobre els tipus de missatge de &ktts;, mireu . Configuració de l'àudio Quan feu clic sobre la pestanya Àudio en kttsmgr apareixerà la pantalla Àudio. El gestor de text-a-veu de &kde; (pestanya Àudio). El gestor de text-a-veu de &kde; (pestanya Àudio) Aquí se seleccionarà el mètode de sortida de l'àudio. Si un component està en color gris, pot ser que o be &ktts; ha estat compilada sense suport per a aquest connector d'àudio, o que &ktts; no ha estat capaç de carregar les biblioteques necessàries. Si està seleccionat GStreamer o aKode com a sortida d'àudio, escolliu aquí el mètode per abocar l'àudio. Si no n'hi ha cap de llistat, us caldrà instal·lar al menys un. Si està seleccionat ALSA, escolliu aquí el dispositiu PCM. Mireu . Ajusteu la velocitat de veu aquí. 50% és aproximadament dues vegades més lenta del normal, mentre que 200% és aproximadament dues vegades més ràpida. Haureu de tenir instal·lada la utilitat sox per a que aquesta opció funcioni. Quan aquesta caixa estigui marcada, &ktts; copiarà els fitxers d'àudio temporals (fitxers .wav) en la carpeta indicada. Escolliu qualsevol carpeta al disc dur, sempre i quan hi tingueu permisos d'escriptura. Això pot ser pràctic per a crear fitxers de veu per a d'altres propòsits. Els fitxers tindran noms amb l'estructura kttsd-J-SS a on J és el número de treball i SS és el número de frase. Quan hi hagin fitxers amb el mateix nom, aquests, seran esborrats. No oblideu desmarcar aquesta caixa , d'altra manera la unitat de disc dur podria quedar plena! Assegureu-vos de fer clic en Aplica per aplicar la nova configuració al sistema &ktts; en execució. Hi ha dues maneres per ajustar la velocitat de la veu en &ktts;. Alguns dels Parladors tenen una opció de Velocitat en els seus diàlegs de configuració, que es pot mostrar fent clic sobre Edita en la pantalla Parladors. Aquesta opció de Velocitat en la pantalla Àudio és addicional a la configuració de velocitat del propi parlador i generalment s'usa si el parlador no suporta la configuració de velocitat. Per a que funcioni aquesta configuració de la velocitat haureu de detenir instal·lada la utilitat sox en el vostre sistema (Per a usuaris de Debian: apt-get install sox). D'altra manera, aquesta opció de velocitat serà ignorada quan el text pronunciat contingui SSML. (Mireu ). La llista de dispositius ALSA inclou tots els dispositius PCM de ALSA i connectors configurats al vostre sistema. Algunes de les eleccions poden no funcionar. Haureu d'experimentar per a trobar un dispositiu que funcioni. En cas de dubte, escolliu omissió. Configuració de les interrupcions de text Quan feu clic sobre la pestanya Interrupció, en kttsmgr, apareixerà la pantalla Interrupció. El gestor de text-a-veu de &kde; (pestanya Interrupció). El gestor de text-a-veu de &kde; (pestanya Interrupció) Aquesta finestra permet especificar accions especials en el cas que es produeixi la interrupció d'un treball de text per un altra missatge de prioritat superior. Hi ha quatre tipus de treballs que &ktts; pot manejar: Text normal. Missatges. Avisos. Lectura de sortides per pantalla. La lectura de sortides per pantalla tenen la màxima prioritat. Estan reservades per a l'ús per part d'aplicacions que llegeixen la pantalla. La lectura de sortides per pantalla deixarà en segon pla tots els altres missatges, causant una pausa en aquests. Una vegada que la lectura de sortides per pantalla hagi estat pronunciada, es continuarà amb els treballs que s'estaven pronunciant. Els avisos són els següents en quant a prioritat. Estan reservats per a missatges d'alta prioritat, tals com "La CPU s'ha sobrecalentat". Un avís deixarà en segon pla tant als missatges com al text normal. Una vegada que s'hagi pronunciat l'avís, es continuarà amb els treballs que s'estaven pronunciant. Els missatges tenen el següent nivell de prioritat més alt. Un missatge deixarà en segon pla els treballs de text normal. &kmouth; és un exemple d'una aplicació que usa missatges. Per exemple, mentre s'està llegint un text llarg en una pàgina web, &kmouth; es pot usar per a saludar a algú que està a l'habitació. Tots els tipus de treball es posen a la cua, excepte la lectura de sortides per pantalla. Si s'envia una lectura de sortides per pantalla des d'una aplicació mentre &ktts; està ocupat amb una altra lectura de sortides per pantalla, el missatge que s'està pronunciant serà aturat i descartat. Quan s'interromp un treball de text per un missatge, avís o lectura de sortides per pantalla, &ktts; afegirà les sortides d'àudio d'aquesta pantalla al flux. Es pronunciarà aquest missatge mentre el treball de text normal serà interromput. Aquest fitxer d'àudio sonarà sent interromput el treball de text normal. Si s'especifiquen ambdós, el So previ i el Missatge previ, el So previ sonarà abans que el Missatge previ. Aquest missatge es pronunciarà desprès de finalitzar el missatge que l'ha interromput. Aquest fitxer d'àudio sonarà desprès finalitzar el missatge que l'ha interromput. Sonarà l'últim. Les configuracions d'aquesta pantalla tan sols s'apliquen als treballs de text normals. Els missatges, avisos i lectura de sortides per pantalla no tenen accions especials quan aquestes són deixades en segon pla per un missatge amb prioritat més alta. Pronunciar text des de les pàgines web Mentre s'estigui executant el fullejador web &konqueror; de &kde;, es podrà pronunciar el text que es mostri en la pàgina web. En primer lloc haureu d'assegurar-vos de que &ktts; estigui en execució. Ressalteu el text a pronunciar i seleccioneu Eines Pronuncia el text en el menú principal. Després d'un instant es pronunciarà el text ressaltat. És una bona idea ressaltar en la pàgina web el text que voleu pronunciar. Podeu saltar aquesta passa, però llavores escoltareu moltes de les capçaleres &HTML; així com d'altres etiquetes no visibles. Pronunciar text des de l'editor de text &kate; Mentre s'estigui executant l'editor de text avançat de &kde; (&kate;), podeu pronunciar el text que es mostri. En primer lloc assegureu-vos de que &ktts; estigui en execució. Ressalteu el text que voleu que sigui pronunciat i escolliu Eines Pronuncia el text en el menú principal. Després d'un instant es pronunciarà el text ressaltat. No és necessari que ressalteu cap text, però en aquest cas es pronunciarà tot el fitxer. Això també funcionarà quan &kate; estigui encastat en una altra aplicació, com &konqueror; o &quanta;. Pronunciar les notificacions (KNotify) KNotify és el subsistema de notificació de &kde;, el qual us alerta dels esdeveniments amb els que s'ha configurat el sistema &kde;. Podeu configurar &ktts; per a pronunciar el text de les notificacions. Per exemple, &konversation;, una aplicació IRC de &kde;, permet configurar una àmplia varietat de notificacions. Podeu indicar a &konversation; que us avisi quan un missatge en un canal de l'IRC aparegui el vostre àlies. Conjuntament amb &ktts; podeu fer que &ktts; pronunciï el text del missatge IRC que us està adreçat. En general, si una aplicació &kde; suporta KNotify, apareixerà un ítem de menú anomenat Notificacions dins del menú Arranjament de l'aplicació. Les configuracions específiques de cada aplicació amb KNotify varien d'una aplicació a una altra. Per a permetre que &ktts; pronunciï les notificacions de text de KNotify, inicieu kttsmgr, feu clic sobre la pestanya Notificacions. Apareixerà la pantalla Notificacions. El gestor de text-a-veu de &kde; (pestanya Notificacions). El gestor de text-a-veu de &kde; (pestanya Notificacions) Marque aquesta caixa per habilitar la pronunciació de les notificacions de &kde;. Si no està marcada totes les demés opcions d'aquesta pantalla apareixeran deshabilitades i &ktts; no en pronunciarà cap. Quan està marcada, qualsevol aplicació que enviï un esdeveniment amb un so no serà pronunciat per &ktts;. Useu aquests botons per afegir o esborrar esdeveniments de les aplicacions de la llista de a sota. Quan feu clic sobre el botó Afegeix, apareixerà un pantalla en la que podreu seleccionar l'aplicació i l'esdeveniment que voleu afegir a la llista. Aquest esdeveniment pronunciarà els missatges que &konversation; enviï quan algú mencioni el vostre àlies en un missatge de l'IRC. Per als demés esdeveniments provinents de &konversation;, no es realitzarà cap acció per part de &ktts;. Per a tots els demés esdeveniments que no es trobin especificats en la llista, no es realitzarà cap acció per part de &ktts;. Useu aquest caixa per especificar què hauria de fer &ktts; quan rebi un esdeveniment. Les eleccions són: Pronuncia el nom de l'esdeveniment Pronuncia el nom de l'esdeveniment, que podreu veure llistat en la llista d'esdeveniments sobre aquesta pantalla. Pronuncia el missatge de notificació Pronuncia el missatge tal i com és enviat des de l'aplicació. No pronunciïs la notificació No pronuncia aquest esdeveniment de cap manera. Pronuncia un text a mida Pronuncia el text que heu introduït en la caixa de la dreta. Si l'acció es Pronuncia el text a mida, introduïu aquí el text del missatge que voleu pronunciar. En el missatge, podreu usar les següents cadenes de substitució: %e El nom de l'esdeveniment %a El nom de l'aplicació que envia l'esdeveniment %m El missatge que envia l'aplicació Per a provar el missatge feu clic aquí. Aquí podreu especificar els atributs dels parladors que voleu que pronunciïn el missatge de notificació. omissió usarà el parlador de la part superior de la llista de la pantalla Parladors. Mireu . Tingueu present que hi ha tres nivells d'esdeveniments. Si s'especifica una acció per a un esdeveniment específic d'una aplicació específica, es realitzarà aquesta. Si no succeeix això i s'ha especificat una acció per a tots els esdeveniments d'una aplicació específica, es realitzarà aquesta. Si tampoc succeeix això, però s'ha especificat una acció per a tots els esdeveniments sota Omissió (tots els altres esdeveniments) es realitzarà aquesta. L'esdeveniment totes les notificacions per a l'aplicació Omissió (tots els altres esdeveniments) no es pot esborrar de la llista. Per omissió tots els altres esdeveniments, podreu especificar els següents tipus de notificacions que seran parlats, tals com els següents: cap No es pronunciarà cap. diàlegs de notificació Les notificacions que mostren un diàleg en la vostra pantalla, que podeu descartar, seran pronunciades. finestres emergents passives Les notificacions que mostren un diàleg passiu a la vostra pantalla, faran que desaparegui aquest al cap d'una estona, desprès de ser pronunciades. diàlegs de notificació i finestres emergents passives Les notificacions que es mostren a la pantalla, siguin passives o no, seran pronunciades. totes les notificacions Es pronunciaran totes les notificacions independentment de si mostren una pantalla. Els filtres que substitueixen cadenes són una bona manera per aclarir els missatges que envien les aplicacions encara que siguin impronunciables o il·legibles en &ktts;. El fitxer kmail.xml, que ve amb &ktts;, és un bon exemple. Elimina les etiquetes br i b dels missatges de les notificacions de &kmail; i també elimina la frase /local/inbox/, ja que s'assumeix que això és correcte en la majoria dels casos. Mireu . Useu el botó Desa per a desar les vostres preferències de notificació a un fitxer. Useu el botó Carrega per a carregar les preferències desades des d'un fitxer. Els esdeveniments carregats seran fusionats amb els esdeveniments existents en la llista. Si voleu començar amb una llista d'esdeveniments buida, feu clic primer al botó Neteja. S'eliminaran tots els esdeveniments, excepte totes les notificacions. Assegureu-vos de fer clic en Aplica o Bé per a desar les vostres preferències. SSML El llenguatge de marques de síntesis de veu (en anglès, Speech Synthesis Markup Language -SSML-), és un estàndard W3C per a l'etiquetat del text que hagi de tenir una sortida de veu. Proveeix etiquetes per a controlar veus, rati de paraules, volum, gènere i timbre (to). També proveeix etiquetes per a controlar com es llegeixen les paraules, per exemple, per a lletrejar abreujaments. SSML forma part de les especificació VoiceXML, que està inclòs en un estàndard W3C. En aquests moments, &ktts; proveeix un suport molt bàsic i limitat per a SSML. Actualment te les següents restriccions. Tan sols treballa amb els parladors Festival Interactive i Hadifix. Haureu d'instal·lar la veu rab_diphone (home britànic), ja que aquesta és la veu que Festival usa per omissió quan es pronuncia SSML. La configuració de la Velocitat en la finestra Àudio serà ignorada quan el text llegit contingui SSML. Si les opcions Velocitat o Timbre en el diàleg de configuració de Festival no estan establertes al 100%, l'usual serà que el text SSML sigui llegit en to mono. Es pot usar la següent mostra de text per a experimentar amb SSML. Qui s'ha dormit al meu llit? ha dit el papà os. Qui s'ha dormit al meu llit? ha dit mama os. Qui s'ha dormit al meu llit? ha dit el petit os. ]]> Per a la següent versió es pretén que el suport per a SSML de &ktts; sigui més robust. Filtres (Avançat) Els filtres són una característica avançada de &ktts;. Per a les operacions bàsiques de &ktts; no són necessaris. Els filtres s'usen per a preprocessar el text abans que aquest sigui enviat al motor de síntesis. Són d'utilitat per al realç de la veu, substitució de paraules que no es poden llegir o abreujaments, escollint l'idioma i el parlador adequats per a fer la pronunciació, o treballant al voltant de certes limitacions dels sintetitzadors de veu i les seves veus. Tipus de missatges de &ktts; Per a entendre com usar els filtres, en primer lloc és d'ajuda entendre com es processat el text per &ktts;. El text pronunciat per &ktts; és de quatre tipus possibles. Lectura de sortides per pantalla. Avisos. Missatges Treballs de text El tipus es determina per l'aplicació que envia el text a &ktts;. La lectura de sortides per pantalla tenen la màxima prioritat. Estan reservades per a la utilització per part de aplicacions que llegeixen la sortida de la pantalla. La lectura de sortides per pantalla deixarà en segon pla tots els demés missatges, causant que aquests siguin pausats. Una vegada la lectura de sortides per pantalla ha finalitzat, es continuarà amb els treballs que s'estaven pronunciant. Els avisos són els següents en quant a prioritat més alta. Estan reservats per a missatges de prioritat alta, tals com "La CPU s'ha sobrecalentat". Un avís deixarà en segon pla tant els missatges com el text normal. Una vegada s'hagi pronunciat l'avís, es continuarà amb els treballs que s'estaven pronunciant. Els missatges són els següents en quant prioritat més alta. Un missatge deixarà en segon pla els treballs de text normal. &kmouth; és un exemple d'una aplicació que usa missatges. Per exemple, mentre s'està llegint un text llarg en una pàgina web, &kmouth; es pot usar per a saludar a algú que camina és a l'habitació. Les notificacions de &kde; també són missatges (mireu ). La resta són treballs de text ordinaris. Qualsevol treball que inicieu des de la pestanya Treballs és un treball de text. KSayit és un exemple d'una aplicació que usa els treballs de text. Els treballs de text estan pensats per a discursos llargs que no siguin urgents. Tots els tipus de treball es posen a la cua, excepte la lectura de sortides per pantalla. Si s'envia una lectura de sortides per pantalla des d'una aplicació mentre &ktts; està ocupat amb una altra lectura de sortides per pantalla, el missatge que s'està pronunciant serà aturat i descartat. Tipus de filtres El primer que hauríeu de conèixer sobre els filtres és que mai s'apliquen a les lectura de sortides per pantalla. S'apliquen als avisos, missatges, i treballs de text, i també a les notificacions de &kde; (KNotify). Hi ha dos tipus de filtres -- filtres ordinaris i filtres Detectors de límit de frase (en anglès, Sentence Boundary Detector -SBD-). Els SBD trenquen el text en frases individuals. Això permet a &ktts; començar a llegir ràpidament, atès que tan sols necessita sintetitzar la primera frase, no tot el treball de text. Això permet avançar o retrocedir per les frases en la pestanya de Treballs, o aturar o fer una pausa en el treball de text quan el sintetitzador de veu no suporti directament l'aturada durant la pronunciació. Els filtres normals processen el text i el passen al següent filtre. Actualment hi ha tres tipus de filtres ordinaris. Substituïdors de cadenes. Transformadors &XML; Escollidors del parlador. Els filtres estan implementats usant una arquitectura de connectors. En el futur, és possible que puguin existir més tipus de filtres. Els filtres per a substituir cadenes substitueixen pedaços de text amb un altra text. Els pedaços de text substituïts poden coincidir amb paraules o amb expressions regulars. &ktts; te predefinits filtres per omissió per a substituir cadenes que permeten pronunciar abreujaments, emoticones dels xat, tals com ":-)", o reformatar missatges de notificació des de &konversation; o &kmail; a un format més comprensible. Els conversors de &XML; usen un Llenguatge d'estil &XML; -usa un fitxer (XSLT) per a convertir &XML; d'un format a l'altra-. &ktts; inclou un parell de fitxers XSLT per a convertir &XHTML; en SSML. El filtre Escollidor del parlador us permetrà redirigir treballs cap a un parlador basant-se en el contingut del text, o en l'aplicació que els envien a &ktts;. Per exemple, si heu configurat un parlador amb veu de dona en la pestanya Parladors, podeu dirigir el text que prové de KSayIt cap a aquest parlador. Mireu . Cada un d'aquests tipus de filtres te regles configurables que indiquen quan han de ser aplicats al text que se va a pronunciar. Si el filtre determina que no s'ha d'aplicar, el text serà passat al següent filtre sense cap alteració. Quan s'envies a &ktts; un treball de text o un missatge de notificació de KDE, aquest passa a través de cadascun dels filtres disponibles que s'han configurat. L'ordre és de dalt cap abaix. Després de passar a través de cadascun dels filtres ordinaris que es llisten en la part superior de la pantalla, els treballs de text es passen als filtres Detectors de límit de frase (SBD). (Les notificacions de &kde;, avisos i missatges mai passen a través dels filtres SBD). A diferència dels filtres ordinaris, el primer filtre SBD que realitza els canvis al text impedeix qualsevol filtrat posterior. Configurar els filtres Per a usar els filtres, feu clic sobre la pestanya Filtres en kttsmgr. El gestor de text-a-veu de &kde; (pestanya Filtres). El gestor de text-a-veu de &kde; (pestanya Filtres) Aquesta és la llista dels filtres ordinaris que estan configurats. Si està sense marcar, el filtre estarà inactiu i no serà tingut en compte. Els filtres s'aplicaran seguint l'ordre que s'hagi especificat aquí, de dalt cap avall. Feu-hi clic per afegir un nou filtre. Se us demanarà pel tipus de filtre que a afegir. Després d'escollir el tipus, mireu els següents diàlegs de configuració. Feu-hi clic per eliminar un filtre. Feu clic aquí per a canviar la configuració d'un filtre. Mireu els següents diàlegs de configuració. Feu clic en aquests botons per a moure un filtre cap a amunt o cap avall en la llista. Aquests són filtres Detectors de límits de frase. La primera vegada que inicieu &ktts;, se configurarà automàticament el detector de límits de frase estàndard. Podeu canviar la configuració d'aquest filtre o afegir filtres Detectors de límits de frase addicionals, però s'aconsella als principiants que no el canviïn. Aquest botó de llista us permetrà afegir, eliminar, editar o canviar l'ordre dels filtres Detectors de límits de frase. Assegureu-vos de fer clic aquí, d'altra manera les vostres configuracions no tindran efecte. Configurar els filtres de substitució de cadenes Podeu configurar els filtres de substitució de cadenes subministrant una llista de paraules o expressions regulars amb les que han de coincidir. Quan es troben aquestes paraules o expressions regulars en el text, cadascuna d'elles serà substituïda per aquella cadena que s'hagi subministrat. Les coincidències no tenen en compte majúscules i minúscules. Substituïdor de cadenes Substituïdor de cadenes Introduïu un nom per al vostre filtre. Useu qualsevol nom que voleu i que el diferenciï de tots els altres filtres. Aquesta és la llista de paraules i expressions regulars. El filtre cerca coincidències amb cadascuna de les cadenes de la columna Coincidència, substituint les cadenes coincidents amb les de la columna Substitueix amb. La llista serà processada en el mateix ordre en el que es mostra, de dalt cap avall. Feu clic aquí per afegir una altra paraula o expressió regular a la llista. Feu clic aquí per a moure la paraula o expressió regular ressaltada actual cap amunt o cap avall en la llista. Feu clic aquí per a canviar una paraula o expressió regular existent en la llista. Feu clic aquí per eliminar de la llista la paraula o expressió regular ressaltada. Useu aquests botons per a carregar una llista de paraules o expressions regulars des d'un fitxer, desar la llista actual a un fitxer, o netejar la llista sencera. Quan es carrega des d'un fitxer, els ítems existents en el fitxer s'afegeixen als existents en la llista. Si no està buit, el filtre tan sols s'aplicarà si l'idioma dels parladors del treball de text coincideixen amb l'idioma que introduïu aquí. Feu clic sobre el botó per a mostrar una llista d'idiomes. Podeu seleccionar més d'un idioma usant la tecla &Ctrl; mentre feu clic. Si no està buit, tan sols s'aplicarà el filtre si el text prove d'una de les aplicacions llistades. Podeu introduir més d'una aplicació separant-les amb comes. Exemple: konversation,kmail Podeu esbrinar l'ID de l'aplicació dels programes en execució usant el programa &kdcop;. No incloure els números &DCOP;. Per exemple, si &kdcop; mostra un ID d'aplicació com kopete-3432, tan sols haureu d'introduir kopete. El filtre Substituïdor de cadenes tan sols s'aplicarà al text si no hi ha cap condició buida en la caixa Aplica aquest filtre quan. Les coincidències no són sensibles a majúscules i minúscules. Quan coincideixen les paraules, el filtre Substituïdor de cadenes usa internament una expressió regular del tipus \sparaula\s. En d'altres paraules, la paraula haurà de tenir límits (espais) per ambdós costats. Una discussió sobre com escriure expressions regulars està fora de l'abast d'aquest manual. Si teniu instal·lat l'editor d'expressions regulars de &kde;, hi ha un botó disponible en les pantalles Afegeix o Edita que us ajudarà a construir expressions regulars. L'editor d'expressions regulars de &kde; forma part del paquet tdeutils. &ktts; inclou uns quants fitxers de llista de paraules, inclouen una llista d'emoticones, com ":-)", alguns abreujaments usats habitualment en el IRC o en aplicacions de missatgeria instantània, i una llista d'altres abreujaments. També hi ha una llista de caràcters especials que amb la versió actual de Festival en polonès no es poden manejar. Si desenvolupeu llistes de paraules útils per al vostre ús, useu el botó Desa per a desar-les a un fitxer i enviar-les a l'equip de &ktts; per a la seva inclusió en la propera versió. Configurar els filtres Transformador &XML; El filtre Transformador &XML; usa fitxers XSLT per a transformar &XML; d'un format a l'altra. XSLT, el llenguatge d'estil &XML;, és un llenguatge estàndard del W3C per a interpretar les transformacions. Tan sols es poden usar sobre el format &XML; format correctament. Haureu de tenir instal·lada la utilitat xsltproc. Transformador &XML; Transformador &XML; Introduïu un nom per al vostre filtre. Useu qualsevol nom que voleu i que el diferenciï de tots els altres filtres. Introduïu la ruta completa d'un fitxer XSLT existent, que realitzi la transformació. Especifiqueu la ruta de la utilitat xsltproc. Si xsltproc està en la vostra variable d'entorn PATH, simplement introduïu xsltproc. Si no està buit, el filtre tan sols s'aplicarà si l'&XML; te al començament del mateix l'especificació amb la cadena introduïda. Això distingeix un format &XML; de l'altra. Per exemple, html en la caixa DOCTYPE coincidirà amb ]]>. Si no està buit, tan sols s'aplicarà el filtre si el text prove d'una de les aplicacions llistades. Podeu introduir més d'una aplicació separant-les amb comes. Exemple: konversation,kmail Podeu esbrinar l'ID de l'aplicació dels programes en execució usant el programa &kdcop;. No incloure els números &DCOP;. Per exemple, si &kdcop; mostra un ID d'aplicació com kopete-3432, tan sols haureu d'introduir kopete. El filtre Transformador &XML; tan sols s'aplicarà al text si es troba l'element arrel o DOCTYPE especificat i si es troba l'ID de l'aplicació en la caixa Aplica aquest filtre quan. Si un ítem en aquesta caixa és buit, no es realitzarà la prova, si totes les caixes són buides, el filtre serà aplicat a tot el text. De tota manera, hauríeu d'omplir almenys una caixa, atès que alguns treballs de text poden no estar en format &XML;. Configurar els filtres Escollidors del parlador Els filtres Escollidors del parlador s'usen per a dirigir el text cap a un parlador configurat en la pestanya Parladors, o cap al parlador que tingui atributs específics. Per exemple, podeu especificar que el text que provingui des de kmail sigui llegit usant el parlador configurat amb una veu de dona. Mireu . Abans de que &ktts; comenci a enviar text a cadascun dels filtres, s'haurà d'haver escollit un parlador per a llegir el text. El parlador escollit es basa en els atributs especificats al parlador per part de l'aplicació que envia el text a &ktts; i pels atributs especificats dels parladors que heu configurat sobre la pestanya Parladors. El filtre Escollidor del parlador us permet solapar el parlador escollit. Escollidor del parlador Escollidor del parlador Introduïu un nom per al vostre filtre. Useu qualsevol nom que voleu i que el diferenciï de tots els altres filtres. Si no està buit, el filtre tan sols s'aplicarà si el text conté l'expressió regular introduïda. Si està instal·lat, feu clic sobre el botó de navegar per iniciar l'editor d'expressions regulars de &kde; per a que us ajudi a introduir l'expressió regular. Per a millorar el rendiment, intenteu "ancorar" l'expressió regular al començament de la cadena. En d'altres paraules, comenceu la vostra expressió regular amb . Si no està buit, tan sols s'aplicarà el filtre si el text prove d'una de les aplicacions llistades. Podeu introduir més d'una aplicació separant-les amb comes. Exemple: konversation,kmail Podeu esbrinar l'ID de l'aplicació dels programes en execució usant el programa &kdcop;. No incloure els números &DCOP;. Per exemple, si &kdcop; mostra un ID d'aplicació com kopete-3432, tan sols haureu d'introduir kopete. Especifiqueu aquí els atributs dels parladors que preferiu per a pronunciar el text. Si el text conté condicions sobre el filtrat, s'escollirà el parlador amb els atributs el més semblant possible als que s'hagin especificat. Feu clic al botó de la dreta per a mostrar la pantalla Escollidor del parlador. Mireu . Useu aquests botons per a desar les vostres preferències per a l'Escollidor del parlador, carregar les preferències des d'un fitxer desat, o netejar totes les preferències. El filtre Escollidor del parlador tan sols s'aplicarà al text si no hi ha cap condició buida dins de la caixa Aplica aquest filtre quan. Almenys hauríeu d'omplir una de les caixes. La manera més fàcil d'aprendre a configurar els Escollidors del parlador és experimentant. Deshabiliteu l'Escollidor del parlador i proposeu algun text. En la pestanya Treballs, mireu quin parlador ha escollit &ktts;. Feu clic sobre el botó Canvia el Parlador, introduïu alguns atributs, i intenteu veure altra vegada com ha afectat la selecció. Per descomptat, haureu de tenir més d'un parlador configurat per a que l'Escollidor del parlador faci la seva feina. Configurar els filtres detectores dels límits de la frase Els filtres Detectors de límits de frase (SBD) divideixen el text en frases individuals. Això és important per que permet a &ktts; començar a pronunciar ràpidament per a que tan sols calgui sintetitzar la primera frase, en comptes de tot el bloc de text, el qual pot ser molt llarg, i us permet retrocedir i avançar per les frases en la pestanya Treballs, i us permet fer uns pausa i aturar els treballs de text en la pestanya Treballs fins i tot encara que el sintetitzador de veu no sigui capaç de fer-ho. Per aquestes raons, el filtre Detectors de límits de frase estàndard es configura automàticament la primera vegada que s'executa kttsmgr i no es pot deshabilitar (tot i que sí es pot eliminar). Us aconsellem que no modifiqueu aquest filtre mentre no sapigueu què és el que esteu fent. De tota manera podeu afegir més filtres SBD per a resoldre certs problemes. Per exemple, a febrer del 2005, la veu en polonès de Festival te una característica molesta que llegeix la puntuació de les frases. Per exemple, pronunciarà els punts al final de cada frase. No podreu resoldre aquest problema creant un filtre de substitució de cadena per eliminar la puntuació de la frase, atès que impediria que el SBD estàndard reconegués les frases. De tota manera, podreu crear una versió modificada del SBD estàndard que reconegui les frases a la vegada que elimini la puntuació de les frases. Per a fer-ho, afegiu un filtre i useu el botó Carrega per a carregar el fitxer polish_festival_sbdrc que ve amb &ktts;. Els filtres SBD treballen cercant una expressió regular de final-de-frase i inserint caràcters de tabulació (8 decimal) en els límits de la frase. (Tots els caràcters de tabulació s'eliminaran del text abans de començar el filtrat). Tingueu present que el SBD estàndard manté la puntuació de la frase. Els filtres SBD mai són aplicats als missatges de notificació de &kde; (knotify), avisos, missatges o lectura de sortides per pantalla. Si accidentalment elimineu el filtre que detecta el límit de la frase estàndard, podeu fer marxa enrere carregant el fitxer standard_sbdrc, que ve amb &ktts;. Seleccionar els parladors (Avançat) Podeu configurar qualsevol nombre de parladors en la pestanya Parladors. Mireu . Quan les aplicacions envien text a &ktts;, podran especificar els atributs del parlador que voleu que llegeixi el text. &ktts; escollirà el parlador més proper dels que heu configurat per a satisfer la petició. Per exemple, una aplicació pot demanar que el text sigui llegit per una veu femenina en anglès. Si heu configurat un parlador amb veu femenina en anglès, aquest serà el que s'usi. Si una aplicació no especifica atributs, s'usaran els parladors per omissió (els de la part superior) que apareixen en la pestanya Parladors. Quan una aplicació especifica els atributs del parlador desitjat, això pot indicar quins atributs són els "preferits". Per exemple, una aplicació pot especificar que preferiu una veu forta femenina per a llegir el text, de manera que l'atribut veu forta sigui el "preferit" sobre l'atribut veu femenina. Si teniu configurat un parlador amb veu femenina suau i altra amb veu forta masculina, &ktts; escollirà el parlador amb veu forta masculina. Atès que l'idioma és un paràmetre crític per a fer comprensible la pronunciació, sempre serà un atribut "preferit". Usant la pantalla Escollidor del parlador, podeu anular les preferències del parlador de l'aplicació. Es mostrarà la pantalla quan feu clic sobre el botó Canvia el Parlador en la pestanya Treballs, o quan feu clic sobre el botó Parlador en el diàleg Configuració del filtre per a un filtre Escollidor del parlador, o quan feu clic sobre el botó Parlador en la pestanya Notificacions. Escollidor del parlador Escollidor del parlador La pantalla ofereix tres mètodes per especificar els atributs desitjats del parlador: Usa el parlador per omissió (el de la part superior de la pestanya Parladors). En d'altres paraules, no especificar els atributs del parlador. Usa el parlador més semblant d'acord amb un o més atributs especificats. Usa el parlador més semblant que tingui tots atributs d'un parlador configurat. Si no s'esborren o modifiquen les preferències del parlador, &ktts; escollirà el parlador especificat. Si s'esborren o modifiquen les preferències del parlador, &ktts; escollirà el parlador amb els atributs més semblants al parlador original. Escolliu el mètode per introduir els atributs del parlador desitjat fent clic sobre un d'aquests botons de ràdio. Escolliu els atributs del parlador desitjat. Deixeu un atribut en blanc si no voleu aquest atribut. Marqueu aquesta caixa si voleu establir un atribut com "preferit" sobre d'altres atributs. Podeu marcar més d'una caixa. Atès que l'idioma és un factor crític a l'hora d'entendre el text pronunciat, sempre serà un atribut preferit. És poc freqüent que useu aquest atribut. Tan sols hauríeu d'especificar l'atribut de l'idioma quan sapigueu que una aplicació envia text en un idioma diferent al del vostre escriptori. Aquesta és una llista dels parladors que teniu configurats en &ktts;. Escollint-ne un, estareu especificant tots els atributs d'aquest parlador. Si aquest parlador està configurat quan s'envia text, obtindreu una coincidència exacta i s'escollirà aquest parlador. De tota manera, si esborreu el parlador, o modifiqueu les seves preferències, no serà escollit més. S'escollirà el parlador amb els atributs que més s'assemblin als originals. L'atribut Idioma és especial atès que el text probablement serà inintel·ligible si és llegit per un parlador que parli en un idioma diferent al del text. Per això, l'idioma és un atribut "preferit". Si especifiqueu un idioma, aquest solaparà l'idioma escollit, però si el deixeu en blanc, s'usarà l'idioma existent. Si l'aplicació que envia text a &ktts; no especifica un idioma, &ktts; assignarà el parlador més semblant configurat en la pestanya Parladors. En d'altres paraules, s'assumirà que el parlador més amunt serà l'usat per a parlar l'idioma del vostre escriptori. Per a netejar tots els atributs en la secció Usa el parlador més semblant, primer feu clic en el botó de ràdio Usa el parlador per omissió, i llavores feu clic al botó de ràdio Usa el parlador més semblant. Referència de comandaments TODO Guia de &ktts; per a desenvolupadors &ktts; te dues interfícies per a programadors d'aplicacions (les API): La API Text-to-Speech de &kde;, és usada pels programadors d'aplicacions per a donar-lis capacitats TTS. Aquestes aplicacions es comunicaran amb KTTSD a través de &DCOP;. La API d'un connector KTTSD, s'usa per afegir connectors de síntesis de veu a KTTSD de manera que &ktts; treballi amb un nou motor de síntesis de veu. La següent secció dona una petita descripció de la interfície DCOP per a la API Text-to-Speech de &kde;. Tota la documentació per a totes dues API està disponible en línia al lloc web de &kde; Accessibility (http://accessibility.kde.org). La interfície &DCOP; de &ktts; Les aplicacions comuniquen les peticions dels serveis text-a-veu a través de la interfície &DCOP; de &kde; per programant l'objecte KSpeech de kttsd. Introduïu els següents comandaments en una &konsole;. Si KTTSD encara no s'està executant: kttsd Per a posar en la cua el treball de text que serà pronunciat: dcop kttsd KSpeech setText "text" "parlador" a on text serà el text que es parlarà, i parlador serà un codi d'idioma, com en, cy, &etc; Aquest comandament no llegeix el text; en comptes d'això, el posa a la cua de treball de text per a que sigui pronunciat. Exemple. dcop kttsd KSpeech setText "This is a test." "en" Per a pronunciar l'últim treball de text que està a la cua dcop kttsd KSpeech startText 0 En aquest cas, 0 es refereix a l'últim treball de text que s'ha col·locat a la cua. També podeu especificar un número de treball. (Si no es dona un número de treball, es requerirà un 0). Per aturar la pronunciació del treball de text actual dcop kttsd KSpeech stopText 0 Depenent del connector de veu usat, la pronunciació podria no aturar-se immediatament. Hi ha alguns comandaments més que es poden enviar. Per a veure una llista dels comandaments possibles, dcop kttsd KSpeech o llegiu la &kde; Text-to-Speech API en línia. Preguntes i respostes &reporting.bugs; &updating.documentation; kttsmgr peta a l'inici. L'he compilat amb suport de depuració i no he pogut veure la traça enrere. GStreamer ha petat mentre era usat per &ktts;. Potser us caldrà "registrar " GStreamer. Per a GStreamer 0.8x, el comandament és gst-register-0.8. Si això no resol el problema, podria ser que teniu instal·lada una versió incompatible de GStreamer. Haureu d'intentar actualitzar o desinstal·lar GStreamer. La sortida d'àudio ALSA no funciona si estic escoltant música en una altra aplicació al mateix temps. Quan faig una pausa en un treball de text, &ktts; es congela. M'he adonat que en la sortida de la &konsole; apareix l'avís "unable to open PCM". Teniu un problema de contenció amb el dispositiu ALSA, que es pot prevenir obrint més d'un dispositiu PCM a la vegada. Mireu el lloc web de ALSA (dmix) per obtenir possibles solucions: www.alsa-project.org. Necessito més. Com puc fer que &ktts; finalitzi del tot? Introduïu els següents comandaments en una &konsole;: killall kttsd killall kttsmgr Com puc veure la sortida de depuració de kttsd? Obriu dos finestres de &konsole;. Primer inicieu kttsd en una finestra, a continuació inicieu kttsmgr en la segona. Tinc més veus per a Festival que he descarregat des d'Internet. Les he instal·lat, i les he pogut usar amb Festival, però no aconsegueixo que les mostri kttsmgr. Editeu el fitxer $TDEHOME/share/apps/kttsd/festivalint/voices per afegir veus noves. Es poden usar les altres entrades com a guia. Si afegiu una veu correctament, si us plau, envieu un pedaç als desenvolupadors amb l'&URL; a partir de la qual heu obtingut el fitxer de veu. Cap dels sintetitzadors de veu suporta l'idioma que em cal. A on puc aconseguir un sintetitzador per al meu idioma? Google(tm) és el vostre amic. Aquest enllaç també us pot ajudar. Si cerqueu un motor de síntesis lliure que suporti l'idioma desitjat, i voleu afegir-li suport a &ktts;, si us plau, contacteu amb l'equip de desenvolupament. S'agraeixen en especial els motors de codi obert. Si coneixeu algun sintetitzador comercial, potser pugui persuadir al venedor per a donar una còpia lliure a l'equip de desenvolupament de &ktts;. Per ara, hauríeu de poder aconseguir que funcioni el sintetitzador usant el connector Comandament. Mireu . &ktts; pronuncia molt a poc a poc. Com ho puc arreglar? Hi ha una opció de Velocitat en la pestanya Àudio. Per a que funcioni, haureu de tenir instal·lada la utilitat sox i accessible a través de la vostra variable d'entorn PATH. Alguns connectors de síntesis, com Festival Interactiu també proveeixen la configuració de la Velocitat en el diàleg de configuració del parlador. Depenent de la veu usada, pot aparèixer habilitat o deshabilitat. Bé, això funciona en alguns casos, però les pàgines web es llegeixen molt a poc a poc. Les configuracions de velocitat són ignorades quan &ktts; llegeix &HTML;. (Això es deu a que l'&HTML; és convertit a SSML, el qual disposa de les seves pròpies etiquetes de "velocitat"). Podeu deshabilitar el filtre transformador de &HTML; &XML; (mireu ), o si us atreviu, editar el fitxer .xsl del filtre transformador de &HTML; a SSML i incrementar la velocitat per omissió. No aconsegueixo que les pàgines web siguin parlades per una veu de dona. En tinc una de configurada en el parlador Festival, però &ktts; sempre parla les pàgines web amb una veu d'home. A Festival 1.95 beta, l'etiqueta SABLE GENDER sembla no funcionar. Per evitar que Festival produeixi errors, el SSML al fitxer .xsl de SABLE ignora les etiquetes de gènere. El mateix s'aplica a les etiquetes de veu. Tinc configurat el filtre transformador &HTML; a &XML;, però les pàgines web no es llegeixen quan s'usa el connector Festival. Degut a un error en Festival 1.95 beta, haureu d'instal·lar la veu rab_diphone (home britànic) per a que SABLE funcioni, fins i tot quan no useu aquesta veu per a llegir les pàgines web. També us haureu d'assegurar que la utilitat xsltproc estigui instal·lada i a la vostra variable d'entorn PATH. Alguns caràcters de puntuació poden produir errors en el sintetitzador, fent que es salte frases senceres, o que pronunciï un verdader galimaties. Què puc fer? Primerament, assegureu-vos de que l'opció Codificació de caràcters en el diàleg de configuració del parlador tingui establert l'idioma adequat. Si algunes paraules o caràcters provoquen problemes us pot ajudar un filtre substituïdor de cadenes. Si alguns caràcters de puntuació es tornen confusos en la síntesis, us caldrà configurar un filtre detector de límits de frase. Mireu . He afegit un filtre per a substituir cadenes pròpies i ara &ktts; no permet avançar o retrocedir entre les frases. En la pestanya Treballs, cada treball apareix en una sola frase. Què està malament? No hauríeu de filtrar els caràcters de puntuació de la frase (punt, signe d'interrogació, signe d'exclamació, coma, punt i coma). Per a aquests caràcters, useu un filtre detector de límits de frase. Crèdits i llicència &ktts; Copyright del programa © 2002 José Pablo Ezequiel "Pupeno" Fernández pupeno@kde.org Mantenidor actual: Gary Cramblitt garycramblitt@comcast.net Col·laboradors: Olaf Schmidt ojschmidt@kde.org Gunnar Schmi Dt gunnar@schmi-dt.de Paul Giannaros ceruleanblaze@gmail.com Copyright de la documentació © 2004 Gary R. Cramblitt garycramblitt@comcast.net. Antoni Bella Pérezbella5@teleline.es &underFDL; &underGPL; Els motors de síntesis de veu usats per &ktts; tenen les seves pròpies llicències. Mireu la documentació de cada motor o el lloc web per obtenir més detalls. Algunes veus tenen les seves pròpies llicències. Instal·lació Com obtenir &ktts; &install.intro.documentation; (FUTUR) Comandament d'instal·lació en Debian: apt-get install tdeaccessibility Podeu trobar enllaços a les fonts i als paquets binaris en el lloc web &kde; Accesibility (http://accessibility.kde.org). Si teniu accés al repositori de codi de &kde;, podeu descarregar &ktts; marcant el mòdul kdeaccesibility. &ktts; es pot trobar en la carpeta kttsd. També podeu descarregar un fitxer comprimit amb tot tdeaccessibility des de ftp://ftp.kde.org/pub/kde/ Requeriments Requeriments obligatoris: Versió 3.2 de &kde; o posterior. Un motor de síntesis de veu. Actualment estan suportats els següents motors i idiomes. Festival Anglès americà, anglès britànic, espanyol, alemany, finès, txec, polonès, rus, italià, francès canadenc, kiswahili, zulú i ibibio Festival Lite (flite) Anglès Hadifix (&mbrola; i txt2pho) Alemany, hongarès Epos Txec, eslové FreeTTS Anglès També funcionarà amb qualsevol motor de síntesis que pugui ser executat des de la línia de comandaments en una &konsole;. La llista anterior no és exhaustiva ni està actualitzada. Verifiqueu les especificacions per a cada motor amb la finalitat d'obtenir una llista amb els idiomes suportats. També podeu fer un cop d'ull al lloc web &ktts; per obtenir informació addicional que pot no haver estat inclosa en aquest manual. &ktts; usa una arquitectura de connectors flexible per a motors de síntesis de veu. Si voleu millorar &ktts; per a que suporti un altra motor, contacteu amb l'equip de desenvolupament. Mireu per a instruccions específiques de cadascun d'aquests motors. Almenys un dels següents subsistemes d'àudio: Sistema de so &arts; de &kde;. &arts; sol ser instal·lat junt amb &kde;. ALSA (Advanced &Linux; Sound Architecture - Arquitectura de so avançada de &Linux;). ALSA s'instal·la en la majoria de sistemes &Linux; (www.alsa-project.org) GStreamer versió 0.8.7 o superior. Nota: Assegureu-vos de registrar els vostres connectors de GStreamer executant el comandament gst-register abans d'usar GStreamer en &ktts; (http://gstreamer.freedesktop.org) Biblioteca aKode. aKode és una biblioteca de decodificació que forma part de &kde;. El projecte &kde; planeja deixar &arts; començant en la versió 4. Alguns usuaris han experimentat problemes de dispositius amb ALSA. Si el vostre sistema presenta aquest problema, no podreu reproduir música mentre el sistema estigui pronunciant. &ktts; fins i tot pot penjar-se si per un treball de text n'inicieu un altra. Mireu al lloc web de ALSA (dmix) per aconseguir possibles solucions. A juliol del 2005, aKode no te suport d'una capacitat real de fer pausa. Quan feu una pausa a un treball de text en &ktts; aquest finalitzarà de pronunciar la frase actual. Components opcionals: La utilitat d'àudio sox és necessària per ajustar de forma global la velocitat, però no és imprescindible. Els usuaris de Debian poden instal·lar sox amb el comandament apt-get install sox. Sox s'inclou a la majoria dels CD de les distribucions &Linux;. La utilitat d'àudio xsltproc és necessària per al suport SSML i per al filtre transformador &XML;, però no és imprescindible. Els usuaris de Debian poden instal·lar xsltproc amb el comandament apt-get install xsltproc. Compilació i instal·lació Per a compilar &ktts;, haureu de tenir una còpia recent (&kde; 3.4 o posterior) dels fitxers de desenvolupament de &kde;, incloguen tdelibs i arts. Si descarregueu &ktts; com a un fitxer tar, accediu com a usuari normal i descomprimiu-lo, canvieu a la seva carpeta i introduïu els següents comandaments: ./configure make Estan disponibles les següents opcions per a configure: Opció per omissió Descripció Alternativa --with-arts Construeix el connector d'àudio arts. --without-arts --with-alsa=check Construeix el connector d'àudio ALSA. --with-alsa=no --with-gstreamer=no No construeix el connector d'àudio GStreamer. --with-gstreamer=check --with-akode=no No construeix el connector d'àudio aKode. --with-akode=check En &kde; 4, el connector &arts; probablement serà eliminat o almenys no serà construït per omissió. Els següents connectors de síntesis de veu no es construeixen per omissió. Alguns d'aquests tan sols es carreguen en temps d'execució sobre programari no lliure (no lliure d'acord a la política de Debian). La columna "Opció de configuració per a no construir" mostra el comandament de configuració per a no construir el connector: Sintetitzador Llicència Opció de configuració per a no construir Festivallliure--disable-kttsd-festivalint Festival Litelliure--disable-kttsd-flite Eposlliure--disable-kttsd-epos Comandamentlliure--disable-kttsd-command Hadifixno-lliure--disable-kttsd-hadifix FreeTTSno-lliure--disable-kttsd-freetts Per omissió, els comandaments anteriors instal·laran &ktts; en /opt/kde3. Si aquesta carpeta no està en la vostra ruta $TDEDIRS, us caldrà afegir una opció --prefix=destí. Per exemple: ./configure --prefix=/usr/local make Sobre sistemes Debian el lloc habitual per a instal·lar les aplicacions compilades a partir del codi font és /usr/local. Accediu com a root i instal·leu &ktts; compilat usant els següents comandaments. su make install Si descarregueu les fonts de &ktts; des del mòdul tdeaccessibility del repositori de codi, o des d'un fitxer comprimit, useu els següents comandaments per a compilar i instal·lar: cd tdeaccessibility echo kttsd>inst-apps make -f Makefile.cvs ./configure cd kttsd make su make install Configuració Assegureu-vos de que el vostre motor de síntesis de veu està funcionant abans d'usar &ktts;. Seguiu les instruccions que venen amb cada motor. En alguns casos, potser us caldrà garantir l'accés d'escriptura al dispositiu d'àudio. chmod a+rw /dev/dsp* Usar amb Festival (Interactiu) Festival és un dels millors motors TTS lliure i de codi obert disponibles. La qualitat de veu és en general bona i suporta uns quants idiomes i tipus de veu. Per a algunes veus, podreu controlar el volum, la velocitat de pronunciació, i el timbre (to) des de &ktts;. Nom del sintetitzador: Festival Interactive &URL;: http://www.cstr.ed.ac.uk/projects/festival/ Comandament d'instal·lació en Debian: apt-get install festival Almenys haureu d'instal·lar un idioma. Seguiu les instruccions que venen amb Festival. Si voleu pronunciar pàgines web, haureu d'instal·lar la veu rab_diphone (home britànic). Hi ha més veus en anglès disponibles per a festival des de http://hts.ics.nitech.ac.jp/. Hi ha veus addicionals en espanyol, anglès i alemany disponibles des de http://cslu.cse.ogi.edu/tts/download/ Haureu de compilar un mòdul addicional per a aquestes veus, per tant, heu de tenir el codi font de Festival. Les veus en alemany tenen una distribució limitada. Una veu d'home en finès està disponible des de http://www.ling.helsinki.fi/suopuhe/download/. Una veu d'home en polonès està disponible des de http://www.artegence.com/download/voicexml/speech/festival_polish_voice.tgz. Una veu d'home en rus està disponible des de http://nshmyrev.narod.ru/festival/festival.html Haureu de tenir Festival 1.95 beta o posterior per a usar aquesta veu. La veu encara està en un desenvolupament temprà. Descomprimiu-la a festival/lib/voices/russian/. Quan configureu el parlador en rus, el codi de veu serà msu_ru_nsh_diphone. Assegureu-vos de seleccionar una codificació ciríl·lica de 8 bits, tal com KOI8-R. Les veus en italià per a Festival 1.95 beta es troben disponibles a http://www.csrf.pd.cnr.it/TTS/It-FESTIVAL-download.htm. Si obteniu un error de CRC al descomprimir el fitxer zip, intenteu tornant-lo a descarregar. Les veus en kishahili, zulú i ibibio per a Festival 1.95 beta es troben disponibles a http://www.llsti.org/. Malauradament, la veu en hindi que també està disponible no funciona amb &ktts;. Es poden comprar veus comercials, inclosa la veu en francès canadenc des de Cepstral, LLC a http://www.cepstral.com/ La FAQ o la seva pàgina de suport conté informació sobre l'ús d'aquestes veus en Festival. Festival s'inclou de forma habitual en les distribucions &Linux;. Comproveu si està inclòs en els CD de la vostra distribució. Quan useu els idiomes en polonès, hongarès o txec, assegureu-vos que l'opció Codificació estigui establerta a ISO 8859-2. Quan useu la veu en rus, assegureu-vos que l'opció Codificació estigui establerta a una de 8 bits, tal com KOI8-R. Usar Festival amb &mbrola; Festival es pot usar en combinació amb el sintetitzador &mbrola;. En aquest mode, Festival realitza un anàlisis lèxic i &mbrola; genera l'àudio. El binari de &mbrola; i els seus fitxers de veu es poden descarregar des de http://festvox.org/mbrola/. Seguiu les instruccions del fitxer readme.txt que ve amb la descàrrega. Tingueu present que &mbrola; no és un sistema de text-a-veu complet. &mbrola; sintetitza veu a partir de fitxers de fonemes. Hi ha programes addicionals que poden generar els fonemes. Quan es combina amb Festival, Festival produeix els fonemes que necessita &mbrola;. txt2pho es pot usar per a produir fitxers de fonemes a partir del text en alemany. Per a més informació mireu . Hi ha tres mètodes de combinar Festival amb &mbrola;. Embolcalls de &mbrola;. En el moment d'escriure aquest manual, aquest mètode està limitat a veus en anglès. Festival IMS alemany. Festival-Czech (en txec). Usar Festival amb embolcalls de &mbrola; En aquest mètode, s'afegeix codi addicional a Festival per aconseguir que aquest realitzi la síntesis de veu usant fitxers de veu &mbrola;. Tingueu present que els fitxers de veu &mbrola; no estan instal·lats en l'arbre de carpetes de &mbrola;. Però sí s'han d'instal·lar en l'arbre de carpetes festival/lib. Per a instruccions, mireu http://www.cstr.ed.ac.uk/projects/festival/mbrola.html Usar Festival IMS alemany Festival IMS en alemany és una versió modificada de Festival que usa veus de &mbrola; en alemany. Funciona amb les versions 1.4.1 o 2.0 (1.95beta) de Festival. En primer lloc instal·leu Festival i &mbrola; si és que encara no ho heu fet. A continuació, descarregueu Festival IMS en alemany, des de http://www.ims.uni-stuttgart.de/phonetik/synthesis/festival_opensource.html. Seguiu les instruccions en el fitxer README que heu descarregat. (Tingueu present, que si l'useu en combinació amb Festival 2.0, no serà necessari aplicar pedaços, però haureu de tornar a construir festival). Finalment, afegiu les següents línies al fitxer festival/lib/siteinit.scm. (voice-location "german_de1_os" "/usr/local/mbrola/de1" "German Female, IMS Festival de1") (voice-location "german_de2_os" "/usr/local/mbrola/de2" "German Male, IMS Festival de2") (voice-location "german_de3_os" "/usr/local/mbrola/de3" "German Female, IMS Festival de3") just a sobre d'aquestes línies es pot llegir (provide 'siteinit) En alguns sistemes, el fitxer a editar serà /etc/festival.scm. Afegiu-hi tan sols les línies que es corresponguin amb les veus en alemany que heu instal·lat. Substituïu a la ruta correcta per /usr/local/mbrola/. També haureu de tenir en compte que (en el moment d'escriure això) Festival IMS en alemany no funciona amb les veus en alemany de4, de5 o de6. Usar Festival-Czech (en txec) Aquest mètode usa un codi especial per habilitar la síntesis de veu usant Festival amb una veu &mbrola; en txec. Per a instal·lar-lo, primer descarregueu i instal·leu Festival i &mbrola;, i assegureu-vos de que ambdós funcionen. Tot seguit, descarregueu Festival-Czech des de http://www.freebsoft.org/festival-czech En els següents procediments substituïu les rutes cap a les carpetes correctes a on procedeixi. Descomprimiu la descàrrega en una carpeta i creeu el lèxic. L'executable de Festival haurà d'estar en la vostra variable d'entorn PATH. cd /usr/local tar xvfz festival-czech.tar.gz cd festival-czech make Descarregueu el fitxer de veu cz2 des del lloc web de &mbrola;, i descomprimiu-lo en la carpeta de &mbrola;: cd /usr/local/mbrola mkdir cz2 cd cz2 unzip cz2-001009.zip Afegiu les següents línies al fitxer festival/lib/siteinit.scm: (set! czech-lexicon-file "/usr/local/festival-czech/czech-lexicon.out") (set! load-path (cons "/usr/local/festival-czech" load-path)) (require 'czech) (set! czech-mbrola_database "/usr/local/mbrola/cz2/cz2") (set! mbrola_progname "/usr/local/mbrola/mbrola") (voice-location "czech_mbrola_cz2" "/usr/local/mbrola/cz2" "Czech Male, MBROLA") (require 'czech-mbrola) just a sobre d'aquestes línies es pot llegir (provide 'siteinit) En alguns sistemes, el fitxer a editar serà /etc/festival.scm. Usar amb Festival Lite (flite) Festival Lite és un motor lliure de codi obert que en aquests moments suporta un limitat nombre de veus i idiomes. És lleuger, però per en sacrifici de la qualitat. No podreu controlar el timbre, el volum o la velocitat d'aquest motor des de &ktts;. Nom del sintetitzador: Festival Lite (flite) &URL;: http://www.speech.cs.cmu.edu/flite/index.html Comandament d'instal·lació en Debian: apt-get install flite flite s'inclou de forma habitual en les distribucions &Linux;. Comproveu si està inclòs en els CD de la vostra distribució. Construïu i instal·leu flite seguint les instruccions en el seu fitxer README. Usar amb Hadifix (&mbrola; i txt2pho) Hadifix és un motor de síntesis en dues passes basat en fonemes. La utilitat txt2pho converteix el text a fonemes i el motor &mbrola; els sintetitza en sons. La qualitat de la veu es bona, però el suport de l'idioma està en aquests moments una mica limitat. Podeu controlar la veu, el timbre, la velocitat i el volum des de kttsmgr. Nom del sintetitzador: Hadifix &URL;: Veure a sota Comandament d'instal·lació en Debian: Cap Si encara no heu instal·lat Hadifix, feu el següent: Descarregueu el binari de &mbrola; des de http://festvox.org/mbrola/. Instal·leu &mbrola; a la carpeta /usr/local/mbrola. Almenys descarregueu un fitxer d'idioma en alemany des del lloc de &mbrola;. Descomprimiu-lo en la carpeta /usr/local/mbrola. Descarregueu txt2pho des de http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html. Descomprimiu txt2pho a /usr/local/txt2pho. Editeu el fitxer txt2phorc, canviant les rutes per les correctes. Copieu txt2phorc a ~/.txt2phorc o a /etc/txt2pho. Tingueu present que s'ha eliminat el "rc" del nom de fitxer. En kttsmgr, escolliu l'idioma en alemany (de), i afegiu Hadifix. En la pantalla Configura el parlador, configureu una veu i les rutes cap a &mbrola; i txt2pho. Feu clic sobre el botó Prova per a fer una verificació. Hi ha una implementació en hongarès per a &mbrola; i txt2pho disponible a http://tkltrans.sourceforge.net/. Usar amb Epos Epos és un motor lliure de codi obert per al txec i l'eslovè. És lleuger, però sacrifica la qualitat de la veu. No podreu controlar el volum d'aquest motor des de &ktts;. Nom del sintetitzador: Sistema de síntesis TTS de Epos &URL;: http://epos.ure.cas.cz/ Comandament d'instal·lació en Debian: apt-get install epos Inicieu kttsmgr. En la pestanya Parladors, feu clic sobre el botó Afegeix. Escolliu els idiomes txec o eslovè i Sistema de síntesis TTS de Epos. Si el servidor executable i el client no estan en la vostra variable d'entorn PATH, especifiqueu les rutes cap a aquests executables en la finestra Configura el parlador. Les caixes d'aquestes opcions us permeten passar paràmetres addicionals al servidor i al client. Per obtenir més informació escriviu epos -h o say -h en una &konsole;. Usar amb FreeTTS FreeTTs és un motor de síntesis de veu lliure de codi obert escrit en &Java;, el qual vol dir que haureu de tenir instal·lat al vostre sistema el programari de la màquina virtual de &Java; per a poder-lo usar. No podreu controlar el timbre, el volum o la velocitat d'aquest motor des de &ktts;. Nom del sintetitzador: FreeTTS &URL;: http://sourceforge.net/projects/freetts/ Comandament d'instal·lació en Debian: Cap Usar el connector Comandament El connector Comandament us permetrà usar &ktts; amb qualsevol motor de síntesis de veu que pugui ser executat com a un comandament en una &konsole;. Nom del sintetitzador: Comandament &URL;: Cap Comandament d'instal·lació en Debian: Cap La manera ideal, seria usar un comandament que sintetitzés a un fitxer d'àudio (wav) temporal, en comptes d'enviar la veu directament cap al dispositiu d'àudio. Si el motor de síntesis de veu necessita text per a ser codificat de forma diferent a l'establert en les preferències del vostre escriptori, useu el paràmetre %f per a passar el text al motor. &ktts; codificarà el text d'acord a les vostres especificacions i l'escriurà al fitxer temporal. Si proveu de passar text sobre la línia de comandaments usant el paràmetre %t, aquest serà codificat usant la configuració local. També podeu usar l'opció Envia les dades com a entrada estàndard per a resoldre aquest problema, si el motor accepta entrades des de l'estrada estàndard. Per exemple, aquest és un comandament que mostra com enviar text en polonès a Festival usant la codificació ISO 8859-2 i eliminant els caràcters de puntuació que no es poden llegir. cat %f | tr '(){}[]"' ' ' | festival --tts --language polish &documentation.index;