KTTS"> MBROLA"> ]> Handbok &ktts; Gary R. Cramblitt garycramblitt@comcast.net Stefan Asserhäll
stefan.asserhall@comhem.se
Översättare
2004-2005 Gary R. Cramblitt &FDLNotice; 2005-07-31 1.05.00 &ktts;, &kde;:s text-till-tal system. är en insticksprogrambaserad tjänst som låter vilket &kde;-program (eller annat program) som helst använda tal via ett &DCOP;-gränssnitt. &ktts; är avsedd att vara implementeringen av &kde;:s text-till-tal programmeringsgränssnitt. KDE handikappstöd tdeaccessibility TTS Text till tal KTTSD kttsmgr festival flite hadifix MBROLA freetts epos SSML
Inledning &ktts; är ett delsystem i &kde; för att skapa text-till-tal (TTS). Det tillhandahåller ett gemensamt programmeringsgränssnitt för &kde;-programmerare som ger möjlighet att använda text-till-tal i sina program. Det tillhandahåller också några trevliga funktioner för slutanvändare. Användarfunktioner: Läs upp innehållet i en textfil. Läs upp &kde;:s meddelandehändelser (Knotify). Läs upp hela eller delar av texten på en webbsida i &konqueror;. Läs upp hela eller delar av texten i &kate; texteditorn, inklusive fall då &kate; är inbäddad i ett annat &kde;-program. Lång text tolkas till meningar. Användaren kan gå bakåt en mening eller ett stycke, läsa upp igen, göra paus och stoppa uppläsning. Ljudutmatning via &arts;, ALSA, Gstreamer (version 0.8.7 eller senare) eller aKode. Filter som kan anpassas av användaren för att ersätta feluttalade ord, välja talsyntes och omvandla XHTML- eller &XML;-dokument. Programmeringsfunktioner: Prioriteringssystem för skärmläsningsutmatning, varningar och meddelanden, medan uppläsning av vanlig text pågår. Arkitektur baserad på insticksprogram med stöd för ett stort antal olika talsyntesprogram och drivrutiner. Tillåter att skapa tal från kommandoraden (eller via skalskript) med &kde;:s &DCOP;-verktyg. Tillhandahåller en lättviktig och lättanvänt gränssnitt för program att skapa talad utmatning. Program behöver inte bekymra sig om konflikt över uppläsningsenheten. FRAMTIDA: Tillhandahåller stöd för talmarkeringsspråk, såsom VoiceXML, Sable, &Java; Speech Markup Language (JSML), och Speech Markup Meta-language (SMML). FRAMTIDA: Tillhandahålla begränsat stöd för inbäddade talmarkörer. Asynkront för att förhindra att systemet blockeras. &ktts; består i själva verket av flera program: kttsd &kde;:s text-till-tal demon, som är ett program utan grafiskt gränssnitt som tillhandahåller text-till-tal tjänster till program via &DCOP;. kttsmgr Ett grafiskt program för att anpassa och styra kttsd. Programmet kttsmgr är placerad i systembrickan. libtdehtmlkttsdplugin Ett insticksprogram för webbläsaren &konqueror; som tillåter att hela eller delar av texten på en webbsida läses upp. tdetexteditor_kttsd Ett insticksprogram för texteditorn &kate; som tillåter att hela eller delar av en textfil läses upp. Stöd Förutom &kde;:s feldatabas Bugzilla (http://bugs.trinitydesktop.org/), äger diskussioner om &ktts; för närvarande rum på e-postlistan kde-accessibility. Prenumerera på https://mail.kde.org/mailman/listinfo/kde-accessibility. Utvecklare finns också på IRC (irc.kde.org, kanalen #kde-accessibility). Att använda &ktts; Innan du kan använda &ktts; måste du installera minst ett talsyntesprogram och försäkra dig om att det fungerar. Se . Starta <command>kttsmgr</command> För att starta &ktts;-systemet, skriv in följande kommando i en terminal kttsmgr eller klicka på kttsmgr i &kde;:s meny. Om det är första gången kttsmgr körs, eller om du ännu inte har ställt in några talare, visas sidan Talare. Se . Om du redan har ställt in minst en talare, visas sidan Allmänt. Se . Anpassa insticksprogram för syntes (talare) De flesta program för text-till-talsyntes (TTS) erbjuder flera språk och röster, och kan erbjuda flera uppläsare med olika kön, volym och hastigheter. Du kan ställa in mer än en instans av syntesen. Varje kombination av språk, syntes, röst, kön, volym och hastighet kallas en talare. Du måste ställa in minst en talare innan du kan starta &ktts; och börja läsa upp text. Flera talare med samma syntesprogram liknar flera skrivarköer för en ensam fysisk skrivare. När program skickar text till &ktts;, kan de ange egenskaper hos talaren de föredrar för att utföra syntesen. Ett program kan till exempel begära en engelskspråkig kvinnlig talare. Om du har ställt in en talare som både är engelskspråkig och kvinnlig används den talaren, annars väljes talaren som bäst passar in automatiskt. För att lära dig mer om hur &ktts; väljer talare, se . När du klickar på fliken Talare i kttsmgr, visas sidan Talare. Sidan visas också automatiskt om du startar kttsmgr och ännu inte har ställt in några talare. &kde;:s text-till-tal hantering (fliken Talare). &kde;:s text-till-tal hantering (fliken Talare) Klicka för att lägga till en ny talare. Alla inställda talare listas här. Talaren med högst prioritet listas överst. Den översta talaren används för att utföra uppläsningen när ett program inte anger en talare. Klicka på en talare i listan för att markera den, och klicka på den här knappen för att ta bort den. Klicka på en talare i listan för att markera den, och klicka på den här knappen för att visa inställningsdialogrutan i insticksprogrammets för talsyntes. Se nedan. Klicka på en talare i listan för att markera den, och klicka på den här knappen för att flytta den neråt i listan. Ju lägre en talare visas i listan, ju lägre är dess prioritering. Klicka på någon av dessa knappar för att verkställa ändringarna du har gjort i &ktts;-systemet som kör. När du klickar på knappen Lägg till, visas skärmen Lägg till talare. Skärmen Lägg till talare. Skärmen Lägg till talare Du kan välja ett insticksprogram för talsyntes antingen med namnet på en Talsyntes, eller enligt Språk som talsyntesen kan läsa upp. Markera alternativknappen intill motsvarande ruta. När alternativknappen Språk är markerad, visar rutan Språk alla språk som stöds av alla tillgängliga talsyntesprogram, och rutan Talsyntes visar bara de talsyntesprogram som stöder det valda språket. När alternativknappen Talsyntes är markerad, visar rutan Talsyntes alla tillgängliga talsyntesprogram, och rutan Språk visar bara de språk som stöds av det valda talsyntesprogrammet. Välj språk och insticksprogram för syntes här. När du klickar här, ställer de flesta insticksprogram för talsyntes in sig själva automatiskt, och väljer en standardinställning. En ny talare visas i listan under fliken Talare. Klicka på knappen Redigera för att visa eller redigera inställningen för talaren. När du klickar på knappen Lägg till under fliken Talare och lägger till en talare som inte kan ställas in automatiskt, eller klickar på knappen Redigera, visas sidan Inställning av talare. Varje insticksprogram för talsyntes har en egen sida för inställning av talare. Följande är ett exempel på inställning av insticksprogrammet för interaktiv Festival. För specifika sätt att ställa in varje insticksprogram, se . Inställning av talare Inställning av talare Ange sökvägen till det körbara Festival-programmet. Om Festival finns i miljövariabeln PATH, skriv bara in festival. Klicka för att söka efter tillgängliga röster. Välj en röst. Välj en teckenkodning för text som skickas till Festival. För röster som &ktts; känner till, väljes inställningen automatiskt åt dig. I allmänhet använder västerländska språk ISO 8859-1. Östeuropeiska språk som tjeckiska eller slovakiska använder ISO 8859-2. Klicka för att testa. Du ska höra en testmening läsas upp. Använd reglagen för att ställa in det syntetiserade talets volym, talhastighet och tonhöjd. Om något av dem är inaktiverat (grått), stöder inte den valda rösten att de ändras. Vissa röster, såsom MultiSyn-röster, är så stora att de kräver flera sekunder att laddas. Markeras rutan gör att de laddas när KTTSD startas, och på så sätt sparas tid (till kostnad av användning av mer minne) innan den första meningen syntetiseras. Klicka på knappen Ok för att spara talarens inställningar. Försäkra dig om att klicka på knappen Verkställ, annars får dina ändringar ingen effekt i &ktts;-systemet som kör. Med antagandet att testen fungerade, är du nästan klar att börja använda &ktts;. Gå nu tillbaka till fliken Allmänt och markera rutan Aktivera text-till-tal systemet (KTTSD). Det startar &kde;:s text-till-tal demon. Se . Du kan nu börja använda &ktts; för att läsa upp text. Klicka på fliken Jobb för att skapa och hantera textjobb. Se . Starta KTTSD och ställa in allmänna alternativ När du väl har ställt in minst en talare, kan du starta &kde;:s text-till-tal system. Klicka på fliken Allmänt. Sidan Allmänt visas. Du kan också ställa in några allmänna alternativ på den här sidan. &kde;:s text-till-tal hantering (fliken Allmänt). &kde;:s text-till-tal hantering (fliken Allmänt) Markera rutan för att aktivera &ktts;-systemet. Det startar &kde;:s text-till-tal demon (KTTSD). Om KTTSD startas med lyckat resultat, visas fliken Jobb. När KTTSD väl har startats, kan du börja skapa och läsa upp textjobb. Se . Avmarkeras rutan, stoppas KTTSD och &kde;:s text-till-tal system inaktiveras. Om rutan är inaktiverad, har du ännu inte ställt in några talare (eller så glömde du klicka på knappen Verkställ). Se . När rutan är markerad, visas en ikon i systembrickan så fort kttsmgr kör. Klickas Avbryt eller Ok i detta läge avslutas inte kttsmgr. Istället försvinner skärmen, men kttsmgr fortsätter att köra i systembrickan. Klicka på ikonen för att återställa skärmen. För att avsluta kttsmgr, högerklicka på ikonen i systembrickan och välj Avsluta. När rutan inte är markerad, visas inte någon ikon i systembrickan. Klickas Ok eller Avbryt avslutas kttsmgr. När kommandot kttsmgr avslutas, fortsätter &ktts; köra om rutan Aktivera text-till-tal (KTTSD) är markerad. Det här alternativet får ingen effekt förrän nästa gång kttsmgr startas. Det här alternativet har ingen effekt när kttsmgr körs i KDE:s inställningscentral. När rutan markeras, visas skärmen för kttsmgr när du startar kttsmgr. Om den inte är markerad visas ikonen för kttsmgr i systembrickan när kttsmgr startas, men skärmen visas inte. Klicka på ikonen i systembrickan för att få skärmen att visas. När rutan är markerad, och kttsmgr inte redan kör, visas det i systembrickan så fort KTTSD läser upp något. Det ger dig möjlighet att stoppa eller på annat sätt hantera uppläsningen. När rutan är markerad, och kttsmgr automatiskt visas i systembrickan så fort uppläsning sker, försvinner det också automatiskt när uppläsningen är klar. Försäkra dig om att du klickar här för att spara dina inställningar. Hantera textjobb När du klickar på fliken Jobb i kttsmgr, visas sidan Jobb. &kde;:s text-till-tal hantering (fliken Jobb). &kde;:s text-till-tal hantering (fliken Jobb) Alla textjobb som för närvarande finns i kön listas här, tillsammans med programmet som köade jobbet, jobbets nuvarande tillstånd, antal meningar i jobbet, och det nuvarande meddelandenumret. Talarens identifikation motsvarar kolumnen Id på sidan Talare. Knapparna i den här verktygsraden låter dig starta, ta bort och göra paus i uppläsningsjobb. Välj ett jobb i listan nedan, och klicka på en av knapparna. Knapparna i den här verktygsraden låter dig gå fram eller tillbaka en mening i jobbet som är markerat i listan nedan. (Alla jobb har inte flera delar.) Knapparna i den här verktygsraden låter dig läsa upp texten som för närvarande finns på &kde;:s klippbord, eller öppna en textfil som ska läsas upp. Du kan också uppdatera listan med textjobb. Se . Meningen som för närvarande läses upp visas här. När du klickar på Ok verkställs alla ändringar av inställningar på andra sidor (om det finns några) och kttsmgr minimeras till systembrickan. Klicka på ikonen i systembrickan för att återställa skärmen. Dra avdelaren för att ändra storlek på jobblistan och rutan Nuvarande mening. Fliken Jobb visas bara när KTTSD kör. Om du inte ser fliken Jobb, klicka på fliken Allmänt och markera rutan Aktivera text-till-tal (KTTSD). Om du inte har installerat ljudsystemet &arts;, men har installerat ALSA, Gstreamer eller aKode, klicka på fliken Ljud. Se . På den här sidan listas och styrs bara textjobb. Skärmläsningsutmatning, varningar och meddelanden visas inte. För mer information om meddelandetyper i &ktts;, se . Ljudinställningar När du klickar på fliken Ljud i kttsmgr, visas sidan Ljud. &kde;:s text-till-tal hantering (fliken Ljud). &kde;:s text-till-tal hantering (fliken Ljud) Välj ljudutmatningsmetod här. Om en komponent är grå, kompilerades antingen &ktts; utan stöd för det ljudinsticksprogrammet, eller kunde inte &ktts; ladda nödvändiga bibliotek. Om Gstreamer eller aKode är vald för ljudutmatning, välj metoden för ljudsänka här. Om inga sänkor anges, måste du installera minst en. Om ALSA är installerad, välj PCM-enhenten här. Se . Justera uppläsningens hastighet här. 50 % är ungefär två gånger långsammare än normalt, medan 200 % är ungefär två gånger snabbare. Du måste ha installerat verktyget sox för att inställningen ska fungera. När rutan är markerad, kopierar &ktts; tillfälliga ljudfiler (.wav-filer) till angiven katalog. Välj vilken katalog på hårddisken du vill, men du måste kunna skriva i den. Det kan vara användbart för att skapa ljudfiler med tal för andra syften. Filerna får namn på formen kttsd-J-M, där J är jobbnumret och M är meningsnumret. Befintliga filer med samma namn tas bort. Glöm inte bort att avmarkera rutan, annars fylls hårddisken upp. Försäkra dig om att klicka på knappen Verkställ, för att använda de nya inställningarna i &ktts;-systemet som kör. Det finns två sätt att justera talhastigheten i &ktts;. Många av Talarna har inställningen Hastighet i sina inställningsdialogrutor, som du kan visa genom att klicka på Redigera på sidan Talare. Inställningen Hastighet på sidan Ljud finns förutom talarens hastighetsinställning, och kan i allmänhet användas även om talaren inte stöder en hastighetsinställning. För att denna hastighetsinställning ska fungera, måste du ha installerat verktyget sox på systemet (Debian-användare: apt-get install sox). Dessutom ignoreras hastighetsinställningen när text som innehåller SSML läses upp (se ). Listan med ALSA-enheter omfattar alla ALSA PCM-enheter och insticksprogram som är inställda i systemet. Många av valen fungerar inte. Du måste experimentera för att hitta en enhet som fungerar för dig. Om du är tveksam, välj default. Inställningar av textavbrott När du klickar på fliken Avbrott i kttsmgr, visas sidan Avbrott. &kde;:s text-till-tal hantering (fliken Avbrott). &kde;:s text-till-tal hantering (fliken Avbrott) Den här sidan låter dig ange speciella åtgärder som ska utföras så fort ett textjobb avbryts av ett annat, högre prioriterat, meddelande. Det finns fyra sorters taljobb som &ktts; hanterar: Vanlig text. Meddelanden. Varningar. Skärmläsningsutmatning. Skärmläsningsutmatning har högst prioritering. Den är reserverad för användning av skärmläsningsprogram. Skärmläsningsutmatning går före alla andra meddelande, och gör paus i dessa jobb. Så fort skärmläsningsutmatningen har lästs upp, återupptas automatiskt jobben som avbröts. Varningar har följande prioritering. De är reserverade för meddelanden med hög prioritet, som "Processorn överhettas". En varning avbryter meddelanden och vanlig text, och gör paus i dessa jobb. Så fort varningen har lästs upp, återupptas automatiskt jobben som avbröts. Meddelanden har följande prioritering. Ett meddelande avbryter vanliga textjobb. &kmouth; är ett exempel på ett program som använder meddelanden. Till exempel medan en lång text från en webbsida läses upp, kan &kmouth; användas för att hälsa på någon som kommer in i rummet. Alla fyra sorters jobb har köer, utom skärmläsningsutmatning. Om en skärmläsningsutmatning skickas från ett program medan &ktts; läser upp en annan skärmläsningsutmatning, stoppas meddelandet som håller på att läsas upp och kastas. När ett textjobb avbryts av ett meddelande, en varning eller en skärmläsningsutmatning, lägger &ktts; till ljudutmatningen på den här sidan till strömmen. Det här meddelandet läses upp så fort ett vanligt textjobb avbryts. Den här ljudfilen spelas upp så fort ett vanligt textjobb avbryts. Om både Inledande ljud och Innan meddelandet är angivna, spelas Inledande ljud upp innan Innan meddelandet läses upp. Det här meddelandet läses upp så fort ett avbrutet textjobb återupptas. Den här ljudfilen spelas upp så fort ett avbrutet textjobb återupptas. Den spelas upp sist. Inställningarna på den här sidan gäller bara vanliga textjobb. Meddelanden, varningar eller skärmläsningsutmatningar har inga särskilda åtgärder när de avbryts av ett meddelande med högre prioritering. Läsa upp text från webbsidor När du kör &kde;:s webbläsare &konqueror;, kan du läsa upp texten på webbsidan som visas. Försäkra dig först om att &ktts; kör. Markera texten du vill läsa upp, och välj Verktyg Läs upp text i huvudmenyn. Efter ett ögonblick, ska den markerade texten börja läsas upp. Det är nästan alltid en god idé att markera texten på webbsidan som du vill ska läsas upp. Du kan hoppa över steget, men du hör då en mängd &HTML;-huvuden och andra osynliga taggar läsas upp. Läsa upp text från editorn &kate; När du kör &kde;:s avancerade texteditor (&kate;), kan du läsa upp texten som visas. Försäkra dig först om att &ktts; kör. Markera texten du vill läsa upp, och välj Verktyg Läs upp text i huvudmenyn. Efter ett ögonblick, ska den markerade texten börja läsas upp. Du behöver inte först markera text. I detta fall, läses hela filen upp. Detta fungerar också när &kate; kör inbäddad i ett annat program, som &konqueror; eller &quanta;. Talade meddelanden (Knotify) Knotify är meddelandesystemet i &kde;, som gör dig uppmärksam på händelser som du ställer in i &kde;-systemet. Du kan anpassa &ktts; att läsa upp textmeddelanden. Till exempel tillåter &konversation;, ett &kde; IRC-program, dig att ställa in en stor uppsättning meddelanden. Du kan till exempel tala om för &konversation; att underrätta dig så fort ett meddelande där ditt smeknamn ingår dyker upp i en IRC-kanal. Tillsammans med &ktts;, kan du låta &kde; läsa upp IRC-meddelandets text. I allmänhet, om ett &kde;-program stöder Knotify, visas menyalternativet Anpassa meddelanden i menyn Inställningar. De specifika sätten att anpassa varje program för Knotify varierar från program till program. För att göra det möjligt för &ktts; att läsa upp textmeddelanden från Knotify, starta kttsmgr och klicka på fliken Underrättelser. Sidan Underrättelser visas. &kde;:s text-till-tal hantering (fliken Underrättelser). &kde;:s text-till-tal hantering (fliken Underrättelser) Markera rutan för att aktivera uppläsning av &kde;:s underrättelser. Om den inte är markerad, är allt på sidan inaktiverat och &ktts; läser inte upp några underrättelser. Om markerad, läser inte &ktts; upp händelser med ett ljud från något program. Använd knapparna för att lägga till eller ta bort programhändelser från listan nedan. När du klickar på knappen Lägg till, visas en ruta där du väljer program och händelse som du vill lägga till i listan. Händelsen läser upp meddelandet &konversation; skickar när någon nämner ditt smeknamn i ett Internet Relay Chat-meddelande. För alla andra händelser som kommer från &konversation;, sker ingen åtgärd i &ktts;. För alla andra händelser som inte anges på annat sätt i listan, sker ingen åtgärd i &ktts;. Använd rutan för att ange vad &ktts; ska göra när en händelse tas emot. Alternativen är: Läs upp händelsens namn Läser upp händelsens namn, det du ser listat i händelselistan på den här sidan. Läs upp händelsens meddelande Läser upp meddelandet som det skickas från programmet. Läs inte upp underrättelsen Läser inte alls upp händelsen. Läs upp egen text Läser upp texten som du skriver in i rutan till höger. Om åtgärden är Läs upp egen text, skriv in meddelandetexten som du vill ska läsas upp här. Du kan använda följande ersättningssträngar i meddelandet: %e Händelsens namn %a Namnet på programmet som skickade händelsen %m Meddelandet som programmet skickade Testa meddelandet genom att klicka här. Du kan ange egenskaper för talaren som önskas för att läsa upp underrättelsemeddelandet här. standard använder den översta talaren på sidan Talare. Se . Observera att det finns tre händelsenivåer. Om en åtgärd för en viss händelse från ett visst program anges, utförs den åtgärden. Annars, om en åtgärd för alla andra händelser från ett visst program anges, utförs den åtgärden. Annars utförs åtgärden som anges för alla andra händelser under Standard (alla andra händelser). Händelsen alla underrättelser för programmet Standard (alla andra händelser) kan inte tas bort från listan. För standardvärdet alla andra händelser kan du ange typ av underrättelse som läses upp, enligt följande: ingen Ingen läses upp. underrättelsedialogrutor Underrättelser som visar en dialogruta på skärmen, som du sedan måste stänga, läses upp. passiva meddelanden Underrättelser som visar ett passivt meddelande på skärmen, som automatiskt försvinner efter ett ögonblick, läses upp. underrättelsedialogrutor och passiva meddelanden Underrättelser som visas på skärmen, passiva eller inte, läses upp. alla underrättelser Alla underrättelser, oberoende av om de visar något på skärmen, läses upp. Strängersättningsfilter är ett bra sätt att göra iordning meddelanden som skickas från program om de har felaktigt uttal eller läses upp felaktigt i &ktts;. Filen kmail.xml som levereras med &ktts;, är ett bra exempel. Den tar bort taggarna br och b i underrättelsemeddelanden från &kmail;, och tar också bort meningen /local/inbox/, eftersom det kan förutsättas i de flesta fall. Se . Använd knappen Spara för att spara inställningar av underrättelser i en fil. Använd knappen Ladda för att ladda sparade inställningar från en fil. De laddade händelserna blandas med befintliga händelser i listan. Om du vill börja med en tom lista, klicka först på knappen Rensa. Alla händelser utom alla underrättelser raderas. Försäkra dig om att klicka på knappen Verkställ eller Ok, för att spara dina inställningar. SSML SSML (Speech Synthesis Markup Language) är en W3C-standard för att märka text för uppläsning. Det tillhandahåller taggar för att styra röster, talhastighet, volym, kön och tonhöjd. Det tillhandahåller också taggar för att styra hur ord läses upp, till exempel utskrift av förkortningar. SSML är en del av specifikationen VoiceXML, som också är en W3C-standard. För närvarande tillhandahåller &ktts; begränsat och mycket grundläggande stöd för SSML. Det har för närvarande följande begränsningar: Fungerar bara med talarna i Festival (interaktivt) och Hadifix. Du måste installera rösten rab_diphone (brittisk man), eftersom det är den förvalda rösten som Festival använder vid uppläsning av SSML. Inställningen Hastighet på sidan Ljud ignoreras när text som innehåller SSML läses upp. Om inställningarna Hastighet eller Tonhöjd i Festivals inställningsdialogruta inte är inställda till 100 %, gör det oftast att SSML-texten läses upp monotont. Följande exempeltext kan användas för att experimentera med SSML. Who's been sleeping in my bed? said papa bear. Who's been sleeping in my bed? said momma bear. Who's been sleeping in my bed? said baby bear. ]]> Robustare stöd för SSML planeras för nästa version av &ktts;. Filter (avancerat) Filter är en avancerad funktion i &ktts;. De behövs inte för den grundläggande användningen av &ktts;. Filter används för att förbehandla text innan den skickas till talsyntesprogrammet. De är användbara för att förbättra tal, ersätta felupplästa ord eller förkortningar, välja lämpligt språk och talare, eller gå runt vissa begränsningar i talsyntesen och dess röster. Typer av meddelanden i &ktts; För att förstå hur filter används, är det till hjälp att först förstå hur text behandlas av &ktts;. Text som läses upp av &ktts; är av fyra möjliga typer. Skärmläsningsutmatning. Varningar. Meddelanden Textjobb Typen avgörs av programmet som skickar texten till &ktts;. Skärmläsningsutmatning har högst prioritering. Den är reserverad för användning av skärmläsningsprogram. Skärmläsningsutmatning går före alla andra meddelande, och gör paus i dessa jobb. Så fort skärmläsningsutmatningen har lästs upp, återupptas automatiskt meddelanden som avbröts. Varningar har näst högst prioritering. De är reserverade för meddelanden med hög prioritet, som "Processorn överhettas". En varning avbryter meddelanden och vanlig text, och gör paus i dessa jobb. Så fort varningen har lästs upp, återupptas automatiskt meddelanden som avbröts. Meddelanden har följande prioritering. Ett meddelande avbryter vanliga textjobb. &kmouth; är ett exempel på ett program som använder meddelanden. Till exempel medan en lång text från en webbsida läses upp, kan &kmouth; användas för att hälsa på någon som kommer in i rummet. &kde;:s underrättelser är också meddelanden (se ). Resten är vanliga textjobb. Alla jobb som du startar från fliken Jobb är textjobb. Ksayit är ett exempel på ett program som använder textjobb. Textjobb är avsedda för längre talutmatning som inte är brådskande. Alla fyra sorters jobb har köer, utom skärmläsningsutmatning. Om en skärmläsningsutmatning skickas från ett program medan &ktts; läser upp en annan skärmläsningsutmatning, stoppas meddelandet som håller på att läsas upp och kastas. Filtertyper Det första du måste veta om filter är att de aldrig används för skärmläsningsutmatning. De används för varning, meddelanden och textjobb, och dessutom för &kde;:s underrättelser (Knotify). Det finns två sorters filter, vanliga filter och filter för detektering av meningsgränser (SBD-filter). SBD-filter delar upp text i enskilda meningar. Det gör att &ktts; kan börja uppläsning snabbare, eftersom bara den första meningen behöver syntetiseras, inte hela textjobbet. Det låter dig också att gå framåt eller bakåt mening för mening under fliken Jobb, eller stoppa och göra paus i textjobb när talsyntesen inte direkt stöder att stoppa uppläsningen. Vanliga filter behandlar texten och skickar den vidare till nästa filter. Det finns för tillfället tre sorters vanliga filter. Strängersättning &XML;-omvandling Val av talare Filter är implementerade med en insticksarkitektur. Det kan komma att finnas ytterligare sorters filter i framtiden. Strängersättningsfilter ersätter textdelar med annan text. De ersatta delarna matchas antingen som ord eller som reguljära uttryck. &ktts; levereras med fördefinierade strängersättningsfilter för att läsa upp förkortningar och chattsmilisar som ":-)", eller för att formatera om underrättelsemeddelanden från &konversation; eller &kmail; till en form som är enklare att förstå. &XML;-omvandlingsfilter använder en &XML;-stilspråkomvandlingsfil (XSLT-fil) för att konvertera &XML; med ett format till ett annat format. &ktts; levereras med några XSLT-filer för att konvertera &XHTML; till SSML. Val av talare låter dig att skicka jobb till en talare baserat på textens innehåll, eller baserat på programmet som skickade det till &ktts;. Om du till exempel har ställt in en kvinnlig talare under fliken Talare, kan du skicka text som kommer från Ksayit till den talaren. Se . Var och en av dessa filtertyper har inställningsbara regler som avgör när filtret ska påverka texten att läsa upp. Om filtret avgör att det inte ska påverka texten, skickas texten vidare till nästa filter oförändrad. När ett textjobb, meddelande, varning eller &kde; underrättelsemeddelande skickas till &ktts;, går det igenom alla aktiverade filter som du har ställt in på skärmen nedan. Ordningen är uppifrån och ner. Efter att ha gått igenom alla vanliga filter listade i den övre delen av skärmen, skickas textjobb till filtren Detektering av meningsgräns (SBD-filtren). &kde;:s underrättelsemeddelanden, varningar och meddelanden går aldrig igenom SBD-filter. I motsats till vanliga filter, så stoppar det första SBD-filter som gör ändringar i texten ytterligare filtrering. Anpassa filter Klicka på fliken Filter i kttsmgr för att använda filter. &kde;:s text-till-tal hantering (fliken Filter). &kde;:s text-till-tal hantering (fliken Filter) Det här är listan med inställda vanliga filter. Om omarkerat, är filtret inaktivt och hoppas över. Filter används i ordningen som anges här, uppifrån och ner. Klicka här för att lägga till ett nytt filter. Du blir tillfrågad om vilken sorts filter som ska läggas till. Efter du har valt sort, se inställningsdialogrutorna nedan. Klicka här för att ta bort ett filter. Klicka här för att ändra ett filters inställning. Se inställningsdialogrutorna nedan. Klicka på knapparna för att flytta upp eller ner ett filter i listan. Det här är filtren för detektering av meningsgränser. När du startar &ktts; för första gången, ställs automatiskt standardfiltret för detektering av meningsgränser in åt dig. Du kan ändra filtrets inställning, eller lägga till ytterligare filter för detektering av meningsgränser, men vi råder nybörjare att inte ändra dem. Den här kombinationsrutan låter dig lägga till, ta bort, redigera eller ändra ordning på filter för detektering av meningsgränser. Försäkra dig om att du klickar här, annars får dina inställningar ingen effekt. Anpassa strängersättningsfilter Du ställer in stängersättningsfilter genom att tillhandahålla en lista med ord eller reguljära uttryck som ska matchas. När det matchade ordet eller reguljära uttrycket hittas i texten, ersätts vart och ett av en ersättningssträng som du anger. Matchningen är okänslig för skiftläget. Strängersättning Strängersättning Skriv in ett namn på ditt filter. Använd vilken namn du vill som skiljer det från alla andra filter. Det här är listan med ord och reguljära uttryck. Filtret söker efter matchande strängar för varje sträng i kolumnen Matcha, och ersätter den matchande strängen med strängen i kolumnen Ersätt med. Listan behandlas i ordningen den visas, uppifrån och ner. Klicka här för att lägga till ytterligare ett ord eller reguljärt uttryck i listan. Klicka här för att flytta ordet eller det reguljära uttrycket som för närvarande är markerat upp eller ner i listan. Klicka för att ändra ett befintligt ord eller reguljärt uttryck i listan. Klicka för att ta bort det befintliga ordet eller reguljära uttrycket som för närvarande är markerat från listan. Använd knapparna för att ladda en lista med ord eller reguljära uttryck från en fil, spara nuvarande lista till en fil, eller rensa hela listan. När du laddar från en fil, läggs posterna i filen till sist i den befintliga listan. Om inte tom, används filtret bara om språket för textjobbets talare stämmer med språket du skriver in här. Klicka på knappen för att visa en lista över språk. Du kan välja mer än ett språk genom att trycka på &Ctrl; när du klickar. Om inte tom, används filtret bara om texten kommer från ett av programmen som listas. Du kan skriva in mer än ett program åtskilda med kommatecken. Exempel: konversation,kmail. Du kan ta reda på Programidentifikation för program som kör med programmet &kdcop;. Du ska utelämna &DCOP;-numret. Om &kdcop; till exempel visar programidentifikationen kopete-3234, ska du bara skriva in kopete. Strängersättningsfiltret används bara för text om alla villkor som inte är tomma uppfylls i rutan Använd filtret när. Om alla rutor är tomma, gäller filtret all text. All matchning är okänslig för skiftläge. När ord matchas, använder strängersättningsfiltret ett reguljärt uttryck på formen \sord\s internt. Med andra ord, måste ordet ha ordgränser (blanktecken) på båda sidor. En beskrivning av hur man skriver reguljära uttryck är utanför den här handbokens omfattning. Om du har &kde;:s editor av reguljära uttryck installerad, finns en knapp tillgänglig på skärmarna Lägg till och Redigera som hjälper dig att skapa reguljära uttryck. &kde;:s editor av reguljära uttryck ingår i paketet tdeutils. &ktts; levereras med några filer med ordlistor, inklusive en lista med smilisar, som ":-)", några förkortningar som typiskt används i IRC- och direktmeddelandeprogram, och en lista med andra förkortningar. Det finns också en lista med specialtecken, som den nuvarande versionen av den polska rösten i Festival inte kan hantera. Om du utvecklar användbara egna ordlistor, använd knappen Spara för att spara dem i en fil, och skicka dem till &ktts;-gruppen så att de kan inkluderas i nästa version. Anpassa filter för &XML;-omvandling Filtret för &XML;-omvandling använder XSLT-filer för att omvandla &XML; från ett format till ett annat. XSLT, &XML;-stilspråkomvandlingar, är ett W3C standardspråk för att utföra sådana omvandlingar. Det kan bara användas med välformad &XML;. Du måste ha verktyget xsltproc installerat. &XML;-omvandlingar &XML;-omvandlingar Skriv in ett namn på ditt filter. Använd vilken namn du vill som skiljer det från alla andra filter. Skriv in fullständig sökväg till en befintlig XSLT-fil, som utför omvandlingen. Ange sökvägen till verktyget xsltproc. Om xsltproc finns i miljövariabeln PATH, skriv helt enkelt in xsltproc. Om inte tom, används filtret bara om &XML; har angivet rotelement eller specifikationen <![CDATA[<!DOCTYPE]]> som börjar med den angivna strängen. Det skiljer en form av &XML; från en annan. Till exempel html i rutan DOCTYPE matchar <![CDATA[<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">]]>. Om inte tom, används filtret bara om texten kommer från ett av programmen som listas. Du kan skriva in mer än ett program åtskilda med kommatecken. Exempel: konversation,kmail. Du kan ta reda på Programidentifikation för program som kör med programmet &kdcop;. Du ska utelämna &DCOP;-numret. Om &kdcop; till exempel visar programidentifikationen kopete-3234, ska du bara skriva in kopete. Filtret för &XML;-omvandling används bara för text om om angivet rotelement eller DOCTYPE stämmer och om program-id stämmer i rutan Använd filtret när. Om en ruta är tom, utförs inte testen, så om alla rutor är tomma gäller filtret för all text. Du bör dock fylla i minst en ruta, eftersom många textjobb inte har &XML;-format. Anpassa filter för val av talare Filter för val av talare används för att styra texten till en önskad talare inställd under fliken Talare, eller till någon talare som har angivna egenskaper. Du kan till exempel ange att text som kommer från kmail ska läsas upp av en talare som är inställd till en kvinnlig röst. Se . Precis innan &ktts; börjar skicka text till vart och ett av filtren, väljer det en talare som ska läsa upp texten. Valet av talare är baserat på talarens egenskaper som anges av programmet som skickar texten till &ktts;, och egenskaper hos talare som du har ställt in under fliken Talare. Filtret för val av talare tillåter att du överskrider den valda talaren. Val av talare Val av talare Skriv in ett namn på ditt filter. Använd vilken namn du vill som skiljer det från alla andra filter. Om inte tom, används filtret bara om texten innehåller det inskrivna reguljära uttrycket. Om den är installerad, klicka på bläddringsknappen för att starta &kde;:s editor av reguljära uttryck som hjälper dig att skriva in det reguljära uttrycket. För bättre prestanda, försök att "förankra" det reguljära uttrycket till strängens början. Med andra ord, inled ditt reguljära uttryck med . Om inte tom, används filtret bara om texten kommer från ett av programmen som listas. Du kan skriva in mer än ett program åtskilda med kommatecken. Exempel: konversation,kmail. Du kan ta reda på Programidentifikation för program som kör med programmet &kdcop;. Du ska utelämna &DCOP;-numret. Om &kdcop; till exempel visar programidentifikationen kopete-3234, ska du bara skriva in kopete. Ange egenskaper hos talaren som du föredrar ska läsa upp texten här. Om texten uppfyller filtervillkoren ovan, väljes en talare som passar bäst in på egenskaperna du anger här. Klicka på knappen till höger för att visa sidan Välj talare. Se . Använd knapparna för att spara inställningarna i Val av talare, för att ladda inställningar från en sparad fil, eller rensa alla inställningar. Filtret för val av talare används bara för text om alla villkor som inte är tomma uppfylls i rutan Använd filtret när. Du måste fylla i minst en av rutorna. Det enklaste sättet att lära sig hur val av talare ställs in är att experimentera. Inaktivera val av talare och låt någon text läsas upp. Observera talaren som &ktts; väljer under fliken Jobb. Klicka på knappen Ändra talare, skriv in några egenskaper, och försök igen för att se hur valet påverkas. Du måste förstås ha mer än en talar inställd för att val av talare ska göra någonting. Anpassa filter för att detektera meningsgränser Filter för att detektera meningsgränser (SBD-filter) delar upp texten i enskilda meningar. Det är viktigt eftersom det tillåter att &ktts; börjar läsa upp texten snabbare, eftersom det bara behöver syntetisera den första meningen, istället för hela textblocket, vilket kan vara mycket långt, och låter dig gå bakåt eller framåt mening för mening under fliken Jobb, och låter dig göra paus eller stoppa textjobb under fliken Jobb, även om talsyntesen inte har möjlighet att stoppas. Av dessa orsaker, ställs standardfiltret för detektering av meningsgränser automatiskt in första gången du kör kttsmgr och kan inte inaktiveras (även om du kan ta bort det). Vi råder dig att inte ändra filtret, om du inte vet vad du gör. Du kan dock lägga till ytterligare SBD-filter för att lösa vissa problem. Till exempel har den polska rösten i Festival, vid tidpunkten februari 2005, den irriterande egenskapen att den läser upp interpunktion. Den läser till exempel upp punkterna i slutet på varje mening. Du kan inte lösa problemet genom att skapa ett strängersättningsfilter för att ta bort meningarnas interpunktion, eftersom om du gör det förhindras det vanliga SBD-filtret från att känna igen några meningar. Istället kan du skapa en ändrad version av det vanliga SBD-filtret som känner igen meningar, och samtidigt tar bort meningarnas interpunktion. För att göra det, lägg till ett SBD-filter och använd knappen Ladda för att ladda filen polish_festival_sbdrc som levereras med &ktts;. SBD-filter fungerar genom att matcha ett reguljärt uttryck för meningsslut och infoga ett tabulatortecken (decimalt 8) vid meningsgränserna. (Alla tabulatortecken tas automatiskt bort från texten innan filtrering börjar.) Observera att standardfiltret bevarar meningens interpunktion. SBD-filter används aldrig för &kde;:s underrättelsemeddelanden (knotify), varningar, meddelanden eller skärmläsningsutmatning. Om du tar bort standardfiltret för att detektera meningsgränser av misstag, kan du få tillbaka det genom att ladda filen standard_sbdrc, som levereras med &ktts;. Välja talare (avancerat) Du kan ställa in hur många talare som helst under fliken Talare. Se . När program skickar text till &ktts; kan de ange egenskaper för en önskad talare som ska läsa upp texten. &ktts; väljer talaren som passar bäst in bland talarna som du har ställt in för att uppfylla programmets begäran. Ett program kan till exempel ange att texten ska läsas upp av en engelskspråkig kvinnlig röst. Om du har ställt in en talare som är engelskspråkig och kvinnlig används den talaren. Om du bara har ställt in engelskspråkiga manliga talare, används en av dem. Om ett program inte anger några egenskaper, används standardtalaren (den översta) som listas under fliken Talare. När program anger egenskaper för den önskade talaren, kan de ange att vissa egenskaper "föredras" framför andra egenskaper. Ett program kan till exempel ange att det önskar att en stark kvinnlig röst läser upp texten, och att egenskapen stark "föredras" framför egenskapen kvinnlig. Om du har en tyst kvinnlig röst och en stark manlig röst inställda, väljer &ktts; den starka manliga rösten för att göra uppläsningen. Eftersom språk är en kritisk parameter för att göra uppläsningen förståelig, är det alltid en "föredragen" egenskap. Genom att använda sidan Välj talare, kan du överskrida talarinställnigar från program. Sidan visas när du klickar på knappen Ändra talare under fliken Jobb, eller när du klickar på knappen Talare i dialogrutan Filterinställning för ett filter för val av talare, eller när du klickar på knappen Talare under fliken Underrättelser. Val av talare Val av talare Sidan erbjuder tre sätt att ange egenskaper för önskade talare: Använd standardtalaren (överst på sidan Talare). Med andra ord, anges inga egenskaper för talare. Använd talaren som passar bäst in med en eller flera angivna egenskaper. Använd talaren som passar bäst och har alla egenskaper hos en inställd talare. Om du inte tar bort eller ändrar talarens inställning, väljer &ktts; den specifika talaren. Om du tar bort eller ändrar talarens inställningar, väljer &ktts; talaren som passar bäst och har talarens ursprungliga egenskaper. Välj sätt att skriva in önskade talaregenskaper genom att klicka på en av alternativknapparna. Välj egenskaper för önskade talare här. Lämna en egenskap tom om du inte bryr dig om den egenskapen. Markera rutan om du vill att egenskapen ska "föredras" framför andra egenskaper. Du kan markera mer än en ruta. Eftersom språk är en kritisk faktor för att göra tal förståeligt, är det alltid en föredragen egenskap. Det är sällsynt att använda egenskapen. Det enda tillfället du kan behöva ange språkegenskapen är när du vet att ett visst program skickar text på ett språk som skiljer sig från skrivbordets språk. Det här är en lista över talare som du för närvarande har ställt in i &ktts;. Genom att välja en av dem, anger du på så sätt alla egenskaper för talaren. Om talaren fortfarande är inställd när text skickas, får du en exakt träff och talaren väljes. Om du dock senare tar bort talaren, eller ändrar inställningarna, kanske det inte blir den valda talaren längre. Talaren som passar bäst in på de ursprungliga egenskaperna väljes. Egenskapen Språk är speciell eftersom text troligen blir omöjlig att förstå om den läses upp av en talare som använder ett språk som skiljer sig från textens. Därför är språket automatiskt en egenskap som "föredras". Om du anger ett språk, överskrider det valt språk, men om du lämnar det tomt, används den befintliga språkinställningen. Om programmet som skickar texten till &ktts; inte angav ett språk, tilldelar &ktts; den översta talarens språk som du har ställt in under fliken Talare. Med andra ord, den översta talaren antas tala skrivbordets språk. För att rensa alla egenskaper i sektionen Använd närmaste matchande talare som har, klicka först på alternativknappen Använd förvald talare, och klicka därefter på alternativknappen Använd närmaste matchande talare som har. Kommandoreferens Att göra. Utvecklingsguide för &ktts; &ktts; har två programmeringsgränssnitt (API:er): &kde;:s text-till-tal programmeringsgränssnitt som används av programmerare för att ge programmen text-till-tal funktioner. Program kommunicerar med KTTSD via &DCOP;. KTTSD gränssnitt för insticksprogram som används för att lägga till insticksprogram för talsyntes till KTTSD, så att &ktts; fungerar med ett nytt talsyntesprogram. Följande avsnitt ger en kort beskrivning av &kde;:s text-till-tal programmering med &DCOP;-gränssnitt. Fullständig dokumentation för båda programmeringsgränssnitten är tillgänglig direkt på &kde;:s webbplats för handikappstöd (http://accessibility.kde.org). &DCOP;-gränssnittet i &ktts; Program skickar begäran om text-till-tal tjänster via &kde;:s &DCOP;-gränssnitt till objektet KSpeech i programmet kttsd. Skriv in följande kommandon i en terminal. Om KTTSD inte redan kör kttsd För att köa ett textjobb som ska läsas upp dcop kttsd KSpeech setText "text" "talare" där text är texten som ska läsas upp, och talare är en språkkod som en, sv, etc. Kommandot läser inte upp texten, utan istället köar det ett textjobb för uppläsning. Exempel. dcop kttsd KSpeech setText "Det här är en test." "sv" För att läsa upp det senast köade textjobbet dcop kttsd KSpeech startText 0 I det här fallet, hänvisar 0 till det senast köade jobbet. Du kan också ange ett specifikt jobbnummer. (Om inget jobbnummer anges, krävs 0.) För att stoppa textjobbet som för närvarande läses upp dcop kttsd KSpeech stopText 0 Beroende på vilket insticksprogram för talsyntes som används, kanske inte uppläsningen stoppar omedelbart. Det finns många fler kommandon som kan skickas. För att se en lista av möjliga kommandon, skriv dcop kttsd KSpeech eller läs &kde;:s text-till-tal programmeringsgränssnitt direkt. Vanliga frågor &reporting.bugs; &updating.documentation; kttsmgr kraschar omedelbart när jag startar det. Jag kompilerade med avlusningsstöd, och jag får inte ens en bakåtspårning. Gstreamer har kraschat och dragit med &ktts;. Du måste troligen "registrera" Gstreamer. För Gstreamer 0.8x är kommandot gst-register-0.8. Om det inte löser problemet, kanske du har en version av Gstreamer som inte fungerar med &ktts; installerad. Du skulle kunna försöka uppdatera eller att avinstallera Gstreamer. ALSA-ljudutmatning fungerar inte om jag spelar musik i ett annat program samtidigt. När jag gör paus i ett textjob, fryses &ktts;. Jag ser "unable to open PCM" i terminalutmatningen. Du har problemet med konflikt över enheter i ALSA, som förhindrar att mer än en PCM-enhet öppnas åt gången. Se ALSA:s webbplats (dmix) för möjliga lösningar. www.alsa-project.org Jag måste börja om. Hur gör jag för att helt avsluta &ktts;? Skriv in följande kommandon i en terminal: killall kttsd killall kttsmgr Hur kan jag se avlusningsutmatning från kttsd? Öppna två terminalfönster. Starta först kttsd i ett fönster, och starta därefter kttsmgr i det andra. Jag har en ytterligare röst för Festival som jag laddade ner från Internet. Jag installerade den och kan använda den i Festival, men den visas inte i kttsmgr. Redigera filen $TDEHOME/share/apps/kttsd/festivalint/voices för att lägga till den nya rösten. Övriga poster kan användas som guide. Om du lägger till en röst med lyckat resultat, skicka gärna en programfix till utvecklarna, tillsammans med webbadressen där du hämtade röstfilen. Ingen av talsyntesprogrammen som stöds, hanterar språket jag behöver. Var kan jag få tag på ett talsyntesprogram för mitt språk? Google™ är till stor hjälp. Den här länken kan också vara användbar. Om du hittar ett fritt talsyntesprogram som stöder ditt önskade språk, och vill lägga till stöd för den i &ktts;, kontakta utvecklingsgruppen. Program med öppen källkod är särskilt välkomna. Om du känner till ett kommersiellt syntesprogram, kan du kanske övertala tillverkaren att donera en gratis kopia till utvecklingsgruppen för &ktts;. Under tiden kan du få syntesprogrammet att fungera med insticksprogrammet Kommando. Se . &ktts; talar för långsamt. Hur kan jag snabba upp talet? Under fliken Ljud finns inställningen Hastighet. För att den ska fungera, måste verktyget sox vara installerat och i din sökväg. Vissa syntesinsticksprogram, som Festival interaktiv tillhandahåller också inställningen Hastighet i inställningsdialogrutan för talare. Beroende på rösten som används, kan den vara aktiverad eller inte. Ok, det fungerar för vissa saker, men webbsidor läses fortfarande upp för långsamt. Hastighetsinställningarna ignoreras när &ktts; läser upp &HTML;. (Det beror på att &HTML; konverteras till SSML, som har sina egna hastighetstaggar.) Inaktivera antingen filtret för &HTML; &XML;-omvandling (se ), eller om du är dristig, redigera .xsl-filen i filtret för omvandling av &HTML; till SSML, och öka förvald talarhastighet. Jag kan inte få webbsidor att läsas upp med en kvinnlig röst. Jag har en kvinnlig talare inställd i Festival, men &ktts; läser alltid upp webbsidor med en manlig röst. Från och med Festival 1.95 beta, verkar inte taggen SABLE GENDER fungera. För att förhindra att Festival ger fel, tar .xsl-filen för SSML till SABLE bort könstaggar. Detsamma gäller också för rösttaggar. Jag har ställt in filtret för omvandling av &HTML; till &XML;, men webbsidor läses inte alls upp med Festival-insticksprogrammet. På grund av ett fel i Festival 1.95 beta, måste du installera rösten rab_diphone (brittisk man) för att SABLE överhuvudtaget ska fungera, även om du inte använder rösten för att läsa upp webbsidorna. Försäkra dig också om att verktyget xsltproc är installerat och i din sökväg. Vissa tecken eller interpunktion verkar ge fel i talsyntesen, som gör att den hoppar över hela meningar, eller uttalar nonsens. Vad kan jag göra? Försäkra dig först om att alternativet Teckenkodning i talarens inställningsdialogruta är riktigt inställd för språket. Om vissa ord eller tecken orsakar problem, kan ett strängersättningsfilter hjälpa. Om vissa interpunktionstecken för meningar förvillar talsyntesen, måste du ställa in ett filter för detektering av meningsgränser. Se . Jag har lagt till ett eget strängersättningsfilter och nu låter inte &ktts; mig gå tillbaka eller framåt mening för mening. Under fliken Jobb, påstås att varje jobb bara har en enda mening. Vad har jag gjort för fel? Du får inte filtrera bort tecken för interpunktion av meningar (punkt, frågetecken, utropstecken, kolon och semikolon). Använd istället ett filter för detektering av meningsgränser för dessa tecken. Tack till och licens &ktts; Program Copyright © 2002 José Pablo Ezequiel "Pupeno" Fernández pupeno@kde.org Nuvarande utvecklare: Gary Cramblitt garycramblitt@comcast.net Bidragsgivare: Olaf Schmidt ojschmidt@kde.org Gunnar Schmi Dt gunnar@schmi-dt.de Paul Giannaros ceruleanblaze@gmail.com Dokumentation Copyright © 2004 Gary R. Cramblitt garycramblitt@comcast.net Översättning Stefan Asserhäll stefan.asserhall@comhem.se &underFDL; &underGPL; Talsyntesprogram som används av &ktts; har sina egna licenser. Se dokumentationen för varje program eller webbplats för detaljinformation. Vissa röster har också sin egen licens. Installation Hur man skaffar &ktts; &install.intro.documentation; FRAMTIDA: Debian installationskommando: apt-get install tdeaccessibility Du hittar länkar till källkod och binärpaket på &kde;:s webbplats för handikappstöd (http://accessibility.kde.org). Om du har tillgång till &kde;:s kodarkiv, kan du ladda ner &ktts; genom att checka ut modulen tdeaccessibility. &ktts; finns i katalogen kttsd. Du kan också ladda ner ett komprimerat arkiv med källkoden för tdeaccessibility från ftp://ftp.kde.org/pub/kde/ Krav Nödvändiga krav: &kde; version 3.2 eller senare. Ett talsyntesprogram. Följande program och talade språk stöds för närvarande: Festival Amerikansk engelska, brittisk engelska, spanska, tyska, finska, tjeckiska, polska, ryska, italienska, kanadensisk franska, kiswahili, zulu, and ibibio Festival Lite (flite) Engelska Hadifix (&mbrola; och txt2pho) Tyska, ungerska Epos Tjeckiska, slovakiska FreeTTS Engelska Det fungerar också med vilket talsyntesprogram som helst som kan köras från ett kommando i en terminal. Språken som listas ovan kanske inte är fullständiga eller aktuella. Kontrollera varje programs specifikation för en fullständig lista med språk som stöds. Kontrollera dessutom &ktts; hemsida för ytterligare information som kanske inte har kommit in i handboken. &ktts; använder en flexibel insticksprogramarkitektur för talsyntesprogram. Om du vill utöka &ktts; för att stöda ytterligare ett program, kontakta utvecklingsgruppen. Se för specifika instruktioner för vart och ett av dessa program. Åtminstone ett av följande ljudsystem: &kde;:s ljudsystem &arts;. &arts; är oftast installerat med &kde;. ALSA (Avancerad &Linux; ljudarkitektur). ALSA är installerat på de flesta &Linux;-system. (www.alsa-project.org) Gstreamer version 0.8.7 eller senare. Observera: försäkra dig om att registrera dina Gstreamer insticksprogram genom att köra kommandot gst-register innan Gstreamer används i &ktts;. (http://gstreamer.freedesktop.org) aKode-biblioteket. aKode är ett avkodarbibliotek som är en del av &kde;. &kde;-projektet planerar att sluta använda &arts; från version 4. Vissa användare upplever konflikt över enheter med ALSA. Om systemet har problemet, kan du inte samtidigt spela musik och läsa upp text. &ktts; fryses också om du gör paus i ett textjobb och därefter startar ett annat. Se ALSA:s webbplats (dmix) för möjliga lösningar. Vid juli 2005 stöder inte aKode en verklig pausmöjlighet. När du gör paus i ett textjobb i &ktts; fortsätter det läsa nuvarande mening. Valfria komponenter: Ljudverktyget sox behövs för att justera allmän uppläsningshastighet, men krävs inte. Debian-användare kan installera sox med kommandot apt-get install sox. Sox ingår i de flesta distributions-cd med &Linux;. Verktyget xsltproc behövs för SSML-stöd och för &XML;-omvandling, men krävs inte. Debian-användare kan installera xsltproc med kommandot apt-get install xsltproc. Kompilering och installation För att kompilera &ktts; måste du ha en aktuell kopia av &kde;:s utvecklingsfiler (&kde; 3.4 eller senare), inklusive tdelibs och arts. Om du har laddat ner &ktts; som ett komprimerat arkiv, logga in som en vanlig användare och packa upp arkivet i en lämplig katalog, gå till katalogen, och skriv in följande kommandon: ./configure make Följande väljare till configure är tillgängliga: Förvald väljare Beskrivning Reserv --with-arts Bygger ljudinsticksprogrammet aRts. --without-arts --with-alsa=check Bygger ALSA-ljudinsticksprogrammet --with-alsa=no --with-gstreamer=no Bygger inte Gstreamer-ljudinsticksprogrammet --with-gstreamer=check --with-akode=no Bygger inte aKode-ljudinsticksprogrammet --with-akode=check I &kde; 4, kommer troligen insticksprogrammet &arts; tas bort eller åtminstone inte byggas som förval. Följande insticksprogram för talsyntes byggs alla normalt. Vissa av dem beror bara på icke-fri programvara vid körning (icke-fri enligt Debians policy). Kolumnen "Väljare till configure för att inte bygga" visar kommandot till configure för att inte bygga insticksprogrammet. Talsyntes Licens Inställningsalternativ för att inte bygga Festivalfri--disable-kttsd-festivalint Festival Litefri--disable-kttsd-flite Eposfri--disable-kttsd-epos Kommandofri--disable-kttsd-command Hadifixicke-fri--disable-kttsd-hadifix FreeTTSicke-fri--disable-kttsd-freetts Normalt installerar kommandona ovan &ktts; i /opt/kde3. Om katalogen inte finns i sökvägen $TDEDIRS, kan du behöva lägga till väljaren --prefix=mål. Till exempel: ./configure --prefix=/usr/local make På Debian-system är /usr/local det vanliga stället att installera program som kompileras från källkod. Logga in som systemadministratör och installera det kompilerade &ktts; med följande kommandon: su make install Om du laddade ner källkoden för &ktts; från modulen tdeaccessibility i kodarkivet, eller laddade ner det komprimerade arkivet som skapas varje natt, använd följande kommandon för att kompilera och installera. cd tdeaccessibility echo kttsd>inst-apps make -f Makefile.cvs ./configure cd kttsd make su make install Anpassning Försäkra dig om att ditt talsyntesprogram fungerar innan du använder &ktts;. Följ instruktionerna som levererades med programmet. I vissa fall måste du ge skrivåtkomst till ljudenheten. chmod a+rw /dev/dsp* Användning med Festival (interaktivt) Festival är ett av de bättre fria text-till-tal programmen med öppen källkod som är tillgängliga. Röstkvalitet är i allmänhet bra och det finns stöd för en hel del språk och röster. För många röster kan du styra volym, det upplästa talets hastighet och tonhöjd från &ktts;. Syntesnamn: Festival interaktiv Webbadress: http://www.cstr.ed.ac.uk/projects/festival/ Debian installationskommando: apt-get install festival Du måste installera minst ett språk. Följ instruktionerna som levereras med Festival. Om du kommer att läsa upp webbsidor, måste du installera rösten rab_diphone (brittisk man). Ytterligare engelska röster för Festival är tillgängliga från http://hts.ics.nitech.ac.jp/. Ytterligare spanska, engelska och tyska röster är tillgängliga från http://cslu.cse.ogi.edu/tts/download/ Du måste kompilera ytterligare en modul för dessa röster, och därför måste du ha källkoden för Festival. De tyska rösterna har en begränsad distribution. En finsk manlig röst är tillgänglig från http://www.ling.helsinki.fi/suopuhe/download/. En polsk manlig röst är tillgänglig från http://www.artegence.com/download/voicexml/speech/festival_polish_voice.tgz. En rysk manlig röst är tillgänglig från http://nshmyrev.narod.ru/festival/festival.html Du måste ha Festival 1.95 beta eller senare för att använda rösten. Rösten är fortfarande i en tidig utvecklingsfas. Packa upp i festival/lib/voices/russian/. När du ställer in den ryska talaren, är röstkoden msu_ru_nsh_diphone. Försäkra dig om att välja en 8-bitars kyrillisk kodning, såsom KOI8-R. Italienska röster för Festival 1.95 beta är tillgängliga på http://www.csrf.pd.cnr.it/TTS/It-FESTIVAL-download.htm. Om du får CRC-fel när du packar upp, försök ladda ner igen. Kiswahili, zulu och ibibio röster för Festival 1.95 beta är tillgängliga på http://www.llsti.org/. Tyvärr fungerar inte Hindi rösten som också är tillgänglig här med &ktts;. Kommersiella röster, inklusive en franskkanadensisk röst, kan köpas av Cepstral, LLC på http://www.cepstral.com/ Vanliga frågor på deras supportsida har information om hur deras röster används i Festival. Festival ingår ofta i &Linux;-distributioner. Kontrollera din distributions-cd för att se om det ingår. När språken polska, ungerska eller tjeckiska används, försäkra dig om att alternativet Kodning är inställt till ISO 8859-2. När den ryska rösten används, försäkra dig om att alternativet Kodning är inställt till en 8-bitars kyrillisk kodning, till exempel KOI8-R. Använda Festival med &mbrola; Festival kan användas i kombination med &mbrola;-talsyntes. I detta läge gör Festival lexikalanalysen och &mbrola; skapar ljudet. &mbrola;-binärfilen och &mbrola;-röstfiler kan laddas ner från http://festvox.org/mbrola/. Följ instruktionerna i filen readme.txt som ingår i nerladdningen. Observera att &mbrola; inte är ett fullständig system för text-till-tal. &mbrola; syntetiserar tal från difonfiler. Du måste ha ytterligare programvara som kan skapa difonerna. Vid kombination med Festival, skapar Festival difonerna som &mbrola; behöver. txt2pho kan också användas för att skapa difoner från tysk text. Se Användning med Hadifix för mer information. Det finns tre metoder för att kombinera Festival med &mbrola;. &mbrola;-omgivning. När den här handboken skrivs, är metoden begränsad till engelska röster. IMS tyska Festival. Tjeckisk Festival. Använda Festival med &mbrola;-omgivning Med den här metoden läggs ytterligare omgivningskod till i Festival för att möjliggöra talsyntes med &mbrola; röstfiler. Observera att &mbrola;-röstfilerna inte installeras i &mbrola;-katalogträdet. Istället installeras de i katalogträdet festival/lib. För instruktioner, se http://www.cstr.ed.ac.uk/projects/festival/mbrola.html Använda IMS tyska Festival IMS tyska Festival är en ändrad version av Festival som använder tyska &mbrola;-röster. Den fungerar antingen med Festival version 1.4.1 eller Festival 2.0 (1.95 beta). Installera först Festival och &mbrola;, om du inte redan har gjort det. Ladda därefter ner IMS tyska Festival från http://www.ims.uni-stuttgart.de/phonetik/synthesis/festival_opensource.html. Följ instruktionerna i filen README som ingår i nerladdningen. (Observera: om det används tillsammans med Festival 2.0, är det inte nödvändigt att installera det komprimerade arkivet fixes, men du måste ändå bygga om Festival.) Lägg till sist till följande rader i filen festival/lib/siteinit.scm. (voice-location "german_de1_os" "/usr/local/mbrola/de1" "German Female, IMS Festival de1") (voice-location "german_de2_os" "/usr/local/mbrola/de2" "German Male, IMS Festival de2") (voice-location "german_de3_os" "/usr/local/mbrola/de3" "German Female, IMS Festival de3") precis ovanför raden som lyder (provide 'siteinit) (På vissa system, är filen du redigerar /etc/festival.scm.) Lägg bara till raderna som motsvarar de tyska röster som du har installerat. Ersätt /usr/local/mbrola med rätt sökväg. Observera också att IMS tyska Festival inte fungerar med de tyska rösterna de4, de5 eller de6 (när det här skrivs). Använda tjeckisk Festival Den här metoden använder en del speciell kod för att aktivera talsyntes med användning av Festival och en &mbrola; tjeckisk röst. För att installera den, ladda först ner och installera Festival och &mbrola; och försäkra dig om att båda fungerar. Ladda därefter ner tjeckiska Festival från http://www.freebsoft.org/festival-czech Ersätt riktiga katalogsökvägar efter behov i följande procedurer. Packa upp nerladdningen i en lämplig katalog och bygg ordboken. Den körbara filen för Festival måste finnas i din PATH. cd /usr/local tar xvfz festival-czech.tar.gz cd festival-czech make Ladda ner röstfilen cz2 från &mbrola;:s webbplats, och packa upp den i &mbrola;:s katalog. cd /usr/local/mbrola mkdir cz2 cd cz2 unzip cz2-001009.zip Lägg till följande rader i filen festival/lib/siteinit.scm : (set! czech-lexicon-file "/usr/local/festival-czech/czech-lexicon.out") (set! load-path (cons "/usr/local/festival-czech" load-path)) (require 'czech) (set! czech-mbrola_database "/usr/local/mbrola/cz2/cz2") (set! mbrola_progname "/usr/local/mbrola/mbrola") (voice-location "czech_mbrola_cz2" "/usr/local/mbrola/cz2" "Czech Male, MBROLA") (require 'czech-mbrola) precis ovanför raden som lyder (provide 'siteinit) (På vissa system är filen du redigerar /etc/festival.scm) Användning med Festival Lite (flite) Festival Lite är ett fritt program med öppen källkod som för närvarande stöder ett begränsat antal röster och språk. Det är lättviktigt, men offrar i viss mån röstkvalitet. Du kan inte styra tonhöjd, volym eller hastighet för programmet från &ktts;. Syntesnamn: Festival Lite (flite) Webbadress: http://www.speech.cs.cmu.edu/flite/index.html Debian installationskommando: apt-get install flite Programmet flite ingår ofta i &Linux;-distributioner. Kontrollera din distributions-cd för att se om det ingår. Bygg och installera flite genom att följa instruktionerna i filen README som levereras med det. Användning med Hadifix (&mbrola; och txt2pho) Hadifix är ett tvåstegs talsyntesprogram baserat på difoner. Verktyget txt2pho konverterar text till difoner och programmet &mbrola; syntetiserar difonerna till ljud. Röstkvaliteten är bra, men språkstödet är för närvarande något begränsat. Du kan styra röst, tonhöjd, hastighet och volym från kttsmgr. Syntesnamn: Hadifix Webbadress: se nedan Debian installationskommando: inget Om du inte redan har installerat Hadifix, gör följande: Ladda ner &mbrola;-binarfiler från http://festvox.org/mbrola/. Installera &mbrola; i katalogen /usr/local/mbrola. Ladda ner minst en tysk språkfil från &mbrola;-platsen. Packa upp den i katalogen /usr/local/mbrola. Ladda ner txt2pho från http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html. Packa upp txt2pho till /usr/local/txt2pho. Redigera filen txt2phorc, och lägg till riktiga datavägar. Kopiera antingen txt2phorc till ~/.txt2phorc eller till /etc/txt2pho. Observera att du tar bort "rc" från filnamnet. Välj språket tyska i kttsmgr (de), och lägg till Hadifix. På skärmen Anpassa talare, ställ in en röst och sökvägarna till &mbrola; och txt2pho. Klicka på knappen Testa för att testa. En ungersk implementering av &mbrola; och txt2pho är tillgänglig på http://tkltrans.sourceforge.net/. Användning med Epos Epos är ett fritt tjeckiskt och slovakiskt program med öppen källkod. Det är lättviktigt, men offrar i viss mån röstkvalitet. Du kan inte styra volym för programmet från &ktts;. Syntesnamn: Epos text-till-tal syntessystem Webbadress: http://epos.ure.cas.cz/ Debian installationskommando: apt-get install epos Starta kttsmgr. Klicka på knappen Lägg till på sidan Talare. Välj språket tjeckiska eller slovakiska och Epos text-till-tal syntessystem. Om den körbara Epos-servern och klienten inte finns i din sökväg, skriv in fullständiga sökvägar till dessa körbara program på sidan Anpassa talare. Alternativrutorna tillåter dig att skicka ytterligare väljare till servern och klienten. Skriv epos -h eller say -h i en terminal för information. Användning med FreeTTS FreeTTS är ett fritt talsyntesprogram med öppen källkod skrivet i &Java;, vilket betyder att du måste ha &Java; virtuella maskin installerad i ditt system för att använda den. Den har för närvarande begränsat stöd för röster och språk. Du kan inte styra tonhöjd, volym eller hastighet för programmet från &ktts;. Syntesnamn: FreeTTS Webbadress: http://sourceforge.net/projects/freetts/ Debian installationskommando: inget Använda insticksprogrammet för kommando Insticksprogrammet för kommando tillåter att du använder &ktts; med vilket talsyntesprogram som helst som kan köras som ett kommando i en terminal. Syntesnamn: Kommando Webbadress: ingen Debian installationskommando: inget Idealiskt bör du använda ett kommando som syntetiserar till en tillfällig ljudfil (wav), istället för att direkt skicka talet till ljudenheten. Om talsyntesprogrammet kräver att text ska ha en annan kodning från skrivbordets kodningsinställning, måste du använda väljaren %f för att skicka texten till programmet. &ktts; kodar texten med inställningen du anger när det skriver texten till den tillfälliga filen. Om du försöker skicka text på kommandoraden med väljaren %t, kodas den med kodningsinställningen i skrivbordets landsinställning. Du kan också använda alternativet Skicka data som standardinmatning för att lösa problemet, om programmet accepterar indata från standardinmatningen. Här är ett exempel på ett kommando för att skicka polsk text till Festival med kodningen ISO 8859-2 och ta bort interpunktionstecken som inte ska läsas upp. cat %f | tr '(){}[]"' ' ' | festival --tts --language polish &documentation.index;