KTTS"> MBROLA"> ]> O Manual do &kmyapplication; Gary R. Cramblitt garycramblitt@comcast.net MarcusGama
marcus_gama@uol.com.br
Tradução
2004-2005 Gary R. Cramblitt &FDLNotice; 2005-02-01 1.03.00 &kmyapplication; - o sistema de Texto-para-Voz do KDE - é um serviço baseado em plugins que permite a qualquer aplicativo (KDE e não-KDE) falar com a interface de DCOP. O &kmyapplication; pretende ser a implementação da API de Texto-para-Voz do KDE. KDE acessibilidade tdeaccessibility TTS Texto-para-Voz KTTSD kttsmgr festival flite hadifix MBROLA freetts epos SSML
Introdução O &kmyapplication; é um sub-sistema no KDE para produzir Texto-para-Voz (do inglês, TTS). Ele oferece uma API comum para os programadores do KDE usarem os recursos de TTS para os seus aplicativos. Ele oferece algumas capacidades boas também para os usuários finais. Recursos para o usuário: Falar o conteúdo de um arquivo de texto. Falar os eventos de notificação do KDE (KNotify). Falar todo ou parte do texto de uma página Web no Konqueror. Falar todo ou parte do texto no editor de texto Kate, incluindo as instâncias em que o Kate está embutido noutro aplicativo do KDE. O texto comprido é processado em frases. O usuário poderá salvaguardar por frase ou parágrafo, repetir, pausar e parar a reprodução. Saída de áudio através do aRts ou do GStreamer (versão 0.8.7 ou posterior) Filtros configuráveis pelo usuário para substituição de palavras pronunciadas de maneira errada, selecionando sintetizadores de voz, e transformando documentos XML. Recursos para o programador: Um sistema de prioridades para o resultado do leitor da tela, dos avisos e das mensagens, enquanto reproduz ainda os textos normais. Uma arquitetura baseada em plugins para suportar uma grande variedade de sintetizadores e controladores de voz. Permite a geração de fala a partir da linha de comando (ou através de 'scripts'), usando os utilitários de DCOP do KDE. Oferece uma interface leve e fácil de usar para os aplicativos gerarem conteúdos falados. Os aplicativos não precisam se preocupar com a conteção sobre o dispositivo de voz. FUTURO: Oferecer o suporte para as linguagens de formatação de voz, como o VoiceXML, o Sable, a Java Speech Markup Language (JSML) e a Speech Markup Meta-language (SMML). FUTURO: Oferecer um suporte limitado para marcadores de voz embutidos. Assíncrono, para evitar o bloqueio do sistema. O &kmyapplication; consiste de fato em vários programas: kttsd O Servidor de Texto-para-Voz do KDE, que é um aplicativo não-gráfico que oferece os serviços de TTS aos aplicativos através do DCOP. kttsmgr um aplicativo gráfico para configurar e controlar o 'kttsd'. O 'kttsmgr' fica na bandeja do sistema. libtdehtmlkttsdplugin Um plugin para o navegador Web Konqueror que lhe permite falar todo ou parte do texto numa página Web. tdetexteditor_kttsd Um plugin para o editor de texto Kate que lhe permite falar todo ou parte de um arquivo de texto. Suporte Além da base de dados do Bugzilla do KDE ( http://bugs.kde.org/ ), as discussões sobre o &kmyapplication; acontecem atualmente na lista de correio 'kde-accessibility'. Inscreva-se em https://mail.kde.org/mailman/listinfo/kde-accessibility. A equipe de desenvolvimento também costuma aparecer no IRC (irc.kde.org, canal #kde-accessibility). Usando o &kmyapplication; Antes de poder usar o &kmyapplication;, você deverá instalar pelo menos um motor de síntese de voz e garantir que ele funcione. Veja em . Iniciando o <command>kttsmgr</command> Para iniciar o sistema do &kmyapplication;, digite o seguinte comando num Konsole kttsmgr ou clique no &kmyapplication; no Menu do KDE. Se for a primeira vez que executa o kttsmgr, ou se ainda não configurou nenhum Locutor, a tela de Locutores aparecerá. Veja em . Se já tiver configurado pelo menos um locutor, a tela Geral aparece. Veja em . Selecionando os Plugins de Síntese (Locutores) Quando clica na página de Locutores do kttsmgr, a tela de Locutores aparece. O Gerenciador de Texto-para-Voz do KDE (página Locutores). O Gerenciador de Texto-para-Voz do KDE (página Locutores) Clique aqui para adicionar um novo locutor, que é um plugin de síntese de voz. Todos os Locutores estão listados aqui. Os Locutores de maior prioridade encontram-se no topo. O locutor do topo será usado para falar, quando um aplicativo não indicar nenhum locutor específico. Clique num locutor da lista para selecioná-lo e clique neste botão para removê-lo. Clique num locutor da lista para selecioná-lo e clique neste botão para mostrar o diálogo de configuração do plugin de síntese. Clique num locutor da lista para selecioná-lo e clique neste botão para descê-lo uma posição na lista. Quanto mais baixo estiver um locutor na lista, menor a sua prioridade. Clique num destes botões para aplicar as alterações que tenha feito ao sistema &kmyapplication; em execução. Quando clicar no botão Adicionar, a tela para Adicionar Locutor aparece. A tela para Adicionar Locutor. A tela para Adicionar Locutor Você poderá selecionar um plugin de síntese de voz pelo nome do Sintetizador ou pelo Idioma que o sintetizador consegue falar. Assinale a opção ao lado da área correspondente. Quando o botão do Idioma estiver assinalado, a área do Idioma mostra todos os idiomas suportados por todos os sintetizadores disponíveis e a área do Sintetizador mostra apenas os que suportam o idioma escolhido. Quando estiver a opção do Sintetizador selecionada, a área do Sintetizador mostra todos os que se encontram disponíveis e a do Idioma mostra apenas os idiomas suportados pelo sintetizador escolhido. Escolha aqui o idioma e o plugin de síntese. Quando clicar aqui, a maioria dos plugins de síntese se configurarão automaticamente eles mesmos, escolhendo uma configuração padrão. Irá aparecer um novo locutor na lista da página Locutores. Clique no botão Configurar para mostrar ou editar a configuração do locutor. Veja . Você precisa de configurar pelo menos um locutor e de clicar nos botões Aplicar ou OK antes de poder iniciar o sistema do &kmyapplication; e começar a falar o texto. Para iniciar o sistema &kmyapplication;, clique na página Geral e assinale a opção Ativar o Sistema de Texto-para-Voz (KTTSD). Veja em . Configurando os Plugins de Síntese (Locutores) Quando você clica no botão Adicionar da página Locutores e adiciona um locutor ou clica no botão Configurar, a tela de Configuração do Locutor aparece. Cada plugin de voz possui uma tela de Configuração do Locutor diferente. O exemplo a seguir é para configuração do Festival Interative. Para mais detalhes específicos sobre cada tipo de plugin, veja . Configuração do Locutor Configuração do Locutor Indique a localização do programa executável do Festival. Se o Festival estiver na sua variável de ambiente PATH, basta inserir festival. Clique para procurar por vozes disponíveis. Selecione uma voz. Clique para testar. Você deverá ouvir agora uma frase de teste falada. Use estas opções para controlar o volume, a velocidade da síntese e o tom da voz sintetizada. Se qualquer uma destas opções estiver desabilitada (em cinza), a voz escolhida não suporta mudanças. Algumas vozes, como as do MultiSyn, são tão grandes que necessitam de vários segundos para serem carregadas. Se assinalar esta opção, fará com que elas sejam carregadas na inicialização do KTTSD, poupando deste modo algum tempo (com a contrapartida de usar mais memória), antes da primeira frase ser sintetizada. Clique no botão Ok para salvar a configuração do locutor. Certifique-se de que clica no botão Aplicar, caso contrário as suas alterações não farão efeito no sistema &kmyapplication; em execução. Assumindo que o teste funcionou, já está quase pronto para começar a usar o &kmyapplication;. Volte agora à página Geral e assinale a opção Ativar o Sistema de Texto-para-Voz (KTTSD). Isto irá iniciar o Servidor de TTS do KDE. Veja . Você poderá começar a usar agora o &kmyapplication; para dizer o texto. Clique na página Tarefas para criar e gerenciar as tarefas de texto. Veja em . Iniciando o KTTSD e Configurando as Opções Gerais Logo que tenha configurado pelo menos um Locutor, você poderá iniciar o Sistema de Texto-para-Voz do KDE. Clique na página Geral. Neste caso, aparecerá a tela Geral. Você poderá também configurar algumas opções gerais nesta tela. O Gerenciador de Texto-para-Voz do KDE (página Geral). O Gerenciador de Texto-para-Voz do KDE (página Geral) Assinale esta opção para ativar o sistema &kmyapplication;. Isto irá iniciar o Servidor de TTS do KDE (KTTSD). Se o KTTSD iniciar com sucesso, irá aparecer a página de Tarefas. Logo que o KTTSD tenha sido iniciado, você poderá começar a criar e a falar as tarefas de texto. Veja em . Se desligar a opção, irá parar o KTTSD e desativar o sistema de TTS do KDE. Se esta opção estiver desativada, ainda não configurou nenhum Locutor (ou então esqueceu-se de clicar no botão Aplicar). Veja em . Assinale esta opção para falar as notificações do KDE. Veja em para obter mais informações. Assinale esta opção para falar somente as notificações do KDE que sejam exibidas em uma janela instantânea. Assinale esta opção para falar somente as notificações do KDE que sejam exibidas em uma janela instantânea passiva. Quando esta opção estiver assinalada, aparece um ícone na bandeja do sistema sempre que o kttsmgr estiver em execução. Neste modo, se clicar em OK ou em Cancelar não fará com que o kttsmgr saia. Em vez disso, a tela desaparece, mas o kttsmgr continua a rodar na bandeja do sistema. Clique no ícone para restaurar a tela. Para sair do kttsmgr, clique com o botão direito no ícone da bandeja do sistema e escolha Sair. Quando estiver desligada a opção, não aparecerá nenhum ícone na bandeja do sistema. Se clicar em OK ou em Cancelar, sairá do kttsmgr. Quando o kttsmgr sai, o &kmyapplication; mantém-se rodando se a opção para Ativar o Sistema de Texto-para-Voz (KTTSD) estiver assinalada. Esta opção não fará efeito até à próxima vez em que o kttsmgr for iniciado. Esta opção não fará efeito quando o kttsmgr estiver em execução no Centro de Controle do KDE. Quando esta opção estiver assinalada, a tela do kttsmgr aparece quando iniciar o kttsmgr. Se estiver desligada, o ícone do kttsmgr aparecerá na bandeja do sistema quando o kttsmgr for iniciado, apesar da tela não aparecer. Clique no ícone da bandeja para que ela então apareça. Certifique-se de clicar aqui para salvar suas configurações. Gerenciando as Tarefas de Texto Quando você clica na página de Tarefas do kttsmgr, a tela de Tarefas aparece. O Gerenciador de Texto-para-Voz do KDE (página Tarefas). O Gerenciador de Texto-para-Voz do KDE (página Tarefas) Os botões nesta barra de ferramentas permitem-lhe iniciar, remover e colocar em pausa as tarefas de texto. Selecione uma tarefa na lista abaixo e clique num destes botões. Os botões nesta barra de ferramentas permitem-lhe avançar ou voltar atrás na frase dentro da tarefa selecionada na lista abaixo. (Nem todas as tarefas possuem várias partes). Os botões nesta barra de ferramentas permitem-lhe falar o texto na área de transferência do KDE ou abrir um arquivo de texto para falar. Você poderá também atualizar a lista de tarefas de texto. A frase atualmente a ser falada aparece aqui. Se necessitar, poderá redimensionar este painel arrastando a divisória para cima ou para baixo. Quando clicar em OK, todas as alterações de configuração nas outras telas são aplicadas (se existirem) e o kttsmgr será minimizado para a bandeja do sistema. Clique no ícone da bandeja do sistema para restaurar a tela. A página de Tarefas só aparece quando o KTTSD está em execução. Se não conseguir ver a página Tarefas, vá à página Geral e assinale a opção Ativar o Texto-para-Voz (KTTSD). Configurações de Áudio Quando você clica na página de Áudio do kttsmgr, a tela de Áudio aparece. O Gerenciador de Texto-para-Voz do KDE (página Áudio). O Gerenciador de Texto-para-Voz do KDE (página Áudio) Selecione o método de saída de áudio aqui. Se o GStreamer estiver em cinza, ou o &kmyapplication; foi compilado sem o suporte para o GStreamer ou o &kmyapplication; foi incapaz de carregar as bibliotecas do GStreamer necessárias. Se o GStreamer estiver selecionado para a saída de áudio, escolha o método de 'sink' (canal) de áudio do GStreamer. Se não estiver listado nenhum 'sink', terá que instalar pelo menos um. Veja em . Ajuste a velocidade da fala aqui. 50% é aproximadamente duas vezes mais lento que o normal, enquanto 200% é aproximadamente duas vezes mais rápido. Você deve ter o utilitário sox instalado para esta configuração funcionar. Quando esta opção estiver selecionada, o &kmyapplication; copiará os arquivos de áudio temporários (arquivos .wav) para o diretório indicado. Escolha qualquer diretório em seu disco rígido que desejar, mas certifique-se de ter acesso de escrita a ele. Isto pode ser útil para criar arquivos de áudio de fala para outras finalidades. Os arquivos terão nomes no formato kttsd-T-FF onde T é o número da tarefa e FF é o número da frase. Arquivos existentes com o mesmo nome serão excluídos. Não esqueça de desabilitar esta opção, caso contrário seu disco rígido ficará cheio rapidamente! Certifique-se de clicar no botão Aplicar para tornar efetivas as opções novas no sistema &kmyapplication; em execução. Existem duas formas de ajustar a velocidade no &kmyapplication;. Muitos dos Locutores possuem uma configuração de Velocidade nos seus diálogos de configuração, que poderão ser acessados clicando em Editar na tela de Locutores. Esta opção de Velocidade da tela de Áudio é adicional em relação à velocidade do Locutor e pode ser usada de um modo geral, mesmo que o Locutor não suporte uma opção de velocidade. Para ela funcionar, você deverá ter o utilitário sox instalado no seu sistema (usuários de Debian: apt-get install sox). Da mesma forma, esta opção de velocidade é ignorada ao falar o texto que contenha SSML. (Veja em ) Filtros Filtros são um recurso avançado do &kmyapplication;. Para a operação básica do &kmyapplication; eles não são necessários. Filtros são usados para pré-processar o texto antes de enviá-lo para o motor de sintetização de fala. Eles são úteis para melhorar a fala, susbtituindo palavras faladas incorretamente ou abreviaturas, escolhendo o idioma apropriado para o locutor usar, ou contornando determinadas limitações dos sintetizadores de fala e suas vozes. Para entender como usar os filtros, é interessante primeiro entender como o texto é processado pelo &kmyapplication;. O texto falado pelo &kmyapplication; pode ser de quatro tipos possíveis. Resultado do Leitor da Tela. Avisos. Mensagens Tarefas de Texto O tipo é determinado pelo aplicativo que envia o texto para o &kmyapplication;. O Resultado do Leitor de Tela é usado por aplicativos desenhados para pessoas cegas ou com deficiência visual. O Resultado do Leitor de Tela é sempre falado antes de qualquer outro tipo e interromperá qualquer tipo de fala. Avisos e Mensagens são mensagens curtas que lhe alertam sobre informações urgentes. Eles interrompem as Tarefas de Texto. Avisos possuem prioridade maior do que as Mensagens. O KMouth é um exemplo de um aplicativo que usa Mensagens para sua fala. As Notificações do KDE são também Mensagens. O resto são Tarefas de Texto comuns. Qualquer tarefa que você inicie a partir da página Tarefas é uma Tarefa de Texto. O KSayit é um exemplo de um aplicativo que usa Tarefas de Texto. Tarefas de Texto tendem a gerar trechos longos de fala que não são urgentes. A primeira coisa que você deve saber sobre filtros é que eles são aplicados somente às Tarefas de Texto comuns e às mensagens de Notificação do KDE. O Resultado do Leitor de Tela, Avisos e Mensagens não são afetados pelos filtros. Existem dois tipos de filtros -- filtros ordinários e filtros Detectores de Limite de Frase (do inglês, SBD). SBDs quebram o texto em frases individuais. Isto permite que o &kmyapplication; comece a falar mais rapidamente porque ele precisa somente sintetizar a primeira sentença, não toda a Tarefa de Texto. Isto também permite que você avance e recue por sentença na página Tarefas, ou para ou pause Tarefas de Texto quando o sintetizador de fala não suporta diretamente a parada da fala. Filtros ordinários processam o texto e passam-no para o próximo filtro. Eles são atualmente de três tipos. Substituidores de Texto. Transformadores XML Selecionadores de Locutor. Filtros são implementados usando uma arquitetura de plugins No futuro, poderão haver tipos de filtros adicionais. Filtros para Substituir Texto substituem partes do texto com outro texto. As partes substituídas são correspondidas com palavras ou expressões regulares. O &kmyapplication; vem com filtros Substituidor de Texto pré-definidos para falar abreviaturas, falar ícones emotivos, como o ":-)", ou reformatar mensagens de notificação do Konversation ou KMail para um formato mais compreensível. Transformadores XML usam uma Linguagem de Estilo XML - Transformam arquivo (XSLT) para converter XML de um formato para outro formato. O &kmyapplication; vem com um arquivo XSLT para converter XHTML para SSML, mas ele deve ser considerado como ainda muito experimental. Selecionadores de Locutor permitem que você redirecione trabalhos para um locutor baseado no conteúdo do texto, ou no aplicativo que o enviou para o &kmyapplication;. Por exemplo, se você tiver configurado um locutor feminino na página Locutores, você pode redirecionar texto vindo das Notificações do KDE para este locutor. Veja . Cada um destes tipos de filtros possui regras de configuração para quando o filtro deve ser aplicado ao texto a ser falado. Se o filtro determinar que ele não deve ser aplicado, o texto é passado para o próximo filtro sem alterações. Quando uma Tarefa de Texto ou mensagem de Notificação do KDE é enviada para o &kmyapplication;, ele passa por cada filtro habilitado que tenha configurado na tela abaixo. A ordem é de cima para baixo. Após passar por cada um dos filtros ordinários listados na porção superior da tela, as Tarefas de Texto são passadas para os filtros de Detector de Limite de Frase (SBD). (Notificações do KDE nunca passam pelos filtros SBD.) Diferentemente dos filtros ordinários, o primeiro filtro SBD que fizer mudanças para qualquer filtragem posterior. Para usar filtros, clique na página de Filtros no kttsmgr. O Gerenciador de Texto-para-Voz do KDE (página Filtros). O Gerenciador de Texto-para-Voz do KDE (página Filtros) Esta é a lista dos filtros ordinários configurados. Se você deselecioná-lo, o filtro fica inativa e será pulado. Quando você roda o &kmyapplication; pela primeira vez, isto é automaticamente preenchido com uma instância de cada tipo de filtro, mas eles ficam todos inativos. Os filtros são aplicados na ordem especificada aqui, de cima para baixo. Clique aqui para adicionar um novo filtro. Você será perguntado pelo tipo de filtro a adicionar. Após escolher o tipo, veja o diálogo de configuração abaixo. Clique aqui para remover um filtro. Se o filtro for o último deste tipo, ele não será removido; ao invés disso, será desativado. Clique aqui para mudar a configuração de um filtro. Veja o diálogo de configuração abaixo. Clique nestes botões para mover um filtro para cima ou para baixo na lista. Estes são os filtros de Detector de Limite de Frase. Quando você inicia pela primeira vez o &kmyapplication;, o Detector de Limite de Frase Padrão é automaticamente configurado para você. Você pode mudar a configuração deste filtro, ou adicionar Detectores de Limite de Frase adicionais, mas nós alertamos aos iniciantes para não mudá-los. Este botão de lista suspensa permite adicionar, remover, editar ou mudar a ordem dos filtros de Detector de Limite de Frase. Certifique-se de clicar aqui, caso contrário suas configurações não terão efeito. Configurando Filtros de Substituição de Texto. Você configura filtros de Substituição de Texto fornecendo uma lista de palavras ou expressões regulares a serem correspondidas. Quando palavras ou expressões regulares correspondentes forem encontrados no texto, cada uma delas será substituída por um texto de substituição fornecido. A correspondência não é sensível à caixa. Substituidor de Texto Substituidor de Texto Insira um nome para seu filtro. Use qualquer nome que desejar para distinguí-lo de todos os outros filtros. Esta é a lista de palavras e expressões regulares. O filtro procura por correspondências de cada texto na coluna Corresponder, susbtituindo o texto correspondente com o texto na coluna Substituir Com. Clique aqui para adicionar outra palavra ou expressão regula à lista. Clique aqui para mover a palavra ou expressão regular atualmente destacada para cima ou para baixo na lista. A lista é processada na ordem exibida, de cima para baixo. Clique para mudar uma palavra ou expressão regular existente na lista. Clique para remover a palavra ou expressão regular atualmente destacada da lista. Use estes botões para carregar uma lista de palavras ou expressões regulares de um arquivo, salvar a lista atual para um arquivo, ou limpar toda a lista. Ao carregar a partir de um arquivo, os itens no arquivo serão adicionados à lista existente. Se não estiver em branco, o filtro será aplicado somente se o idioma do locutor da Tarefa de Texto corresponder com o idioma inserido aqui. Clique o botão para exibir uma lista de idiomas. Você pode selecionar mais de um idioma pressionando o &Ctrl; enquanto clica. Se não estiver em branco, o filtro será aplicado somente se o texto vier de um dos aplicativos listados. Você pode inserir mais de um aplicativo separado por vírgulas. Exemplo: knotify,konversation Você pode descobrir o ID do Aplicativo de programas em execução usando o programa kdcop. Você deve deixar o número DCOP fora. Por exemplo, se o kdcop mostra um ID de Aplicativo de kopete-3432, você deve apenas inserir kopete. O filtro Substituidor de Texto somente será aplicado ao texto se todas as condições não vazias forem atendidas na caixa Aplicar Este Filtro Quando. Todas as correspondências são insensíveis à caixa. Ao corresponder palavras, o filtro Substituidor de Texto internamente usa uma expressão regular no formato \spalavra\s. Em outras palavras, a palavra deve estar rodeada por espaço em ambos os lados. Uma discussão sobre como escrever expressões regulares está fora do escopo deste manual. Se você tiver o editor de Expressões Regulares do KDE instalado, existe um botão disponível nas telas Adicionar ou Editar que lhe auxiliam a construir expressões regulares. O Editor de Expressões Regulares do KDE é parte do pacote tdeutils. O &kmyapplication; vem com uma pequena lista de arquivos, incluindo uma lista de ícones emotivos, como o ":-)", algumas abreviaturas tipicamente usadas em IRC ou aplicativos de mensagens instantâneas, e uma lista de abreviaturas diversas. Existe também uma lista de caracteres especiais que a versão atual da voz do Polish Festival não pode manipular. Se você criar uma lista de palavras úteis que queira compartilhar, use o botão Salvar para salvá-las para um arquivo e envie-as para a equipe do &kmyapplication; para inclusão na próxima versão. Configurando Filtros Transformadores XML. O filtro Transformador XML usa arquivos XSLT para transformar XML de um formato para outro. O XSLT (do inglês Transformação de Linguagem no Estilo XML), é uma linguagem padrão W3C para realizar estas transformações. Ele somente pode ser usado em XML formado corretamente. Transformador XML Transformador XML Insira um nome para seu filtro. Use qualquer nome que desejar para distinguí-lo de todos os outros filtros. Insira o caminho completo para um arquivo XSLT existente, que realizará a transformação. Especifique o caminho para o utilitário xsltproc. Se o 'xsltproc' estiver em seu PATH, simplesmente insira xsltproc. Se não estiver em branco, o filtro somente se aplicará se o XML tiver o elemento raiz especificado. Isto diferencia uma forma XML de outra. Se não estiver em branco, o filtro será aplicado somente se o XML tiver uma especificação iniciando com o texto inserido. Por exemplo, html corresponde à ]]>. Se não estiver em branco, o filtro será aplicado somente se o texto vier de um dos aplicativos listados. Você pode inserir mais de um aplicativo separado por vírgulas. Exemplo: knotify,konversation Você pode descobrir o ID do Aplicativo de programas em execução usando o programa kdcop. Você deve deixar o número DCOP fora. Por exemplo, se o kdcop mostra um ID de Aplicativo de kopete-3432, você deve apenas inserir kopete. O filtro Transformador XML somente se aplicará ao texto se todas as condições não vazias forem atendidas na caixa Aplicar Este Filtro Quando. Configurando Filtros Selecionadores de Locutor. Os filtros Selecionadores de Locutor são usados para direcionar o texto para um locutor especificado configurado na página Locutor, ou para qualquer locutor que possua determinados atributos. Por exemplo, você pode especificar que o texto vindo do knotify deva ser falado usando um locutor configurado como voz feminina. Veja . Imediatamente antes do &kmyapplication; começar a enviar o texto para os filtros, ele seleciona um locutor para falar o texto. O locutor escolhido é baseado nos atributos do locutor especificados pelo aplicativo que enviou o texto para o &kmyapplication; e os atributos dos locutores que você configurou na página Locutores. O filtro Selecionador de Locutor permite que você sobreponha esta escolha de locutor. Selecionador de Locutor Selecionador de Locutor Insira um nome para seu filtro. Use qualquer nome que desejar para distinguí-lo de todos os outros filtros. Se não estiver em branco, o filtro será aplicado somente se o texto contiver a expressão regular inserida. Se ele estiver instalado, clique o botão de navegação apra iniciar o Editor de Expressão Regular do KDE para auxiliá-lo a inserir a expressão regular. Para um melhor desempenho, tente "ancorar" a expressão regular ao início do texto. Em outras palavras, inicie sua expressão regular com . Se não estiver em branco, o filtro será aplicado somente se o texto vier de um dos aplicativos listados. Você pode inserir mais de um aplicativo separado por vírgulas. Exemplo: knotify,konversation Você pode descobrir o ID do Aplicativo de programas em execução usando o programa kdcop. Você deve deixar o número DCOP fora. Por exemplo, se o kdcop mostra um ID de Aplicativo de kopete-3432, você deve apenas inserir kopete. Especifique os atributos do locutor que deseja que fale o texto aqui. Se o texto corresponder às condições do filtro acima, um locutor será escolhido que corresponda mais precisamente aos atributos especificados aqui. Você pode especificar um idioma clicando neste botão. De modo semelhante, as entradas que fizer aqui também especificarão os atributos do locutor que deseja que fale o texto. Você não precisa especificar todos os atributos. Você pode especificar que um atributo é mais importante que os outros selecionando estas caixas. O filtro Selecionador de Locutor somente se aplicará ao texto se todas as condições não vazias forem atendidas na caixa Aplicar Este Filtro Quando. O atributo Idioma é especial porque o texto ficará provavelmente ininteligível se falado por um locutor que fala um idioma diferente do texto. Assim, o idioma é automaticamente um atributo preferencial. Se você especificar um idioma, ele sobreporá o idioma escolhido, mas se você deixar em branco, o idioma já escolhido pelo &kmyapplication; será usado. Se o aplicativo que enviar o texto para o &kmyapplication; não especificar um idioma, o &kmyapplication; atribuirá o idioma do primeiro locutor (o mais acima) configurado na página Locutores. Os outros atributos serão sempre sobrepostos. Em outras palavras, se você deixar o atributo Taxa em branco, o Selecionador de Locutor encontrará o locutor mais adequado independete da taxa de fala. A maneira mais fácil de aprender como configurar os Selecionadores de Locutor é experimentar. Desabilite o Selecionador de Locutor e envie algum texto. Na página Tarefas, observe o locutor que o &kmyapplication; seleciona. Habilite o Selecionador de Locutor, insira alguns atributos, e tente novamente para ver como as opções são afetadas. É claro, você deve possuir mais de um locutor configurado para que o Selecionador de Locutor faça alguma coisa. Configurando Filtros de Detector de Limite de Frase. Filtros de Detector de Limite de Frase (do inglês SBD) quebram o texto em frases individuais. Isto é importante porque permite ao &kmyapplication; iniciar a fala mais rapidamente porque ele precisa somente sintetizar a primeira frase, ao invés de todo o bloco de texto, que pode ser muito longo, e permite você voltar atrás ou avançar nas frases na página Tarefas, e permite você pausar ou parar Tarefas de Texto na página Tarefas mesmo que o sintetizador de fala não seja capaz de ser parado. Por estas razões, o filtro do Detector de Limite de Frase Padrão é automaticamente configurado na primeira vez que você roda o kttsmgr e não pode ser desabilitado (apesar de você poder removê-lo). Nós orientamos que não modifique este filtro a menos que saiba o que está fazendo. Você pode, no entanto, adicionar filtros BSD adicionais para resolver determinados problemas. Por exemplo, em Fevereiro de 2005, a voz do Polish Festival possui um atributo irritante de fala da pontuação da frase. Ele fala os pontos finais de cada frase, por exemplo. Você não pode resolver este problema criando um filtro Substituidor de Texto para remover a pontuação da frase, porque fazendo isso você impedirá que o SBD Padrão reconheça qualquer frase. Ao invés disso, você pode criar uma versão modificada do SBD Padrão que reconhece a frase enquanto ao mesmo tempo remove a pontuação da frase. Para fazer isto, adicione um filtro SBD e use o botão Carregar para carregar o arquivo polish_festival_sbdrc que vem com o &kmyapplication;. Filtros BSD funcionam correspondendo uma expressão regular de fim de frase e inserindo caracteres de tabulação (8 decimal) nos limites das frases. (Todos os cararcteres são automaticamente removidos do texto antes da filtragem iniciar.) Observe que o SBD Padrão preserva a pontuação da frase. Filtros SBD nunca são aplicados à mensagens de Notificação do KDE (knotify). Se você remover acidentalmente o filtro de Detector de Limite de Frase Padrão, você pode restaurá-lo carregando o arquivo standard_sbdrc, que vem com o &kmyapplication;. Configurações de Interrupção do Texto Quando clicar na página Interrupção do kttsmgr, irá aparecer a tela de Interrupção. O Gerenciador de Texto-para-Voz do KDE (página Interrupção). O Gerenciador de Texto-para-Voz do KDE (página Interrupção) Este tela permite-lhe indicar algumas ações especiais a tomar quando uma tarefa de texto for interrompida por outra de maior prioridade. Existem quatro tipos de tarefas de voz com que o &kmyapplication; lida: Texto normal. Mensagens. Avisos. Resultado do Leitor da Tela. O Resultado do Leitor da Tela tem a maior prioridade. Ele está reservado para os aplicativos de Leitura da Tela. O Resultado do Leitor faz a preempção de todas as outras mensagens, fazendo com que essas tarefas fiquem em pausa. Logo que o Resultado do Leitor da Tela tenha sido sintetizado, as tarefas anteriores irão prosseguir automaticamente. Os avisos são a próxima prioridade mais elevada. Eles estão reservados para as mensagens de alta prioridade, como "o CPU está super-aquecendo". Um aviso irá interromper as mensagens e o texto normal. Logo que o Aviso tenha sido sintetizado, as tarefas anteriores irão prosseguir automaticamente. As mensagens são a próxima prioridade. Uma mensagem irá interromper as tarefas de texto normal. O KMouth é um exemplo de um aplicativo que usa as Mensagens. Por exemplo, ao ler um texto longo de uma página Web, o KMouth pode ser usado para cumprimentar alguém que ande pela sala. Todos os tipos de tarefas são filas, exceto o Resultado do Leitor da Tela. Se um Resultado do Leitor da Tela for enviado de um aplicativo enquanto o &kmyapplication; estiver falando outro Resultado destes, a mensagem a ser falada é interrompida e eliminada. Quando uma tarefa de texto for interrompida por uma Mensagem, Aviso ou Resultado do Leitor da Tela, o &kmyapplication; irá adicionar o resultado de áudio nesta tela à sequência. Esta mensagem é falada sempre que uma tarefa de texto normal for interrompida. Este arquivo de áudio é reproduzido sempre que uma tarefa de texto normal for interrompida. Se tanto existir um Pré-som como uma Pré-mensagem, o Pré-som toca primeiro que a Pré-mensagem. Esta mensagem é falada sempre que uma tarefa de texto interrompida prosseguir. Este arquivo de áudio é tocado sempre que uma tarefa de texto interrompida prosseguir. Ele é tocado por último. As opções nesta tela aplicam-se apenas às tarefas de texto normal. As Mensagens, Avisos e Resultados do Leitor da Tela não possuem ações especiais quando forem interrompidos por uma mensagem de prioridade mais elevada. Falando o Texto das Páginas Web Ao rodar o navegador Web do KDE, o Konqueror, você poderá falar o texto da página Web apresentada. Primeiro, certifique-se de que o &kmyapplication; está rodando. Selecione o texto que deseja falar e escolha a opção Ferramentas Falar o Texto do menu principal.Depois de algum tempo, o texto selecionado irá começar a ser falado. É quase sempre uma boa idéia selecionar o texto na página Web que deseja falar. Você poderá ignorar este passo, mas irá ouvir um conjunto de cabeçalhos de HTML e outras marcas invisíveis. Falando o Texto do Editor de Texto Kate Ao rodar o Editor de Texto Avançado do KDE, o Kate, poderá falar o texto apresentado. Primeiro, certifique-se de que o &kmyapplication; está rodando. Selecione o texto que deseja falar e escolha a opção Ferramentas Falar o Texto do menu principal.Depois de algum tempo, o texto selecionado irá começar a ser falado. Não precisa selecionar primeiro o texto. Neste caso, o arquivo inteiro será falado. Isto também funciona quando o Kate estiver embutido em outro aplicativo, como o Konqueror ou o Quanta. Falando as Notificações (KNotify) O KNotify é o subsistema de notificações no KDE que o alerta dos eventos que configurar no sistema do KDE. Você poderá configurar o &kmyapplication; para falar as notificações de texto. Por exemplo, o Konversation, um aplicativo de IRC para o KDE, permite-lhe configurar uma variedade grande de notificações. Por exemplo, poderá dizer ao Konversation para o notificar sempre que uma mensagem apareça num canal de IRC com o seu nome ou apelido nela. Em conjunto com o &kmyapplication;, poderá fazer com que o KDE fale o texto da mensagem de IRC para você. De um modo geral, se um aplicativo do KDE suportar o KNotify, irá aparecer um item de menu Notificações no menu de Configurações. Os detalhes específicos para configurar cada um dos aplicativos com o KNotify variam de aplicativo para aplicativo. Para ativar o &kmyapplication; para falar as notificações de texto do KNofify, inicie o kttsmgr, clique na página Geral e assinale a opção Falar as notificações (KNotify). Depois, clique no botão Aplicar. SSML A Speech Synthesis Markup Language (SSML) é uma norma da W3C para formatar o texto de forma a ser sintetizado. Ele oferece marcas para controlar as vozes, a taxa de voz, volume, sexo e tom. Oferece também marcas para controlar a forma como as palavras são sintetizadas, como por exemplo para soletrar as abreviaturas. O SSML faz parte da especificação VoiceXML, que é também uma norma da W3C. Neste momento, o &kmyapplication; oferece um suporte limitado e muito básico para o SSML. Possui atualmente as restrições a seguir. Funciona apenas com os locutores do Festival Interative e do Hadifix. Você deverá instalar a voz rab_diphone (homem britânico), uma vez que esta é a voz que o Festival usa ao sintetizar o SSML. A opção Velocidade da tela de Áudio é ignorada quando se fala texto que contenha SSML. Se a Velocidade ou o Tom no diálogo de configuração do Festival não estiverem a 100%, isto poderá fazer com que o texto em SSML seja falado de forma monotônica. O seguinte texto de exemplo poderá ser usado para experimentar com o SSML. Quem esteve dormindo na minha cama? disse o pai-urso. Quem esteve dormindo na minha cama? disse a mãe-ursa. Quem esteve dormindo na minha cama? disse o bebé-urso. ]]> Planeja-se um suporte mais robusto de SSML para a próxima versão do &kmyapplication;. Referência de Comandos A FAZER Guia de Programação do &kmyapplication; O &kmyapplication; possui duas Interfaces de Programação de Aplicativos (APIs): A API de Texto-para-Voz do KDE, que é usada pelos programadores dos aplicativos para oferecerem aos seus aplicativos capacidades de TTS. Os aplicativos comunicam-se com o KTTSD através de DCOP. A API de Plugins do KTTSD, que é usada para adicionar plugins de síntese de voz ao KTTSD, para que o &kmyapplication; funcione com motores novos de síntese de voz. A seção a seguir fornece uma breve descrição da API da Interface em DCOP de Texto-para-Voz do KDE. A documentação completa para ambas as APIs está disponível 'online' na página Web de Acessibilidade no KDE. A Interface de DCOP do &kmyapplication; Os aplicativos comunicam os pedidos de serviços de Texto-para-Voz através da interface de DCOP do KDE para programar o objeto KSpeech do kttsd. Insira os seguintes comandos num Konsole. Se o KTTSD não estiver já rodando kttsd Para agendar uma tarefa de texto a ser falada dcop kttsd KSpeech setText "texto" "locutor" onde o texto é o texto que pretende ser sintetizado e o locutor é um código de idioma do tipo en, pt_BR, etc. Este comando não fala o texto; simplesmente coloca-o numa fila de tarefas de texto para ser falado. Exemplo. dcop kttsd KSpeech setText "Isto é um teste." "pt_BR" Para falar a última tarefa de texto que foi posta na fila. dcop kttsd KSpeech startText 0 Neste caso, o 0 refere-se à última tarefa de texto na fila. Você poderá também indicar um número de tarefa específico. (Se não for indicado nenhum número, assume-se o 0.) Para parar a tarefa de texto sendo falada atualmente dcop kttsd KSpeech stopText 0 Dependendo do plugin de voz usado, a síntese poderá não parar imediatamente. Existem muitos mais comandos que poderão ser enviados. Para ver uma lista dos comandos possíveis, dcop kttsd KSpeech ou leia a página da API de Texto-para-Voz do KDE. Perguntas e Respostas &reporting.bugs; &updating.documentation; Eu preciso recomeçar tudo. Como eu interrompo por completo o &kmyapplication;? Insira os seguintes comandos num Konsole: killall kttsd killall kttsmgr Como vejo o resultado de depuração do kttsd? Abra duas janelas do Konsole. Primeiro inicie o kttsd numa janela e depois o kttsmgr na segunda. Tenho uma voz adicional do Festival que obtive da Internet. Instalei-a e posso usá-la no Festival, mas não aparece no kttsmgr. Edite o arquivo $TDEHOME/share/apps/kttsd/festivalint/voices para adicionar a voz nova. Os outros itens poderão ser usados como um guia. Se adicionar com sucesso uma voz, envie por favor uma correção para os programadores, em conjunto com o URL de onde obteve o arquivo de voz. Nenhum dos sintetizadores de voz suportados possui o idioma que eu necessito. Onde poderei obter um sintetizador para o meu idioma? O Google(tm) é seu amigo. Esta referência também poderá ajudar. Se descobrir um motor aberto que suporte o seu idioma desejado e quiser adicionar o suporte para ele no &kmyapplication;, por favor contacte a equipe de desenvolvimento. Os motores abertos são especialmente bem-vindos. Se conhecer algum sintetizador comercial, talvez consiga persuadir o distribuidor a doar uma cópia gratuita à equipe de desenvolvimento do &kmyapplication;. Entretanto, você poderá conseguir colocar o sintetizador funcionando com o plugin do Comando. Veja . Créditos e Licença &kmyapplication; Direitos Autorais do Programa © 2002 José Pablo Ezequiel "Pupeno" Fernández pupeno@kde.org Mantenedor Atual: Gary Cramblitt garycramblitt@comcast.net Contribuições: Olaf Schmidt ojschmidt@kde.org Gunnar Schmi Dt gunnar@schmi-dt.de Paul Giannaros ceruleanblaze@gmail.com Direitos Autorais da Documentação © 2004 Gary R. Cramblitt garycramblitt@comcast.net Tradução de Marcus Gamamarcus_gama@uol.com.br &underFDL; &underGPL; Os motores de síntese de voz usados pelo &kmyapplication; possuem as suas próprias licenças. Veja a documentação de cada motor ou a sua página na Web para mais detalhes. Instalação Como obter o &kmyapplication; &install.intro.documentation; (FUTURO) Comando de Instalação da Debian: apt-get install tdeaccessibility Você poderá encontrar algumas referências para os pacotes de código e binários na págiana Web de Acessibilidade do KDE (http://accessibility.kde.org). Se tiver acesso ao CVS do KDE, você poderá obter o &kmyapplication; através do módulo tdeaccessibility. O &kmyapplication; encontra-se na pasta kttsd. Você poderá também obter um pacote criado todas as noites em ftp://ftp.kde.org/pub/kde/unstable/latest/tdeaccessibility.tar.bz2 Requisitos Requisitos obrigatórios: KDE versão 3.2 ou posterior. Um motor de síntese de voz. São suportados os seguintes motores e idiomas falados. Festival Inglês Americano, Inglês Britânico, Espanhol, Alemão, Finlandês, Tcheco, Polaco, Russo Festival Lite (flite) Inglês Hadifix (MBROLA e txt2pho) Alemão Epos Tcheco, Eslovaco FreeTTS Inglês Funciona também com qualquer motor de síntese que possa ser executado com um comando num Konsole. Os idiomas indicados acima poderão não ser compreensíveis ou estar desatualizados. Veja as especificações de cada motor para uma lista completa dos idiomas suportados. O &kmyapplication; usa uma arquitetura de plugins flexível para os motores de síntese de voz. Se quiser melhorar o &kmyapplication; de modo a suportar outro motor, contacte a equipe de desenvolvimento. Veja em as instruções específicas para cada um destes motores. Componentes opcionais: O utilitário de áudio sox é necessário para ajustar a velocidade global da voz, mas não é necessário. Os usuários de Debian poderão instalar o 'sox' com o comando apt-get install sox. O Sox vem incluído na maioria dos CDs de distribuições de &Linux;. O utilitário xsltproc é necessário para o suporte de SSML e para o filtro Transformador XML, mas não é obrigatório. Os usuários de Debian poderão instalar o 'xsltproc' com o comando apt-get install xsltproc. GStreamer versão 0.8.7 ou posterior. Por padrão, o &kmyapplication; usa o aRts para a saída de áudio, mas se instalar o GStreamer, você poderá usá-lo em alternativa. Poderá obter o GStreamer em http://gstreamer.freedesktop.org/ Compilação e Instalação Para compilar o &kmyapplication;, você deve possuir uma cópia recente (KDE 3.4 ou superior) dos arquivos de desenvolvimento do KDE, incluindo o tdelibs e arts. Se você obteve o &kmyapplication; como um pacote TAR, logue-se como um usuário normal e descomprima o pacote para uma pasta adequada, entre nesta e introduza os seguintes comandos. ./configure make Se você possuir os arquivos de desenvolvimento do GStreamer 0.8.7 ou superior instalados, e desejar compilar o &kmyapplication; com suporte ao GStreamer, insira o seguinte comando em substituição. ./configure --enable-kttsd-gstreamer make Por padrão, os comandos acima irão instalar o &kmyapplication; em /opt/kde3. Se esta pasta não estiver não estiver na sua variável $TDEDIRS, você poderá ter que adicionar uma opção --prefix=destino. Por exemplo, ./configure --prefix=/usr/local make Nos sistemas Debian, o /usr/local é o local normal para instalar os aplicativos compilados a partir de código-fonte. Logue-se como 'root' e instale o &kmyapplication; compilado com os seguintes comandos. su make install Se obteve o código do &kmyapplication; a partir do módulo de CVS tdeaccessibility ou através dos pacotes TAR noturnos do CVS, use os seguintes comandos para compilar e instalar. cd tdeaccessibility echo kttsd>inst-apps make -f Makefile.cvs ./configure cd kttsd make su make install Configuração Certifique-se de que o seu motor de síntese de voz está funcionando antes de usar o &kmyapplication;. Siga as instruções que vieram com o motor. Em alguns casos, é necessário dar acesso de escrita ao dispositivo de áudio. chmod a+rw /dev/dsp* Usando com o Festival (Interative) O Festival é um dos melhores motores de TTS gratuitos e abertos que se encontram disponíveis. A qualidade da voz é geralmente boa, existem alguns idiomas e vozes suportadas e você poderá controlar a voz, a velocidade do texto gerado e o tom no &kmyapplication;. Nome do Sintetizador: Festival Interative URL: http://www.cstr.ed.ac.uk/projects/festival/ Comando de Instalação da Debian: apt-get install festival Você necessitará instalar pelo menos um idioma. Siga as instruções que vêm com o Festival. As vozes adicionais em inglês do Festival estão disponíveis em http://hts.ics.nitech.ac.jp/. As vozes adicionais em espanhol, inglês e alemão estão disponíveis em http://cslu.cse.ogi.edu/tts/download/ Você deverá, contudo, compilar um módulo adicional para estas vozes, sendo necessário para isso o código-fonte do Festival. As vozes em alemão possuem uma distribuição limitada. Está disponível uma voz masculina em finlandês em http://www.ling.helsinki.fi/suopuhe/download/. Está disponível uma voz masculina em polaco em http://www.artegence.com/download/voicexml/speech/festival_polish_voice.tgz. Está disponível uma voz masculina em russo em http://nshmyrev.narod.ru/festival/festival.html Você deve possuir o Festival 1.95 beta ou superior para usar esta voz. A voz ainda está em desenvolvimento inicial. Descompacte para festival/lib/voices/russian/. Quando você configurar o locutor Russo, a código da voz é msu_ru_nsh_diphone. Certifique-se de selecionar uma codificação de byte simples em cirílico, como a KOI8-R. O Festival vem tipicamente incluído com as distribuições do &Linux;. Veja nos CDs da sua distribuição se está incluído. Inicie o kttsmgr. Na tela de Locutores, clique no botão Adicionar. Escolha o Festival Interative e um Idioma. Se a tela para Configurar o Locutor não aparecer, clique no botão Editar. Se o arquivo executável do Festival não estiver na sua PATH, indique a localização completa do executável. Clique no botão Pesquisar de Novo, escolha uma voz e clique no botão Testar. Você deverá ouvir uma frase de teste sendo falada. Ao usar os idiomas Tcheco ou Polaco, certifique-se que a opção de Codificação está definida como ISO 8859-2. Ao usar o idioma Russo, certifique-se que a opção de Codificação está definida para uma com byte simples cirílico, como a KOI8-R. Usando o Festival com o &mbrola; O Festival pode ser usado em conjunto com o sintetizador &mbrola;. Neste modo, o Festival faz a análise léxica e o &mbrola; produz o áudio. O executável &mbrola; e os arquivos de vozes do &mbrola; podem ser obtidos em http://festvox.org/mbrola/. Siga as instruções no readme.txt que vem com o pacote obtido. Repare que o &mbrola; não é um sistema de Texto-para-Voz completo. O &mbrola; sintetiza a voz a partir de arquivos de difonemas. Você deverá ter um 'software' adicional que possa produzir os difonemas. Ao ser combinado com o Festival, o Festival produz os difonemas necessários para o &mbrola;. O txt2pho poderá também ser usado para produzir difonemas a partir de texto em alemão. Veja para mais informações. Existem três métodos para combinar o Festival com o &mbrola;. Interfaces do &mbrola;. No momento em que este manual foi escrito, este método estava limitado a vozes em Inglês. IMS German Festival. Festival-Czech. Usando o Festival com as Interfaces do &mbrola; Neste método, o código adicional das interfaces é adicionado ao Festival para ativar a síntese de voz com os arquivos de vozes do &mbrola;. Lembre-se que os arquivos de vozes do &mbrola; não são instalados na árvore de pastas do &mbrola;. Em vez disso, são instalados na árvore de pastas festival/lib/. Para mais instruções, veja http://www.cstr.ed.ac.uk/projects/festival/mbrola.html Usando o IMS German Festival O IMS German Festival é uma versão modificada do Festival que usa as vozes em alemão do &mbrola;. Funciona tanto com o Festival versão 1.4.1 como com o Festival 2.0 (1.95beta). Instale primeiro o Festival e o &mbrola;, se não tiver já feito isso. Depois, obtenha o IMS German Festival em http://www.ims.uni-stuttgart.de/phonetik/synthesis/festival_opensource.html. Siga as instruções no arquivo README que vem com o pacote obtido. (Lembre-se que, se for usado em conjunto com o Festival 2.0, não é necessário aplicar o pacote fixes, mas terá ainda que recompilar o festival.) Finalmante, adicione as seguintes linhas ao arquivo festival/lib/siteinit.scm. (voice-location "german_de1_os" "/usr/local/mbrola/de1" "German Female, IMS Festival de1") (voice-location "german_de2_os" "/usr/local/mbrola/de2" "German Male, IMS Festival de2") (voice-location "german_de3_os" "/usr/local/mbrola/de3" "German Female, IMS Festival de3") logo acima da linha que diz (provide 'siteinit) Em alguns sistemas, o arquivo que edita é o /etc/festival.scm. Adicione apenas as linhas que correspondem às vozes em alemão que instalou. Substitua a localização correta por /usr/local/mbrola/ . Lembre-se também que (no momento em que isto foi escrito), o IMS German Festival não funciona com os arquivos de vozes de4, de5 ou de6. Usando o Festival-Czech Este método usa algum código especial para ativar a síntese de voz no Festival com uma voz do &mbrola; em tcheco. Para instalar, obtenha primeiro, instale o Festival e o &mbrola; e certifique-se que ambos funcionam. Depois, obtenha o Festival-Czech em http://www.freebsoft.org/festival-czech Nos procedimentos a seguir, substitua as localizações de pastas corretas de acordo com as necessidades. Descomprima o pacote transferido para uma pasta adequada e compile o léxico. O executável do Festival deverá estar na sua PATH. cd /usr/local tar xvfz festival-czech.tar.gz cd festival-czech make Obtenha o arquivo de voz cz2 da página Web do e de&mbrola;scomprima-o na pasta do &mbrola;. cd /usr/local/mbrola mkdir cz2 cd cz2 unzip cz2-001009.zip Adicione as seguintes linhas ao arquivo festival/lib/siteinit.scm. (set! czech-lexicon-file "/usr/local/festival-czech/czech-lexicon.out") (set! load-path (cons "/usr/local/festival-czech" load-path)) (require 'czech) (set! czech-mbrola_database "/usr/local/mbrola/cz2/cz2") (set! mbrola_progname "/usr/local/mbrola/mbrola") (voice-location "czech_mbrola_cz2" "/usr/local/mbrola/cz2" "Czech Male, MBROLA") (require 'czech-mbrola) logo acima da linha que diz (provide 'siteinit) Em alguns sistemas, o arquivo que edita é o /etc/festival.scm. Usando com o Festival Lite (flite) O Festival Lite é um motor gratuito e aberto que suporta atualmente um número limitado de vozes e idiomas. É leve, mas sacrifica de certa forma a qualidade da voz. Não pode controlar o tom, o volume ou a velocidade deste motor no &kmyapplication;. Nome do Sintetizador: Festival Lite (flite) URL: http://www.speech.cs.cmu.edu/flite/index.html Comando de Instalação da Debian: apt-get install flite O 'flite' vem tipicamente instalado com as distribuições de Linux. Verifique os CDs da sua distribuição para confirmar se vem incluído. Compile e instale o 'flite', seguindo as instruções no README que vem com ele. Usando com o Hadifix (&mbrola; e txt2pho) O Hadifix é um motor de síntese de voz baseado em difonemas. O utilitário txt2pho converte o texto é difonemas e o motor &mbrola; sintetiza os difonemas a reproduzir. A qualidade da voz é boa, mas o suporte do idioma está atualmente ligeiramente limitado. Você poderá controlar a voz, o tom, a velocidade e o volume no kttsmgr. Nome do Sintetizador: Hadifix URL: ver abaixo Comando de Instalação da Debian: nenhum Se não tiver já o Hadifix instalado, faça o seguinte: Obtenha o executável do MBROLA em http://festvox.org/mbrola/. Instale o &mbrola; na pasta /usr/local/mbrola. Obtenha pelo menos um arquivo de idioma (alemão, por exemplo), na página do &mbrola;. Descomprima na pasta /usr/local/mbrola. Obtenha o 'txt2pho' de http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html. Descomprima o 'txt2pho' em /usr/local/txt2pho. Modifique o arquivo txt2phorc, colocando os locais corretos dados nele. Copie o txt2phorc tanto para o ~/.txt2phorc como para o /etc/txt2pho. Repare que deve retirar o "rc" do nome do arquivo. No kttsmgr, escolha o idioma 'Alemão' (de), e adicione o Hadifix. Na tela para Configurar o Locutor, configure uma voz e as localizações do &mbrola; e do txt2pho. Clique no botão Testar para efetuar o teste. Usando com o Epos O Epos é um motor aberto e gratuito para Tcheco e Eslovaco. É leve, mas sacrifica de certa forma a qualidade da voz. Você não poderá controlar o tom, o volume ou a velocidade deste motor no &kmyapplication;. Nome do Sintetizador: Epos TTS Synthesis System URL: http://epos.ure.cas.cz/ Comando de Instalação da Debian: apt-get install epos Inicie o kttsmgr. Na página de Locutores, clique no botão Adicionar. Escolha o idioma Tcheco ou Eslovaco e o Epos TTS Synthesis System. Se o executável do servidor do Epos e o cliente não estiverem na sua PATH, indique a localização destes executáveis na tela para Configurar o Locutor. As opções permitem-lhe passar argumentos adicionais ao cliente e ao servidor. Num Konsole, digite epos -h ou say -h para ver mais informações. Usando com o FreeTTS O FreeTTS é um motor de voz aberto e gratuito feito em Java(tm), o que significa que você precisa de ter a máquina virtual de Java instalada no seu sistema para a usar. Atualmente, tem um suporte de vozes e idiomas limitado. Você não pode controlar o tom, o volume ou a velocidade deste motor no &kmyapplication;. Nome do Sintetizador: FreeTTS URL: http://sourceforge.net/projects/freetts/ Comando de Instalação da Debian: nenhum Usando o 'Plugin' do Comando O plugin do comando permite-lhe usar o &kmyapplication; com qualquer motor de síntese de voz que possa ser executado como um comando num Konsole. Nome do Sintetizador: Comando URL: nenhum Comando de Instalação da Debian: nenhum Idealmente, deverá usar um comando que sintetize para um arquivo de áudio temporário (WAV), em vez de enviar a voz diretamente para o dispositivo de áudio. Se o motor do sintetizador de fala precisar que o texto seja codificado de maneira diferente da configuração de codificação do seu ambiente de trabalho, você deve usar o parâmetro %f para passar o texto para o motor. O &kmyapplication; codificará o texto na configuração que você especificou quando ele escreveu o texto para o arquivo temporário. Se você passar o texto na linha de comando usando o parâmetro %t, ele será codificado usando a configuração local do seu ambiente. Você pode também usar a opção Enviar os dados como entrada padrão para resolver este problema, se o motor aceitar entrada de StdIn. Por exemplo, aqui está um comando exemplo para enviar um texto em polonês para o Festival usando a codificação ISO 8859-2 e removendo a fala dos caracteres de pontuação. cat %f | tr '(){}[]"' ' ' | festival --tts --language polish &documentation.index;