Desenvolvimento de aplicativos usando reconhecimento e síntese de voz

SAMPAIO NETO, Nelson Cruz

Use este identificador para citar ou linkar para este item: https://repositorio.ufpa.br/jspui/handle/2011/3341

Tipo:	Dissertação
Data do documento:	30-Ago-2006
Autor(es):	SAMPAIO NETO, Nelson Cruz
Primeiro(a) Orientador(a):	KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
Título:	Desenvolvimento de aplicativos usando reconhecimento e síntese de voz
Citar como:	SAMPAIO NETO, Nelson Cruz. Desenvolvimento de aplicativos usando reconhecimento e síntese de voz. Orientador: Aldebaro Barreto da Rocha Klautau Júnior. 2006. 86 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Tecnológico, Universidade Federal do Pará, Belém, 2006. Disponível: http://repositorio.ufpa.br/jspui/handle/2011/3341. Acesso:.
Resumo:	A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.
Abstract:	Speech is a natural mechanism for human-machine interaction. Speech (or voice) technology is a well-developed field when one considers the international community. There is a wide variety of academic and industrial software. The majority of them assumes a recognizer or synthesizer is available, and can be programmed through an API. In contrast, there are no such resources in public domain for Brazilian Portuguese. This work discusses some of these issues and compares SAPI and JSAPI, which are APIs promoted by Microsoft and Sun, respectively. We also present two examples: a CALL application using SAPI-based speech synthesis in English and Portuguese, recognition in English, and visual agents; and a JSAPI-based software that incorporates speech synthesis and recognition to IRC through Java APIs.
Palavras-chave:	voz Síntese Reconhecimento SAPI JSAPI Soeech Synthesis Recognition
CNPq:	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
País:	Brasil
Instituição:	Universidade Federal do Pará
Sigla da Instituição:	UFPA
Instituto:	Instituto de Tecnologia
Programa:	Programa de Pós-Graduação em Engenharia Elétrica
Tipo de Acesso:	Acesso Aberto
Aparece nas coleções:	Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Dissertacao_DesenvolvimentoAplicativosUsando.pdf		374,78 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciado sob uma Licença Creative Commons