Desenvolvimento de aplicativos usando reconhecimento e síntese de voz

SAMPAIO NETO, Nelson Cruz

Please use this identifier to cite or link to this item: https://repositorio.ufpa.br/jspui/handle/2011/3341

metadata.dc.type:	Dissertação
Issue Date:	30-Aug-2006
metadata.dc.creator:	SAMPAIO NETO, Nelson Cruz
metadata.dc.contributor.advisor1:	KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
Title:	Desenvolvimento de aplicativos usando reconhecimento e síntese de voz
Citation:	SAMPAIO NETO, Nelson Cruz. Desenvolvimento de aplicativos usando reconhecimento e síntese de voz. Orientador: Aldebaro Barreto da Rocha Klautau Júnior. 2006. 86 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Tecnológico, Universidade Federal do Pará, Belém, 2006. Disponível: http://repositorio.ufpa.br/jspui/handle/2011/3341. Acesso:.
metadata.dc.description.resumo:	A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.
Abstract:	Speech is a natural mechanism for human-machine interaction. Speech (or voice) technology is a well-developed field when one considers the international community. There is a wide variety of academic and industrial software. The majority of them assumes a recognizer or synthesizer is available, and can be programmed through an API. In contrast, there are no such resources in public domain for Brazilian Portuguese. This work discusses some of these issues and compares SAPI and JSAPI, which are APIs promoted by Microsoft and Sun, respectively. We also present two examples: a CALL application using SAPI-based speech synthesis in English and Portuguese, recognition in English, and visual agents; and a JSAPI-based software that incorporates speech synthesis and recognition to IRC through Java APIs.
Keywords:	voz Síntese Reconhecimento SAPI JSAPI Soeech Synthesis Recognition
metadata.dc.subject.cnpq:	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
metadata.dc.publisher.country:	Brasil
Publisher:	Universidade Federal do Pará
metadata.dc.publisher.initials:	UFPA
metadata.dc.publisher.department:	Instituto de Tecnologia
metadata.dc.publisher.program:	Programa de Pós-Graduação em Engenharia Elétrica
metadata.dc.rights:	Acesso Aberto
Appears in Collections:	Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Files in This Item:

File	Description	Size	Format
Dissertacao_DesenvolvimentoAplicativosUsando.pdf		374,78 kB	Adobe PDF	View/Open

Show full item record Recommend this item

This item is licensed under a Creative Commons License