Um software de reconhecimento de voz para português brasileiro

SILVA, Carlos Patrick Alves da

Use este identificador para citar ou linkar para este item: https://repositorio.ufpa.br/jspui/handle/2011/2074

Tipo:	Dissertação
Data do documento:	17-Jun-2010
Autor(es):	SILVA, Carlos Patrick Alves da
Primeiro(a) Orientador(a):	KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
Título:	Um software de reconhecimento de voz para português brasileiro
Agência de fomento:	CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
Citar como:	SILVA, Carlos Patrick Alves da. Um Software de reconhecimento de voz para português brasileiro. Orientador: Aldebaro Barreto da Rocha Klautau Júnior. 2010. 74 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2010. Disponível em: http://www.repositorio.ufpa.br:8080/jspui/handle/2011/2074. Acesso em:.
Resumo:	Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.
Abstract:	This work describes a speech recognition software for Brazilian Portuguese. The main objective is to build a system for large vocabulary continuous speech recognition, able to be used in real-time applications. The concepts, characteristics and all steps needed for the construction of such systems are presented. Several resources were produced and made available: acoustic and language models, new voice and text corpora. The text corpus has been built through the extraction and automatic formatting of text from newspapers on the Internet. In addition, two voice corpora were produced, one based on audiobooks and another specifically developed to simulate real-time tests. This work also proposes the use of speaker adaptation techniques for solving the acoustic mismatch problem between speech corpora. Finally, an application programming interface is presented in order to facilitate using the open-source Julius speech decoder. Performance tests are also presented, comparing the developed system with a commercial software.
Palavras-chave:	Sistema de reconhecimento de voz Língua portuguesa Processamento de dados Fonética Técnicas de adaptação de locutor Voice recognition system Portuguese language Data processing Phonetics Speaker adaptation techniques
CNPq:	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
País:	Brasil
Instituição:	Universidade Federal do Pará
Sigla da Instituição:	UFPA
Instituto:	Instituto de Tecnologia
Programa:	Programa de Pós-Graduação em Engenharia Elétrica
Tipo de Acesso:	Acesso Aberto
Aparece nas coleções:	Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Dissertacao_SoftwareReconhecimentoVoz.pdf		959,03 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciado sob uma Licença Creative Commons