SIBI! EM BREVE O RIUFPA ESTARÁ LIBERADO! AGUARDEM!
 

Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro

Imagem de Miniatura

Tipo

Data

17-06-2011

Título da Revista

ISSN da Revista

Título de Volume

item.page.theme

Tipo de acesso

Acesso Abertoaccess-logo

Agência de fomento

FAPESPA - Fundação Amazônia de Amparo a Estudos e Pesquisas

Contido em

Citar como

SAMPAIO NETO, Nelson Cruz. Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro. Orientador: Aldebaro Barreto da Rocha Klautau Júnior. 2011. 96 f. Tese (Doutorado em Engenharia Elétrica.) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2011. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/2845. Acesso em:.

DOI

Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.

browse.metadata.ispartofseries

Área de concentração

Linha de pesquisa

CNPq

CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES

País

Brasil

Instituição

Universidade Federal do Pará

Sigla da Instituição

UFPA

Instituto

Instituto de Tecnologia

Programa

Programa de Pós-Graduação em Engenharia Elétrica

item.page.isbn

Fonte

item.page.dc.location.country

Fonte URI