SIBI! EM BREVE O RIUFPA ESTARÁ LIBERADO! AGUARDEM!
 

Imitação da voz humana através do processo de análise-por-síntese utilizando algoritmo genético e sintetizador de voz por formantes

Imagem de Miniatura

Tipo

Data

18-12-2015

Título da Revista

ISSN da Revista

Título de Volume

item.page.theme

Tipo de acesso

Acesso Abertoaccess-logo

Agência de fomento

CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico

Contido em

Citar como

ARAUJO, Fabiola Pantoja Oliveira. Imitação da voz humana através do processo de análise-por-síntese utilizando algoritmo genético e sintetizador de voz por formantes. 2015. 107 f. Orientador: Aldebaro Barreto da Rocha Klautau Júnior. Tese (Doutoradoem Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2015. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/7749. Acesso em:.

DOI

A imitação da voz através do mecanismo de utterance copy consiste em estimar os parâmetros de entrada de um sintetizador de voz para gerar um sinal parecido com o da voz original. Este processo distingue-se da tradicional conversão texto-fala, porém é usado em muitas áreas, especialmente, em Linguística e na Saúde. Imitar a voz humana através deste mecanismo é um problema inverso difícil, pois este mapeamento é não linear e de muitos para um. Por exemplo, existem diferentes combinações dos valores dos parâmetros de entrada do sintetizador que produzem o mesmo sinal de voz sintética. Sendo assim, realizar manualmente a imitação da voz requer uma quantidade considerável de tempo e métodos automáticos, como o proposto aqui, são de interesse. Este trabalho apresenta um arcabouço baseado em algoritmo genético (AG) para estimar automaticamente os valores dos parâmetros de entrada de um sintetizador de voz por formantes, utilizando o processo de análise-por-síntese. Os resultados apresentados compreendem a imitação de vozes sintéticas (geradas por computador) e naturais (geradas por humanos) em inglês americano, para falantes masculinos e femininos. Estes resultados são comparados com os obtidos através do Winsnoori (baseline), o único software disponível atualmente que executa a mesma tarefa. Os experimentos mostraram que o arcabouço desenvolvido (newGASpeech) é uma alternativa eficaz para o trabalhoso processo manual de estimar os valores dos parâmetros de entrada de um sintetizador por formantes, superando a qualidade das vozes geradas pelo baseline em relação à cinco métricas objetivas utilizadas e à avaliação subjetiva aplicada a vinte e sete ouvintes não especialistas na área de voz e nem no idioma adotado.

browse.metadata.ispartofseries

Área de concentração

Linha de pesquisa

CNPq

CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO, CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES

País

Brasil

Instituição

Universidade Federal do Pará

Sigla da Instituição

UFPA

Instituto

Instituto de Tecnologia

Programa

Programa de Pós-Graduação em Engenharia Elétrica

item.page.isbn

Fonte

item.page.dc.location.country

Fonte URI