Imitação da voz humana através do processo de análise-por-síntese utilizando algoritmo genético e sintetizador de voz por formantes

ARAÚJO, Fabiola Pantoja Oliveira

Imitação da voz humana através do processo de análise-por-síntese utilizando algoritmo genético e sintetizador de voz por formantes

Arquivo(s)

Tese_ImitacaoVozHumana.pdf (1.95 MB)

Tipo

Tese

Data

18-12-2015

Autor(es)

ARAÚJO, Fabiola Pantoja Oliveira

Orientador(es)

KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha

Tipo de acesso

Acesso Aberto

Agência de fomento

CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico

Citar como

ARAUJO, Fabiola Pantoja Oliveira. Imitação da voz humana através do processo de análise-por-síntese utilizando algoritmo genético e sintetizador de voz por formantes. 2015. 107 f. Orientador: Aldebaro Barreto da Rocha Klautau Júnior. Tese (Doutoradoem Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2015. Disponível em: https://repositorio.ufpa.br/handle/2011/7749. Acesso em:.

A imitação da voz através do mecanismo de utterance copy consiste em estimar os parâmetros de entrada de um sintetizador de voz para gerar um sinal parecido com o da voz original. Este processo distingue-se da tradicional conversão texto-fala, porém é usado em muitas áreas, especialmente, em Linguística e na Saúde. Imitar a voz humana através deste mecanismo é um problema inverso difícil, pois este mapeamento é não linear e de muitos para um. Por exemplo, existem diferentes combinações dos valores dos parâmetros de entrada do sintetizador que produzem o mesmo sinal de voz sintética. Sendo assim, realizar manualmente a imitação da voz requer uma quantidade considerável de tempo e métodos automáticos, como o proposto aqui, são de interesse. Este trabalho apresenta um arcabouço baseado em algoritmo genético (AG) para estimar automaticamente os valores dos parâmetros de entrada de um sintetizador de voz por formantes, utilizando o processo de análise-por-síntese. Os resultados apresentados compreendem a imitação de vozes sintéticas (geradas por computador) e naturais (geradas por humanos) em inglês americano, para falantes masculinos e femininos. Estes resultados são comparados com os obtidos através do Winsnoori (baseline), o único software disponível atualmente que executa a mesma tarefa. Os experimentos mostraram que o arcabouço desenvolvido (newGASpeech) é uma alternativa eficaz para o trabalhoso processo manual de estimar os valores dos parâmetros de entrada de um sintetizador por formantes, superando a qualidade das vozes geradas pelo baseline em relação à cinco métricas objetivas utilizadas e à avaliação subjetiva aplicada a vinte e sete ouvintes não especialistas na área de voz e nem no idioma adotado.

Palavras-chave

Imitação da voz Sistemas de processamento da fala Algoritmos genéticos Análise-por-síntese Sintetizador por formantes Voice imitation Genetic algorithm Analysis-by-synthesis Formant synthesizer Speech processing system

CNPq

CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES

País

Brasil

Instituição(ões)

Universidade Federal do Pará

Sigla(s) da(s) Instituição(ões)

UFPA

Instituto

Instituto de Tecnologia

Programa

Programa de Pós-Graduação em Engenharia Elétrica

URI

https://repositorio.ufpa.br/handle/2011/7749

Coleção

Teses em Engenharia Elétrica (Doutorado) - PPGEE/ITEC

Página do item completo

Este item está licenciado sob uma Licença Creative Commons

Imitação da voz humana através do processo de análise-por-síntese utilizando algoritmo genético e sintetizador de voz por formantes

Arquivo(s)

Tipo

Data

Autor(es)

Afiliação

Grau

Orientador(es)

Título da Revista

ISSN da Revista

Título de Volume

Tema

Eixo temático

Tipo de acesso

Agência de fomento

Contido em

Citar como

DOI

browse.metadata.ispartofseries

Palavras-chave

Área de concentração

Linha de pesquisa

CNPq

País

Instituição(ões)

Sigla(s) da(s) Instituição(ões)

Instituto

Programa

item.page.isbn

Fonte

item.page.dc.location.country

Fonte URI

URI

Coleção

Imitação da voz humana através do processo de análise-por-síntese utilizando algoritmo genético e sintetizador de voz por formantes

Arquivo(s)

Tipo

Data

Autor(es)

Afiliação

Grau

Orientador(es)

Título da Revista

ISSN da Revista

Título de Volume

Tema

Eixo temático

Tipo de acesso

Agência de fomento

Compartilhar

Contido em

Citar como

DOI

browse.metadata.ispartofseries

Palavras-chave

Área de concentração

Linha de pesquisa

CNPq

País

Instituição(ões)

Sigla(s) da(s) Instituição(ões)

Instituto

Programa

item.page.isbn

Fonte

item.page.dc.location.country

Fonte URI

URI

Coleção