Please use this identifier to cite or link to this item: http://repositorio.ufpa.br/jspui/handle/2011/2533
metadata.dc.type: Dissertação
Issue Date: 17-Feb-2006
metadata.dc.creator: TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz
metadata.dc.contributor.advisor1: KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
metadata.dc.contributor.advisor-co1: PELAES, Evaldo Gonçalves
Title: Classificação fonética utilizando Boosting e SVM
Citation: TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz. Classificação fonética utilizando Boosting e SVM. Orientador: Evaldo Gonçalves Pelaes. 2006. 78 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Tecnológico, Universidade Federal do Pará, Belém, 2006. Disponível em: http://repositorio.ufpa.br/jspui/2011/2533. Acesso em:.
metadata.dc.description.resumo: Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.
Abstract: With the aim of setting up a Automatic Speech Recognition (ASR) system, a task named Phonetic Classification can be used. That task consists in, from a speech sample, deciding which phoneme was pronounced by a speaker. To ease the classification task and to enhance the most marked characteristics of the phonemes, the speech samples are usually pre-processed by a front-end. A front-end, as a general rule, extracts a set of features to each speech sample. After that, these features are inserted in a classification algorithm, that (already properly trained) will try to decide which phoneme was pronounced. There is a rule of thumb which says that the more features the system uses, the smaller the classification error rate will be. The disadvantage to that is the larger computational cost. Feature Selection task aims to show which are the most relevant (or more used) features in a classification task. Therefore, it is possible to discover which are the redundant features, that make little (or no) contribution to the classification task. The aim of this work is to apply SVM classificator in Phonetic Classification task, using TIMIT database, and discover the most relevant features in this classification using Boosting approach to implement Feature Selection.
Keywords: Fonemas
Classificação
SVM
Parâmetros
Phonemes
Classification
SVM
Features
Front-end
Feature selection
Boosting
TIMIT
metadata.dc.subject.cnpq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal do Pará
metadata.dc.publisher.initials: UFPA
metadata.dc.publisher.department: Instituto de Tecnologia
metadata.dc.publisher.program: Programa de Pós-Graduação em Engenharia Elétrica
metadata.dc.rights: Acesso Aberto
Appears in Collections:Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Files in This Item:
File Description SizeFormat 
Dissertacao_ClassificacaoFoneticaUtilizando.pdf1,91 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons