Imputação de dados baseado em otimização por enxame de partículas considerando os principais mecanismos de ausência de dados

Carregando...
Imagem de Miniatura

Data

2013-06-18

Título da Revista

ISSN da Revista

Título de Volume

item.page.theme

Editora(s)

Universidade Federal do Pará

Tipo de acesso

Acesso Abertoaccess-logo

Contido em

Citação

DIAS, Lilian de Jesus Chaves. Imputação de dados baseado em otimização por enxame de partículas considerando os principais mecanismos de ausência de dados.Orientador: Ádamo Lima de Santana. 2013. 64 f. Dissertação (Mestrado em Engenharia Elétrica.) - em Engenharia Elétrica., Universidade Federal do Pará, Belém, 2013. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/4617. Acesso em:.

DOI

Durante o processo de extração do conhecimento em bases de dados, alguns problemas podem ser encontrados como por exemplo, a ausência de determinada instância de um atributo. A ocorrência de tal problemática pode causar efeitos danosos nos resultados finais do processo, pois afeta diretamente a qualidade dos dados a ser submetido a um algoritmo de aprendizado de máquina. Na literatura, diversas propostas são apresentadas a fim de contornar tal dano, dentre eles está a de imputação de dados, a qual estima um valor plausível para substituir o ausente. Seguindo essa área de solução para o problema de valores ausentes, diversos trabalhos foram analisados e algumas observações foram realizadas como, a pouca utilização de bases sintéticas que simulem os principais mecanismos de ausência de dados e uma recente tendência a utilização de algoritmos bio-inspirados como tratamento do problema. Com base nesse cenário, esta dissertação apresenta um método de imputação de dados baseado em otimização por enxame de partículas, pouco explorado na área, e o aplica para o tratamento de bases sinteticamente geradas, as quais consideram os principais mecanismos de ausência de dados, MAR, MCAR e NMAR. Os resultados obtidos ao comprar diferentes configurações do método à outros dois conhecidos na área (KNNImpute e SVMImpute) são promissores para sua utilização na área de tratamento de valores ausentes uma vez que alcançou os melhores valores na maioria dos experimentos realizados.

Agência de Fomento

browse.metadata.ispartofseries

item.page.isbn

Fonte

item.page.dc.location.country

Citação

DIAS, Lilian de Jesus Chaves. Imputação de dados baseado em otimização por enxame de partículas considerando os principais mecanismos de ausência de dados.Orientador: Ádamo Lima de Santana. 2013. 64 f. Dissertação (Mestrado em Engenharia Elétrica.) - em Engenharia Elétrica., Universidade Federal do Pará, Belém, 2013. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/4617. Acesso em:.