Estratégias evolucionárias para otimização no tratamento de dados ausentes por imputação múltipla de dados

Carregando...
Imagem de Miniatura

Tipo

Data

2016-02-16

Título da Revista

ISSN da Revista

Título de Volume

item.page.theme

Editora(s)

Universidade Federal do Pará

Tipo de acesso

Acesso Abertoaccess-logo

Contido em

Citação

LOBATO, Fábio Manoel França. Estratégias evolucionárias para otimização no tratamento de dados ausentes por imputação múltipla de dados. Orientador: Ádamo Lima de Santana. 2016. 138 f. Tese (Doutorado em Engenharia Elétrica.) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2016. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/7267. Acesso em:.

DOI

A análise de dados envolve aquisição e organização de informação com o objetivo de se obter conhecimento a partir deles, propiciando avanços científicos nos mais variados campos, bem como provendo vantagens competitivas às corporações. Neste âmbito, um problema ubíquo na área merece destaque, os valores ausentes, pois a maior parte das técnicas de análise de dados não consegue lidar de forma satisfatória com dados incompletos, impactando negativamente o resultado final. Visando contornar os efeitos danosos desta problemática, diversos trabalhos vêm sendo desenvolvidos nas áreas de análise estatística e aprendizado de máquina, com destaque para o estudo de métodos de Imputação Múltipla de Dados (IMD), que consiste no preenchimento dos dados ausentes por valores plausíveis. Tal metodologia pode ser vista como um problema de otimização combinatória, onde buscam-se valores candidatos à imputação de forma a reduzir o viés imposto por esta problemática. Meta-heurísticas, em especial, métodos baseados em Computação Evolucionária (CE) têm sido aplicadas com sucesso em problemas de otimização combinatórios. Apesar dos recentes avanços na área, percebe-se algumas falhas na modelagem dos métodos de imputação baseados em CE existentes. Visando preencher tais lacunas encontradas na literatura, esta tese apresenta uma descrição da IMD como um problema de otimização combinatória e propõe métodos baseados em CE neste contexto. Além disso, em virtude das falhas encontradas na modelagem dos métodos recentemente propostos na literatura e da necessidade de se adotar diferentes medidas de desempenho para avaliar a eficiência dos métodos de imputação, também é proposto neste projeto de tese um algoritmo genético multiobjetivo para a imputação de dados no contexto de classificação de padrões. Este método mostra-se flexível quanto aos tipos de dados, além de evitar a análise de caso completo. Dado a flexibilidade da abordagem proposta, é possível ainda utilizá-lo em outros cenários como no aprendizado não supervisionado, classificação multirrótulo e em análise de séries temporais.

Agência de Fomento

CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico, CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior

browse.metadata.ispartofseries

item.page.isbn

Fonte

item.page.dc.location.country

Citação

LOBATO, Fábio Manoel França. Estratégias evolucionárias para otimização no tratamento de dados ausentes por imputação múltipla de dados. Orientador: Ádamo Lima de Santana. 2016. 138 f. Tese (Doutorado em Engenharia Elétrica.) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2016. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/7267. Acesso em:.