Please use this identifier to cite or link to this item: http://repositorio.ufpa.br:8080/jspui/handle/2011/4617
Full metadata record
DC FieldValueLanguage
dc.creatorDIAS, Lilian de Jesus Chaves-
dc.date.accessioned2014-01-17T14:29:14Z-
dc.date.available2014-01-17T14:29:14Z-
dc.date.issued2013-06-18-
dc.identifier.citationDIAS, Lilian de Jesus Chaves. Imputação de dados baseado em otimização por enxame de partículas considerando os principais mecanismos de ausência de dados.Orientador: Ádamo Lima de Santana. 2013. 64 f. Dissertação (Mestrado em Engenharia Elétrica.) - em Engenharia Elétrica., Universidade Federal do Pará, Belém, 2013. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/4617. Acesso em:.pt_BR
dc.identifier.urihttp://repositorio.ufpa.br/jspui/handle/2011/4617-
dc.description.abstractDuring the knowledge discovery in database process some problems may be found, e.g. some instance of one attribute may be missing. Such issue can even cause harmful effects to the final results of the process, since directly affects the data quality of a database which some machine learning algorithm may be applied to. In the literature are some proposals to solve such harm; among them is the data imputation process that estimates a plausible value to fill in the missing one. Inside the area of missing value treatment, some researches were analyzed and observations were raised such as, a few utilization of synthetic datasets that simulates the main mechanisms of missingness and a tendency to use bioinspired algorithm to treat the missing values. From this scenario, the present dissertation analyses an imputation method based on particle swarm optimization, an underexplored one, and applies it to the treatment of synthetics datasets generated considering the main mechanisms of missingness, MAR, MCAR and NMAR. The results obtained when comparing the algorithm against different configurations of itself and another two treatments known in the area (KNNImpute and SVMImpute) are promising for its use as missing value treatment whereas the bioinspired method reached the bests values for the major of the experiments.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal do Pará-
dc.rightsAcesso Aberto-
dc.subjectEnxame de partículaspt_BR
dc.subjectValores ausentespt_BR
dc.subjectImputação de dadospt_BR
dc.subjectPSOpt_BR
dc.subjectTratamento de valores ausentespt_BR
dc.subjectMecanismo de ausência de dadospt_BR
dc.subjectValores faltosospt_BR
dc.subjectMissing value treatmenten
dc.subjectMechanism of missingnessen
dc.subjectData imputationen
dc.subjectMissing dateen
dc.subjectParticle swarm optimizationen
dc.titleImputação de dados baseado em otimização por enxame de partículas considerando os principais mecanismos de ausência de dadospt_BR
dc.typeDissertaçãopt_BR
dc.publisher.countryBrasil-
dc.publisher.departmentInstituto de Tecnologia-
dc.publisher.initialsUFPA-
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO-
dc.contributor.advisor1SANTANA, Ádamo Lima de-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4073088744952858-
dc.creator.Latteshttp://lattes.cnpq.br/0212800890257958-
dc.description.resumoDurante o processo de extração do conhecimento em bases de dados, alguns problemas podem ser encontrados como por exemplo, a ausência de determinada instância de um atributo. A ocorrência de tal problemática pode causar efeitos danosos nos resultados finais do processo, pois afeta diretamente a qualidade dos dados a ser submetido a um algoritmo de aprendizado de máquina. Na literatura, diversas propostas são apresentadas a fim de contornar tal dano, dentre eles está a de imputação de dados, a qual estima um valor plausível para substituir o ausente. Seguindo essa área de solução para o problema de valores ausentes, diversos trabalhos foram analisados e algumas observações foram realizadas como, a pouca utilização de bases sintéticas que simulem os principais mecanismos de ausência de dados e uma recente tendência a utilização de algoritmos bio-inspirados como tratamento do problema. Com base nesse cenário, esta dissertação apresenta um método de imputação de dados baseado em otimização por enxame de partículas, pouco explorado na área, e o aplica para o tratamento de bases sinteticamente geradas, as quais consideram os principais mecanismos de ausência de dados, MAR, MCAR e NMAR. Os resultados obtidos ao comprar diferentes configurações do método à outros dois conhecidos na área (KNNImpute e SVMImpute) são promissores para sua utilização na área de tratamento de valores ausentes uma vez que alcançou os melhores valores na maioria dos experimentos realizados.pt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica-
Appears in Collections:Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Files in This Item:
File Description SizeFormat 
Dissertacao_ImputacaoDadosBaseado.pdf1,18 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons