Use este identificador para citar ou linkar para este item: https://repositorio.ufpa.br/jspui/handle/2011/16790
Registro completo de metadados
Campo DCValorIdioma
dc.creatorFALCÃO, Igor Wenner Silva-
dc.date.accessioned2025-01-30T18:05:17Z-
dc.date.available2025-01-30T18:05:17Z-
dc.date.issued2024-12-18-
dc.identifier.citationFALCÃO, Igor Wenner Silva. Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiologicas da hanseniase na Amazônia. Orientador: Marcos César da Rocha Seruffo.; Coorientador: Diego Lisboa Cardoso. 2024, 86 f. Tese (Doutorado em Engenharia Elétrica) - Instituto de Tecnologia, , Universidade Federal do Pará, Belém, 2024. Disponível em: . Acesso em:.pt_BR
dc.identifier.urihttps://repositorio.ufpa.br/jspui/handle/2011/16790-
dc.description.abstractLeprosy is a significant public health problem that largely affects low-income populations. Although the World Health Organization (WHO) establishes guidelines for diagnosis, prevention, and treatment, disease detection faces limitations, often resulting in late or inaccurate diagnoses and leading to serious neurological complications and multidrug-resistant cases. Therefore, early diagnosis is essential to reduce the burden of this disease. Machine learning has been widely used in several areas of science and industry, but especially in health, where it plays an essential role in the analysis and treatment of large volumes of data. In this sense, this thesis investigates the application of a model based on Data Science and Machine Learning to act in the specification of the clinical profile of possible leprosy cases in the Amazon Region and, thus, to be able to act preventively in the early diagnosis and treatment of patients under medical followup. The work takes into account clinical data of patients from a non-public dataset, collected between 2015 and 2020 in the North region of Brazil. Therefore, this thesis proposes a learning model to identify groups clinically affected by the disease using Clustering and Random Forest techniques. In the results obtained, the proposed model demonstrated efficiency in evaluating the probability of individuals being ill, achieving an accuracy of 90.39% in the performance evaluation and identifying a probability of 83.46% of an individual being ill, considering a set of epidemiological and non-generic variables. This approach offers a promising vision for the future of health, allowing the formulation of effective strategies for the early identification of possible cases.pt_BR
dc.description.provenanceSubmitted by Luciclea Silva (luci@ufpa.br) on 2025-01-30T18:05:01Z No. of bitstreams: 2 Tese_CienciaDadosAprendizado.pdf: 3238971 bytes, checksum: 5001a0f2e2b6370ec67b895208114921 (MD5) license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)en
dc.description.provenanceApproved for entry into archive by Luciclea Silva (luci@ufpa.br) on 2025-01-30T18:05:16Z (GMT) No. of bitstreams: 2 Tese_CienciaDadosAprendizado.pdf: 3238971 bytes, checksum: 5001a0f2e2b6370ec67b895208114921 (MD5) license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)en
dc.description.provenanceMade available in DSpace on 2025-01-30T18:05:17Z (GMT). No. of bitstreams: 2 Tese_CienciaDadosAprendizado.pdf: 3238971 bytes, checksum: 5001a0f2e2b6370ec67b895208114921 (MD5) license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Previous issue date: 2024-12-18en
dc.languageporpt_BR
dc.publisherUniversidade Federal do Parápt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.source.uriDisponível na internet via correio eletrônico: bibliotecaitec@ufpa.brpt_BR
dc.subjectHanseníasept_BR
dc.subjectCiência de dadospt_BR
dc.subjectFloresta aleatóriapt_BR
dc.subjectData Scienceen
dc.subjectClusteringen
dc.subjectLeprosyen
dc.titleCiência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazôniapt_BR
dc.typeTesept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Tecnologiapt_BR
dc.publisher.initialsUFPApt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOESpt_BR
dc.contributor.advisor1SERUFFO, Marcos César da Rocha-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3794198610723464pt_BR
dc.contributor.advisor-co1CARDOSO, Diego Lisboa-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/0507944343674734pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/6677376621642966pt_BR
dc.description.resumoA hanseníase é um problema de saúde pública significativo que afeta, em grande parte, populações de baixo nível sócioeconômico. Embora a Organização Mundial da Saúde (OMS) estabeleça diretrizes para diagnóstico, prevenção e tratamento, a detecção da doença enfrenta limitacões, frequentemente resultando em diagnósticos tardios ou imprecisos e levando a complicações neurológicas graves e casos multirresistentes. Portanto, o diagnóstico precoce é essencial para reduzir a carga dessa doença. O aprendizado de máquina vem sendo largamente utilizado em diversas áreas da ciência e da indústria, mas especialmente na saúde, área em que desempenha um papel essencial na análise e tratamento de grandes volumes de dados. Neste sentido, esta tese investiga a aplicação de um modelo baseado em Ciência de Dados e Aprendizado de Máquina para atuar na especificação do perfil clínico de possíveis casos da hanseníase na Região Amazônica e, com isso, poder-se agir preventivamente no diagnóstico precoce e tratamento de pacientes em acompanhamento médico. O trabalho leva em consideracão dados clínicos de pacientes provenientes de um conjunto de dados não públicos, coletados entre 2015 e 2020 na região Norte do Brasil. Logo, esta tese propõe um modelo de aprendizado para identificar grupos clinicamente afetados pela doença usando técnicas de Agrupamento e Random Forest. Nos resultados obtidos, o modelo proposto demonstrou eficiência ao avaliar a probabilidade de indivíduos estarem doentes, alcançando uma precisão de 90,39% na avaliação de performance e identificando uma probabilidade de 83,46% de um indivíduo estar doente, considerando um conjunto de variáveis epidemiológicas e não genéricas. Essa abordagem oferece uma visão promissora para o futuro da saúde, permitindo a formulação de estratégias eficazes para a identificação precoce de possíveis casos.pt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétricapt_BR
dc.subject.areadeconcentracaoCOMPUTAÇÃO APLICADApt_BR
Aparece nas coleções:Teses em Engenharia Elétrica (Doutorado) - PPGEE/ITEC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Tese_CienciaDadosAprendizado.pdf3,16 MBAdobe PDFVisualizar/Abrir


Este item está licenciado sob uma Licença Creative Commons Creative Commons