Dissertações em Computação Aplicada (Mestrado) - PPCA/NDAE/Tucuruí
URI Permanente para esta coleçãohttps://repositorio.ufpa.br/handle/2011/9399
Navegar
Navegando Dissertações em Computação Aplicada (Mestrado) - PPCA/NDAE/Tucuruí por Assunto "Aprendizado de máquina"
Agora exibindo 1 - 4 de 4
- Resultados por página
- Opções de Ordenação
Dissertação Acesso aberto (Open Access) Aplicação e comparação de técnicas de classificação automática de documentos: um estudo de caso com o dataset do domínio jurídico “Victor”(Universidade Federal do Pará, 2024-02-01) MARTINS, Victor Simões; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; https://orcid.org/0000-0001-8280-2928A aplicação do Processamento de Linguagem Natural (PLN) e Inteligência Artifical (IA) no contexto jurídico brasileiro é uma área em franco crescimento, que pode alterar o modo e rotina de trabalho dos profissionais da área, dada a quantidade de texto gerada. Dentre as possibilidades de aplicação da PLN e IA há a classificação automática de documentos, que dentre outras, pode ser empregada na automatização do processo de digitalização de Processos Judiciais que ainda estão apenas em meio físico. Assim, este trabalho aplica e compara algoritmos de IA para a classificação de documentos jurídicos. Os algoritmos são divididos em duas Abordagens diferentes, a primeira (I) separa o processo representação computacional do texto do treinamento do classificador em si aplicando SVM e Regressão Logística em conjunto com representações computacionais baseadas em: TF-IDF, Word2Vec, FastText e BERT. A segunda Abordagem (II) realiza em conjunto a representação computacional dos documentos e o treinamento do classificador, e para tal são aplicados algoritmos de Deep Learning baseados em redes neurais recorrentes, especificamente o ULMFiT (Universal Language Model Fine-tuning) e HAN (Hierarchical Attention Networks). O Dataset estudado é denominado VICTOR, composto por documentos do Supremo Tribunal Federal (STF) do Brasil. A pesquisa conclui pela possibilidade de aplicação de ambas abordagens para a classificação de documentos jurídicos do Dataset empregado, bem como, apesar de menos custosos computacionalmente, os pipelines de classificação da Abordagem I que empregam a representação computacional do documento com TF-IDF apresentam resultados equivalentes aos pipelines que empregam Deep Learning. Além disso, a especialização da representação computacional dos documentos com os dados do dataset em estudo, melhoram o desempenho dos pipelines que empregam Word2Vec, FastText e ULMFiT, quando comparados aos pipelines que aplicam as representações genéricas desses, ou seja, modelos pré-treinados com dados do contexto geral.Dissertação Acesso aberto (Open Access) Clusterização de padrões espaço-temporais de precipitação na Amazônia via deep convolutional autoencoder(Universidade Federal do Pará, 2023-07-07) SILVA, Vander Augusto Oliveira da; TEIXEIRA, Raphael Barros; http://lattes.cnpq.br/4902824086591521; https://orcid.org/0000-0003-2993-802XEstudos utilizando diferentes métodos de aprendizado de máquina para descoberta de conhecimento e reconhecimento de padrões em séries temporais de precipitação são cada vez mais frequentes na literatura. Identificar e analisar padrões em séries temporais de precipitação em uma determinada região é fundamental para seu desenvolvimento socioeconômico. Logo, pode-se afirmar que o conhecimento e compreensão das características pluviométricas das regiões são importantes para viabilizar o planejamento do uso, manejo e conservação dos recursos hídricos. O fenômeno natural da precipitação é um processo fundamental de impacto direto nas bacias hidrográficas e no desenvolvimento humano e ambiental. A variabilidade desse fenômeno produz implicações importantes na navegabilidade dos rios, sobre a abundância do indivíduo e a riqueza das espécies. Nos últimos anos muitos estudos com essa abordagem foram realizados no Brasil, principalmente na região amazônica. Esta pesquisa teve como objetivo desenvolvimento de um método computacional para análise de séries temporais de precipitação utilizando técnicas de machine learning com aprendizado não supervisionado, afim de propor um método capaz de realizar a extração de características complexas dos dados, obtendo um mapa de atributos em baixa dimensionalidade para reconhecimento de padrões, descoberta de regiões homogêneas com relação à precipitação e reconstrução aproximada de séries temporais de precipitação da Amazônia Legal. O modelo de rede neural de aprendizado profundo proposto é treinado para aprender as principais e mais complexas características dos dados originais e apresentá-los em baixa dimensionalidade no espaço latente. Após o treinamento os resultados se mostram promissores, as observações dos dados reconstruídos apresentaram um bom desempenho conforme avaliação da métrica de RMSE e NRMSE com valores resultantes iguais a 0.06610 e 0.3355 respectivamente. A análise da representação dos dados em baixa dimensão foi aplicada e analisada por uma estrutura de clustering usando aglomerativo hierárquico com método de Ward. Essa metodologia também apresentou bons resultados, pois realizou agrupamentos consistentes caracterizando regiões homogêneas com relação aos dados de precipitação. Desta forma, demonstrando que a representação em baixa dimensionalidade carregava as características principais das séries temporais dos dados analisados. Destaca-se que o método desenvolvido nesse estudo pode ser aplicado não apenas na região amazônica, mas também em outras áreas com desafios semelhantes relacionados à análise de séries temporais.Dissertação Acesso aberto (Open Access) Implementação de modelos computacionais na predição temporal e espaço-temporal de parâmetros de qualidade de água(Universidade Federal do Pará, 2021-12-14) ALMEIDA, Anderson Francisco de Sousa; MERLIN, Bruno; http://lattes.cnpq.br/7336467549495208; HTTPS://ORCID.ORG/0000-0001-7327-9960; GONZÁLEZ, Marcos Tulio Amaris; http://lattes.cnpq.br/9970287865377659A qualidade da água esta diretamente relacionada com o nível de poluição causada pelas acoes antrópicas e industrias, destacando-se como consequência a redução da disponibilidade de uma água de qualidade. Por isso, são realizados os monitoramentos limnológicos dos parâmetros básicos da qualidade da água como forma de obtenção de dados que norteiam as tomadas de decisão dos órgãos de recursos hídricos. Neste contexto, o presente estudo tem a implementação de algoritmos de aprendizado de maquina para predizer de modo temporal e espaço-temporal os dados dos parâmetros da qualidade da água. As técnicas de aprendizado de maquina usadas foram regressão linear, ramdom forest, redes neurais MLP e L STM. Foram usados dois pontos de coletas de uma Unidade Gerenciamento de Recursos Hídricos em São Paulo, Brasil. Os modelos são avaliados atraves de métricas MAPE ( Erro percentual médio absoluto) e RMSE( Erro raiz quadrada média). Portanto, na predição temporal a técnica LSTM apresentou o melhor desempenho em relação as demais técnicas, pois tem menor resultado de RMSE médio, com 2,47. Porem, na predição espaço-temporal, o MLP tem os melhores desempenhos tanto em relação as demais técnicas quanto aos dados utilizados, pois tem menores resultados médios de MAPE e RMPE, respectivamente, 5,94% e 1,34. Desse modo, estes desempenhos neurais podem ser justificados pela não linearidade dos dados parâmetros. Além disso, os resultados dos experimentos visam contribuir com os processos de monitoramento da qualidade da água e auxiliar o planejamento da gestão hídrica de modo que atenda as legislações vigentes e possibilite a indicação de politicas publicas atraves de modelos de aprendizado de maquina na predição dos parâmetros de qualidade de água.Dissertação Acesso aberto (Open Access) PredictmodelGUI: ferramenta para classificação de genes essenciais através de técnicas de aprendizado de máquina(Universidade Federal do Pará, 2025-06-06) MOIA, Gislenne da Silva; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; HTTPS://ORCID.ORG/0000-0001-8280-2928; VERAS, Adonney Allan de Oliveira; http://lattes.cnpq.br/2201652617167877; https://orcid.org/0000-0002-7227-0590As tecnologias de sequenciamento de DNA proporcionaram avanços significativos no conhecimento sobre o conteúdo gênico de inúmeros organismos, desde microrganismos até seres humanos. Dentre as análises realizadas pelas Ciências Ômicas, a Anotação se destaca como uma das mais importantes. Conceitualmente, esse processo consiste na inferência de informações biológicas a partir de sequências genômicas, o que permite aos Pesquisadores compreender a função de produtos genéticos, como os genes — Unidades Básicas da Hereditariedade responsáveis por características físicas e hereditárias de um organismo. Alguns genes desempenham funções vitais, pois codificam proteínas ou RNAs essenciais para processos como o Metabolismo Celular, que participam em vias cruciais como a Glicólise e o Ciclo do Ácido Tricarboxílico. As Plataformas de Sequenciamento passaram a gerar grandes volumes de dados, o que impulsionou avanços nas Áreas Ômicas e fomentou o desenvolvimento de métodos computacionais voltados às mais diversas análises. Mais recentemente, técnicas de Machine Learning e Inteligência Artificial têm sido aplicadas a esses dados, com estudos que demonstram a eficácia de abordagens inspiradas na Biologia. Esses modelos não exigem programação baseada em regras, embora sua criação ainda requeira habilidades avançadas em Programação e Computação. Com o objetivo de contribuir para a solução desse desafio, este estudo apresenta o PredictModelGUI, uma interface gráfica desenvolvida em Python que implementa nove modelos para classificar Genes Essenciais. A interface permite importar conjuntos de dados, re-treinar os modelos e ajustar parâmetros. As informações são armazenadas no banco de dados do software, o que assegura rastreabilidade e proporciona uma ferramenta simples e intuitiva para testar diferentes configurações.
