Programa de Pós-Graduação em Computação Aplicada - PPCA/NDAE/Tucuruí

URI Permanente desta comunidadehttps://repositorio.ufpa.br/handle/2011/9398

Navegar

Agora exibindo 1 - 5 de 5

Acesso aberto (Open Access)
Aplicação e comparação de técnicas de classificação automática de documentos: um estudo de caso com o dataset do domínio jurídico “Victor”
(Universidade Federal do Pará, 2024-02-01) MARTINS, Victor Simões; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; https://orcid.org/0000-0001-8280-2928
A aplicação do Processamento de Linguagem Natural (PLN) e Inteligência Artifical (IA) no contexto jurídico brasileiro é uma área em franco crescimento, que pode alterar o modo e rotina de trabalho dos profissionais da área, dada a quantidade de texto gerada. Dentre as possibilidades de aplicação da PLN e IA há a classificação automática de documentos, que dentre outras, pode ser empregada na automatização do processo de digitalização de Processos Judiciais que ainda estão apenas em meio físico. Assim, este trabalho aplica e compara algoritmos de IA para a classificação de documentos jurídicos. Os algoritmos são divididos em duas Abordagens diferentes, a primeira (I) separa o processo representação computacional do texto do treinamento do classificador em si aplicando SVM e Regressão Logística em conjunto com representações computacionais baseadas em: TF-IDF, Word2Vec, FastText e BERT. A segunda Abordagem (II) realiza em conjunto a representação computacional dos documentos e o treinamento do classificador, e para tal são aplicados algoritmos de Deep Learning baseados em redes neurais recorrentes, especificamente o ULMFiT (Universal Language Model Fine-tuning) e HAN (Hierarchical Attention Networks). O Dataset estudado é denominado VICTOR, composto por documentos do Supremo Tribunal Federal (STF) do Brasil. A pesquisa conclui pela possibilidade de aplicação de ambas abordagens para a classificação de documentos jurídicos do Dataset empregado, bem como, apesar de menos custosos computacionalmente, os pipelines de classificação da Abordagem I que empregam a representação computacional do documento com TF-IDF apresentam resultados equivalentes aos pipelines que empregam Deep Learning. Além disso, a especialização da representação computacional dos documentos com os dados do dataset em estudo, melhoram o desempenho dos pipelines que empregam Word2Vec, FastText e ULMFiT, quando comparados aos pipelines que aplicam as representações genéricas desses, ou seja, modelos pré-treinados com dados do contexto geral.
Acesso aberto (Open Access)
Clusterização de padrões espaço-temporais de precipitação na Amazônia via deep convolutional autoencoder
(Universidade Federal do Pará, 2023-07-07) SILVA, Vander Augusto Oliveira da; TEIXEIRA, Raphael Barros; http://lattes.cnpq.br/4902824086591521; https://orcid.org/0000-0003-2993-802X
Estudos utilizando diferentes métodos de aprendizado de máquina para descoberta de conhecimento e reconhecimento de padrões em séries temporais de precipitação são cada vez mais frequentes na literatura. Identificar e analisar padrões em séries temporais de precipitação em uma determinada região é fundamental para seu desenvolvimento socioeconômico. Logo, pode-se afirmar que o conhecimento e compreensão das características pluviométricas das regiões são importantes para viabilizar o planejamento do uso, manejo e conservação dos recursos hídricos. O fenômeno natural da precipitação é um processo fundamental de impacto direto nas bacias hidrográficas e no desenvolvimento humano e ambiental. A variabilidade desse fenômeno produz implicações importantes na navegabilidade dos rios, sobre a abundância do indivíduo e a riqueza das espécies. Nos últimos anos muitos estudos com essa abordagem foram realizados no Brasil, principalmente na região amazônica. Esta pesquisa teve como objetivo desenvolvimento de um método computacional para análise de séries temporais de precipitação utilizando técnicas de machine learning com aprendizado não supervisionado, afim de propor um método capaz de realizar a extração de características complexas dos dados, obtendo um mapa de atributos em baixa dimensionalidade para reconhecimento de padrões, descoberta de regiões homogêneas com relação à precipitação e reconstrução aproximada de séries temporais de precipitação da Amazônia Legal. O modelo de rede neural de aprendizado profundo proposto é treinado para aprender as principais e mais complexas características dos dados originais e apresentá-los em baixa dimensionalidade no espaço latente. Após o treinamento os resultados se mostram promissores, as observações dos dados reconstruídos apresentaram um bom desempenho conforme avaliação da métrica de RMSE e NRMSE com valores resultantes iguais a 0.06610 e 0.3355 respectivamente. A análise da representação dos dados em baixa dimensão foi aplicada e analisada por uma estrutura de clustering usando aglomerativo hierárquico com método de Ward. Essa metodologia também apresentou bons resultados, pois realizou agrupamentos consistentes caracterizando regiões homogêneas com relação aos dados de precipitação. Desta forma, demonstrando que a representação em baixa dimensionalidade carregava as características principais das séries temporais dos dados analisados. Destaca-se que o método desenvolvido nesse estudo pode ser aplicado não apenas na região amazônica, mas também em outras áreas com desafios semelhantes relacionados à análise de séries temporais.
Acesso aberto (Open Access)
Diagnóstico inteligente de faltas em transformadores baseado na análise de gás dissolvido em óleo
(Universidade Federal do Pará, 2024-07-12) OLIVEIRA FILHO, Otacílio Rodrigues de; TEIXEIRA, Raphael Barros; http://lattes.cnpq.br/4902824086591521; https://orcid.org/0000-0003-2993-802X; SILVA, Cleison Daniel; MOREIRA, Davi Carvalho; VILAS BOAS , Vitor Mendes; http://lattes.cnpq.br/1445401605385329; http://lattes.cnpq.br/2413664649532144; http://lattes.cnpq.br/5675605268102409; https://orcid.org/0000-0001-8280-2928; https://orcid.org/0000-0002-5974-3285
O Sistema Interligado Nacional (SIN) de produção e transmissão de energia elétrica bra sileiro é um sistema hidro-termo-eólico de grande porte, com predominância de usinas hidrelétricas, cuja representação resulta da congregação de diversos sistemas de geração, por uma malha robusta de linhas de transmissão e inúmeras subestações envolvendo a rede básica de energia a partir da classe de tensão de 230kV. O transformador de po tência se apresenta como elo de conexão entre geração e transmissão, possuindo papel essencial nos sistemas de energia elétrica, cuja detecção precoce de falhas é crucial para tais sistemas, devido ao elevado custo de manutenção e ao impacto dos defeitos nesses equipamentos. Neste contexto, diversos métodos, tanto inteligentes quanto convencio nais, para a detecção de falhas a partir da análise de gases dissolvidos em óleo isolante (DGA) têm sido desenvolvidos e normatizados. Este trabalho apresenta uma base de dados de DGA composta por amostras reais coletadas de transformadores ao longo de 20 anos de operação, além de dados provenientes de literaturas consolidadas. As mais de 2000 amostras permitem o projeto de classificadores de falhas térmicas e elétricas em transformadores por aprendizado de máquina (AM). O estudo detalha a exploração dos dados e avalia classificadores como Regressão Logística (RL), Máquina de Vetores de Su porte (SVM), Redes Neurais Artificiais (ANN), K-Vizinhos mais Próximos (KNN), além dos métodos convencionais do triângulo de Duval, relações de Rogers, Gás-chave, Do ernenburg e IEC 60599. Os resultados indicam que uma arquitetura híbrida, composta pelos classificadores KNN, ANN e o método convencional do triângulo de Duval, possui melhores resultados que o emprego individual dos métodos testados neste trabalho. Onde a classificação das amostras de teste, evidenciaram o desempenho da arquitetura híbrida em 98% no diagnóstico de falhas incipientes em transformadores.
Acesso aberto (Open Access)
Implementação de modelos computacionais na predição temporal e espaço-temporal de parâmetros de qualidade de água
(Universidade Federal do Pará, 2021-12-14) ALMEIDA, Anderson Francisco de Sousa; MERLIN, Bruno; http://lattes.cnpq.br/7336467549495208; HTTPS://ORCID.ORG/0000-0001-7327-9960; GONZÁLEZ, Marcos Tulio Amaris; http://lattes.cnpq.br/9970287865377659
A qualidade da água esta diretamente relacionada com o nível de poluição causada pelas acoes antrópicas e industrias, destacando-se como consequência a redução da disponibilidade de uma água de qualidade. Por isso, são realizados os monitoramentos limnológicos dos parâmetros básicos da qualidade da água como forma de obtenção de dados que norteiam as tomadas de decisão dos órgãos de recursos hídricos. Neste contexto, o presente estudo tem a implementação de algoritmos de aprendizado de maquina para predizer de modo temporal e espaço-temporal os dados dos parâmetros da qualidade da água. As técnicas de aprendizado de maquina usadas foram regressão linear, ramdom forest, redes neurais MLP e L STM. Foram usados dois pontos de coletas de uma Unidade Gerenciamento de Recursos Hídricos em São Paulo, Brasil. Os modelos são avaliados atraves de métricas MAPE ( Erro percentual médio absoluto) e RMSE( Erro raiz quadrada média). Portanto, na predição temporal a técnica LSTM apresentou o melhor desempenho em relação as demais técnicas, pois tem menor resultado de RMSE médio, com 2,47. Porem, na predição espaço-temporal, o MLP tem os melhores desempenhos tanto em relação as demais técnicas quanto aos dados utilizados, pois tem menores resultados médios de MAPE e RMPE, respectivamente, 5,94% e 1,34. Desse modo, estes desempenhos neurais podem ser justificados pela não linearidade dos dados parâmetros. Além disso, os resultados dos experimentos visam contribuir com os processos de monitoramento da qualidade da água e auxiliar o planejamento da gestão hídrica de modo que atenda as legislações vigentes e possibilite a indicação de politicas publicas atraves de modelos de aprendizado de maquina na predição dos parâmetros de qualidade de água.
Acesso aberto (Open Access)
PredictmodelGUI: ferramenta para classificação de genes essenciais através de técnicas de aprendizado de máquina
(Universidade Federal do Pará, 2025-06-06) MOIA, Gislenne da Silva; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; HTTPS://ORCID.ORG/0000-0001-8280-2928; VERAS, Adonney Allan de Oliveira; http://lattes.cnpq.br/2201652617167877; https://orcid.org/0000-0002-7227-0590
As tecnologias de sequenciamento de DNA proporcionaram avanços significativos no conhecimento sobre o conteúdo gênico de inúmeros organismos, desde microrganismos até seres humanos. Dentre as análises realizadas pelas Ciências Ômicas, a Anotação se destaca como uma das mais importantes. Conceitualmente, esse processo consiste na inferência de informações biológicas a partir de sequências genômicas, o que permite aos Pesquisadores compreender a função de produtos genéticos, como os genes — Unidades Básicas da Hereditariedade responsáveis por características físicas e hereditárias de um organismo. Alguns genes desempenham funções vitais, pois codificam proteínas ou RNAs essenciais para processos como o Metabolismo Celular, que participam em vias cruciais como a Glicólise e o Ciclo do Ácido Tricarboxílico. As Plataformas de Sequenciamento passaram a gerar grandes volumes de dados, o que impulsionou avanços nas Áreas Ômicas e fomentou o desenvolvimento de métodos computacionais voltados às mais diversas análises. Mais recentemente, técnicas de Machine Learning e Inteligência Artificial têm sido aplicadas a esses dados, com estudos que demonstram a eficácia de abordagens inspiradas na Biologia. Esses modelos não exigem programação baseada em regras, embora sua criação ainda requeira habilidades avançadas em Programação e Computação. Com o objetivo de contribuir para a solução desse desafio, este estudo apresenta o PredictModelGUI, uma interface gráfica desenvolvida em Python que implementa nove modelos para classificar Genes Essenciais. A interface permite importar conjuntos de dados, re-treinar os modelos e ajustar parâmetros. As informações são armazenadas no banco de dados do software, o que assegura rastreabilidade e proporciona uma ferramenta simples e intuitiva para testar diferentes configurações.

Navegar

Navegando Programa de Pós-Graduação em Computação Aplicada - PPCA/NDAE/Tucuruí por Assunto "Aprendizado de máquina"