Dissertações em Computação Aplicada (Mestrado) - PPCA/NDAE/Tucuruí
URI Permanente para esta coleçãohttps://repositorio.ufpa.br/handle/2011/9399
Navegar
Navegando Dissertações em Computação Aplicada (Mestrado) - PPCA/NDAE/Tucuruí por Orientadores "SILVA, Cleison Daniel"
Agora exibindo 1 - 5 de 5
- Resultados por página
- Opções de Ordenação
Dissertação Acesso aberto (Open Access) Aplicação e comparação de técnicas de classificação automática de documentos: um estudo de caso com o dataset do domínio jurídico “Victor”(Universidade Federal do Pará, 2024-02-01) MARTINS, Victor Simões; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; https://orcid.org/0000-0001-8280-2928A aplicação do Processamento de Linguagem Natural (PLN) e Inteligência Artifical (IA) no contexto jurídico brasileiro é uma área em franco crescimento, que pode alterar o modo e rotina de trabalho dos profissionais da área, dada a quantidade de texto gerada. Dentre as possibilidades de aplicação da PLN e IA há a classificação automática de documentos, que dentre outras, pode ser empregada na automatização do processo de digitalização de Processos Judiciais que ainda estão apenas em meio físico. Assim, este trabalho aplica e compara algoritmos de IA para a classificação de documentos jurídicos. Os algoritmos são divididos em duas Abordagens diferentes, a primeira (I) separa o processo representação computacional do texto do treinamento do classificador em si aplicando SVM e Regressão Logística em conjunto com representações computacionais baseadas em: TF-IDF, Word2Vec, FastText e BERT. A segunda Abordagem (II) realiza em conjunto a representação computacional dos documentos e o treinamento do classificador, e para tal são aplicados algoritmos de Deep Learning baseados em redes neurais recorrentes, especificamente o ULMFiT (Universal Language Model Fine-tuning) e HAN (Hierarchical Attention Networks). O Dataset estudado é denominado VICTOR, composto por documentos do Supremo Tribunal Federal (STF) do Brasil. A pesquisa conclui pela possibilidade de aplicação de ambas abordagens para a classificação de documentos jurídicos do Dataset empregado, bem como, apesar de menos custosos computacionalmente, os pipelines de classificação da Abordagem I que empregam a representação computacional do documento com TF-IDF apresentam resultados equivalentes aos pipelines que empregam Deep Learning. Além disso, a especialização da representação computacional dos documentos com os dados do dataset em estudo, melhoram o desempenho dos pipelines que empregam Word2Vec, FastText e ULMFiT, quando comparados aos pipelines que aplicam as representações genéricas desses, ou seja, modelos pré-treinados com dados do contexto geral.Dissertação Acesso aberto (Open Access) Aprendizado em conjunto aplicado à classificação da imagética motora(Universidade Federal do Pará, 2025-01-20) JORGE, Vitor da Silva; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; https://orcid.org/0000-0001-8280-2928Dissertação Acesso aberto (Open Access) AutoBCI: interface cérebro-máquina com configuração hiperparamétrica automatizada(Universidade Federal do Pará, 2021-03-11) VILAS BOAS, Vitor Mendes; TEIXEIRA, Otávio Noura; http://lattes.cnpq.br/5784356232477760; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; https://orcid.org/0000-0001-8280-2928Interfaces Cérebro-Máquina baseadas em Imagética Motora (ICM-IM) permitem o controle de dispositivos independente do uso de nervos e músculos periféricos, a partir da modulação voluntária da atividade eletrofisiológica do cérebro. O desafio imposto à ICM-IM não invasivas típicas é extrair padrões que descrevam a intenção motora nos sinais coletados por eletroencefalografia (EEG) e classificá-los a fim de se gerar comandos confiáveis à aplicação. Para tanto a seleção de técnicas de processamento adequadas assim como a parametrização correta do sistema são fundamentais no ajuste de modelos de classificação eficazes. A configuração dos múltiplos hiperparâmetros na cadeia de processamento, comumente realizada de forma manual e inespecífica do usuário, tende a gerar modelos rígidos e incapazes de generalizar bem em diferentes indivíduos, em especial pela alta variabilidade dos padrões de IM observada entre eles. O uso de estratégias para estimativa desses hiperparâmetros conforme as especificidades do sujeito apresenta-se como uma abordagem mais eficaz e tem sido explorada em estudos recentes. Este trabalho propõe uma estrutura baseada em aprendizado Bayesiano para configuração automática de hiperparâmetros incorporada à uma nova plataforma computacional ICM-IM de código aberto. O sistema integra todas as etapas básicas da arquitetura de ICM-IM de sub-bandas, desde a aquisição até o controle de uma aplicação virtual. Múltiplas técnicas de processamento compõem um amplo espaço de configuração para busca de instâncias hiperparamétricas particulares que maximizam a performance do sistema e abstraem do usuário a tarefa de ajuste manual. Dados de 72 sujeitos em três conjuntos públicos de EEG foram usados em simulações off-line e on-line cujo intuito foi validar o funcionamento dos módulos implementados e investigar os efeitos da configuração automática no desempenho de classificação e no controle efetivo da aplicação. Uma melhora expressiva na acurácia de classificação foi observada ao usar modelos provenientes da configuração automática do sistema em comparação à modelos gerados a partir de configurações frequentes na literatura. Os resultados sugerem que a otimização dos hiperparâmetros produz modelos mais assertivos na classificação dos padrões de IM de diferentes usuários e tende a contribuir para um controle mais eficaz da aplicação. Conclui-se que este estudo contribui com o projeto de ICM-IM mais eficazes no reconhecimento dos padrões de IM particulares do usuário ao fornecer um ambiente experimental completo, personalizável e de uso descomplicado pela configuração automatizada. A opção por técnicas mais eficientes no processamento dos sinais também mostrou-se viável e também são consideradas contribuições deste trabalho.Dissertação Acesso aberto (Open Access) ICM Space Game: uma interface baseada na imaginação de movimentos(Universidade Federal do Pará, 2023-03-10) CALVINHO, Jhoanyn Valois Fantin; MERLIN, Bruno; http://lattes.cnpq.br/7336467549495208; HTTPS://ORCID.ORG/0000-0001-7327-9960; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; https://orcid.org/0000-0001-8280-2928A Interface Cérebro-Máquina (ICM) pode auxiliar os usuários na participação de tarefas rotineiras, como o ato de se locomover. A comunidade científica trabalha diariamente na tentativa de oferecer sistemas de ICM cada vez mais robustos, com melhores respostas aos comandos dos usuários. No entanto, estes trabalhos, geralmente focam na melhoria do sistema em si. Com base nesta afirmação, o objetivo deste trabalho é desenvolver um jogo virtual como parte de uma ferramenta computacional com a intenção de oferecer uma alternativa aos usuários para auxiliar no aprendizado da utilização de equipamentos de uma ICM baseada na imaginação de movimentos. Para isso o jogo é projetado e programado como tentativa de melhorar a precisão dos usuários no controle dos dispositivos destes sistemas. Os resultados mostram que o jogo funciona quando conectado a uma ICM, e pode servir como alternativa no processo de coleta de sinais de EEG. Ao longo deste trabalho são utilizadas linguagens de programação dedicadas a ICMs, como o OpenVibe, assim como uma linguagem bastante utilizada na programação de jogos eletrônicos, Python. No experimento realizado com 8 voluntários, não há uma diferença discrepante entre as taxas de classificação realizada com o auxílio do protocolo convencional e do ICM Space Game, aproximadamente 56% para ambos os casos, contudo, o ICM Space Game foi o escolhido pela maioria dos participantes deste experimento.Dissertação Acesso aberto (Open Access) Redes neurais convolucionais aplicadas à inspeção de componentes do vagão ferroviário(Universidade Federal do Pará, 2020-02-03) ROCHA, Rafael de Lima; GOMES, Ana Claudia da Silva; http://lattes.cnpq.br/9898138854277399; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; https://orcid.org/0000-0001-8280-2928O vagão ferroviário é um dos patrimônios mais importantes em uma empresa mineradora, onde toneladas de minério são transportados por este diariamente, além disso, o vagão ferroviário pode ser utilizado para o transporte de pessoas. Por isso, a inspeção de defeitos em componentes estruturais do vagão ferroviário é uma atividade de suma importância, possibilitando evitar problemas na logística da ferrovia, assim como prevenir acidentes. A tarefa de inspeção é realizada visualmente por um técnico operacional que está exposto a acidentes no local em que a inspeção é realizada, além da possibilidade de erro humano devido ao estresse, fadiga e outros. O pad é componente ferroviário analisado neste trabalho, onde este é responsável pela suspensão primária, papel que é importante na dinâmica dos vagões. Assim, o intuito deste trabalho é utilizar técnicas de aprendizado profundo, especificamente redes neurais convolucionais (CNN) para a realização da inspeção do componente. A CNN classifica a imagem do componente estrutural analisado em relação aos possíveis estados em que ele se encontra na ferrovia, pad ausente, pad não danificado e pad danificado. Além disso, pretende-se investigar a contribuição da imagem do componente no domínio da frequência obtida através da magnitude e fase da transformada discreta de Fourier (DFT) da imagem original (domínio espacial) no processo de classificação da CNN. As técnicas de equalização de histograma e o aumento do número de imagens através do data augmentation também são examinadas, de modo a avaliar suas colaborações na melhoria no desempenho de classificação. Os resultados da inspeção do pad por CNN demonstram-se bastante inspiradores, em especial quando é utilizada a imagem espacial do componente em conjunto da imagem da magnitude da DFT da imagem de origem como entradas da CNN, que se demonstram superiores quando é utilizada somente a imagem original (espacial) do componente, atingindo uma acurácia de classificação de 95,65%. Em especial, o método que utiliza o aumento do número de imagens de treinamento pelo data augmentation e as imagens do domínio espacial e da frequência (magnitude) é o que alcança a maior acurácia, com 97,47%, que representa aproximadamente 385,5 imagens classificadas corretamente de um total de 395,2 imagens.
