Análise de desempenho de mecanismos de atenção para estimativa de pose 2D baseada em resnet-50

dc.contributor.advisor1CASTRO, Adriana Rosa Garcez
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5273686389382860
dc.contributor.advisor1ORCIDhttps://orcid.org/0000-0001-5884-4511
dc.contributor.memberARAÚJO, Jasmine Priscyla Leite de
dc.contributor.memberFONSECA, Maria da Conceição Pereira
dc.contributor.memberOHASHI JÚNIOR, Orlando Shigueo
dc.contributor.member1Latteshttp://lattes.cnpq.br/4001747699670004
dc.contributor.member1Latteshttp://lattes.cnpq.br/3496755183083633
dc.contributor.member1Latteshttp://lattes.cnpq.br/8905793797626608
dc.contributor.member1ORCIDhttps://orcid.org/0000-0003-3514-0401
dc.contributor.member1ORCIDxxx
dc.contributor.member1ORCIDxxx
dc.creatorMALHEIROS, Marlon Nanael Leitão
dc.creator.Latteshttp://lattes.cnpq.br/8806712009357352
dc.creator.ORCIDxxx
dc.date.accessioned2026-02-04T17:44:08Z
dc.date.available2026-02-04T17:44:08Z
dc.date.issued2025-09-11
dc.description.abstract2Dhumanpose estimation is a fundamental computer vision problem focused on locating human anatomical keypoints. While deep learning, particularly Convolutional Neural Networks (CNNs), has driven significant progress, attention mechanisms have emerged as an effective method to enhance a model’s focus on salient image regions. This dissertation presents a comparative study analyzing the impact of six different attention mechanisms on 2D human pose estimation when integrated into a ResNet-50-based CNN baseline. The evaluated mechanisms are: Convolutional Block Attention Module (CBAM), Coordinate Attention, Global Context Attention, Self-Attention, Multi-Head Attention, and SimAM (Simple, Parameter-Free Attention Module). All models were trained and evaluated on the MS COCO dataset under a unified experimental protocol. Quantitative results show that all attention mechanisms improved performance over the baseline. Coordinate Attention and CBAM were the most effective, achieving an Average Precision (AP) of 67.7% (+1.5 p.p.) and 67.6% (+1.4 p.p.), respectively, with CBAM also leading in the AP75 metric. A cost-benefit analysis confirmed these two models offered the best performance gains with a minimal increase in parameters and FLOPS. Conversely, the computationally expensive Self-Attention yielded one of the smallest gains, while the parameter-free SimAM offered the lowest improvement at no extra cost. In conclusion, this work demonstrates that integrating attention mechanisms is an effective strategy for human pose estimation. Specifically, approaches emphasizing explicit spatial information, like CBAM and Coordinate Attention, provide an excellent balance between performance improvement and computational efficiency
dc.description.resumoA estimação de pose humana 2D é um problema fundamental em visão computacional que visa identificar a localização de pontos anatômicos humanos. A evolução do aprendizado profundo, em particular das Redes Neurais Convolucionais (CNNs), tem proporcionado avanços significativos no campo. Recentemente, a introdução de mecanismos de atenção se destacou como uma abordagem eficaz para aprimorar o foco das CNNs em regiões importantes das imagens. Esta dissertação apresenta um estudo comparativo do impacto de seis mecanismos de atenção na tarefa de estimação de pose humana 2D, integrando-os a uma arquitetura CNN baseada em ResNet-50: Convolutional Block Attention Module (CBAM), Coordinate Attention, Global Context Attention, Self-Attention, Multi-Head Attention e SimAM (Simple, Parameter Free Attention Module). O treinamento e a avaliação dos modelos utilizaram o conjunto de imagens MS COCO (Common Objects in Context) sob um protocolo experimental unificado. Os resultados quantitativos demonstraram que todos os mecanismos de atenção testados melhoraram o desempenho da arquitetura base. Os mecanismos CBAM e Coordinate Attention mostraram-se os mais eficazes, com os maiores ganhos na métrica principal Average Precision (AP). O modelo com Coordinate Attention alcançou uma AP de 67,7% (+1,5 p.p.), enquanto o modelo com CBAMatingiu 67,6% (+1,4 p.p.), obtendo também a melhor pontuação na métrica secundária AP75. A análise de custo-benefício revelou que CBAM e Coordinate Attention alcançaram esses ganhos com acréscimo mínimo de parâmetros e FLOPS. Em contraste, Self-Attention, de maior custo computacional, apresentou um dos menores ganhos, enquanto SimAM, livre de parâmetros, obteve o menor ganho sem custo adicional. Em síntese, os resultados demonstram que a integração de mecanismos de atenção é uma estratégia eficaz para aprimorar modelos de estimação de pose, destacando-se abordagens com ênfase em informação espacial explícita, como CBAMeCoordinate Attention, por oferecerem um excelente equilíbrio entre desempenho e eficiência computacional.
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.citationMALHEIROS, Marlon Nanael Leitão. Análise de desempenho de mecanismos de atenção para estimativa de pose 2D baseada em resnet-50. Orientadora: Adriana Rosa Garcez Castro. 2025. 69 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2025. Disponível em: https://repositorio.ufpa.br/handle/2011/17953. Acesso em:.
dc.identifier.urihttps://repositorio.ufpa.br/handle/2011/17953
dc.languageporpt_BR
dc.language.isopt
dc.publisherUniversidade Federal do Parápt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Tecnologiapt_BR
dc.publisher.initialsUFPApt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétricapt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.source.uriDisponível via correio eletrônico: Bibliotecaitec@ufpa.br
dc.subjectEstimação de pose humana
dc.subjectMecanismos de atenção
dc.subjectRedes neurais convolucionais
dc.subjectResNet
dc.subjectCBAM
dc.subjectCoordinate attention
dc.subjectHuman Pose Estimation, Attention Mechanisms, Convolutional Neural Networks
dc.subjectAttention Mechanisms
dc.subjectConvolutional Neural Networks
dc.subject.areadeconcentracaoCOMPUTAÇÃO APLICADA
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
dc.subject.linhadepesquisaINTELIGÊNCIA COMPUTACIONAL
dc.titleAnálise de desempenho de mecanismos de atenção para estimativa de pose 2D baseada em resnet-50
dc.typeDissertaçãopt_BR

Arquivo(s)

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
DIssertacao_AnaliseDesempenhoMecanismos.pdf
Tamanho:
1.83 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.85 KB
Formato:
Item-specific license agreed upon to submission
Descrição: