Análise de desempenho de mecanismos de atenção para estimativa de pose 2D baseada em resnet-50
| dc.contributor.advisor1 | CASTRO, Adriana Rosa Garcez | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5273686389382860 | |
| dc.contributor.advisor1ORCID | https://orcid.org/0000-0001-5884-4511 | |
| dc.contributor.member | ARAÚJO, Jasmine Priscyla Leite de | |
| dc.contributor.member | FONSECA, Maria da Conceição Pereira | |
| dc.contributor.member | OHASHI JÚNIOR, Orlando Shigueo | |
| dc.contributor.member1Lattes | http://lattes.cnpq.br/4001747699670004 | |
| dc.contributor.member1Lattes | http://lattes.cnpq.br/3496755183083633 | |
| dc.contributor.member1Lattes | http://lattes.cnpq.br/8905793797626608 | |
| dc.contributor.member1ORCID | https://orcid.org/0000-0003-3514-0401 | |
| dc.contributor.member1ORCID | xxx | |
| dc.contributor.member1ORCID | xxx | |
| dc.creator | MALHEIROS, Marlon Nanael Leitão | |
| dc.creator.Lattes | http://lattes.cnpq.br/8806712009357352 | |
| dc.creator.ORCID | xxx | |
| dc.date.accessioned | 2026-02-04T17:44:08Z | |
| dc.date.available | 2026-02-04T17:44:08Z | |
| dc.date.issued | 2025-09-11 | |
| dc.description.abstract | 2Dhumanpose estimation is a fundamental computer vision problem focused on locating human anatomical keypoints. While deep learning, particularly Convolutional Neural Networks (CNNs), has driven significant progress, attention mechanisms have emerged as an effective method to enhance a model’s focus on salient image regions. This dissertation presents a comparative study analyzing the impact of six different attention mechanisms on 2D human pose estimation when integrated into a ResNet-50-based CNN baseline. The evaluated mechanisms are: Convolutional Block Attention Module (CBAM), Coordinate Attention, Global Context Attention, Self-Attention, Multi-Head Attention, and SimAM (Simple, Parameter-Free Attention Module). All models were trained and evaluated on the MS COCO dataset under a unified experimental protocol. Quantitative results show that all attention mechanisms improved performance over the baseline. Coordinate Attention and CBAM were the most effective, achieving an Average Precision (AP) of 67.7% (+1.5 p.p.) and 67.6% (+1.4 p.p.), respectively, with CBAM also leading in the AP75 metric. A cost-benefit analysis confirmed these two models offered the best performance gains with a minimal increase in parameters and FLOPS. Conversely, the computationally expensive Self-Attention yielded one of the smallest gains, while the parameter-free SimAM offered the lowest improvement at no extra cost. In conclusion, this work demonstrates that integrating attention mechanisms is an effective strategy for human pose estimation. Specifically, approaches emphasizing explicit spatial information, like CBAM and Coordinate Attention, provide an excellent balance between performance improvement and computational efficiency | |
| dc.description.resumo | A estimação de pose humana 2D é um problema fundamental em visão computacional que visa identificar a localização de pontos anatômicos humanos. A evolução do aprendizado profundo, em particular das Redes Neurais Convolucionais (CNNs), tem proporcionado avanços significativos no campo. Recentemente, a introdução de mecanismos de atenção se destacou como uma abordagem eficaz para aprimorar o foco das CNNs em regiões importantes das imagens. Esta dissertação apresenta um estudo comparativo do impacto de seis mecanismos de atenção na tarefa de estimação de pose humana 2D, integrando-os a uma arquitetura CNN baseada em ResNet-50: Convolutional Block Attention Module (CBAM), Coordinate Attention, Global Context Attention, Self-Attention, Multi-Head Attention e SimAM (Simple, Parameter Free Attention Module). O treinamento e a avaliação dos modelos utilizaram o conjunto de imagens MS COCO (Common Objects in Context) sob um protocolo experimental unificado. Os resultados quantitativos demonstraram que todos os mecanismos de atenção testados melhoraram o desempenho da arquitetura base. Os mecanismos CBAM e Coordinate Attention mostraram-se os mais eficazes, com os maiores ganhos na métrica principal Average Precision (AP). O modelo com Coordinate Attention alcançou uma AP de 67,7% (+1,5 p.p.), enquanto o modelo com CBAMatingiu 67,6% (+1,4 p.p.), obtendo também a melhor pontuação na métrica secundária AP75. A análise de custo-benefício revelou que CBAM e Coordinate Attention alcançaram esses ganhos com acréscimo mínimo de parâmetros e FLOPS. Em contraste, Self-Attention, de maior custo computacional, apresentou um dos menores ganhos, enquanto SimAM, livre de parâmetros, obteve o menor ganho sem custo adicional. Em síntese, os resultados demonstram que a integração de mecanismos de atenção é uma estratégia eficaz para aprimorar modelos de estimação de pose, destacando-se abordagens com ênfase em informação espacial explícita, como CBAMeCoordinate Attention, por oferecerem um excelente equilíbrio entre desempenho e eficiência computacional. | |
| dc.description.sponsorship | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | |
| dc.identifier.citation | MALHEIROS, Marlon Nanael Leitão. Análise de desempenho de mecanismos de atenção para estimativa de pose 2D baseada em resnet-50. Orientadora: Adriana Rosa Garcez Castro. 2025. 69 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2025. Disponível em: https://repositorio.ufpa.br/handle/2011/17953. Acesso em:. | |
| dc.identifier.uri | https://repositorio.ufpa.br/handle/2011/17953 | |
| dc.language | por | pt_BR |
| dc.language.iso | pt | |
| dc.publisher | Universidade Federal do Pará | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.department | Instituto de Tecnologia | pt_BR |
| dc.publisher.initials | UFPA | pt_BR |
| dc.publisher.program | Programa de Pós-Graduação em Engenharia Elétrica | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.rights | Attribution 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.source.uri | Disponível via correio eletrônico: Bibliotecaitec@ufpa.br | |
| dc.subject | Estimação de pose humana | |
| dc.subject | Mecanismos de atenção | |
| dc.subject | Redes neurais convolucionais | |
| dc.subject | ResNet | |
| dc.subject | CBAM | |
| dc.subject | Coordinate attention | |
| dc.subject | Human Pose Estimation, Attention Mechanisms, Convolutional Neural Networks | |
| dc.subject | Attention Mechanisms | |
| dc.subject | Convolutional Neural Networks | |
| dc.subject.areadeconcentracao | COMPUTAÇÃO APLICADA | |
| dc.subject.cnpq | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA | |
| dc.subject.linhadepesquisa | INTELIGÊNCIA COMPUTACIONAL | |
| dc.title | Análise de desempenho de mecanismos de atenção para estimativa de pose 2D baseada em resnet-50 | |
| dc.type | Dissertação | pt_BR |
Arquivo(s)
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- DIssertacao_AnaliseDesempenhoMecanismos.pdf
- Tamanho:
- 1.83 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.85 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
