Análise de desempenho de mecanismos de atenção para estimativa de pose 2D baseada em resnet-50

Imagem de Miniatura

Data

11-09-2025

Afiliação

Grau

Título da Revista

ISSN da Revista

Título de Volume

item.page.theme

Tipo de acesso

Acesso AbertoAttribution 4.0 Internationalaccess-logo

Agência de fomento

CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior

Contido em

Citar como

MALHEIROS, Marlon Nanael Leitão. Análise de desempenho de mecanismos de atenção para estimativa de pose 2D baseada em resnet-50. Orientadora: Adriana Rosa Garcez Castro. 2025. 69 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2025. Disponível em: https://repositorio.ufpa.br/handle/2011/17953. Acesso em:.

DOI

A estimação de pose humana 2D é um problema fundamental em visão computacional que visa identificar a localização de pontos anatômicos humanos. A evolução do aprendizado profundo, em particular das Redes Neurais Convolucionais (CNNs), tem proporcionado avanços significativos no campo. Recentemente, a introdução de mecanismos de atenção se destacou como uma abordagem eficaz para aprimorar o foco das CNNs em regiões importantes das imagens. Esta dissertação apresenta um estudo comparativo do impacto de seis mecanismos de atenção na tarefa de estimação de pose humana 2D, integrando-os a uma arquitetura CNN baseada em ResNet-50: Convolutional Block Attention Module (CBAM), Coordinate Attention, Global Context Attention, Self-Attention, Multi-Head Attention e SimAM (Simple, Parameter Free Attention Module). O treinamento e a avaliação dos modelos utilizaram o conjunto de imagens MS COCO (Common Objects in Context) sob um protocolo experimental unificado. Os resultados quantitativos demonstraram que todos os mecanismos de atenção testados melhoraram o desempenho da arquitetura base. Os mecanismos CBAM e Coordinate Attention mostraram-se os mais eficazes, com os maiores ganhos na métrica principal Average Precision (AP). O modelo com Coordinate Attention alcançou uma AP de 67,7% (+1,5 p.p.), enquanto o modelo com CBAMatingiu 67,6% (+1,4 p.p.), obtendo também a melhor pontuação na métrica secundária AP75. A análise de custo-benefício revelou que CBAM e Coordinate Attention alcançaram esses ganhos com acréscimo mínimo de parâmetros e FLOPS. Em contraste, Self-Attention, de maior custo computacional, apresentou um dos menores ganhos, enquanto SimAM, livre de parâmetros, obteve o menor ganho sem custo adicional. Em síntese, os resultados demonstram que a integração de mecanismos de atenção é uma estratégia eficaz para aprimorar modelos de estimação de pose, destacando-se abordagens com ênfase em informação espacial explícita, como CBAMeCoordinate Attention, por oferecerem um excelente equilíbrio entre desempenho e eficiência computacional.

browse.metadata.ispartofseries

Palavras-chave

Estimação de pose humanaMecanismos de atençãoRedes neurais convolucionaisResNetCBAMCoordinate attentionHuman Pose Estimation, Attention Mechanisms, Convolutional Neural NetworksAttention MechanismConvolutional neural networks

Área de concentração

COMPUTAÇÃO APLICADA

Linha de pesquisa

INTELIGÊNCIA COMPUTACIONAL

CNPq

CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA

País

Brasil

Instituição(ões)

Universidade Federal do Pará

Sigla(s) da(s) Instituição(ões)

UFPA

Instituto

Instituto de Tecnologia

Programa

Programa de Pós-Graduação em Engenharia Elétrica

item.page.isbn

Fonte

item.page.dc.location.country

Fonte URI

Disponível via correio eletrônico: Bibliotecaitec@ufpa.br