Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpa.br/jspui/handle/2011/12262
Tipo: Dissertação
Fecha de publicación : 18-nov-2019
Autor(es): GONÇALVES, Luan Assis
Primer Orientador: BARROS, Fabrício José Brito
Primer Coorientador: ZAMPOLO, Ronaldo de Freitas
Título : Uma Análise do uso de informacões multiescala no mapeamento da PSNR para pontuacão perceptual
Otros títulos : An Analysis of the use of multiscale information in mapping of PSNR for perceptual scoring
metadata.dc.description.sponsorship: 
Citación : GONÇALVES, Luan Assis. Uma Análise do uso de informacões multiescala no mapeamento da PSNR para pontuacão perceptual. Orientador : Fabrício José Brito Barros. Coorientador: Ronaldo de Freitas Zampolo. 2019. 64 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2019. Disponível em: http://repositorio.ufpa.br:8080/jspui/handle/2011/12262. Acesso em:.
Resumen: A previsão da qualidade visual é crucial nos sistemas de imagem e vídeo. Métricas de qualidade de imagem com base no erro quadrático médio prevalecem em diversas aplicacões, apesar de apresentarem baixa correlacão¸ com a percepção visual humana, devido à sua simplicidade matemática. As últimas realizacões na área sustentam que o uso de redes neurais convolucionais (CNN) para avaliar a qualidade visual perceptiva é uma tendência clara. Resultados em outras aplicacões, como deteccão de desfoque e remocão de chuva, indicam que a combinacão de informacões de diferentes escalas melhora o desempenho da CNN. No entanto, até onde sabemos, a melhor maneira de incorporar informacões em várias escalas na caracterizacão da qualidade visual ainda é uma questão em aberto. Assim, neste trabalho, investigamos a influência do uso de informacões em várias escalas para prever a qualidade perceptual de imagens. Especificamente, propomos uma rede densa de fluxo único que estima um parâmetro espacialmente variável da funcão logística usada para mapear valores de métricas objetivas de qualidade visual para as notas subjetivas de qualidade visual através da imagem de referência. O método proposto alcançou uma reducão de 36,37% e 69,45% para o número de parâmetros e de operacões de ponto flutuante por segundo, respectivamente, e seu desempenho é comparado com o estado da arte, usando um banco de dados de imagens disponível publicamente.
Resumen : The prediction of visual quality is crucial in image and video systems. For this task, image quality metrics based on the mean squared error prevail in the field, due to their mathematical straightforwardness, even though they do not correlate well with the visual human perception. Latest achievements in the area support that the use of convolutional neural networks (CNN) to assess perceptual visual quality is a clear trend. Results in other applications, like blur detection and de-raining, indicate the combination of information from different scales improves the CNN performance. However, to the best of our knowledge, the best way to embody multi-scale information in visual quality characterization is still an open issue. Thus, in this work, we investigate the influence of using multi-scale information to predict the perceptual image quality. Specifically, we propose a single-stream dense network that estimates a spatially-varying parameter of a logistic function used to map values of a objective visual quality metric to subjective visual quality scores through the reference image. The proposed method achieved a reduction of 36.37% and 69.45% for the number of parameters and floating-point operations per second, respectively, and its performance is compared with a competing state-of-the-art approach by using a public image database.
Palabras clave : Redes neurais convolucionais
Avaliação de qualidade visual
Escore de opinião médio diferencial
Pontuação de opinião média diferencial
Informações multiescala
Relacão sinal-ruído de pico
Convolutional neural networks
Multi-scale information
Peak signal-to-noise ratio (PSNR)
Visual quality assessment
metadata.dc.subject.areadeconcentracao: TELECOMUNICAÇÕES
metadata.dc.subject.linhadepesquisa: PROCESSAMENTO DE SINAIS
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
País: Brasil
Editorial : Universidade Federal do Pará
Sigla da Instituição: UFPA
Instituto: Instituto de Tecnologia
Programa: Programa de Pós-Graduação em Engenharia Elétrica
metadata.dc.rights: Acesso Aberto
metadata.dc.source: 1 CD-ROM
Aparece en las colecciones: Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Dissertacao_AnaliseUsoInformacoes.pdf1,48 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons