Please use this identifier to cite or link to this item: https://repositorio.ufpa.br/jspui/handle/2011/12262
metadata.dc.type: Dissertação
Issue Date: 18-Nov-2019
metadata.dc.creator: GONÇALVES, Luan Assis
metadata.dc.contributor.advisor1: BARROS, Fabrício José Brito
metadata.dc.contributor.advisor-co1: ZAMPOLO, Ronaldo de Freitas
Title: Uma Análise do uso de informacões multiescala no mapeamento da PSNR para pontuacão perceptual
Other Titles: An Analysis of the use of multiscale information in mapping of PSNR for perceptual scoring
metadata.dc.description.sponsorship: 
Citation: GONÇALVES, Luan Assis. Uma Análise do uso de informacões multiescala no mapeamento da PSNR para pontuacão perceptual. Orientador : Fabrício José Brito Barros. Coorientador: Ronaldo de Freitas Zampolo. 2019. 64 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2019. Disponível em: http://repositorio.ufpa.br:8080/jspui/handle/2011/12262. Acesso em:.
metadata.dc.description.resumo: A previsão da qualidade visual é crucial nos sistemas de imagem e vídeo. Métricas de qualidade de imagem com base no erro quadrático médio prevalecem em diversas aplicacões, apesar de apresentarem baixa correlacão¸ com a percepção visual humana, devido à sua simplicidade matemática. As últimas realizacões na área sustentam que o uso de redes neurais convolucionais (CNN) para avaliar a qualidade visual perceptiva é uma tendência clara. Resultados em outras aplicacões, como deteccão de desfoque e remocão de chuva, indicam que a combinacão de informacões de diferentes escalas melhora o desempenho da CNN. No entanto, até onde sabemos, a melhor maneira de incorporar informacões em várias escalas na caracterizacão da qualidade visual ainda é uma questão em aberto. Assim, neste trabalho, investigamos a influência do uso de informacões em várias escalas para prever a qualidade perceptual de imagens. Especificamente, propomos uma rede densa de fluxo único que estima um parâmetro espacialmente variável da funcão logística usada para mapear valores de métricas objetivas de qualidade visual para as notas subjetivas de qualidade visual através da imagem de referência. O método proposto alcançou uma reducão de 36,37% e 69,45% para o número de parâmetros e de operacões de ponto flutuante por segundo, respectivamente, e seu desempenho é comparado com o estado da arte, usando um banco de dados de imagens disponível publicamente.
Abstract: The prediction of visual quality is crucial in image and video systems. For this task, image quality metrics based on the mean squared error prevail in the field, due to their mathematical straightforwardness, even though they do not correlate well with the visual human perception. Latest achievements in the area support that the use of convolutional neural networks (CNN) to assess perceptual visual quality is a clear trend. Results in other applications, like blur detection and de-raining, indicate the combination of information from different scales improves the CNN performance. However, to the best of our knowledge, the best way to embody multi-scale information in visual quality characterization is still an open issue. Thus, in this work, we investigate the influence of using multi-scale information to predict the perceptual image quality. Specifically, we propose a single-stream dense network that estimates a spatially-varying parameter of a logistic function used to map values of a objective visual quality metric to subjective visual quality scores through the reference image. The proposed method achieved a reduction of 36.37% and 69.45% for the number of parameters and floating-point operations per second, respectively, and its performance is compared with a competing state-of-the-art approach by using a public image database.
Keywords: Redes neurais convolucionais
avaliação de qualidade visual
escore de opinião médio diferencial
pontuação de opinião média diferencial
informações multiescala
relacão sinal-ruído de pico
convolutional neural networks
multi-scale information
peak signal-to-noise ratio
visual quality assessment
metadata.dc.subject.areadeconcentracao: TELECOMUNICAÇÕES
metadata.dc.subject.linhadepesquisa: PROCESSAMENTO DIGITAL DE SINAIS
metadata.dc.subject.cnpq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal do Pará
metadata.dc.publisher.initials: UFPA
metadata.dc.publisher.department: Instituto de Tecnologia
metadata.dc.publisher.program: Programa de Pós-Graduação em Engenharia Elétrica
metadata.dc.rights: Acesso Aberto
metadata.dc.source: 1 CD-ROM
Appears in Collections:Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Files in This Item:
File Description SizeFormat 
Dissertacao_AnaliseUsoInformacoes.pdf1,48 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons