Use este identificador para citar ou linkar para este item:
https://repositorio.ufpa.br/jspui/handle/2011/16859
Tipo: | Dissertação |
Data do documento: | 27-Nov-2024 |
Autor(es): | SILVA, Lucas Damasceno![]() |
Afiliação do(s) Autor(es): | INESC P&D Brasil - Instituto de Engenharia de Sistemas |
Primeiro(a) Orientador(a): | KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha![]() |
Título: | Compression of activation signals from partitioned deep neural networks exploring temporal correlation |
Título(s) alternativo(s): | Compressão de sinais de ativação de redes neurais profundas particionadas explorando a correlação temporal |
Agência de fomento: | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior |
Citar como: | SILVA, Lucas Damasceno. Compression of activation signals from partitioned deep neural networks exploring temporal correlation. . Orientador: Aldebaro Barreto da Rocha Klautau Junior. 2024. 82 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2024. Disponível em: https://repositorio.ufpa.br/jspui/handle/2011/16859. Acesso em:. |
Resumo: | O uso de redes neurais artificiais para detecção de objetos, juntamente com avanços na pesquisa de 6G e IoT, desempenha um papel importante em aplicações como monitoramento de estruturas por drones, operações de busca e resgate, e implantação em plataformas de hardware como FPGAs. No entanto, um desafio fundamental na implementação dessas redes em tais hardwares é a necessidade de economizar recursos computacionais. Apesar dos avanços substanciais na capacidade computacional, implementar dispositivos com recursos amplos continua sendo um desafio. Como solução, técnicas de particionamento e compressão de redes neurais, bem como compressão de sinais de ativação (ou feature maps), foram desenvolvidas. Este trabalho propõe um sistema que particiona modelos de redes neurais para detecção de objetos em vídeos, alocando parte da rede em um end device e o restante em um servidor na nuvem. O sistema também comprime os mapas de características gerados pelas últimas camadas no dispositivo final, explorando a correlação temporal, o que possibilita um esquema de compressão preditiva. Essa abordagem permite que redes neurais sejam incorporadas em dispositivos de baixo consumo de energia, respeitando os limites computacionais do dispositivo, as restrições de taxa de transmissão do canal de comunicação entre o dispositivo e o servidor, e os requisitos de precisão da rede. Experimentos conduzidos em modelos de redes neurais pré-treinadas mostram que o sistema proposto pode reduzir significativamente a quantidade de dados a serem armazenados ou transmitidos ao explorar a correlação temporal, facilitando a implantação dessas redes em dispositivos com poder computacional limitado. |
Abstract: | The use of artificial neural networks for object detection, along with advancements in 6G and IoT research, plays an important role in applications such as drone-based monitoring of structures, search and rescue operations, and deployment on hardware platforms like FPGAs. However, a key challenge in implementing these networks on such hardware is the need to economize computational resources. Despite substantial advances in computational capacity, implementing devices with ample resources remains challenging. As a solution, techniques for partitioning and compressing neural networks, as well as compressing activation signals (or feature maps), have been developed. This work proposes a system that partitions neural network models for object detection in videos, allocating part of the network to an end device and the remainder to a cloud server. The system also compresses the feature maps generated by the last layers on the end device by exploiting temporal correlation, enabling a predictive compression scheme. This approach allows neural networks to be embedded in low-power devices while respecting the computational limits of the device, the transmission rate constraints of the communication channel between the device and server, and the network’s accuracy requirements. Experiments conducted on pre-trained neural network models show that the proposed system can significantly reduce the amount of data to be stored or transmitted by leveraging temporal correlation, facilitating the deployment of these networks on devices with limited computational power |
Palavras-chave: | Compressão Sinais de ativação correlação temporal Predição Compression Activation signals Prediction Temporal correlation Redes Neurais Profundas DNN (Deep Neural Networks) |
Área de Concentração: | SISTEMAS DE ENERGIA ELÉTRICA |
Linha de Pesquisa: | CONTROLE E AUTOMAÇÃO |
CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES |
País: | Brasil |
Instituição: | Universidade Federal do Pará |
Sigla da Instituição: | UFPA |
Instituto: | Instituto de Tecnologia |
Programa: | Programa de Pós-Graduação em Engenharia Elétrica |
Tipo de Acesso: | Acesso Aberto |
Fonte URI: | Disponível na internet via correio eletrônico:bibliotecaitec@ufpa.br |
Aparece nas coleções: | Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertacao_CompressionActivationSignals.pdf | 1,2 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciado sob uma Licença Creative Commons