Use este identificador para citar ou linkar para este item: https://repositorio.ufpa.br/jspui/handle/2011/17255
Tipo: Dissertação
Data do documento: 24-Jan-2020
Autor(es): QUEIROZ, Daniele Moura de
Afiliação do(s) Autor(es): MPPA - Ministério Público do Estado do Pará
Primeiro(a) Orientador(a): FRANCÊS, Carlos Renato Lisboa
Título: Uma Proposta de arquitetura de big data para detecção de fake news.
Citar como: QUEIROZ, Danielle Moura de. Uma Proposta de arquitetura de big data para detecção de fake news. Orientador: Carlos Renato Lisboa Francês. 2020. 71 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2020. Disponível em:https://repositorio.ufpa.br/jspui/handle/2011/17255 . Acesso em:.
Resumo: Nos últimos anos, uma grande quantidade de informações tem sido veiculada através da internet, especialmente em mídias sociais, proporcionando uma maior facilidade na obtenção de conhecimentos sobre diversos temas, mas tornando as pessoas suscetíveis a informações falsas que podem acarretar danos variados. Apesar de não ser um fenômeno recente, o compartilhamento de notícias falsas tem sido motivo de preocupação por parte de especialistas e da população em geral, uma vez que pode ocasionar impactos de proporções nacionais e até mundiais. A veiculação de fake news pode ocasionar danos diversos, desde financeiros a prejuízos relacionados com difamação, injúria, ofensa, reputação ou dignidade de pessoas ou organizações. A disseminação destas informações falsas tornou difícil detectar fontes de notícias confiáveis, aumentando a necessidade de ferramentas computacionais que sejam capazes de auxiliar na identificação da confiabilidade do conteúdo digital. Ademais, a quantidade massiva de dados gerados diariamente em alta velocidade e com diferentes tipos de formatos tais como textos, imagens, vídeos e áudios, torna a análise destes dados um grande desafio. Com o advento das tecnologias de Big Data, é possível utilizar uma gama de ferramentas e técnicas para armazenar, processar e analisar, de maneira eficiente, o massivo volume de dados, de forma a contribuir com a investigação da credibilidade de notícias divulgadas e compartilhadas por meio da internet. Este trabalho discute a importância do Big Data para o combate às fake news, pautado em um apropriado enquadramento conceitual e tecnológico, e apresenta uma proposta de arquitetura de Big Data para armazenamento, processamento e análise de grandes conjuntos de dados, objetivando auxiliar na investigação da veracidade de notícias. Para tanto, foram realizados experimentos utilizando uma massa de dados contendo formatos distintos, ou seja, dados estruturados e não estruturados, extraídos a partir de fontes de notícias e formando um corpus composto por notícias falsas e verdadeiras, totalizando 10700 notícias. Essa massa de dados foi armazenada em um cluster Hadoop, utilizando o sistema de arquivos distribuído denominado HDFS (Hadoop Distributed File System). O processamento do corpus ocorreu através do modelo de programação MapReduce e a classificação das notícias foi realizada através do algoritmo Naive Bayes da biblioteca Mahout, obtendo-se uma acurácia de 99,74%. Os resultados preliminares produzidos pelo desenvolvimento deste estudo revelam uma arquitetura capaz de armazenar, processar e analisar Big Data no contexto do combate às fake news.
Abstract: In last years, a large amount of information has been transmitted through the Internet, especially in social media, providing greater knowledge on various topics, but making people susceptible to false information that can cause various damage. Although it is not a recent phenomenon, the sharing of false news has been a matter of concern for specialists and the population in general, since it can cause impacts of national and even global proportions. The transmission of fake news can cause various damages, from financial to losses related to defamation, injury, offense, reputation or dignity of people or organizations. The spread of this false information has made it difficult to detect reliable news sources, increasing the need for computational tools that can help identify the reliability of digital content. Moreover, the massive amount of data generated daily at high speed and different types of formats such as text, images, videos and audios, makes analysing this data a big challenge. With the advent of big data technologies, it is possible to use a range of tools and techniques to efficiently store, process and analyse massive data to help investigate the credibility of news disseminated and shared by middle of the internet. This paper discusses the importance of Big Data to combat fake news, based on an appropriate conceptual and technological framework, and presents a Big Data architecture proposal for storing, processing and analysing large data sets, aiming to assist in the investigation of truth of news. For this, experiments were performed using a mass of data containing different formats, i.e. structured and unstructured data, extracted from news sources and forming a corpus composed of false and true news. This mass of data was stored in a Hadoop cluster using the Hadoop Distributed File System (HDFS). The corpus was processed using the MapReduce programming model and the news classification was performed using the Naive Bayes algorithm from Mahout library, obtaining an accuracy of 99.74%. The preliminary results produced by the development of this study reveal an architecture capable of storing, processing and analysing Big Data in the context of fighting fake news.
Palavras-chave: Arquitetura de Big data
Big data
Fake news
Hadoop
Área de Concentração: COMPUTAÇÃO APLICADA
Linha de Pesquisa: INTELIGÊNCIA COMPUTACIONAL
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
País: Brasil
Instituição: Universidade Federal do Pará
Sigla da Instituição: UFPA
Instituto: Instituto de Tecnologia
Programa: Programa de Pós-Graduação em Engenharia Elétrica
Tipo de Acesso: Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 Brazil
Fonte URI: Disponível na internet via correio eletrônico: bibliotecaitec@ufpa.br
Aparece nas coleções:Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dis_PropostaArquiteturaBig.pdf1,76 MBAdobe PDFVisualizar/Abrir


Este item está licenciado sob uma Licença Creative Commons Creative Commons