Uma Proposta de arquitetura de big data para detecção de fake news.

Carregando...
Imagem de Miniatura

Data

2020-01-24

Título da Revista

ISSN da Revista

Título de Volume

item.page.theme

Editora(s)

Universidade Federal do Pará

Tipo de acesso

Acesso Aberto
Attribution-NonCommercial-NoDerivs 3.0 Brazilaccess-logo

Contido em

Citação

QUEIROZ, Danielle Moura de. Uma Proposta de arquitetura de big data para detecção de fake news. Orientador: Carlos Renato Lisboa Francês. 2020. 71 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2020. Disponível em:https://repositorio.ufpa.br/jspui/handle/2011/17255 . Acesso em:.

DOI

Nos últimos anos, uma grande quantidade de informações tem sido veiculada através da internet, especialmente em mídias sociais, proporcionando uma maior facilidade na obtenção de conhecimentos sobre diversos temas, mas tornando as pessoas suscetíveis a informações falsas que podem acarretar danos variados. Apesar de não ser um fenômeno recente, o compartilhamento de notícias falsas tem sido motivo de preocupação por parte de especialistas e da população em geral, uma vez que pode ocasionar impactos de proporções nacionais e até mundiais. A veiculação de fake news pode ocasionar danos diversos, desde financeiros a prejuízos relacionados com difamação, injúria, ofensa, reputação ou dignidade de pessoas ou organizações. A disseminação destas informações falsas tornou difícil detectar fontes de notícias confiáveis, aumentando a necessidade de ferramentas computacionais que sejam capazes de auxiliar na identificação da confiabilidade do conteúdo digital. Ademais, a quantidade massiva de dados gerados diariamente em alta velocidade e com diferentes tipos de formatos tais como textos, imagens, vídeos e áudios, torna a análise destes dados um grande desafio. Com o advento das tecnologias de Big Data, é possível utilizar uma gama de ferramentas e técnicas para armazenar, processar e analisar, de maneira eficiente, o massivo volume de dados, de forma a contribuir com a investigação da credibilidade de notícias divulgadas e compartilhadas por meio da internet. Este trabalho discute a importância do Big Data para o combate às fake news, pautado em um apropriado enquadramento conceitual e tecnológico, e apresenta uma proposta de arquitetura de Big Data para armazenamento, processamento e análise de grandes conjuntos de dados, objetivando auxiliar na investigação da veracidade de notícias. Para tanto, foram realizados experimentos utilizando uma massa de dados contendo formatos distintos, ou seja, dados estruturados e não estruturados, extraídos a partir de fontes de notícias e formando um corpus composto por notícias falsas e verdadeiras, totalizando 10700 notícias. Essa massa de dados foi armazenada em um cluster Hadoop, utilizando o sistema de arquivos distribuído denominado HDFS (Hadoop Distributed File System). O processamento do corpus ocorreu através do modelo de programação MapReduce e a classificação das notícias foi realizada através do algoritmo Naive Bayes da biblioteca Mahout, obtendo-se uma acurácia de 99,74%. Os resultados preliminares produzidos pelo desenvolvimento deste estudo revelam uma arquitetura capaz de armazenar, processar e analisar Big Data no contexto do combate às fake news.

Agência de Fomento

browse.metadata.ispartofseries

item.page.isbn

Fonte

item.page.dc.location.country

Citação

QUEIROZ, Danielle Moura de. Uma Proposta de arquitetura de big data para detecção de fake news. Orientador: Carlos Renato Lisboa Francês. 2020. 71 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2020. Disponível em:https://repositorio.ufpa.br/jspui/handle/2011/17255 . Acesso em:.