Use este identificador para citar ou linkar para este item:
https://repositorio.ufpa.br/jspui/handle/2011/10338
Tipo: | Dissertação |
Data do documento: | 23-Ago-2018 |
Autor(es): | CIRQUEIRA, Douglas da Rocha |
Primeiro(a) Orientador(a): | SANTANA, Ádamo Lima de |
Título: | Uma arquitetura de pré-processamento para análise de sentimento em mídias sociais em português brasileiro |
Título(s) alternativo(s): | A pre-processing architecture for feeling in social media in Brazilian Portuguese |
Agência de fomento: | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior |
Citar como: | CERQUEIRA, Douglas da Rocha. ,Uma arquitetura de pré-processamento para análise de sentimento em mídias sociais em português. Orientador: Ádamo Lima de Santana. 2018. 106 f.Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2018. Disponível em: <http://repositorio.ufpa.br/jspui/handle/2011/10338>. Acesso em:. |
Resumo: | A Web 2.0 e a evolução nas Tecnologias da Informação e Comunicação, têm impulsionado novos meios de interação e relacionamento. Neste contexto, as Redes Sociais Online (RSO) são um exemplo, como plataformas que permitem a interação e o compartilhamento de informações entre pessoas. Além disso, é possível observar que RSO passaram a ser adotadas como canal de desabafo de consumidores, por meio de opiniões sobre produtos e experiências. Este cenário apresenta uma ótima oportunidade para que empresas possam melhorar produtos, serviços e estratégias de mercado, já que as RSO são poderosas fontes massivas de dados não-estruturados gerados pelo consumidor (do inglês, User- Generated Content - UGC), com opiniões e avaliações sobre ofertas em plataformas tais como Facebook, Twitter e Instagram. O Brasil é um grande exemplo onde esse fenômeno pode ser observado e apresenta potencial oportunidade de exploração de mercado, dado que a população brasileira é uma das nações que mais utiliza RSO no mundo. Neste âmbito, técnicas computacionais de Mineração de Opinião (MO) ou Análise de Sentimento (AS) são aplicadas com o intuito de inferir a polaridade dominante (positivo, negativo, neutro) quanto ao sentimento associado a textos, e, podem ser aplicadas em dados de RSO a fim de avaliar o feedback do público-alvo. Apesar das diversas estratégias de AS reportadas na literatura, ainda há vários desafios enfrentados na aplicação de AS em textos oriundos de RSO, devido às características da linguagem utilizada em tais plataformas. O estado da arte de AS é voltado para a língua inglesa e as propostas existentes para Português Brasileiro (PT_Br) não apresentam uma metodologia padronizada nas tarefas de pré-processamento. Neste âmbito, esta pesquisa investiga uma metodologia sem tradução e propõe uma nova arquitetura expandida de pré-processamento de AS voltada para o PT_Br, a fim de prover atributos enriquecidos para os algoritmos de AS. A proposta foi comparada com modelos bem estabelecidos na literatura, e resultados obtidos indicam que esta pode superar o estado da arte em até 3% de revocação, para 6 de 7 bases de dados avaliadas. |
Abstract: | The Web 2.0 and the evolution of Information Technologies have brought novel interaction and relationship channels. In this context, the Online Social Networks (OSN) are an example as platforms which allow interactions and sharing of information between people. In this scenario, it is possible to observe the adoption of OSN as a channel for posting opinions regarding products and experience. This scene presents an excellent opportunity for companies that aim to improve products, services and marketing strategies, given OSNs are powerful sources of massive unstructured data generated by consumers (UGC), with opinions and reviews concerning offers, in platforms such as Facebook, Twitter and Instagram. Brazil is a highlight in this scenario, where this phenomenon can be observed, as the Brazilian population is one of the most active in social media platforms in the world. This makes it a country full of opportunities to market exploitation. In this context, computational techniques of Opinion Mining and Sentiment Analysis (SA) are applied aiming to infer the polarity (positive, negative, neutral) regarding a sentiment associated to texts, and can also be applied in data from OSN to evaluate the feedback from a target audience. Although the existing diversity of SA strategies reported in the literature, there are still challenges faced in the application of SA in text data from OSN, given the characteristics of the language adopted in such platforms. The state of art is focused on SA towards the English language, and the existing proposals for Brazilian Portuguese do not have a standardized methodology for preprocessing steps. In this context, this research investigates an approach with no translation, and proposes a novel preprocessing architecture for SA towards Brazilian Portuguese, aiming to provide enriched features to SA algorithms. The proposal was compared with well-established baselines from the literature, and the obtained results indicate that this architecture can overcome the state of art recall in at least 3% , for 6 out of 7 datasets evaluated. |
Palavras-chave: | Análise de Sentimento pré-processamento; processamento de Linguagem Natural mineração de Texto mineração de opinião mineração de dados redes sociais on line midias sociais Sentiment analysis Preprocessing Text mining Opinion mining Data mining Social media |
Área de Concentração: | COMPUTAÇÃO APLICADA |
Linha de Pesquisa: | INTELIGÊNCIA COMPUTACIONAL |
CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
Tema: | Social networks |
País: | Brasil |
Instituição: | Universidade Federal do Pará |
Sigla da Instituição: | UFPA |
Instituto: | Instituto de Tecnologia |
Programa: | Programa de Pós-Graduação em Engenharia Elétrica |
Tipo de Acesso: | Acesso Aberto |
Fonte: | 1 CD-ROM |
Aparece nas coleções: | Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertacao_Arquiteturapreprocessamentoanalise.pdf | 2,15 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciado sob uma Licença Creative Commons