ANÁLISE DE SENTIMENTO NA CLASSIFICAÇÃO DE FAKE NEWS, DESINFORMAÇÃO E DISCURSO DE ÓDIO
Repositório com os Dados
VENÂNCIO, Otávio. Autor ANDRADE, Michelle. Orientador
Este trabalho apresenta as Fake News, através de uma análise histórica sobre o contexto de desinformação e manipulação, além de mostrar a relação atual com as redes sociais, especialmente no cenário político. Para exemplificação, foram coletados aproximadamente 37.000 registros do Twitter entre o período de 25 de outubro a 15 de novembro de 2020 sobre os candidatos à Prefeitura de Belo Horizonte, MG. Com os tweets coletados, realizou-se as etapas para classificação de texto: Padronização, Tokenização, Normalização, Filtragem e Classificação, com a utilização da ferramenta Orange Canvas. Posteriormente, foram rotulados manualmente tweets que apresentaram sentimentos negativos, em três possíveis categorias: Fake News, Discurso de Ódio e Desinformação. E por fim, foi proposto um modelo de Framework com vistas a gerar automaticamente esta classificação. Palavras-chave: Fake News, Discurso de Ódio, Desinformação, Análise de Sentimento, Processamento de Linguagem Natural. SENTIMENT ANALYSIS IN THE CLASSIFICATION OF FAKE NEWS, DISINFORMATION AND HATE SPEECH
Abstract This work presents as Fake News, through a historical analysis of the context of disinformation and manipulation, in addition to showing the current relationship with social networks, especially in the political scenario. For example, approximately 37,000 Twitter records were collected from October 25 to November 15, 2020 on candidates for the Belo Horizonte City Hall, MG. With the tweets collected, steps were taken to classify text: Transformation, Tokenization, Normalization, Filtering and Classification, using the Orange Canvas tool. Subsequently, tweets that dissipate negatives were manually labeled in three possible categories: Fake News, Hate Speech and Disinformation. Finally, a Framework model was proposed to generate this classification automatically. Keywords: Fake News, hate speech, misinformation, sentiment analysis, natural language processing