Skip to content

LALIC-UFSCar/Analise-de-emocoes-em-tweets-na-politica-brasileira

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Análise de emoções em tweets de resposta a posts do ex-presidente do Brasil Jair Messias Bolsonaro

Neste repositório estão armazenados os códigos e recursos empregados na pesquisa de TCC conduzida pela aluna Fernanda Malheiros Assi. O estudo consistiu na aplicação do modelo GoEmotions adaptado para o Português, para identificar as emoções presentes nas respostas a posts do ex-presidente do Brasil, Jair Bolsonaro. A Figura abaixo ilustra o pipeline geral adotado no trabalho. A investigação foi segmentada em três módulos principais: extração dos tweets, pré-processamento dos dados e inferência de emoções dos tweets pelo GoEmotions para Português. Adicionalmente, foram conduzidas análises exploratórias dos dados resultantes da aplicação do GoEmotions, bem como uma análise linguística dos erros do modelo para as três emoções mais proeminentes no córpus: Raiva, Curiosidade e Admiração.


Estrutura do Repositório

  • annotation: Resultado da anotação manual de 100 instâncias de cada classe para as emoções mais presentes no corpus.
  • data_collect: Scripts desenvolvidos para coletar os dados do Elasticsearch e salvá-los em uma pasta do Google Drive.
  • goEmotions: Códigos de inferência do GoEmotions no corpus utilizado e análise exploratória realizada.
  • preprocessing: Códigos utilizados para pré-processar os textos do Twitter em duas fases: antes e após passar pelo goEmotions.

Datasets

Devido ao tamanho, os datasets utilizados no projeto não estão hospedados diretamente neste repositório. Você pode acessá-los nos links abaixo:

  • all_replies.csv: Todas as respostas, sem nenhuma etapa de pré-processamento.
  • all_replies_clean.csv: Todas as respostas após a primeira etapa do pré-processamento.
  • all_replies_goEmotions.csv: Os dados após a primeira etapa de pré-processamento e da inferência pelo GoEmotions.
  • all_replies_goEmotions_clean.csv: Os dados resultantes da inferência do GoEmotions após a segunda etapa de pré-processamento. Estes dados foram utilizados para a análise linguística.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published