Este projeto foi desenvolvido com o objetivo de criar um algoritmo automatizado que possa ler documentos e gerar os tópicos mais relevantes e discutidos.📰.
- Veja os dados utilizados MANCHETES BRASILEIRAS;
- Leia o notebook do projeto IMPLEMENTANDO O MODELO LDA PARA MODELAGEM DE TÓPICOS EM PYTHON.
A modelagem de tópicos é um método que extrai tópicos ocultos de grandes volumes de texto. Ela utiliza as aplicações do processamento de linguagem natural para extrair os tópicos que as pessoas estão mais discutindo, dentre os volumes de texto apresentados.
E o modelo Latent Dirichlet Allocation (LDA) é um algoritmo utilizado para modelagem de tópicos que tem implementações no pacote Gensim do Python.
Esse processo é bem importante para as empresas que querem criar estratégias de monetização e melhoria de serviços, por exemplo, seja analisando avaliações de clientes, feedbacks de usuários, notícias, redes sociais, etc.
- 📄 Bibliotecas: Pandas, Numpy, NLTK, Gensim, Matplotlib.
- ⚡️ Google Colaboratory.
Made with 💜 by Letícia Pires 👋