Skip to content

Latest commit

 

History

History
47 lines (28 loc) · 1.92 KB

README.md

File metadata and controls

47 lines (28 loc) · 1.92 KB

Modelagem de Tópicos em Python utilizando Modelo de Alocação Latente de Dirichlet (LDA)

Este projeto foi desenvolvido com o objetivo de criar um algoritmo automatizado que possa ler documentos e gerar os tópicos mais relevantes e discutidos.📰.

Numpy Pandas Gensim NLTK

📄 Estrutura do repositório

⚠️ Contexto

A modelagem de tópicos é um método que extrai tópicos ocultos de grandes volumes de texto. Ela utiliza as aplicações do processamento de linguagem natural para extrair os tópicos que as pessoas estão mais discutindo, dentre os volumes de texto apresentados.

E o modelo Latent Dirichlet Allocation (LDA) é um algoritmo utilizado para modelagem de tópicos que tem implementações no pacote Gensim do Python.

Esse processo é bem importante para as empresas que querem criar estratégias de monetização e melhoria de serviços, por exemplo, seja analisando avaliações de clientes, feedbacks de usuários, notícias, redes sociais, etc.

🚀 Tecnologias

  • 📄 Bibliotecas: Pandas, Numpy, NLTK, Gensim, Matplotlib.
  • ⚡️ Google Colaboratory.

Made with 💜 by Letícia Pires 👋