O anpocs-scraper
é um raspador dos dados dos Encontros Anuais da ANPOCS escrito em Python. Atualmente o código permite coletar:
- os dados de todos os resumos dos trabalhos apresentados em GT's e SPG's do 44º Encontro Anual da ANPOCS
- os dados de todos os resumos dos trabalhos apresentados em ST's e SPG's do 43º Encontro Anual da ANPOCS
Para instalar o raspador basta clonar o presente repositório e instalar suas dependências:
git clone https://github.com/vmussa/anpocs-scraper
cd anpocs-scraper
python -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
Para rodar o raspador, continue no repositório clonado e execute o código main.py
com o Python:
⚠️ Você precisa instalar o Google Chrome e o ChromeDriver: Clique aqui para ler um tutorial sobre como instalar o ChromeDriver.
python src/main.py
Futuramente o raspador abarcará todos os GT's e SPG's do encontro 45, cujos resumos dos trabalhos estarão disponíveis aqui. Além disso, ele contará com um módulo de limpeza dos dados que fará o pré-processamento para a análise qualitativa e/ou computacional.
Vítor Mussa (@vmussa) e Daniel Mendes (@danielmnds34).
Agradecemos à ANPOCS, à CAPES, ao PPGSA/UFRJ e aos laboratórios de pesquisa LABHD/UFBA e DTA/UFRJ.