Skip to content
This repository has been archived by the owner on Aug 10, 2018. It is now read-only.

Latest commit

 

History

History
26 lines (14 loc) · 1.09 KB

README.md

File metadata and controls

26 lines (14 loc) · 1.09 KB

Bankin web scraping challenge

Projet destiné au concours de web scraping Bankin.

Ce script utilise la librairie puppeteer (de l'équipe Chrome DevTools) pour scraper le site du concours Bankin afin d'en extraire la liste des transactions bancaires.

Testé sur Node.js 8.8.

Utilisation

npm install
node main.js

Le paquet puppeteer se charge d'installer automatiquement une version de Chromium compatible. Si, pour une raison quelconque Chromium n'a pas été installé, lancer la commande npm install puppeteer.

Désactivation du mode headless

Pour faciliter le débuggage et désactiver le mode headless, mettre la variable d'environnement DISABLE_HEADLESS à 1.

Configurer le nombre de threads

Si le nombre de threads lancés par défaut ne convient pas, il suffit d'en indiquer le nombre souhaité dans la variable d'environnement MAX_THREADS.

Logs

Les logs sont écrits dans un fichier debug.log durant l'exécution du script.