Pour installer le projet, suivez les étapes suivantes:
- Téléchargez ou clonez le dépôt sur votre ordinateur
- Ouvrez un terminal et accédez au répertoire du projet
- Exécutez la commande
npm install
pour installer les dépendances
- Exécutez la commande
pip install -r requirements.txt
pour installer les dépendances Python - Sur un terminal dans le répertoire
GUI/
, exécutez la commandepython app.py
L'application Flask sera disponible à l'URL http://localhost:8000/
Pour utiliser le projet, suivez les étapes suivantes:
- Ouvrez un terminal et accédez au répertoire du projet
- Exécutez la commande npm start pour lancer l'application
- Suivez les instructions affichées dans le terminal pour utiliser le projet
- Docker installé sur l'ordinateur local
- Docker Compose installé sur l'ordinateur local
- Accès à internet pour télécharger les images Docker nécessaires
- Connaissances de base sur l'utilisation de Docker et Docker Compose
- Un fichier docker-compose.yml présent dans le répertoire du projet
- Les ports 5432 et 3000 doivent être disponibles pour les services PostgreSQL et Metabase respectivement
- Éventuellement, une configuration spécifique pour le réseau Docker (si vous avez d'autres services en cours d'exécution sur le même réseau)
Après avoir vérifié que toutes les exigences sont remplies, vous pouvez exécuter la commande docker-compose up pour démarrer les services PostgreSQL et Metabase.
Voici comment nettoyer mon dataframe df en utilisant pandas pour m'assurer que les données sont propres et sûres :
- Vérifier les valeurs manquantes dans chaque colonne en utilisant la méthode df.isnull().sum()
- Remplir les valeurs manquantes avec une valeur par défaut ou en utilisant la valeur moyenne, la valeur la plus fréquente, etc. en utilisant les méthodes df.fillna() ou df.replace()
- Vérifier les données aberrantes dans chaque colonne en utilisant des méthodes de visualisation de données telles que df.plot() ou df.boxplot()
- Supprimer les données aberrantes en utilisant la méthode df.drop()
- Vérifier la cohérence des données en utilisant des méthodes de vérification de données telles que df.duplicated() ou df.groupby()
- Normaliser les données en utilisant des méthodes de normalisation de données telles que df.apply() ou df.map()
- Enregistrer les données nettoyées en utilisant la méthode df.to_csv() ou df.to_excel() pour les utiliser ultérieurement.