Parcours Data Science
Projet n°4 : "Anticipez les besoins en consommation électrique de bâtiments"
- Mise en place d'un modèle d'apprentissage supervisé (régression) pour prévoir les consommations de bâtiments de la ville de Seattle
- Création d'un pipeline de nettoyage des données
- Entraînement de différents algorithmes de machine learning (XGBoost, Random Forest Regressor)
- Optimisation des hyperparamètres
- Recherche d'importance des features
- Mise en place d'un modèle d'ensemble
- Mise en place d'une fonction de préparation des données et prédiction de consommation et émissions de C02.
Source des données : https://www.kaggle.com/city-of-seattle/sea-building-energy-benchmarking#2015-building-energy-benchmarking.csv
- Transformer les variables pertinentes d'un modèle d'apprentissage supervisé
- Adapter les hyperparamètres d'un algorithme d'apprentissage supervisé afin de l'améliorer
- Évaluer les performances d’un modèle d'apprentissage supervisé
- Mettre en place le modèle d'apprentissage supervisé adapté au problème métier