SpotifyHits_DescriptiveStats es un proyecto que utiliza la estadística descriptiva para preparar datos para modelos de Machine Learning. Este proceso es crucial para realizar un análisis exploratorio de datos efectivo y para la implementación precisa de modelos predictivos.
Para configurar el entorno virtual necesario para este proyecto, ejecute el siguiente comando:
conda create --name nuevo_nombre_entorno_virtual --file requirements.txt
- Lenguaje de Programación: Python
- Librerías:
- pandas
- numpy
- matplotlib
- seaborn
- timeit
- scikit-learn
- Medidas Centrales y de Dispersión: Se calcularon estadísticas como la media, mediana, moda y desviación estándar.
- Técnicas de Escalamiento:
- Z-Score: Normalización de datos utilizando la puntuación estándar.
- Max-Min: Escalamiento de datos entre un rango definido.
- One-Hot Encoding: Transformación de variables categóricas en una forma binaria.
- Comparación de Técnicas de Escalamiento: Se utilizaron técnicas para determinar qué método de escalamiento es más eficiente en términos de tiempo.
- Escalamiento No Lineal: Se aplicaron técnicas de transformación no lineales a los datos.
- Correlación de Variables: Se exploró la correlación entre variables numéricas y categóricas.
- Reducción de Dimensionalidad: Se implementó el Análisis de Componentes Principales (PCA) para simplificar los datos manteniendo la esencia de la información original.
Si tiene alguna pregunta o desea discutir más sobre el proyecto, no dude en c