Skip to content

En este proyecto se verá métodos avanzados para manejar los datos faltantes de manera más eficiente

Notifications You must be signed in to change notification settings

gianmarco-holm/Diabetes_HandlingMissingData

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Diabetes_HandlingMissingData

✨ Descripción

SpotifyHits_DescriptiveStats es un proyecto que utiliza la estadística descriptiva para preparar datos para modelos de Machine Learning. Este proceso es crucial para realizar un análisis exploratorio de datos efectivo y para la implementación precisa de modelos predictivos.

🎡 Configuración del Entorno

Para configurar el entorno virtual necesario para este proyecto, ejecute el siguiente comando:

conda create --name nuevo_nombre_entorno_virtual --file requirements.txt

💻 Tecnologías Utilizadas

  • Lenguaje de Programación: Python
  • Librerías:
    • pandas
    • numpy
    • matplotlib
    • seaborn
    • timeit
    • scikit-learn

⚡ Análisis Realizado

  • Medidas Centrales y de Dispersión: Se calcularon estadísticas como la media, mediana, moda y desviación estándar.
  • Técnicas de Escalamiento:
    • Z-Score: Normalización de datos utilizando la puntuación estándar.
    • Max-Min: Escalamiento de datos entre un rango definido.
    • One-Hot Encoding: Transformación de variables categóricas en una forma binaria.
  • Comparación de Técnicas de Escalamiento: Se utilizaron técnicas para determinar qué método de escalamiento es más eficiente en términos de tiempo.
  • Escalamiento No Lineal: Se aplicaron técnicas de transformación no lineales a los datos.
  • Correlación de Variables: Se exploró la correlación entre variables numéricas y categóricas.
  • Reducción de Dimensionalidad: Se implementó el Análisis de Componentes Principales (PCA) para simplificar los datos manteniendo la esencia de la información original.

📱 Contacto

Si tiene alguna pregunta o desea discutir más sobre el proyecto, no dude en c

About

En este proyecto se verá métodos avanzados para manejar los datos faltantes de manera más eficiente

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published