Libro Python para análisis de datos

Este curso tiene como objetivo enseñar Python orientado al análisis de datos en aproximadamente 24 horas.

No hace falta tener conocimientos previos de Python.

Contenido del curso

1: Anaconda y notebooks
2: Pandas
3: Programación
4: APIs
5: Web scraping
6: Introducción a la visualización de datos
7: Gráficos
8: Gráficos con seaborn
9: Mapas
10: Numpy
11: Pivotación de tablas
12: Bases de datos
13: Producción
14: Entornos

Nota: Hay gente que piensa que esta forma de ordenar el curso es rara. Los programadores estamos acostumbrados a empezar viendo sintaxis básica, tipos de datos, etc... para ir subiendo a librerías de más alto nivel más tarde.

Aquí, lo he hecho al revés. Lo primero que vemos son tablas de datos con pandas y de forma indirecta iremos utilizando números, cadenas de texto, listas, diccionarios, ... sin haberlos dado explícitamente. ¿Por qué? Para que el principiante pueda ver avance rápidamente y comprenda para qué sirve esa parte aburrida de los tipos de datos y estructuras básicas antes de ponerse con ellas.

Ejecutar los notebooks del curso

Opción 1: Binder

La forma más fácil es utilizando Binder. Entra aquí, espera a que se inicie, y tendrás los notebooks disponibles en un entorno funcional. De esta forma, puedes seguir el curso sin necesidad de que instales nada en tu ordenador.

En cambio, si quieres ir realizando los ejercicios y guardando los resultados, te recomiendo que instales Python localmente.

Opción 2: Instalación local

Para lanzarlo desde tu máquina, tienes dos opciones:

Instalar Anaconda para Python 3 (recomendado para usuarios principiantes)
Utilizar pipenv (recomendado para usuarios avanzados).

Opción 2a: Instalación local con Anaconda

Instala la última versión de Anaconda para Python 3.7 para tu sistema operativo desde aquí. Fíjate bien que instales la de Python 3.7 (y no la de Python 2.7).

Aquí tienes un tutorial paso a paso de cómo hacerlo:

Windows. Fíjate bien en el paso en el que debes marcar que añada anaconda al PATH. Esa casilla debe quedar marcada.
Mac.

Una vez instalado, nuestra terminal debería reconocer los comandos conda (el gestor de paquetes), jupyter (la herramienta de notebooks) y python, gracias a que hemos añadido anaconda a nuestro PATH. Esto quiere decir que, cuando escribamos uno de estos comandos, nuestro sistema lo buscará en la carpeta de anaconda.

Para comprobarlo, abre una consola. Esto se puede hacer:

En Windows, abriendo el menú inicio y escribiendo cmd.exe. Si necesitas ayuda, mira más opciones aquí.
En Mac, abre una terminal. Si necesitas ayuda sobre cómo abrirla, mira aquí.
En ubuntu / debian, abre una terminal. Si necesitas ayuda, mira aquí.

Una vez abierto, nos debería funcionar bien los siguientes tres comandos:

python --version

conda --version

jupyter --version

Si nos dice que no reconoce el comando, es que no se ha añadido correctamente anaconda al PATH. Los tutoriales referenciados tienen buenas soluciones a este problema habitual.

Ahora, vamos a instalar las dependencias necesarias para nuestras sesiones con conda. Para ello, abre una terminal en tu ordenador y lanza lo siguiente:

conda install -c conda-forge seaborn
conda install -c conda-forge folium

Los comandos anteriores deberán instalar sin error las librerías.

Y finalmente, para abrir los notebooks en Windows, puedes hacer, desde la consola (cmd.exe):

jupyter notebook --notebook-dir='C:\mi\ruta\con\notebooks\'

En mac o linux, con la terminal:

jupyter notebook --notebook-dir='/mi/ruta/con/notebooks'

Modificando la ruta dependiendo de dónde los hayas descargado.

Opción 2b: Instalación local con pipenv

Necesitarás:

Python 3.7 o superior
pipenv
jupyter

Si no tienes pipenv, puedes instalarlo como comando así:

sudo -H pip install -U pipenv

Si no tienes jupyter, puedes instalarlo como comando así:

sudo -H pip install -U jupyter

Para instalar las dependencias, ejecuta:

pipenv install --dev

La primera vez que lo lances, creará el entorno virtual con las dependencias del proyecto.

Y para crear el kernel sobre el que correrán los notebooks, lanza lo siguiente:

# Activate the virtual environment
pipenv shell

# Create the kernel
python -m ipykernel install --user --name='libropython'

# Exit the virtual environment shell
exit

A partir de ahora, en jupyter, tendrás un nuevo kernel disponible llamado libropython. Tendrás que seleccionarlo para ejecutar correctamente los notebooks de este curso.

Finalmente, para lanzar los notebooks:

pipenv run jupyter notebook notebooks

Opción 3: Docker

Si prefieres utilizar un contenedor para lanzar el curso, basta con que tengas instalado docker en tu ordenador y lances:

docker-compose up --build

Cuando esté corriendo, saldrá un mensaje parecido a este por consola:

curso_1  |     To access the notebook, open this file in a browser:
curso_1  |         file:///root/.local/share/jupyter/runtime/nbserver-1-open.html
curso_1  |     Or copy and paste one of these URLs:
curso_1  |         http://d9a5de8c039a:8888/?token=xxxxxxxx
curso_1  |      or http://127.0.0.1:8888/?token=xxxxxxxx

Copia y pega en tu navegador la última URL (la que empieza por http://127.0.0.1:8888/?token=) y accederás a los notebooks desplegados en tu contenedor.

Contribuye

Si ves algo incorrecto, que no se entiende bien, crees que falta alguna explicación o tienes alguna idea que compartir, puedes crear una issue en el repositorio.

Licencia

TODO

Revisar links rotos
Añadir ejemplo paleta cut en sns
Ejercicio OVNIs quitar hist o sugerir agregar por año
Cambiar orden de ejercicio APIs después de mapas
Pasar tema 06 intro visualización a notebook (en lugar de Rmd + html)

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
notebooks		notebooks
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE.txt		LICENSE.txt
Pipfile		Pipfile
Pipfile.lock		Pipfile.lock
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Libro Python para análisis de datos

Contenido del curso

Ejecutar los notebooks del curso

Opción 1: Binder

Opción 2: Instalación local

Opción 2a: Instalación local con Anaconda

Opción 2b: Instalación local con pipenv

Opción 3: Docker

Contribuye

Licencia

TODO

About

Releases

Packages

Languages

License

jjballano-qatium/curso-python-analisis-datos

Folders and files

Latest commit

History

Repository files navigation

Libro Python para análisis de datos

Contenido del curso

Ejecutar los notebooks del curso

Opción 1: Binder

Opción 2: Instalación local

Opción 2a: Instalación local con Anaconda

Opción 2b: Instalación local con pipenv

Opción 3: Docker

Contribuye

Licencia

TODO

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages