Este es el repositorio del curso de LinkedIn Learning Domina Python: PySpark
. El curso completo está disponible en LinkedIn Learning.
Consulta el archivo Readme en la rama main para obtener instrucciones e información actualizadas.
Descubre cómo utilizar PySpark para tus necesidades de procesamiento y análisis de datos. En este curso, dirigido a quienes se dedican a la programación, análisis de datos, ingeniería de datos y ciencia de datos, aprenderás a resolver problemas específicos con PySpark. El contenido está organizado en tres módulos esenciales: operaciones básicas, transformaciones y acciones, y manipulación de datos. Cada módulo está diseñado para proporcionar habilidades prácticas y aplicables en el mundo real. Aprovecha esta oportunidad para mejorar tu capacidad de manejar grandes volúmenes de datos de manera eficiente y efectiva con PySpark.
Este repositorio tiene ramas (branches) para cada uno de los vídeos del curso. Puedes usar el menú emergente de la rama en GitHub para cambiar a una rama específica y echar un vistazo al curso en esa etapa, o puedes añadir /tree/nombre_de_la_rama
a la URL para ir a la rama a la que quieres acceder.
Las ramas están estructuradas para corresponder a los vídeos del curso. La convención de nomenclatura es Capítulo#_Vídeo#. Por ejemplo, la rama denominada 02_03
corresponde al segundo capítulo y al tercer vídeo de ese capítulo. Algunas ramas tendrán un estado inicial y otro final. Están marcadas con las letras i («inicio») y f («fin»). La branch i tiene el mismo código que al principio del vídeo. La branch f tiene el mismo código que al final del vídeo. La rama master tiene el estado final del código que aparece en el curso.
-
Para utilizar estos archivos de ejercicios, debes tener descargado lo siguiente:
- openjdk version 17.0.12 o superior
- Apache Spark version 3.5.3 o superior
- Python version 3.12.6 o superior
-
Clona este repositorio en tu máquina local usando la Terminal (macOS) o CMD (Windows), o una herramienta GUI como SourceTree.
Lincy González
Echa un vistazo a mis otros cursos en LinkedIn Learning.