Skip to content

Latest commit

 

History

History
38 lines (22 loc) · 2.81 KB

README.md

File metadata and controls

38 lines (22 loc) · 2.81 KB

Domina Python: PySpark

Este es el repositorio del curso de LinkedIn Learning Domina Python: PySpark. El curso completo está disponible en LinkedIn Learning.

Nombre completo del curso

Consulta el archivo Readme en la rama main para obtener instrucciones e información actualizadas.

Descubre cómo utilizar PySpark para tus necesidades de procesamiento y análisis de datos. En este curso, dirigido a quienes se dedican a la programación, análisis de datos, ingeniería de datos y ciencia de datos, aprenderás a resolver problemas específicos con PySpark. El contenido está organizado en tres módulos esenciales: operaciones básicas, transformaciones y acciones, y manipulación de datos. Cada módulo está diseñado para proporcionar habilidades prácticas y aplicables en el mundo real. Aprovecha esta oportunidad para mejorar tu capacidad de manejar grandes volúmenes de datos de manera eficiente y efectiva con PySpark.

Instrucciones

Este repositorio tiene ramas (branches) para cada uno de los vídeos del curso. Puedes usar el menú emergente de la rama en GitHub para cambiar a una rama específica y echar un vistazo al curso en esa etapa, o puedes añadir /tree/nombre_de_la_rama a la URL para ir a la rama a la que quieres acceder.

Ramas

Las ramas están estructuradas para corresponder a los vídeos del curso. La convención de nomenclatura es Capítulo#_Vídeo#. Por ejemplo, la rama denominada 02_03 corresponde al segundo capítulo y al tercer vídeo de ese capítulo. Algunas ramas tendrán un estado inicial y otro final. Están marcadas con las letras i («inicio») y f («fin»). La branch i tiene el mismo código que al principio del vídeo. La branch f tiene el mismo código que al final del vídeo. La rama master tiene el estado final del código que aparece en el curso.

Instalación

  1. Para utilizar estos archivos de ejercicios, debes tener descargado lo siguiente:

    • openjdk version 17.0.12 o superior
    • Apache Spark version 3.5.3 o superior
    • Python version 3.12.6 o superior
  2. Clona este repositorio en tu máquina local usando la Terminal (macOS) o CMD (Windows), o una herramienta GUI como SourceTree.

Docente

Lincy González

Echa un vistazo a mis otros cursos en LinkedIn Learning.