En este proyecto, nos sumergimos en el fascinante mundo de la ciencia de datos aplicada a la industria del entretenimiento, específicamente en el desarrollo de un sistema de recomendación de películas. Con acceso a datos reales de una plataforma de streaming, nuestro objetivo es mejorar la experiencia del usuario mediante la construcción de un recomendador personalizado, capaz de ofrecer sugerencias precisas y relevantes. El proyecto está estructurado en varias etapas, cada una diseñada para abordar diferentes enfoques de recomendación:
Recomendación No Personalizada: Comenzamos con un sistema básico que sugiere películas populares a todos los usuarios, independientemente de sus preferencias individuales.
Recomendación Basada en Contenido (Content-Based): Avanzamos hacia un modelo que recomienda películas basadas en las características de las películas que un usuario ya ha disfrutado, utilizando similitudes en géneros y descripciones.
Filtrado Colaborativo (Collaborative Filtering): Finalmente, implementamos un enfoque que sugiere películas basadas en las preferencias de usuarios similares, aprovechando patrones de comportamiento colectivo.
-
Permitir al usuario interactuar con el repositorio de películas y poder calificarlos, de acuerdo a un rango de rating del 1 al 5.
-
Desarrollar un algoritmo de recomendación que aprenderá de las preferencias del usuario analizando datos del usuario y películas para ofrecer sugerencias personalizadas basadas en sus gustos y que estará disponible una vez que haya calificado al menos una película.
-
Implementar un recomendador basado en contenido (Content-based), para que el cliente pueda ver títulos recomendados de películas según popularidad y por género.
Para ello utilizaron dos estrategias: Similitud de Jaccard y la Similitud de Coseno que se basan en las teorias siguientes:
- Similitud de Jaccard: es una métrica utilizada para medir la similitud entre dos conjuntos de datos y permite a los sistemas identificar y recomendar películas que comparten características similares.
- Similitud de Coseno con TF-IDF
-
Implementar un recomendador basado en filtrado colaborativo (Collaborative filtering) y visualizar resultados.