DS307.N11 - Hệ Khuyến Nghị
Học kỳ 1 Năm 4 Năm học 2022-2023
Giảng Viên:
- ThS Nguyễn Văn Kiệt
- CN Huỳnh Văn Tín
Nhóm SVTH:
- Phạm Đức Thể
- Trần Thành Luân
- Bộ dữ liệu sử dụng trong báo cáo này có tên là Booking Hotels Dataset được chúng tôi thu thập từ trang web du lịch trực tuyến cho đặt chỗ booking.com. Sử dụng ngôn ngữ lập trình Python kết hợp với hai framework được hỗ trợ mạnh mẽ cho việc cào dữ liệu là Selenium và BeautifulSoup để thu thập thông tin về khách sạn và người dùng. Bộ dữ liệu được thu thập gồm 38,801 dòng dữ liệu và 9 thuộc tính với hơn 4,500 khách sạn thuộc 10 tỉnh/thành phố như: Đà Lạt, Hà Nội, TP. Hồ Chí Minh, . . . và gần 6,500 user khác nhau.
- Bộ dữ liệu được chúng tôi công bố tại Kaggle - Hotel Booking Rating Dataset
-
Thu thâp, xây dựng và phân tích bộ dữ liệu
-
Hướng tiếp cận: Để tạo ra mô hình khuyến nghị khách sạn cho user, chúng tôi tiến hành xây dựng các mô hình khuyến nghị: Content-based Filtering, User-user collaborative filtering, Item-item collaborative filtering. Để đánh giá mô hình chúng tôi sử dụng các độ đo RMSE, MSE, MAE, NMAE.
-
Kết quả tốt nhất mà chúng tôi đạt được là 12.66 MSE, 3.56 RMSE, 2.60 MAE và 0.34 NMAE.
-
Demo Youtube
Phạm Đức Thể
Thể ~/~