MovieRecommendSys

V1.0 整个过程分三步 Step1: moviesimilarity.py 计算电影相似度 input: u.data output: (movieid1,movieid2) (similarity,n) similarity 有三个，denfined in metrics.py. n is the number of users who had seen that two movies

Step2: nameid.py 计算全部电影的组合 input: u.item output: (movieid1,movieid2) (moviename1,moviename2)

Step3:

LastStep.py 合成之前两步的结果，input: two files got from former steps output (moviename1,moviename2) (similarity,n)

Final output file is "output"

data scale: 100,000 ratings (1-5) from 943 users on 1682 movies. 单机运行大约2，3 分钟 V1.1版本可以考虑加大数据量，使用EMR

mrjob official website: https://pythonhosted.org/mrjob/

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MovieRecommendSys

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
out		out
out1		out1
.DS_Store		.DS_Store
LastStep.py		LastStep.py
README.md		README.md
metrics.py		metrics.py
moviesimilarity.py		moviesimilarity.py
nameid.py		nameid.py
output		output
readme.txt		readme.txt
test.py		test.py
u.data		u.data
u.item		u.item

Yucheng-Ren/MovieRecommendSys

Folders and files

Latest commit

History

Repository files navigation

MovieRecommendSys

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages