MovieLens 20M数据集
自1995年以来,超过2000万部电影的评级和标记活动
数据集描述了电影推荐服务MovieLens的评分和自由文本标记活动。它包含27278个电影中的20000263个评分和465564个标签应用程序。这些数据由1995年1月9日至2015年3月31日之间的138493位用户创建。此数据集于2016年10月17日生成。
随机选择要纳入的用户。所有选定的用户都评价了至少20部电影。
内容
不包括人口统计信息。每个用户用一个id表示,并且不提供其他信息。数据包含在六个文件中。
tag.csv,其中包含用户应用于电影的标签:
-
用户身份
-
movieId
-
标签
-
时间戳记
rating.csv,其中包含用户对电影的评分:
-
用户身份
-
movieId
-
评分
-
时间戳记
包含电影信息的movie.csv:
-
movieId
-
标题
-
体裁
link.csv,其中包含可用于链接到其他来源的标识符:
-
movieId
-
imdbId
-
tmbdId
包含电影标签相关性数据的全基因组_scores.csv:
-
movieId
-
tagId
-
关联
包含标签说明的全基因组_标签.csv:
-
tagId
-
标签