电影数据集
超过45,000部电影的元数据。来自超过270,000位用户的2600万收视率。
这些文件包含完整MovieLens数据集中列出的所有45,000电影的元数据。数据集包含2017年7月或之前发行的电影。数据点包括演员,剧组,剧情关键字,预算,收入,海报,发行日期,语言,制作公司,国家/地区,TMDB投票数和平均投票数。
该数据集还包含文件,其中包含来自270,000位用户的2600万个评分,用于所有45,000部电影。评级范围为1-5,可从GroupLens官方网站获得。
内容
该数据集包含以下文件:
films_metadata.csv:主电影元数据文件。包含有关Full MovieLens数据集中精选的45,000部电影的信息。功能包括海报,背景,预算,收入,发行日期,语言,制作国家和公司。
keyword.csv:包含MovieLens电影的电影情节关键字。以字符串化JSON对象的形式提供。
credits.csv:包含我们所有电影的演员和剧组信息。以字符串化JSON对象的形式提供。
links.csv:包含完整电影镜头数据集中所有电影的TMDB和IMDB ID的文件。
links_small.csv:包含完整数据集的9,000部电影的一小部分的TMDB和IMDB ID。
rating_small.csv:来自9,000个电影的700位用户的100,000个评分的子集。
完整的MovieLens数据集包含2600万个分级和来自270,000个用户的750,000个标签应用程序,该数据集中包含此数据集中所有45,000部电影