女士电子商务服装的评测23,000个客户评论和评分
这是一个围绕着客户撰写的评论的女装电子商务数据集。由于这是真实的商业数据,因此已被匿名化,并且在评论文本和正文中对公司的引用已替换为“零售商”。
内容
该数据集包括23486行和10个特征变量。每行对应一个客户评论,并包含以下变量:
- 服装ID:整数分类变量,指的是要查看的特定作品。
- 年龄:评论者年龄的正整数变量。
- 标题:评论标题的字符串变量。
- 评论文本:评论正文的字符串变量。
- 评分:客户授予的产品评分的正序整数变量,从1最差,到5最佳。
- 推荐的IND:二进制变量,说明客户在推荐1的地方推荐产品,不推荐0的地方。
- 积极的反馈计数:积极的整数,记录发现该评论为积极的其他客户的数量。
- 部门名称:产品高级部门的分类名称。
- 部门名称:产品部门名称的分类名称。
- 类名称:产品类名称的分类名称。