原创投稿 行业报告 AI展会 数据标注
投稿发布
您的当前位置:首页 > 下载中心 > 文本语料 > 正文

新闻类别数据集

发布:可思数据 时间:2020-05-31
数据类型:文本语料 热度

文件类型:.JSON              文件大小:80 MB

授权方式:公共开源     发布时间:2020-05-31

数据来源:Rishabh Misra             数据语言:英文

数据介绍:

新闻类别数据集根据标题和简短说明识别新闻类型

该数据集包含从HuffPost获得的2012年至2018年的大约20万条新闻标题。在该数据集上训练的模型可用于识别未跟踪新闻文章的标签或识别不同新闻文章中使用的语言类型。

内容

每个新闻标题都有一个相应的类别。类别和相应的文章计数如下:

  • POLITICS: 32739

  • WELLNESS: 17827

  • ENTERTAINMENT: 16058

  • TRAVEL: 9887

  • STYLE & BEAUTY: 9649

  • PARENTING: 8677

  • HEALTHY LIVING: 6694

  • QUEER VOICES: 6314

  • FOOD & DRINK: 6226

  • BUSINESS: 5937

  • COMEDY: 5175

  • SPORTS: 4884

  • BLACK VOICES: 4528

  • HOME & LIVING: 4195

  • PARENTS: 3955

  • THE WORLDPOST: 3664

  • WEDDINGS: 3651

  • WOMEN: 3490

  • IMPACT: 3459

  • DIVORCE: 3426

  • CRIME: 3405

  • MEDIA: 2815

  • WEIRD NEWS: 2670

  • GREEN: 2622

  • WORLDPOST: 2579

  • RELIGION: 2556

  • STYLE: 2254

  • SCIENCE: 2178

  • WORLD NEWS: 2177

  • TASTE: 2096

  • TECH: 2082

  • MONEY: 1707

  • ARTS: 1509

  • FIFTY: 1401

  • GOOD NEWS: 1398

  • ARTS & CULTURE: 1339

  • ENVIRONMENT: 1323

  • COLLEGE: 1144

  • LATINO VOICES: 1129

  • CULTURE & ARTS: 1030

  • EDUCATION: 1004

下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码:www.sykv.com
人工智能权威社区
人工智能交流群扫码邀请

相关文章:

    无相关信息

相关推荐:

网友评论:

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

数据标注服务
sem搜索推广

Copyright©2005-2020 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭