原创投稿 行业报告 AI展会 数据标注
投稿发布
您的当前位置:首页 > 下载中心 > NLP > 正文

范围外意图分类数据集

发布:可思数据 时间:2020-05-29
数据类型:文本语料 热度

文件类型:.zip              文件大小:2 MB

授权方式:公共开源     发布时间:2020-05-29

数据来源:Stefan Larson             数据语言:英文

数据介绍:

范围外意图分类数据集

您的文本分类器在范围外(又称为分布外)的性能

大多数受监督的机器学习任务都假设数据集具有一组定义明确的目标标签集。但是,当经过训练的模型与现实世界相遇时,会出现什么情况?在这种情况下,对训练后的模型的输入可能不是来自定义明确的目标标签集?该数据集提供了一种评估“范围外”输入上的意图分类模型的方法。

“范围外”输入是不属于“范围内”目标标签集的那些输入。您可能已经听说过其他超出范围的方式,包括“域外”或“分布范围外”。

内容

  • is_*.json:这些文件包含范围内数据的训练/验证/测试集。有150个范围内的“意图”(aka类),其中包括诸如“我的平衡是什么”(属于balance该类)类的示例
  • oos_*.json:这些文件包含范围外数据的训练/验证/测试集。有一个范围外的意图:oos请注意,您不必使用oos_train.json数据。换句话说,对于范围外问题的ML解决方案无需针对范围外数据进行训练,但这可能会有所帮助!

评估指标

任务是意图分类,目的是归纳为文本分类(或分类)。这是一个监督的机器学习问题。我们使用两个指标进行评估:

  • 范围内精度定义为#(正确分类的范围内样本)/#(范围内样本)。
  • 范围外召回定义为#(正确分类的范围外样本)/#(范围外样本)。
下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码:www.sykv.com
人工智能权威社区
人工智能交流群扫码邀请

相关文章:

    无相关信息

相关推荐:

网友评论:

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

数据标注服务
sem搜索推广

Copyright©2005-2020 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭