原创投稿 行业报告 AI展会数据标注

您的当前位置：首页 > 下载中心 > NLP > 正文

范围外意图分类数据集

发布：可思数据时间：2020-05-29

数据类型：文本语料热度

数据咨询

数据采集定制

数据标注定制

数据标注定制

文件类型：.zip 文件大小：2 MB

授权方式：公共开源 发布时间：2020-05-29

数据来源：Stefan Larson 数据语言：英文

数据介绍：

范围外意图分类数据集

您的文本分类器在范围外（又称为分布外）的性能

大多数受监督的机器学习任务都假设数据集具有一组定义明确的目标标签集。但是，当经过训练的模型与现实世界相遇时，会出现什么情况？在这种情况下，对训练后的模型的输入可能不是来自定义明确的目标标签集？该数据集提供了一种评估“范围外”输入上的意图分类模型的方法。

“范围外”输入是不属于“范围内”目标标签集的那些输入。您可能已经听说过其他超出范围的方式，包括“域外”或“分布范围外”。

内容

is_*.json：这些文件包含范围内数据的训练/验证/测试集。有150个范围内的“意图”（aka类），其中包括诸如“我的平衡是什么”（属于balance该类）之类的示例。
oos_*.json：这些文件包含范围外数据的训练/验证/测试集。有一个范围外的意图：oos。请注意，您不必使用oos_train.json数据。换句话说，对于范围外问题的ML解决方案无需针对范围外数据进行训练，但这可能会有所帮助！

评估指标

任务是意图分类，目的是归纳为文本分类（或分类）。这是一个监督的机器学习问题。我们使用两个指标进行评估：

范围内精度定义为＃（正确分类的范围内样本）/＃（范围内样本）。
范围外召回定义为＃（正确分类的范围外样本）/＃（范围外样本）。

下载地址：

下载提取码：16ta

特别声明：

¤ 此数据集库仅供研究和教育用途，不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库，则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途，请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码：www.sykv.com

人工智能权威社区

人工智能交流群扫码邀请

下载帮助：

加入收藏夹

上一篇：用于命名实体识别的带注释语料库
下一篇：情感标注句子数据集

相关文章：

无相关信息

相关推荐：

网友评论：

数据集分类

数据标注服务

最新数据集

sem搜索推广

推荐数据集

Copyright©2005-2020 Sykv.com 可思数据版权所有京ICP备14056871号

关于我们免责声明广告合作版权声明联系我们原创投稿网站地图

可思数据数据标注行业联盟

扫码入群

咨询反馈

客服QQ

微信公众号

关闭