- 265,016张图像(COCO和抽象场景)
- 每张图片至少3个问题(平均5.4个问题)
- 每个问题10个基本事实答案
- 每个问题3个合理(但可能不正确)的答案
- 自动评估指标
Visual Question Answering V2.0 图像数据
发布:可思数据
时间:2020-03-21
数据介绍:
Visual Question Answering (VQA) 是一个针对图像内容进行自然语言问答数据集,其中有关图像的自然语言问题和答案需要对图像内容、自然语言和常识进行智能运用才能回答。包括 25 万张图像,每张图片 3 个自然语言描述的问题,每个问题 10 个标准答案,3 个近似答案。
下载地址:
特别声明:
¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码:www.sykv.com
人工智能交流群扫码邀请
相关文章:
-
无相关信息
相关推荐:
网友评论:
数据集分类
最新数据集
推荐数据集