原创投稿 行业报告 AI展会 数据标注
投稿发布
您的当前位置:首页 > 下载中心 > 智能医疗 > 正文

COVID-19开放研究数据集

发布:可思数据 时间:2020-05-07
数据类型:文本语料 热度

文件类型:.JSON              文件大小:1.7 GB

授权方式:公共开源     发布时间:2020-05-07

数据来源:Allen Institute             数据语言:英文

数据介绍:
COVID-19开放研究数据集挑战(CORD-19)AI2,CZI,MSR,Georgetown,NIH和白宫的AI挑战
 

数据集说明

为了应对COVID-19大流行,白宫和主要研究小组的联盟已经准备好了COVID-19开放研究数据集(CORD-19)。CORD-19的资源超过59,000篇学术文章,其中包括超过47,000篇全文,涉及COVID-19,SARS-CoV-2和相关冠状病毒。该免费的数据集已提供给全球研究社区,以应用自然语言处理和其他AI技术的最新进展来产生新见解,以支持正在进行的抵抗这种传染病的斗争。由于新的冠状病毒文献的迅速发展,这些方法的紧迫性越来越高,这使得医学研究界很难跟上。

呼吁采取行动

我们正在呼吁全球的人工智能专家采取行动,以开发文本和数据挖掘工具,这些工具可以帮助医学界找到对高度优先的科学问题的答案。CORD-19数据集代表了迄今为止可用于数据挖掘的最广泛的机器可读冠状病毒文献集。这使全球的AI研究社区有机会应用文本和数据挖掘方法来查找此内容中的问题的答案,并在此内容之间建立见解,以支持全球正在进行的COVID-19响应工作。由于冠状病毒文献的迅速增加,这些方法的紧迫性越来越高,这使得医学界很难跟上。

此数据集的“ 任务”部分下,可以找到我们最初的关键问题的列表这些关键的科学问题来自NASEM的SCIED(美国国家科学院,工程学和医学会新兴传染病和21世纪健康威胁常务委员会)研究主题以及世界卫生组织针对COVID-19的研发蓝图。

其中许多问题都适合进行文本挖掘,我们鼓励研究人员开发文本挖掘工具以提供有关这些问题的见解。

我们正在维护社区贡献的摘要。有关如何使您的贡献有用的指导,我们正在维护一个论坛主题,并从医疗保健政策社区获得反馈。

访问数据集

该数据集还托管在AI2的语义学者中。然后,您可以使用AI2的新COVID-19资源管理器搜索数据集。

每个数据集的许可证都可以在全部_来源_元数据csv文件中找到。

致谢

该数据集由艾伦(Allen)人工智能研究所与Chan Zuckerberg Initiative,乔治敦大学安全与新兴技术中心,微软研究院以及美国国立卫生研究院国家医学图书馆合作,与美国白宫办公室合作创建。科技政策。

下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码:www.sykv.com
人工智能权威社区
人工智能交流群扫码邀请

相关文章:

    无相关信息

相关推荐:

网友评论:

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

数据标注服务
sem搜索推广

Copyright©2005-2020 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭