原创投稿 行业报告 AI展会 数据标注
投稿发布
您的当前位置:首页 > 下载中心 > 经济数据 > 正文

安然电子邮件数据集

发布:可思数据 时间:2020-03-22
数据类型:文本语料 热度

文件类型:.zip              文件大小:1.7G

授权方式:公共开源     发布时间:2020-03-22

数据来源:William W             数据语言:英文

数据介绍:
安然公司 150多个使用者的100万封邮件,安然电子邮件数据集,文集数据库,Public Domain Enron Email Corpus and Database

该数据集由CALO项目(一个学习和组织的认知助手)收集和准备它包含来自大约150个用户的数据,这些数据大部分都存储在文件夹中,其中大多数是Enron。语料库总共包含约50万条消息。该数据最初是由联邦能源管理委员会在调查期间公开并发布到网络上的。

将此数据集作为资源分发给有兴趣改进当前电子邮件工具或了解当前电子邮件使用方式的研究人员。电子邮件的唯一集合。

数据集的研究用途

这是部分且维护不善的列表
  • 2004年CEAS会议上发表了一篇描述Enron数据的论文。
  • 与该数据相关的一些实验在Ron Bekkerman的主页上进行了描述 
  • 可从Andres Corrada-Emmanuel获得对数据的社交网络分析,包括“电子邮件正文的MD5摘要与诸如作者,收件人等之类的有用映射”。
  • 来自的一组 SIMS,加州大学伯克利分校提供搜索,可视化以及一些带有主题和情感标签的电子邮件
  • EDRM提供了具有所有附件的数据集版本。
  • 宾夕法尼亚大学的工作包括用于电子邮件搜索的查询数据集以及用于基于Enron语料库生成拼写错误的工具。
  • Kimmie Farrington及其同事在2011年发表了一篇论文,该论文将Enron数据集用作测试语料库的一部分,用于将人与计算机生成的分类解释进行众包:参见Hutton,Amanda,Alexander Liu和Cheryl Martin。“分类器可解释性的众包评估。” 2012年AAAI人群智慧春季研讨会上的论文集
  • Parakweet发布了一套开源的Enron句子数据,标记为言语行为。
  • 查理·奥克斯伯勒(Charlie Oxborough )发布了 一组句子级别的注释(需要用户采取行动或回应的内容)。
下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码:www.sykv.com
人工智能权威社区
人工智能交流群扫码邀请

相关文章:

    无相关信息

相关推荐:

网友评论:

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

数据标注服务

Copyright©2005-2020 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭