欺诈邮件语料库
CLAIR收集“尼日利亚”欺诈邮件
欺诈性电子邮件中包含具有欺骗性的欺骗性信息,通常是为了说服收件人向发件人支付大量金钱。欺诈电子邮件中最著名的类型可能是尼日利亚字母或“ 419”欺诈。
内容:
该数据集收集了1998年至2007年之间的2500多个“尼日利亚”欺诈信。
这些电子邮件在单个文本文件中。每封电子邮件都有一个标头,其中包含以下信息:
- 返回路径:电子邮件发送地址
- X-Sieve:X-Sieve主机(始终为cmu-sieve 2.0)
- Message-Id:每个消息的唯一标识符
- 发件人:邮件发件人(有时为空白)
- 回复至:将回复发送到的电子邮件地址
- 收件人:最初设置电子邮件的电子邮件地址(由于匿名,一些电子邮件地址被截断了)
- 日期:发送电子邮件的日期
- 主题:电子邮件的主题行
- X-Mailer:电子邮件发送的平台
- MIME版本:多功能Internet邮件扩展版本
- Content-Type:内容类型和字符编码
- 内容传输编码:按位编码
- X-MIME-自动转换:完成自动转换的类型
- 状态:r(已读)和o(已打开)