原创投稿 行业报告 AI展会 数据标注
投稿发布
您的当前位置:首页 > 下载中心 > 文本语料 > 正文

Twitter-dataset数据集

发布:可思数据 时间:2019-10-19
数据类型:文本语料 热度

文件类型:.zip              文件大小:338 MB

授权方式:公共开源     发布时间:2019-10-19

数据来源:网络             数据语言:英文

数据介绍:

ICWSM 2010论文中的数据可从以下链接获得。我们的数据集已匿名化,以保护用户自己的隐私。我们只发布有关Twitter链接结构的信息。 
 

数据集

  • 链接列表:

    此文件包含我们在2009年9月根据Twitter网络快照从Twitter抓取的所有用户到用户链接的列表。该文件包含1,963,263,821个定向社交链接。

    格式:   Gzip压缩包。每行包含两个用户标识符,暗示从第一个用户到第二个用户观察到链接(第一个用户跟随第二个用户)。

    数据:Twitter关注链接(10.73GB)

 

  • 转发公约的时间序列:

    此文件包含每天7种不同转发变体(RT,via,转发,转发,HT,R / T和回收符号)的新采用者数。

    格式:   xlsx。   每行对应一个转发变体,其中第一列给出了变体的名称,后续列给出了每天新采用者的数量,从2007-03-16(使用第一次转发变体的那天)开始。

    数据:转发会议时间序列(<1MB)

 

我们还在此图中共享一组垃圾邮件发送者节点,这些节点来自Twitter中关于链接耕作的相关项目 。 


如果您想引用我们的工作,请使用以下BibTeX条目。 

对于Twitter拓扑:

@inproceedings {icwsm10cha,
  作者= {Meeyoung Cha和Hamed Haddadi和Fabricio Benevenuto和Krishna P. Gummadi},
  title = {{衡量用户对Twitter的影响:百万追随者谬误}},
  booktitle = {第四届国际AAAI网络日志和社交媒体会议论文集(ICWSM)}},
  month = {May},
  年= {2010},
  地址= {华盛顿特区,美国}
}


对于转发惯例:
@inproceedings {icwsm12kooti,
  作者= {Farshad Kooti和Haeryun Yang和Meeyoung Cha和Krishna P. Gummadi和Winter A. Mason},
  title = {{在线社交网络中的公约的出现}},
  booktitle = {第六届国际AAAI网络日志和社交媒体会议论文集(ICWSM)}},
  月= {六月},
  年= {2012},
  地址= {都柏林,爱尔兰}
}

 
下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码:www.sykv.com
人工智能权威社区
人工智能交流群扫码邀请

相关文章:

    无相关信息

相关推荐:

网友评论:

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

数据标注服务
sem搜索推广

Copyright©2005-2020 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭