在2019年的澳大利亚大选期间,在推特发表的选举内容讨论。此数据进行舆情分析、观点分析论证以及情绪分析等。以便其他人可以帮助解决情绪或任何其他有趣的分析。
内容
在2019.05.10和2019.05.20之间使用Twitter API关键字搜索收集了超过180,000条推文。列如下:
- created_at:创建推文的日期和时间
- id:推文的唯一ID
- full_text:完整的推文文字
- retweet_count:转推的数量
- favorite_count:喜欢的数量
- user_id:推文创建者的用户ID
- user_name:推文创建者的用户名
- user_screen_name:推文创建者的屏幕名称
- user_description:关于推文创建者个人资料的说明
- user_location:在推文创建者的个人资料中给出的位置
- user_created_at:推文创建者加入Twitter的日期
该纬度和经度的USER_LOCATION也location_geocode.csv可用。
灵感
有很多有趣的东西可以通过这些数据进行调查。主要是有兴趣在选举结果公布之前和之后进行情绪和舆情分析。
其他调查的想法包括:
-
考虑转推和收藏,以加重整体情绪分析。
-
除澳大利亚外,世界哪些地区对澳大利亚选举感兴趣(即:推文)?
-
推文有关此类事情的用户如何描述自己?
-
用户加入Twitter的时间与他们的观点之间是否存在相关性(这假设情绪分析已经运作良好)?
-
从用户名/屏幕名称预测性别,并按性别分段推特计数和情绪