英国公投选择了脱离欧洲,震惊了世界。人们究竟怎么看待这件事?机器学习分析能帮我们找到答案。
2016 年 6 月 24 日是将出现在历史课本上的一天。英国全民公投选择了退出欧盟,并在欧洲的心脏上打开了一条深深的裂缝。作为这一结果的后果,英国首相戴维·卡梅伦将在今年十月选出一个新领袖前辞职。
此时此刻,没有人了解这个结果所带来的影响。脱欧会伤害英国经济并引发另一轮衰退吗?会存在多米诺效应造成欧盟崩溃吗?这会是导致苏格兰独立以及大不列颠及北爱尔兰联合王国的终结的最后一根稻草吗?其后果目前仍不清楚的,此时此刻,一切都是猜测。
使用机器学习分析 Twitter 上的 #Brexit
作为一个历史性大事件,我们认为分析人们如何谈论英国脱欧的结果是一件有趣的事。首先,我们使用一个被称为 tweepy 的 Python库连接 Twitter 信息流,得到了 45 多万条使用 #Brexit(#英国脱欧)标签的推文。
然后,我们使用我们语言分类器根据语言对这些推文进行了筛选,仅保留使用英语的推文(大约25万条)。接下来,我们使用带有一些公共的、预先训练的和准备好的机器学习模型的 MonkeyLearn 分析了这些推文。我们对这些推文进行了情感分析(sentiment analysis ),以了解人们在谈论英国脱欧这件事上是乐观的(positive)、悲观的(negative)还是中性的(neutral)。
最后,我们希望更深入和更好地理解不同角度的观点,所以我们对我们分析过的不同情感的推文进行了关键词提取,以了解人们使用的词或短语,从而对整体状况和背景有更好的理解。
你可以查看源代码:https://github.com/monkeylearn/brexit-analysis。
分裂的王国:交错复杂的情感
我们证实了人们对于英国脱欧结果的看法存在巨大的分歧。我们发现有 63,024 条推文是乐观的,有 70,581 条是悲观的。
带有乐观情绪的人们使用以下这些关键词或短语:
许多乐观推文对该结果表示感激,宣称这是一件「好事」。一些人甚至庆祝新的「英国独立」,一些「乐观」推文其实是在讽刺,它们祝英国好运或者提到了唐纳德·特朗普。以下是一些例子:
相对地,在悲观推文中所使用的关键词:
带有悲观情绪的推文直截了当地表达了他们反对离开欧盟的情感。以下是一些例子:
有关 #Brexit 的其它有趣见解
为了更好理解人们如何谈论其它相关的话题,我们将提到 #brexit 且同时谈论了比如说苏格兰、民主、戴维·卡梅伦、Nigel Farage 和唐纳德·特朗普的推文进行分类整理,并发现了有趣的结果:
结语
英国脱欧可能是欧洲政治巨变的催化剂。社交媒体对此非常直言不讳。
当我们分析大量的带有乐观和悲观情绪的推文时,我们了解到对于该话题的两极态度。
所有的推文中提到的唐纳德·特朗普的相关性是惊人的,我们或许可以得出结论,大多数人将此事看作是一个全球现象,我们见证了整个世界上保守主义的增长。
令人惊讶的是并没有很多推文提到关于此次运动的领袖 Nigel Farage。
提到苏格兰的推文数量提出了一个重大的问题,他们会支持英格兰吗?
最后,FUTURE(未来)是出现在悲观推文中一个相关关键词,这些推文描绘了一个即将到来的黑暗未来。