前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2020微博热点数据简析,附完整数据文件下载!

2020微博热点数据简析,附完整数据文件下载!

作者头像
周萝卜
发布2021-02-25 11:41:45
1.1K1
发布2021-02-25 11:41:45
举报
文章被收录于专栏:萝卜大杂烩

转眼之间,2021年的春节假期就要结束了,真的是太快了!

今天再分享一份超级棒的数据,就是2020年全年的微博热点数据,说实话,这里面如果认真分析的话,还是可以找到很多有意思,有价值的信息的。 但是由于我已经写过一篇2019年微博热点数据分析的文章了,这里就不再重复了,有兴趣的同学可以点击这里查看

2019微博热点分析

这里分享数据出来,希望更多的朋友可以从数据当中挖掘出更多的有价值的信息,大家一起学习进步!

下面是一些简单的数据汇总,欢迎大家一起讨论

搜索次数排行

全年微博热搜,最为直观的就是搜索次数了

可以看到小猪的分手消息还真的是高啊,毕竟是可以完美的进行时间管理的人儿啊

热搜关键词

下面来根据热搜标题,进行关键词的划分,来看看不同词汇的出现次数 这里使用著名的 jieba 来进行分词处理,然后分别提取出人名,名词已经动词

代码语言:javascript
复制
import jieba.posseg as psg
import jieba

weibo_title = df['keyword'].values.tolist()
name_list = []
noun_list = []
verb_list = []
for i in weibo_title:
    result = psg.cut(i)
    for x in result:
        if x.flag == 'nr':
            name_list.append(x.word)
        elif x.flag == 'n':
            noun_list.append(x.word)
        elif x.flag == 'v':
            verb_list.append(x.word)

分词做好之后,就可以进行词汇数量的汇总,并进行排序

代码语言:javascript
复制
name_counts = {}
stopword = ['陈', '李', '杨', '王', '郭', '吴', '周', '明星', '辟谣']
for w in name_list:
    if w not in stopword:
        name_counts[w] = name_counts.get(w, 0) + 1

sort_counts = sorted(name_counts.items(), key=lambda item: item[1], reverse=True)

最后我们来看看对应的排名靠前的词汇图片

1

人名

前美国总统竟然高居榜首,看来微博用户还都是很关注国际形势的,也包括华为、荣耀等,这都是大国之间博弈的体现!

2

名词

新冠、肺炎占据着前两位,在这个不平凡的2020年里,我们大家注定都会不平凡!

3

动词

动词就看看吧,不多说了

最后还是以动态视频来结尾,祝大家在新的一年里,工作顺心,事事如意!

喜欢就给个“在看”吧!

后台回复“2020微博”获取完整数据文件,七天有效哦!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 萝卜大杂烩 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 搜索次数排行
  • 热搜关键词
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档