近期Mix晴子VS乔碧萝殿下,可谓是在火得很,无论是B站 还是知乎,甚至于知乎都已经达到了5亿的热度(手机狗头,不知道知乎怎么算热度的)
小编突然转念一想,分析分析B站视频的弹幕,看看网友都在说什么!
准备工作:'先进b站找到视频',喏就是他了
17万的播放量
第二步 找弹幕文件
chrome浏览器进入开发者模式(F12),
B站弹幕一般都是xlm文件(别问我怎么知道的,熟能生巧,晓得不):如下图所示
然后点击这个xml文件看看是不是弹幕文件
搞定,确认过眼神,就是你了!
下面开始码,写代码,
思路是这样的,用requests库访问,然后用Beautifulsoup4库进行解析,,用numpy,pands,jieba对数据进行分析,用wordcloud进行词云的生成!
然后竟然都是 '啊啊啊啊,'哈哈哈哈哈'...
超出了小编的意料.
都是 ''哈哈哈哈...."
核心代码展示
词云生成代码
抓取弹幕代码
这一套代码可以用于B站任何一个弹幕文件,-.-真香(源码文件在最后哦)
领取专属 10元无门槛券
私享最新 技术干货