首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python分析B站'Mix晴子VS乔碧萝殿,大型翻车现场!

近期Mix晴子VS乔碧萝殿下,可谓是在火得很,无论是B站 还是知乎,甚至于知乎都已经达到了5亿的热度(手机狗头,不知道知乎怎么算热度的)

小编突然转念一想,分析分析B站视频的弹幕,看看网友都在说什么!

准备工作:'先进b站找到视频',喏就是他了

17万的播放量

第二步 找弹幕文件

chrome浏览器进入开发者模式(F12),

B站弹幕一般都是xlm文件(别问我怎么知道的,熟能生巧,晓得不):如下图所示

然后点击这个xml文件看看是不是弹幕文件

搞定,确认过眼神,就是你了!

下面开始码,写代码,

思路是这样的,用requests库访问,然后用Beautifulsoup4库进行解析,,用numpy,pands,jieba对数据进行分析,用wordcloud进行词云的生成!

然后竟然都是 '啊啊啊啊,'哈哈哈哈哈'...

超出了小编的意料.

都是 ''哈哈哈哈...."

核心代码展示

词云生成代码

抓取弹幕代码

这一套代码可以用于B站任何一个弹幕文件,-.-真香(源码文件在最后哦)

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190731A0HNUE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券