温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
大家好,这是我用Python开发的采集快手评论的界面软件啊,我们首先打开这个软件看一下界面效果。那这个界面上需要填入个人cookie和爬取的目标链接啊,我们首先看一下个人cookie,打开快手的网页端,首先把账号登录上啊,这个账号必须要登录。然后打开开发者模式,我们任意打开一个视频,打开他的评论啊,往下翻这个评论的数数据,我们看到这个graph circle, 这个目标链接,我们打开标头啊,下面的请求头啊,Cookie把这一项复制粘贴到个人cookie,然后视频链接啊,爬起的目标链接啊,这里我准备了一些啊目视频链接,我们把它粘贴过来,点击开始执行,那这个时候软件就开始把取快手的啊评论数据了啊我们从这个日志刷新上可以看到爬取进度现在是1/4个视频,那评论的内容也展示在这个运行日志上了,那当这个软件运行完的时候,它会自动。
01:31
生成。呃,软件的运行过程中,它会保存。评论数据到CSV文件。那由于时间的关系,我们就不再等待了,那他现在已经爬到3/4视频的评论了,好,我们直接点退出程序,我们看最新的这个CSV文件。
02:03
我们把它打开看一下它的扒题结果啊,那目标链接啊,就是刚才啊,我们设置的爬取的4个视频啊,页码,评论者昵称啊,评论者的ID啊,根据ID可以拼接出评论者的主页链接啊,评论时间啊,这些都是标准的时间格式,那评论的点赞数啊,评论级别,那这里的级别分为一级评论,二级评论和二级展开评论,那评论的内容啊,这个就是最核心的,那我们随便打开一个啊视频看一下,他觉得是否正确呢?
03:01
我们可以对照着来看一下这个视频的评论。那第一条评论就是只爱小婷,他评论的那些内容是我也是做奶茶的,只爱小婷,我也是做奶茶的,那他下面的二级评论是不值得,累是一回事。啊,那是一回事。啊,不值得。那也就是这个二级评论和二级展开评论,紧跟着的就是这个一级评论下面的子评论啊,就是这样的一个逻辑关系。那同时呢?这个软件运行的过程中还会生成一个日志文件啊,在这个log字目录下啊,今天是3月18号,我们就打开这个文件,那这个文件里记录了刚才软件运行的整个过程。方便问题的回溯。好,这就是软件的。运行演示,我们下次见。
我来说两句