首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >微博登陆爬取用户影响力

微博登陆爬取用户影响力

作者头像
李玺
发布2021-11-22 18:39:00
发布2021-11-22 18:39:00
4170
举报
文章被收录于专栏:爬虫逆向案例爬虫逆向案例

下面的操作针对于 m.weibo.cn :

这里要实现的是对微博用户的影响力抓取,我本文以广电时评为例。

点击查看,里面的数据会更多一点。

未登陆时:

这里是需要微博用户登陆之后才可以查看的, 所以为了实现我们的需求,我们开始模拟登陆。

  • 首先来到微博移动端的登陆页面
  • 然后选择使用账号密码登陆
  • 先输入一个错误的账号来查看一下登陆的接口

错误的账号返回了retcode

  • 查看下 Formdata
  • 当然请求头也不能忘记
  • 有了这些信息之后,我们就可以进行代码登陆测试了

模拟登陆:

代码语言:javascript
复制
import requests
session = requests.session()
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36',
    'Accept': 'text/html;q=0.9,*/*;q=0.8',
    'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.3',
    'Connection': 'close',
    'Referer': 'https://passport.weibo.cn/signin/login',
    'Host': 'passport.weibo.cn'
            }
formdata = {
    'username': '你的账号',
    'password': '你的密码',
    'savestate': '1',
    'r': r'',
    'ec': '0',
    'pagerefer': '',
    'entry': 'mweibo',
    'wentry': '',
    'loginfrom': '',
    'client_id': '',
    'code': '',
    'qq': '',
    'mainpageflag': '1',
    'hff': '',
    'hfp': ''
            }

login_url = 'https://passport.weibo.cn/sso/login'
print(session.post(url=login_url, headers=headers, data=formdata).text)

输出之后,返回了 retcode,已经登陆成功

如果需要获取指定的微博影响力。我们可以通过接口
  • 先访问用户api,获取用户主页的cid
代码语言:javascript
复制
uid = '微博ID'
user_api = 'https://m.weibo.cn/api/container/getIndex?uid={}&luicode=10000011&containerid=100505{}'.format(uid, uid)
  • 然后通过cid请求影响力的api
代码语言:javascript
复制
yingxiangli_url = 'https://m.weibo.cn/api/container/getIndex?uid={}&luicode=10000011&lfid=100103type%3D3%26q%3D{}%26t%3D0&containerid={}'.format(item['uid'], item['userName'], yingxiang_cid)

这里就不多做介绍了,没有太多难度。 结果如下:

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/10/24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档