下面的操作针对于 m.weibo.cn :
这里要实现的是对微博用户的影响力抓取,我本文以广电时评为例。

点击查看,里面的数据会更多一点。


这里是需要微博用户登陆之后才可以查看的, 所以为了实现我们的需求,我们开始模拟登陆。


错误的账号返回了retcode



模拟登陆:
import requests
session = requests.session()
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36',
'Accept': 'text/html;q=0.9,*/*;q=0.8',
'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.3',
'Connection': 'close',
'Referer': 'https://passport.weibo.cn/signin/login',
'Host': 'passport.weibo.cn'
}
formdata = {
'username': '你的账号',
'password': '你的密码',
'savestate': '1',
'r': r'',
'ec': '0',
'pagerefer': '',
'entry': 'mweibo',
'wentry': '',
'loginfrom': '',
'client_id': '',
'code': '',
'qq': '',
'mainpageflag': '1',
'hff': '',
'hfp': ''
}
login_url = 'https://passport.weibo.cn/sso/login'
print(session.post(url=login_url, headers=headers, data=formdata).text)输出之后,返回了 retcode,已经登陆成功

uid = '微博ID'
user_api = 'https://m.weibo.cn/api/container/getIndex?uid={}&luicode=10000011&containerid=100505{}'.format(uid, uid)yingxiangli_url = 'https://m.weibo.cn/api/container/getIndex?uid={}&luicode=10000011&lfid=100103type%3D3%26q%3D{}%26t%3D0&containerid={}'.format(item['uid'], item['userName'], yingxiang_cid)这里就不多做介绍了,没有太多难度。 结果如下:
