想用nodejs写个微博客户端发微博,无奈新浪微博的nodejs sdk是OAuth1.0的。 只能自己根据OAuth1.0 改了改。...", passwd = "微博密码"; var baseurl = "https://api.weibo.com/2/"; var weibo = module.exports = function...response_type'] = "code"; params['action'] = "submit"; params['userId'] = userId; // 微博帐号...//statuses/destroy 删除微博信息 //statuses/update 发布一条微博信息 //statuses/upload 上传图片并发布一条微博 //statuses.../* args参数: * id : 微博id * status : 转发文本 * is_comment 0-不发评论 1-发评论给当前微博 2-发评论给原微博
最近在研究用 Python 来制作各个类别的机器人,今天先来分享一个自动发布新浪微博的机器人。...基本思路 其实要实现一个简单的自动发布微博机器人还是不难的,只需要每天按时找好要发布的素材(一般就是爬虫了),然后再通过微博开放出来的 API 接口,自动发布即可。...分别执行如下命令安装 python setup.py build python setup.py install 至此可以安装 weibo 库成功 准备工作与编写思路就是这些,下面我们来看看具体的过程与代码...自动发布微博 根据 weibo 库的说明文档,使用其操作微博还是相关容易的,只需要提供我们创建微博应用时的 App Key 与 App Secret 和应用回调地址信息即可。...那么现在自动发布微博搞定了,我们再来看看如何自动获取微博素材 微博素材 对于金山词霸的每日一句,我们可以使用如下的一个 API 来获得每天的信息 http://open.iciba.com/dsapi
一:获取app-key 和 app-secret 使用自己的微博账号登录微博开放平台,在微博开放中心下“创建应用”创建一个应用,应用信息那些随便填,填写完毕后,不需要提交审核,需要的只是那个app-key...在“微博开放平台”的“管理中心”找到刚才创建的应用,点开这个应用,点开左边“应用信息”栏,会看见“App key”和“App Secret”的字样,这两个东西是要在后面程序中使用的。...三:安装微博 python SDK 有两种安装方式: 1:http://github.liaoxuefeng.com/sinaweibopy/下载新浪微博SDK 2:python有个简单的安装方式:直接在命令行下键入...: sudo pip install sinaweibopy 四:实例验证,获取当前登录用户及其所关注(授权)用户的最新微博 这里需要注意的是在浏览器弹出一个页面,要先点击“授权”(这里进行的OAuth...以下为我的关注用户的微博: ? ? ? ? 拿上边代码为例,这里我们获取的信息有: ?
/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/7/1 上午3:29 # @Author : BrownWang # @Email.../0070m4EAly8fpp1pwqq26j3050050jrb.jpg 是否认证:False 微博说明:知名财经博主 头条文章作者 微博签约自媒体 关注人数:3301 粉丝数:111 性别:m 微博等级...:11 -----正在爬取第1页,第0条微博------ -----正在爬取第1页,第1条微博------ -----正在爬取第1页,第2条微博------ -----正在爬取第1页,第3条微博---...--- -----正在爬取第1页,第4条微博------ -----正在爬取第1页,第5条微博------ -----正在爬取第1页,第6条微博------ -----正在爬取第1页,第7条微博----...-- -----正在爬取第1页,第8条微博------ -----正在爬取第2页,第0条微博------ -----正在爬取第2页,第1条微博------ -----正在爬取第2页,第2条微博-----
(Python) PC 登录新浪微博时, 在客户端用js预先对用户名、密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分。...由于要用的一部分微博数据用API获取不方便, 所以还是要自己写个小爬虫, 模拟登录是必不可少的。琢磨了一下这个东西,最终登录成功。...接下来再请求这个URL,这样就成功登录到微博了。 记得要提前build 缓存。 下面是完整代码(没加注释,凑合看吧): #!...很多豆友反馈有模拟登录新浪微博抓取数据的需求,其实对于一般的微博数据获取,如用户信息、微博内容等,使用微博开放平台API是更明智的选择:速度更快,而且节省许多网页处理的功夫。...熟悉Web的朋友只要定期维护模拟登录的代码就可以一直成功登录微博。如果不那么熟悉的话,其实可以采用更naive的思路来解决:直接将Cookie发送给新浪微博以实现模拟登录。
.decode("utf-8") # 预登陆获得 servertime, nonce, pubkey, rsakv def get_server_data(self, su): """与原来的相比,微博的登录从...注册的手机号) password = "123456" # 密码 cookie_path = "Cookie.txt" # 保存cookie 的文件名称 id = '4477416430959369' # 爬取微博的...', 'username', 'following', 'followed', 'gender']) start_crawl(get_cookies(), id) 第八步:获取id 你需要获得想要找的微博...首先找到你想爬的微博,这里以微博故事为例,在浏览器内按下F12,并且点击评论按钮 点击‘网络’,找到一条像图中的get请求。....decode("utf-8") # 预登陆获得 servertime, nonce, pubkey, rsakv def get_server_data(self, su): """与原来的相比,微博的登录从
Python抓取微博有两种方式,一是通过selenium自动登录后从页面直接爬取,二是通过api。 这里采用selenium的方式。...strlist = strName.text.split(' ') nickname = strlist[0] print('昵称:' + nickname) # 3.微博数...d*" # 匹配数字,包含整数和小数 cntArr = re.findall(pattern, strCnt.text) print(strCnt.text) print("微博数...filter=0&page=1 # filter为0表示全部,为1表示原创 print("微博内容") pageList = driver.find_element_by_xpath...匹配数字,只包含整数 pageArr = re.findall(pattern, pageList.text) totalPages = pageArr[1] # 总共有多少页微博
在平时的开发中,我们会看到不管是微信发朋友圈照片还是微博发布新鲜事,添加图片的时候都是选完后面还有个+号再去选择图片,这样的话比较方便用户去添加图片,有的右上角还有个-号方便用户去删除图片,而一般用户选择的图片多少都是不定的
如何通过一个微博图片链接,找到这张图片的发布者?...比如下面这个微博图片链接: https://wx4.sinaimg.cn/orj360/4242e8adgy1hlugictxquj235s2pknpe.jpg 怎么找到这个图片对应的微博用户?...微博实际上将用户的元数据保存在了对应用户所发布的图片中,而URL就是其中的方式之一。我们以知名微博用户“来去之间”为例,通过访问其用户主页,查看URL可知其用户UID为1111681197。...当然有些用户设置了个性域名,不能直观地看到用户UID,我们则可以把鼠标移动到微博人物头像下方的“关注”和“粉丝”处,这时候在浏览器的左下角就会看到带数字串的URL,而数字串就是用户UID。...://wx4.sinaimg.cn/orj360/4242e8adgy1hlugictxquj235s2pknpe.jpg” 下面我们来拆分一下该URL: 第一部分:“wx4.sinaimg.cn”为微博的图片存储服务器域名
❈ 本文简要讲述用Python爬取微博移动端数据的方法。可以看一下Robots协议。另外尽量不要爬取太快。如果你毫无节制的去爬取别人数据,别人网站当然会反爬越来越严厉。...环境介绍 Python3/Windows-10-64位/微博移动端 网页分析 以获取评论信息为例(你可以以自己的喜好获得其他数据)。如下图: ?
❈ 本文简要讲述用Python爬取微博移动端数据的方法。可以看一下Robots协议。另外尽量不要爬取太快。如果你毫无节制的去爬取别人数据,别人网站当然会反爬越来越严厉。...环境介绍 Python3/Windows-10-64位/微博移动端 网页分析 以获取评论信息为例(你可以以自己的喜好获得其他数据)。
经过的一天的研究,把微博模拟登陆基本上弄清楚了,下面就把过程详细说明。...---- 工具和环境 1.语言:Python3 2.IDE: Pycharm 3.浏览器:Chrome 4.使用的库:re, rsa, base64, requests, PIL, urllib ---...- 模拟登陆过程 弄清楚所需的数据 首先我们在Chrome浏览器中打开微博登陆界面,然后Ctrl+shift+i开启开发者工具,在开发者工具的Network选项里找到Preserve log并勾选,然后登录你的微博...我们只需要找到这几个数据就可以模拟登录到微博,那么怎么找到这些数据呢?接着往下看… 获取servertime,nonce等数据 在登录页面里打开开发者工具,清除Network里的数据。...wvr=5&lf=reg"}}); 提取你自己的uniqueid值放入下列网址中get得到你的微博主页信息。
---恢复内容开始--- 需要用到的工具:python(pymouse、selenium)、chrome、webdriver 使用的webdriver一定要和chrome的版本相匹配,具体的对应关系可以参考以下博客...请务必选择正确的版本,我的这部分代码使用的是python2.7+64位系统,所以选择的是pywin32-221.win-amd64-py2.7.exe。 ? ...完成以上部分的内容之后正式进入到selenium+chrome+python+chrome的爬虫。
需求分析 抓取 琢磨先生的新浪微博 ? 微博主页 抓取的内容包括:微博发布的时间,正文(仅提取文字),转发数,评论数,点赞数 ?...抓取的内容 数据是怎么加载的 新浪微博的数据是用ajax异步下拉加载的,在chrome的调试模式下可捕捉到相应的请求: ?...格陵兰', 'attitudes': 35, 'comments': 18, 'reposts': 1} {'id': '4276459473976711', 'text': '北极 微博视频', 'attitudes
(一)编程环境 操作系统:Win 10 编程语言:Python 3.6 (二)安装selenium 这里使用selenium实现。...如果没有安装过python的selenium库,则安装命令如下 pip install selenium (三)下载ChromeDriver 因为selenium要用到浏览器的驱动,这里我用的是Google...(四)分析微博登录界面 通常而言,m站的网页结构比pc站要简单的多,咱们可以从m站入手。...微博m站登录界面的网址是 https://passport.weibo.cn/signin/login 在Chrome浏览器中打开此地址,并右键点击界面的任何位置-->查看网页源代码,发现邮箱/手机号框的...(五)编写python程序 from selenium import webdriver import time browser = webdriver.Chrome("C:\Program Files
在前面的分享中,我们制作了一个天眼查 GUI 程序,今天我们在这个的基础上,继续开发新的功能,微博抓取工具,先来看下最终的效果 整体的界面还是继承自上次的天眼查界面,我们直接来看相关功能 微博功能布局...我们整体的界面布局就是左侧可以选择不同功能,然后右侧的界面会对应改变 创建微博 Widget 对于右侧界面的切换,我们可以为不同的功能创建不同的 Widget,当点击左侧不同功能按钮后,对应切换 Widget..."""子进程微博查询""" class WeiBoQueryThread(QThread): # 创建一个信号,触发时传递当前时间给槽函数 update_data = pyqtSignal...weibo_page = None total_pv = 0 timestamp = str(int(time.time())) def run(self): # 微博爬虫...,这里就不再展开说明了,我是把所有微博爬虫的代码都封装好了,这里直接调用暴露的接口即可 ❝对微博爬虫感兴趣的同学可以点点赞和在看,如果数量可观就专门写一篇文章,谢谢大家 词云制作 对于词云的制作,我们还是先通过
python爬虫,微博爬虫,需要知晓微博用户id号,能够通过抓取微博用户主页内容来获取用户发表的内容,时间,点赞数,转发数等数据,当然以上都是本渣渣结合网上代码抄抄改改获取的! ?...要抓取的微博地址:https://weibo.com/u/5118612601 BUT,我们实际应用的抓取地址:https://m.weibo.cn/u/5118612601(移动端的微博地址) ?...----" + "\n") fh.write(f"微博地址: {str(scheme)}\n微博内容:{raw_text}\n"...手里头有二份微博爬虫的源码,不同的爬取地址和思路,一起分享给大家,仅供参考学习! 一份还包含GUI界面,当然这是本渣渣参考的主要来源代码! ? 亲测可运行哈!! 关注本渣渣微信公众号:二爷记 ?...后台回复关键字:“微博爬虫” 获取所有源码
1:首先去微信企业号官网去申请一个帐号 2:在‘企业应用’里创建自建应用,并记住agentid。下面会用到 3:corpid,corpsecret在哪里,你自己百度找吧。多的是答案。 #!.../usr/bin/env python # -*- coding: utf-8 -*- #GuoYabin import requests,json,sys,imp imp.reload(sys)...def __init__(self): self.url='https://qyapi.weixin.qq.com/cgi-bin/gettoken' self.corpid = '你申请的微信企业号...corpid' self.corpsecret = '你申请的微信企业号corpsecret' def auth(self): params={'corpid':self.corpid,
全文简介 本文是用Python爬取微博移动端的数据。可以看一下Robots协议。另外尽量不要爬取太快。如果你毫无节制的去爬取别人数据,别人网站当然会反爬越来越严厉。...环境介绍 Python3 Windows-10-64位 微博移动端 网页分析 以获取评论信息为例(你可以以自己的喜好获得其他数据)。...Python代码 代码写的丑,凑合着看吧。
表情包是大家聊天的时候的必备,之前在知乎上爬取了一些表情包,但是已经用的久了该换新的了,所以我们再通过爬虫技术去微博爬一波表情包吧。...本来这个爬虫是想作为讲python异步爬虫的一个例子的,昨天代码写完测试了一下,结果是我微博账号和ip都直接被封了,然后我去搜了一下别人写的异步爬虫教程,测试用的都是些没啥反爬措施的小网站。...于是今天改了下代码,就先整个普普通通的微博小爬虫算了。鉴于之前IP被封,所以这次在在访问微博的时候我加上了代理。关于选择代理也是让人很烦恼的事,网上的代理太多了,靠谱的太少。...StreamReader(response.GetResponseStream(), Encoding.UTF8)) { string htmlStr = sr.ReadToEnd(); 访问微博除了像代理和一些反爬机制需要我们做好以外并没有什么难度...,到此这篇关于Python模拟登录微博并爬取表情包的文章就介绍到这了,大家有哪些意见可以发出来一起交流交流。
领取专属 10元无门槛券
手把手带您无忧上云