上期内容讲解了集思录基础页面的数据获取方法(包含了三类可转债的筛选标记),本期内容分享集思录可转债单独详细页面的数据获取方法,获取页面如下:
图一
本期内容我们需要获取上图中用红框圈起来的信息。其它信息大家可根据自己需要添加。该文章的内容只是抛砖引玉,大家有好的想法也可以互相交流。
(包含基本的环境搭建与Python编辑器安装方法)
(包含基本的模拟登录方法)
本人并非计算机专业出身,所有python知识均为自学,所写代码如有不规范的地方,还望指正。
废话不多说,直接上代码!
第一步:导入库(导入各个模块,为了让代码成功运行)
ps:所有的库安装好之后先导入下试试,测试下是否安装成功(导入模块跟上期内容一样)
第二步:编写数据获取函数Thelogin4()
1.准备工作,配置运行环境(集思录需要登录(非会员版)才能获取完整的数据)
ps:集思录网站第一次登录不需要进行图片验证(省了很多事情),输入账号密码即可
2.模拟登录,利用selenium自动输入账号密码,勾选同意选项并点击登录按钮
3.获取页面下每一个可转债单独页面的链接
每一个可转债单独页面中链接都存储在代码数据这一栏中,所以我们只需要将这里的信息获取并保存下来即可。
4.单独打开每一个可转债的链接,获取其中需要的信息(数据较多,整体获取的时间较长,后续可以考虑加入多线程,节约等待时间)
5.将获取到的数据转换成DataFrame格式并进行整理
6.退出设置
第三步:调用数据获取函数
完整代码如下:整体数据较多,获取信息的时间大概在40分钟左右
显示结果例图:
下期内容投票:
本期内容和上期内容如有侵权行为,请及时联系本人,第一时间删除各平台文章。
领取专属 10元无门槛券
私享最新 技术干货