首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

可转债代码交流第三期:利用Python获取集思录可转债单独页面数据

上期内容讲解了集思录基础页面的数据获取方法(包含了三类可转债的筛选标记),本期内容分享集思录可转债单独详细页面的数据获取方法,获取页面如下:

图一

本期内容我们需要获取上图中用红框圈起来的信息。其它信息大家可根据自己需要添加。该文章的内容只是抛砖引玉,大家有好的想法也可以互相交流。

(包含基本的环境搭建与Python编辑器安装方法)

(包含基本的模拟登录方法)

本人并非计算机专业出身,所有python知识均为自学,所写代码如有不规范的地方,还望指正。

废话不多说,直接上代码!

第一步:导入库(导入各个模块,为了让代码成功运行)

ps:所有的库安装好之后先导入下试试,测试下是否安装成功(导入模块跟上期内容一样)

第二步:编写数据获取函数Thelogin4()

1.准备工作,配置运行环境(集思录需要登录(非会员版)才能获取完整的数据)

ps:集思录网站第一次登录不需要进行图片验证(省了很多事情),输入账号密码即可

2.模拟登录,利用selenium自动输入账号密码,勾选同意选项并点击登录按钮

3.获取页面下每一个可转债单独页面的链接

每一个可转债单独页面中链接都存储在代码数据这一栏中,所以我们只需要将这里的信息获取并保存下来即可。

4.单独打开每一个可转债的链接,获取其中需要的信息(数据较多,整体获取的时间较长,后续可以考虑加入多线程,节约等待时间)

5.将获取到的数据转换成DataFrame格式并进行整理

6.退出设置

第三步:调用数据获取函数

完整代码如下:整体数据较多,获取信息的时间大概在40分钟左右

显示结果例图:

下期内容投票:

本期内容和上期内容如有侵权行为,请及时联系本人,第一时间删除各平台文章。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230117A02YXZ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券