首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >web scraper——爬取知乎|微博用户数据模板【三】

web scraper——爬取知乎|微博用户数据模板【三】

作者头像
思索
发布于 2024-08-16 04:21:31
发布于 2024-08-16 04:21:31
22100
代码可运行
举报
运行总次数:0
代码可运行

前言

在这里呢,我就只给模板,不写具体的教程啦,具体的可以参考我之前写的博文。

https://cloud.tencent.com/developer/article/2445219

模板

  1. 进入微博选择粉丝较多的博主
  1. 复制下面的模板导入站点即可
  1. 修改地址,编辑好名称,点击Import Sitemap即可

微博

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{"_id":"weibo_chenglong","startUrl":["https://weibo.com/p/1006051234552257/follow?relate=fans&page=[1-5]"],"selectors":[{"id":"userinfo","type":"SelectorElement","parentSelectors":["_root"],"selector":"li.follow_item","multiple":true,"delay":6},{"id":"username","type":"SelectorText","parentSelectors":["userinfo"],"selector":"a.S_txt1","multiple":false,"regex":"","delay":0},{"id":"avatar","type":"SelectorImage","parentSelectors":["userinfo"],"selector":"img","multiple":false,"delay":0},{"id":"city","type":"SelectorText","parentSelectors":["userinfo"],"selector":"div.info_add span","multiple":false,"regex":"","delay":0}]}

知乎

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{"_id":"zhihuranqiqigongzuoshi","startUrl":["https://www.zhihu.com/people/xie-ling-520/followers?page=[1-45]"],"selectors":[{"id":"list","type":"SelectorElement","parentSelectors":["_root"],"selector":"div.List-item","multiple":true,"delay":0},{"id":"username","type":"SelectorText","parentSelectors":["list"],"selector":"div.UserItem-title","multiple":false,"regex":"","delay":0},{"id":"avatar","type":"SelectorImage","parentSelectors":["list"],"selector":"img","multiple":false,"delay":0}]}
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-07-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 模板
    • 微博
    • 知乎
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档