爬虫 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签爬虫

#爬虫

网络爬虫，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。

快手数据难采集？我用python开发了个GUI爬虫工具，一键爬取评论、主页视频等

马哥天才3218 1天前2026-07-10 06:50:54

想看看某个爆款视频底下的评论有没有潜在客户吧——好家伙，手动翻页翻到手抽筋。想分析某个大V的主页作品吧——一条一条复制粘贴，眼睛都快瞎了。app端分享过来的链接...

3200

我做了一个 BOSS直聘抓取工具，开源了

用户10158165 7天前2026-07-04 22:54:37

最近在看机会，天天刷 BOSS直聘。刷多了就想：这些职位数据能不能批量拉下来分析一下？比如哪些技能出现频率最高、不同城市的薪资分布、哪些公司在招 AI Agen...

13800

PHP 最全标准爬虫检测库 Crawler-Detect

Tinywan 10天前2026-07-01 12:17:35

Crawler-Detect 是一个专注于识别网络爬虫（Bot/Crawler/Spider）的 PHP 类库，通过分析User-Agent字符串和HTTP头信...

12410

突发技术信号：AI 新闻监控系统加速落地，自动爬虫与智能摘要成为高新科技新入口

用户12583401 12天前2026-06-29 22:03:01

2026 年，技术资讯正在从“人工浏览”走向“自动监控”。过去，开发者获取行业动态，主要依赖技术社区、云厂商博客、开源项目主页和行业媒体。现在，随着大模型、AI...

11100

GitHub推荐：MediaCrawler中文媒体爬虫把签名做成了订阅生意

智能时代蛮子 12天前2026-06-29 15:48:52

中文社媒爬虫的「教学型 reference implementation」——新爬虫工程师从这里入门，进阶后转向 TikHub/SaaS 或 fork 出自己的...

18010

这个 Claude Code Skill，专门帮你给网站做 GEO

Immerse 12天前2026-06-29 14:54:28

AI 爬虫检查。它会读你的 robots.txt，对照 14 个以上的 AI 爬虫（GPTBot、ClaudeBot、PerplexityBot 这些）看有没有...

18210

WorkBuddy保姆级教程（十八）｜网页数据采集——自动抓取全网信息

用户12566316 12天前2026-06-29 12:13:30

打开浏览器 → 搜索 → 点开第一个链接 → 找到价格 → 复制 → 粘贴到Excel → 点开第二个链接 → 又找价格 → 又复制 → 又粘贴……重复20遍。

65110

为什么不同人做出的 Skill 差别那么大？

PikeTalk 15天前2026-06-26 13:45:02

Python 在爬虫领域本身就是使用最广泛的语言，所以在它的生态中积累了非常多的优秀的爬虫库。

10400

自己写爬虫三年,不如这个神器一行调用

用户11563501 16天前2026-06-25 16:09:07

这两年做 AI 应用和自媒体的人多了，工具也好用了。但真动手做一阵子就会发现，决定一个资讯类应用能不能跑起来的，常常是数据，模型反而排在后面。

15210

让Claude Code为你打工的七个方法#跨学科视角 · 实践出真知#Agentic Coding&Working指南发布

mixlab 17天前2026-06-24 09:43:24

一个提醒：爬虫只能爬“你在浏览器中能看到的信息”。破解付费墙或越权获取数据，那不是爬虫范畴。

11810

收藏 200 篇文章后，我用Hermes+Obsidian搭了一套自动化个人知识库

专业造轮子 18天前2026-06-23 20:53:38

简单的爬虫能抓静态页面，但很多资讯站不是静态页面——Hacker News 的评论要点击展开，GitHub Trending 要登录才能看个性化推荐，有些技术博...

38100

爬网页要收费了！AI应用成本再度增高！Cloudflare宣布新实验

用户11563501 18天前2026-06-23 08:49:13

Cloudflare刚刚宣布了一个震撼性的实验：AI爬虫想要抓取网站内容？先交钱！这个被称为"按爬取付费"（pay per crawl）的机制，正在悄然改变A...

19410

#爬虫

快手数据难采集？我用python开发了个GUI爬虫工具，一键爬取评论、主页视频等

我做了一个 BOSS直聘抓取工具，开源了

PHP 最全标准爬虫检测库 Crawler-Detect

突发技术信号：AI 新闻监控系统加速落地，自动爬虫与智能摘要成为高新科技新入口

GitHub推荐：MediaCrawler中文媒体爬虫把签名做成了订阅生意

这个 Claude Code Skill，专门帮你给网站做 GEO

WorkBuddy保姆级教程（十八）｜网页数据采集——自动抓取全网信息

为什么不同人做出的 Skill 差别那么大？

自己写爬虫三年,不如这个神器一行调用

让Claude Code为你打工的七个方法#跨学科视角 · 实践出真知#Agentic Coding&Working指南发布

收藏 200 篇文章后，我用Hermes+Obsidian搭了一套自动化个人知识库

爬网页要收费了！AI应用成本再度增高！Cloudflare宣布新实验

热门专栏

张戈的专栏

贺嘉的专栏

腾讯IVWEB团队的专栏

社区的朋友们

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐