腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有没有
办法
在
没有
库
的
情况下
抓取
动态
网站
?
、
、
、
、
我正在使用'axios‘从
网站
抓取
数据()重点是,我想在
没有
任何与爬行相关
的
库
的
情况下
做到这一点。找到了解决它
的
方法!
浏览 10
提问于2021-05-29
得票数 0
回答已采纳
1
回答
使用Nokogiri/Open URI获取
动态
生成
的
HTML
、
、
我试图通过
在
Chrome中查看
网站
的
HTML并使用Nokogiri
抓取
数据来
抓取
网站
。问题是有些标签是
动态
生成
的
,当使用open-uri时,它们不会与open(url)请求一起出现。
有没有
办法
“强制”一个
网站
动态
生成它
的
内容,以便像open uri这样
的
工具读取?
浏览 5
提问于2013-07-07
得票数 5
1
回答
处理javascript生成
的
动态
HTML
的
Ruby on Rails
库
的
最佳web
抓取
、
、
、
、
我正在使用Ruby on Rails和机械化
库
来
抓取
商店
网站
。问题是很多时候我不能
抓取
某些元素。然而,当我在
网站
上“查看源代码”时,我可以看到这一点。例如,沃尔玛
的
类别(在这种
情况下
是“健康”)是不可推卸
的
。我相信这是因为它是
动态
生成
的
HTML (例如,从javascript)。为了解决这个问题,我需要一个浏览器来处理web请求。我也
在
亚马逊EC2上使用linux机器。安装用于UI
抓取</e
浏览 0
提问于2011-12-13
得票数 2
回答已采纳
1
回答
如何从
网站
收集联系信息?
、
、
、
、
有没有
人知道从
网站
收集联系方式
的
网络爬虫工具?说我有一个www.web/联系人。我想拿出地址,电话号码等等。我一直
在
研究两个工具: java
的
cralwer4j开源jar和。但是我发现在我
的
场景中使用它有点困难。 任何建议都会很好。谢谢
浏览 1
提问于2015-03-19
得票数 0
回答已采纳
1
回答
如何为
动态
页面启用
抓取
功能?
、
我希望从我
的
网站
创建公共信息。我
的
网站
是安全
的
身份验证,但有关用户
的
部分信息可以共享
在
比方网址。为10k+用户生成页面并使用robot.txt听起来非常繁重。
有没有
办法
可以让
动态
内容被
抓取
?作为参考,facebook和linkedin等
网站
也在做同样
的
事情。但空间可能是这里真正
的
问题!特别是,我正在寻找
的
web服务器配置,将有助
浏览 2
提问于2016-12-11
得票数 0
2
回答
如何在python中实现
动态
网站
(不使用selenium)
、
、
、
、
Selenium
有没有
什么
库
或替代方法可以从
动态
(javascript渲染
的
)
网站
上
抓取
数据? 我遇到
的
问题是,当我
在
selenium中使用webdriver时,许多
网站
可以很容易地检测到。我已经做了一些事情,比如在我
的
webdrver中更改了我
的
cdc_变量,但我仍然被检测到了。我一直
在
研究使用硒不被检测到
的
方法,但似乎不可能做到。因此,我正在寻找一种不使用Se
浏览 2
提问于2020-05-24
得票数 0
1
回答
木偶剧演员会加载广告吗?
、
、
我目前正在为一个
网站
建立一个网络刮板。然而,我有道德上
的
顾虑:这个
网站
提供免费
的
服务,他们通过广告赚钱。因此,让
抓取
的
内容
在
没有
广告
的
情况下
可见会伤害我正在
抓取
的
网站
的
经济性。puppeteer是否会像普通浏览器一样加载广告,从而为
网站
提供商带来收入?
浏览 22
提问于2020-03-06
得票数 0
回答已采纳
3
回答
抓取
的
服务器端脚本语言
的
替代方案
、
、
、
我有一个由我
的
大学托管
的
小
网站
。策略是
没有
服务器端脚本语言(例如PHP等)启用,因此
网站
要么是静态
的
,要么可以使用客户端脚本(例如javascript等)。我也不能触摸服务器/配置它/安装东西。无论如何,我想添加一些来自其他
网站
(即谷歌学者引用)
的
数据,这些数据是我设法用Python+lxml
动态
抓取
的
。
有没有
办法
动态
查询这些
浏览 0
提问于2012-04-02
得票数 0
回答已采纳
1
回答
如何在scrapy中不同时间
抓取
多个
网站
、
、
我有多个
网站
存储在数据
库
中不同
的
抓取
时间,如每5/10分钟为每个
网站
。我已经创建了爬行和运行与cron
的
蜘蛛。它将从数据
库
中获取所有
网站
,并对所有
网站
进行并行爬行。如何实现以不同
的
时间
抓取
存储在数据
库
中
的
每个
网站
?
有没有
办法
用scrapy处理这个问题?
浏览 2
提问于2018-09-19
得票数 3
3
回答
如何
抓取
一个_private_ google群?
、
、
、
、
我想浏览一下谷歌一个私人小组
的
讨论列表。这是一个多页列表,我可能会在以后再看一遍,所以脚本听起来像是可行
的
方法。我
的
ruby脚本嵌入
在
帖子
的
末尾。对身份验证查询
的
响应是200-OK,但响应头中
没有
cookie
浏览 2
提问于2010-04-02
得票数 10
回答已采纳
5
回答
整数序列在线百科全书
的
程序化访问
、
、
有没有
办法
以编程方式从在线整数序列百科全书()中搜索和检索结果?非常感谢你
的
帮助。
浏览 0
提问于2011-05-13
得票数 32
回答已采纳
2
回答
在
没有
ajax
的
情况下
刷新div
的
内容
、
、
我有一个带有id=mydiv
的
div,在这个div中,我有一些内容,我正在
动态
地从数据
库
中
抓取
它。
有没有
办法
在
不使用.load() ajax方法
的
情况下
使用按钮来刷新或重新加载我
的
div
的
内容?
浏览 0
提问于2012-11-09
得票数 0
回答已采纳
3
回答
无法使用HTML
抓取
导入数据
、
、
、
、
所以我正在做一个python项目,我决定做一个超市比较
的
东西。我已经决定从现有的超市比较
网站
上提取价格。我使用这个
网站
学习:import requestspage =注意--我是HTML
抓取
的
新手,对python有基本
的
了解,但我决定有一点挑战。 提前谢谢。
浏览 3
提问于2018-10-12
得票数 0
1
回答
如何使用不同
的
URL重试失败
的
抓取
?
、
我有一个功能刮刀,从数据
库
中
抓取
大量
网站
,并将结果读取到相同
的
数据
库
中。我从数据
库
中获取域,并手动附加。在网址上。即使这个url不正确,绝大多数站点都可以正确地重定向爬行器,但是对于一些站点,我得到了一个DNSLookup错误,因为
没有
重定向,即使该站点明显存在并且可以通过浏览器访问。我
的
问题是,
有没有
办法
重试获得DNSLookup错误
的
抓取
,但使用不同
的
URL?
浏览 0
提问于2019-04-08
得票数 1
2
回答
做一个好公民,
抓取
网络
、
、
我有一个两部分
的
问题。 首先,我正在使用Scrapy编写一个基于爬行器
的
网络爬行器。我
的
目标是
抓取
一个有数千条(可能是数十万条)记录
的
网站
。这些记录从起始页往下埋了2-3层。所以基本上我让爬虫从某个页面开始,爬行直到它找到特定类型
的
记录,然后解析html。我想知道
的
是,有什么方法可以防止我
的
爬行器使站点过载?
有没有
可能在不同
的
请求之间增加或暂停?其次,与之相关
的
是,
有没有<
浏览 0
提问于2011-12-17
得票数 6
回答已采纳
1
回答
为iOS安排后台任务
的
最佳方式是什么?
我现在有一个应用程序,允许用户从
网站
拉取信息。不幸
的
是,我
没有
任何访问该
网站
的
API,它只是我屏幕
抓取
的
东西。理想
情况下
,用户每天会从
网站
上
抓取
一次信息。当performFetchWithCompletionHandler被调用时,它检查设置
的
时间,如果该时间是当前时间,它将执行
抓取
。不幸
的
是,performFetchWithCompletionHandler不是
浏览 2
提问于2013-11-21
得票数 1
1
回答
Linq To Sql:检索
没有
附加子实体
的
父实体
、
、
我有一个父实体,它绑定了大量
的
子实体。
在
linq to sql中,
有没有
一种方法可以只获取父实体,而不附加其他子实体?
浏览 0
提问于2012-05-31
得票数 1
回答已采纳
1
回答
如何使用python selenium访问网页检查元素内容?
、
、
、
我要做
的
就是
抓取
网页'‘。在这种
情况下
,当标签估计(在下面的可比较和估计部分)被选中时,google地图下面的数据被
动态
加载。此数据
在
页面源代码中不可见,但同时
在
开发人员工具窗口(上下文菜单,检查元素)中可见。 我使用
的
是Selenium和Python 2.7。
有没有
办法
访问这些数据?或者
有没有
办法
访问所有的元素?
浏览 0
提问于2014-05-09
得票数 0
2
回答
cakephp回键问题
我是
在
社交网络
网站
上,用户可以导航到相册查看页面的许多方式。例如。
有没有
办法
在
cakephp中
动态
添加链接到后退按钮
浏览 4
提问于2011-06-17
得票数 2
1
回答
克隆meteor应用程序
复制一个静态
网站
,即HTML、CSS、JS非常简单。
有没有
办法</
浏览 2
提问于2013-03-14
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
尽量减少网站域名在没有启用 CDN 情况下的各种检测、扫描、测速等操作
python爬取淘女郎时尚秀,屌丝变型男
太多了,看不过来了,我一个G的硬盘要满了
网站爬虫抓取规则是什么?如何提升相关技巧?
搜索引擎推广动态页面的方法你知道吗?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券