腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
如何通过哈希获取URL
的
内容?
、
、
我正在尝试使用file_get_contents()获取url
的
内容,如下所示:这很好用,但我还必须获得如下所示
的
页面内容:http://www.website.com#somevalue,但是,如果我使用与上面相同
的
方法,它只返回与没有散列相同
的
内容。可以获取更新
的
内容吗?我假设他们正在使用主干或其他类型
的
路由来处理此问题。
浏览 2
提问于2012-11-11
得票数 1
回答已采纳
2
回答
用python
抓取
动态
加载
的
网站
、
、
、
、
我刚开始
抓取
动态
加载
的
网站,我被困在试图
抓取
这个网站
的
团队名称和赔率。www.cashpoint.com/de/fussball/deutschland/bundesliga')
js
_test= soup.find('div', class_='game__team gam
浏览 0
提问于2019-12-13
得票数 0
1
回答
使用Xpath提取值时来自Scrapy
的
空列表
、
、
、
真的需要这个社区
的
帮助。我
的
问题是,当我使用python中
的
代码时要提取scrapy shell中
的
供应商名称,输出为空
浏览 2
提问于2018-02-12
得票数 2
2
回答
在javascript加载了值之后,Nodejs
抓取
网站
、
、
、
可能是关于nodejs/jsdom
的
一个新手问题有没有办
浏览 4
提问于2012-02-21
得票数 9
回答已采纳
2
回答
故事板上两个长距离场景之间
的
巧妙制作方法
、
、
、
、
如果我
的
问题看起来很蠢,我很抱歉。因为在我
的
故事板上有很多场景。例如,在sceneA中,我有一个buttonA。当用户单击sceneB时,我想连接到buttonA。问题是:因为我
的
故事板很大,所以两个场景A和B之间
的
距离是我
的
macbook屏幕上
的
溢出,所以我无法控制拖放来进行搜索。我目前唯一
的
解决方案是:将sceneB拖到更近
的
sceneA (当然,可以溢出其他一些场景),并将其转换为segue。在此之后,再次将sceneB拖到原始位置。 我认为这个
浏览 3
提问于2014-08-02
得票数 0
回答已采纳
2
回答
搜索引擎能
抓取
纯javascript应用吗?
、
、
、
UI中有很多向纯javascript前端发展
的
趋势,比如backbone.
js
或javascript mvc。我知道谷歌有一些指导原则来给你
的
urls添加#hash标签,使它们成为crawlable...but。我很好奇他们是否仍然可以
抓取
不遵循这个指导原则
的
应用程序。我正在讨论是在服务器端使用模板引擎,还是只使用纯javascript解决方案,以及对api
的
json请求。我希望人们在搜索时能在我
的
网站上找到页面。
浏览 0
提问于2012-09-21
得票数 2
1
回答
如何更改每个Heroku请求
的
IP地址?
、
、
、
、
所以我在网上
抓取
谷歌,我很确定它会根据IP地址阻止我
的
请求。我已经将我
的
应用程序部署到Heroku上(当dynos重启时,Heroku有
动态
IP地址),我注意到如果应用程序启动,在5个请求之后,它们就不能正常
抓取
了。如果我重新启动dyne,那么在它停止
抓取
之前,我会收到另外5个请求。这使我相信当dyno启动时静态IP地址是问题所在。我研究了QuotaGuard
的
动态
IP (),但我认为这不会起作用,因为谷歌似乎是https。以前有没有人在Heroku上
浏览 24
提问于2021-05-17
得票数 1
1
回答
鼠标悬停
抓取
java网页。
抓取
后不显示
动态
数据
、
我想从一个特定网站
的
图表中
抓取
数据。图形中
的
此信息只有在我刮擦后将鼠标悬停在graph.But上时才可用,我无法看到输出中
的
数据,即使它在'Inspect Element‘下可见。我曾尝试使用JSoup
抓取
数据,但当我
抓取
数据时,不会显示通过鼠标悬停更改
的
数据。我该
怎么
做呢? 当您将鼠标悬停在上面
浏览 1
提问于2018-09-21
得票数 0
1
回答
爬行url \如何在node.
js
中获取
动态
链接
、
我正在使用
js
爬虫来
抓取
网站,现在我遇到了CNN,
的
那一部分(基于某种原因
动态
生成
的
urls)。事情是爬虫,不要真正接触脚本-我应该如何解决它?除了我
的
node.
js
爬虫之外,我还应该编写自己
的
代码吗?是否有先进
的
爬虫知道如何处理这种
动态
行为?
浏览 1
提问于2016-07-23
得票数 2
回答已采纳
1
回答
无法使用Goutte Laravel包
抓取
此站点。视图源中存在元素
、
、
、
我正在用Laravel Goutte包https://github.com/FriendsOfPHP/Goutte构建一个
抓取
工具,我已经能够
抓取
大多数网站,直到我遇到这个网站
的
http://www.bhutanpost.bt/,我需要
抓取
。我怀疑
的
问题是该站点
的
字符集为UTF-7,并且返回
的
xml与"view source“中显示
的
不同。我试图
抓取
<em
浏览 21
提问于2021-02-09
得票数 0
2
回答
html - div标记中隐藏
的
内容
、
我打开了页面,开始了Firefox
的
调试,选择了带有数字
的
元素,并发现它在<div id="lblOptimizePercent" class="wod-dpsval">98.4%</div>中(98.4%是我想要
的
)。所以我打开了它
的
源代码,用于lblOptimizePercent
的
Ctrl,我发现
的
只有这个没有任何内容
的
<div id="lblOptimizePercent&q
浏览 3
提问于2014-10-18
得票数 0
回答已采纳
1
回答
如何使用web
抓取
中
的
变量?
、
、
、
我使用以下代码
抓取
了一个作业门户: ;(asyncconsole.log(JSON.stringify(position)) })()我在这里粘贴了一个示例URL,当然我在示例中使用了一个真正
的
URL我
的
问题是: 我可以在const位置下控制台记录我提取
的
数据。这是可行
的
浏览 3
提问于2018-11-22
得票数 0
1
回答
Html中有java脚本。如何从中提取HTML标签
、
、
、
、
我必须下载URL链接
的
所有html。但是我没有得到任何HTML标签。取而代之
的
是,我只得到了这些行。 <script type="text/javascript" src="/github-user-search/app.bundle.562f293b75a96de878ab.
js
浏览 3
提问于2019-07-07
得票数 0
1
回答
如何使用BS4或Selenium (Python)
抓取
动态
内容?
、
、
、
我正在尝试从文件查找页面()中
抓取
Github中
的
所有文件路径。漂亮
的
Soup 4无法
抓取
包装文件路径列表
的
<tbody class="
js
-tree-finder-results
js
-navigation-container
js
-active-navigation-container我想这是b/c bs4无法
抓取
动态
内容,所以我试着等待所有元素装载Selenium: driver =
浏览 4
提问于2017-10-04
得票数 0
1
回答
从html页面不显示数据
的
url读取数据
、
r = s.get(link) print(soup.prettify()) 但是我看不到网页
的
内容
浏览 1
提问于2020-02-05
得票数 0
1
回答
如何使用返回null
的
api url爬行
动态
web?
、
、
、
我有一个任务要
抓取
所有的普利策获奖者,我发现这个网页有我想要
的
:。问题1:如何
抓取
动态
页面?我使用python/urllib2.urlopen来获取页面的内容,但是这个
动态
页面并不返回真实
的
内容。如果这对你来说太天真了,请说出一些单词,这样我就可以从谷歌学到它了。 提前感谢!
浏览 3
提问于2019-03-19
得票数 1
回答已采纳
1
回答
在Python中爬行网页并调用javascript函数
、
、
、
、
我需要
抓取
一个网站,然而,它
的
内容是
动态
的
。Python中有没有可以调用
js
函数
的
包?例如,假设我在
JS
中有一个链接和
JS
函数1、2和3,我应该在该网页上调用,并且在所有
JS
函数调用之后我需要最终
的
网页。
浏览 16
提问于2019-02-12
得票数 0
1
回答
如何在旋转代理中使用scrapy splash?
、
、
、
、
我仅通过使用以下内容作为请求才能成功
抓取
js
内容。, ) 如何在
抓取
动态
内容
的
同时同时应用
浏览 10
提问于2017-08-14
得票数 1
1
回答
抓取
oddsportal信息
、
、
、
、
我使用
的
是Python3.5,实际上我关注
的
是使用BeautifulSoup/lxml/Selenium/PhantomJS进行3.5
抓取
我只是想用Python代码
抓取
我需要
的
所有数据。我可以很容易地用BeautifulSoup从静态HTML中
抓取
信息。我最近也发现了如何从
动态
url中获取信息,使用Chrome
的
网络选项卡,并在XHR选项下查看出现
的
HTTPrequest。它通常会给我从
JS</
浏览 2
提问于2016-01-14
得票数 1
1
回答
在R中使用`read_html`时缺少元素
、
、
、
我正在尝试使用rvest包中
的
read_html函数,但遇到了一个我正在努力解决
的
问题。例如,如果我试图读取出现在页面上
的
底部表格,我将使用以下代码:html_content <- read_html("https://projects.fivethirtyeight.com/2016-election-forecast/washington/#now") 通过检查浏览器中
的
HTML代码,我可以看到我想要
的<
浏览 17
提问于2016-08-31
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python项目实战:抓取大型网站JS特效模板
动态网页常用的两种数据加载方式ajax和js动态请求
如何利用Python网络爬虫抓取微信朋友圈的动态
node.js怎么出题的
如何利用Python网络爬虫抓取微信朋友圈的动态(上)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券