腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
是否更容易
抓取
AMP版本的网页?
、
、
、
、
我知道AMP协议要求Javascript的精简版本,我也知道Javascript (在一定程度上)使网站管理员能够检测/防止
抓取
。因此,从逻辑上讲,我认为
抓取
AMP网站会更容易一些。
浏览 11
提问于2019-04-08
得票数 0
2
回答
我需要关于如何加速网络
抓取
器的建议
、
、
、
我对此还是个新手。我正在尝试从网页中提取数据,但我实现的这个方法似乎有点慢。我使用了time模块来缩小延迟的原因。花费了大部分时间(1-5秒)始终如一地耗时0.15秒
浏览 1
提问于2015-05-08
得票数 2
1
回答
从html
页面
不显示数据的url读取数据
、
我正在尝试以下代码:if __name__ == '__main__': import requests r = s.get(link) print(sou
浏览 1
提问于2020-02-05
得票数 0
2
回答
使用
Python
自动化创建例程的最佳方法
、
它应该做的是浏览几个网站,点击一些按钮,
抓取
所需的信息,存储收集的信息,并填写一些表格。使用
Python
可以做到这一点吗?如果是,那么最紧凑的方法是什么?
浏览 1
提问于2013-05-07
得票数 0
1
回答
在
python
中浏览/解析html
页面
、
、
、
、
为了与html
页面
进行交互,我试图把一些我需要的插件集合在一起。我需要的范围从简单的浏览和与按钮或网页链接(如“在这个文本框中写一些文本并按这个按钮”)进行交互,到解析html
页面
和向服务器发送自定义get/post消息。我正在使用
Python
3,到目前为止,我有Request用于简单的网页加载、自定义get和post消息,BeautifulSoup用于解析HTML树,我正在考虑尝试机械化来进行简单的网页交互。是否有某种集合的地方,所有的
Python
库挂起?因为我有时会发现很难找到我要找的东西。
浏览 3
提问于2014-04-17
得票数 1
回答已采纳
1
回答
webcrawling-有哪些可能的方法来检测使用javascript加载的
页面
?
我想
抓取
一些网站。我正在使用selenium/PhantomJS
抓取
JS
(react、angular、jquery等)。和
python
爬行其他所有的东西。我的主要问题是,我无法区分
页面
是否使用
JS
加载。 任何想法都将受到欢迎!
浏览 2
提问于2018-03-16
得票数 0
1
回答
如何在
js
图表中刮取数据?
、
、
、
我使用
python
4/selenium来、刮和
抓取
网页。我对刮这个很感兴趣。如您所见,有几个
js
图表。但是当我查看源代码时,我找不到点的值。我
怎样
才能刮掉这些价值。
浏览 3
提问于2020-05-18
得票数 0
2
回答
使用
python
抓取
动态javascript内容网页
、
、
、
、
我正在尝试使用
Python
抓取
这个网站:'‘。但是,requests + BS4只给了我HTML格式的
页面
源代码。我假设这是因为内容是动态的。因此,我尝试了Selenium + BS4来
抓取
网站,但我仍然只能
抓取
页面
源代码。eac/msca/jobs/import-jobs_en.htm'soup = BeautifulSoup(driver.page_
浏览 4
提问于2020-02-02
得票数 0
1
回答
如何在Siteground托管服务器中运行
Python
脚本
、
我正在建立我的网站,其中包含一个
python
(.py)文件,超文本标记语言,css和
JS
文件。我想知道,我
怎样
才能运行我的
python
脚本在我的网站从我的托管帐户,以便它可以从一个网站
抓取
数据,并输出一个JSON文件到Javascript文件,可以显示在网页上。
浏览 15
提问于2021-01-06
得票数 0
3
回答
Perl vs PHP to web
抓取
、
、
、
、
假设我们有一个需要web
抓取
的项目。(解析字符串(< 40)和
抓取
网页(获取元数据等等)我知道perl有非常好的适合这项工作的cpan模块,所以我可以采用这种方式,不用太麻烦自己。(可能是
Python
??)在速度方面,哪一个更适合这项工作?请解释一下。 提前谢谢。
浏览 0
提问于2011-04-04
得票数 4
回答已采纳
2
回答
BeautifulSoup web
抓取
,无结果
、
、
我在试着从https://hk.appledaily.com/search/apple..。我需要从div class="flex-feature"但它只返回[]..。希望大家能帮忙,谢谢! from bs4 import BeautifulSoup results = soup.find_all(
浏览 40
提问于2020-10-06
得票数 2
回答已采纳
1
回答
有没有办法在不使用
Python
中的可执行文件的情况下刮掉
JS
呈现的
页面
?
、
、
我需要用纯
Python
来完成这个任务,但遗憾的是,BS4不支持
JS
页面
,Selenium需要一个作为可执行文件的need驱动程序。是否有人知道/是否有任何方法可以使用纯
Python
和它的模块而不必运行任何exe来
抓取
JS
呈现的
页面
? 如果可能的话,我并不要求精确的解,只要求方法和模块。表示完整的上下文:我试图每天在云上运行一个web
抓取
脚本,该脚本不允许运行任何前妻。使用Selenium和PhantomJS进行了尝试,但得到了一个无权限错误。
浏览 1
提问于2018-08-22
得票数 1
回答已采纳
1
回答
有没有可能用代码自动向下滚动网页?
、
、
、
我正在为一个特定的网页做网页
抓取
,我注意到我的代码只
抓取
了只显示第一个滚动的部分。当进一步向下滚动时,
页面
会自动显示更多信息。下面是似乎控制这种算法的代码。<div class="view-pagination text-right"> <ul class="
js
-pager__items pager" data-drupal-views-infinite-scroll-pagersome_links_here" title="Go to
浏览 1
提问于2019-10-31
得票数 0
1
回答
使用scrapy从facebook中
抓取
数据
、
、
、
我想通过刮擦刮刮结果
页面
()。 最初的问题是facebook只允许facebook用户访问信息,因此将我引向login.php。因此,在
抓取
这个url之前,我通过scrapy登录,然后通过这个结果
页面
登录。但是,即使这个
页面
的http响应是200,它也不会丢弃任何数据。
浏览 3
提问于2013-05-31
得票数 5
2
回答
我可以从highcharts.
js
中刮取原始数据吗?
、
、
、
、
我想从一个使用highcharts.
js
显示图形的
页面
中
抓取
数据,这样我就完成了对所有
页面
的解析,以到达。但是,显示数据集的最后一页使用highcharts.
js
来显示图形,这似乎几乎不可能访问原始数据。还能解析它吗?
浏览 3
提问于2016-09-03
得票数 9
回答已采纳
1
回答
使用Selenium获取JavaScript函数调用值
、
、
、
、
我正在使用
python
抓取
网页,这对静态内容非常有用。我试图从
页面
中
抓取
一个url,但结果是,它是通过javascript调用返回的。为此,我使用selenium,但无法弄清楚如何实现它。我
怎样
才能在我的程序中得到这个指南的网址? 我也面临着一个类似的问题,在以及获得尺寸指南。如果有人能指点这些链接,我会非常感激的。
浏览 2
提问于2015-05-27
得票数 0
回答已采纳
3
回答
如何在
python
中并行
抓取
多个html
页面
?
、
、
、
、
我正在用Django web框架用
Python
制作一个网络
抓取
应用程序。我需要用漂亮的汤库
抓取
多个查询。url) links = soup.find_all("a", {"class":"dev-link"}) 实际上,网页的
抓取
是按顺序进行的我对
Python
中的线程化不是很了解。谁能告诉我,我
怎样
才能并行
抓取
?任何帮助都将不胜感激
浏览 0
提问于2017-05-29
得票数 2
2
回答
是否有一种方法可以
抓取
使用
python
加载的数据?
、
、
、
我在做一个从网站上
抓取
的数据。我发现表数据在
页面
的源代码中显示为加载。我想知道如何使用
python
收集数据。它似乎是一个有反应的
js
网络应用。 网址:
浏览 2
提问于2019-12-20
得票数 1
回答已采纳
2
回答
将
Python
脚本连接到Nodejs
、
完成Node.
js
新手入门。最近,我接到一个任务,用
python
在web上
抓取
一个网站,然后使用Node.
js
中的
python
-shell包将
python
脚本连接到Node.
js
。我已经完成了
抓取
部分,但对Node.
js
没有任何先验知识。你能指导我如何解决这个问题吗?
浏览 0
提问于2020-01-07
得票数 0
2
回答
使用selenium获取数据
、
我开发了一个web应用程序,它使用RangeNode.
js
/Express.
js
和MySQL开发。我的应用程序有一些
页面
,在从另一个web应用程序example: https://www.example.com获取数据后显示数据。由于另一个应用程序没有从哪里获取数据的API,所以在
Python
的帮助下,我使用了web
抓取
,而则从站点中
抓取
数据。我用Node.
js
调用我的
Python
程序。
浏览 4
提问于2021-05-31
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python项目实战:抓取大型网站JS特效模板
爬虫抓取页面图片
如何吸引百度蜘蛛来抓取页面,蜘蛛抓取页面的因素
爬虫抓取页面图片 update
批量抓取页面图片 up!
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券