腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1421)
视频
沙龙
2
回答
Python
Web
抓取
|
如何
通过
Beautiful
Soup
和
selenium
选择
页码
作为
范围
,
从
多个
urls
抓取
数据
?
、
、
、
from
selenium
import webdriverfrom bs4 import BeautifulSoup as
Soup
bs =
Soup
浏览 54
提问于2021-09-21
得票数 0
回答已采纳
1
回答
如何
从
Oddsportal获取URL?
、
如何
从这个特定的链接获取所有的URL:单击链接后:当我去检查元素时,我可以看到链接可以被刮掉,但我对它非常陌生。 请帮帮忙
浏览 1
提问于2021-07-01
得票数 0
1
回答
使用
Python
进行
Web
抓取
,而无需加载整个页面
、
、
、
我刚用
Python
开始了几个
web
抓取
项目。我目前使用lxml,
Beautiful
Soup
和
requests模块来
抓取
网页。我需要知道是否有任何方法可以只
从
网站获得我们需要的
数据
,而不是加载整个页面。requests模块执行GET请求并接收整个,bs4,lxml只过滤
数据
。我尝试过
Selenium
,但这也打开了浏览器,这不太适合工业项目。我对scrapy
和
splash一无所知。
浏览 28
提问于2021-11-13
得票数 0
回答已采纳
1
回答
基于动态内容
和
隐藏
数据
表的
Selenium
Web
抓取
、
、
、
、
我正在使用
Selenium
和
Beautiful
Soup
在
Python
中对动态内容进行
web
抓取
。问题是,即使使用以下代码,也无法将定价
数据
表解析为
Python
:sel_
soup
=BeautifulSoup(html, 'html.parser')
浏览 15
提问于2018-02-14
得票数 2
9
回答
BeautifulSoup
和
Scrapy crawler有什么区别?
、
、
、
我想做一个网站,显示亚马逊和易趣产品价格的比较。其中哪一个会工作得更好?为什么?我对BeautifulSoup比较熟悉,但对Scrapy crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
3
回答
“汤”
和
“美汤”中的“汤”是什么意思?
、
“汤”
和
“美汤”中的“汤”是什么意思,为什么它被称为“汤”?
浏览 1
提问于2014-05-19
得票数 10
4
回答
检索广告URL
我想要做的可能是编写一个脚本来持续刷新页面并
抓取
广告URL。 有什么建议吗?
浏览 2
提问于2012-11-05
得票数 0
3
回答
为什么BeautifulSoup不能在Google上获得所有html呢?
、
当在Google上搜索某物时,所有的链接
和
标题都会放在h3标签中。然而,如果我尝试使用“美丽汤”,则不会出现任何h3标记,而且似乎丢失了许多标记。我不认为这是一个JavaScript问题。q=" + input print (item) 编辑:
浏览 11
提问于2020-11-08
得票数 0
回答已采纳
2
回答
将
数据
从
Tripadvisor导入Google电子表格或Excel
、
、
、
是否可以获取此
数据
的列表:阿姆斯特丹所有餐馆的名单。如果可能的话,还有详细的地址等等。非常感谢!
浏览 1
提问于2020-09-17
得票数 0
1
回答
Python
Web
抓取
:
通过
加载页面
抓取
页面
、
、
我正在建立一个网络
抓取
项目使用
python
与美丽的汤和请求模块,问题是我想要
抓取
的网站有一个加载页面(完全不同于主页),然后它将我重定向到主页。我怎么能等到页面加载完成,然后
从
主页上
抓取
数据
呢?我知道
Selenium
可以处理这些类型的网站,但网站必须使用
web
驱动程序启动,这是我不希望在我的项目中使用的原因,这就是为什么我使用
Beautiful
Soup
和
requests模块。
浏览 15
提问于2020-10-25
得票数 0
1
回答
Selenium
Python
的IE webdriver加载网页并进入停顿状态
、
、
、
大家好,
Python
专家们,我已经使用了
Beautiful
Soup
和
REquests来为我的项目
从
静态
web
上
抓取
数据
。但对于动态内容,我无法做到这一点。我已经为此安装了
selenium
。请帮助:)from
selenium
.webdriver.common.keys import Keys driver = webdriver.Ie
浏览 41
提问于2020-05-26
得票数 1
回答已采纳
3
回答
Python
Web
抓取
-必需库及其实现方法
我想要使用
Python
进行
web
抓取
,我需要它,因为我想导入一些
数据
库,我们
如何
在
Python
中做到这一点。我们需要什么样的库?
浏览 2
提问于2016-02-11
得票数 0
2
回答
原始HTML与
python
中的DOM
抓取
使用机械化和美观的汤
、
、
、
我正在尝试写一个程序,
作为
一个例子,它将刮掉这个网页的最高价格: from urllib import urlopen print
soup
但是,原始HTML不包含价格。浏览器做的事情(在这里澄清可能对我也有帮助)...and在构造DOM树的同时
从
其他地方检索价格。有人引导我相信mechanize会像我的浏览器一样工作,并返回DOM树,我也相信这就是我在查看页面时所看到的,例如,Chro
浏览 3
提问于2012-03-04
得票数 3
回答已采纳
5
回答
如何
从
其他网站获取
数据
?
、
、
、
我想创建一个网站,
从
其他网站提取信息,并将它们打印到我的网站上,我正在进行研究,所以我想听取一些意见,这个项目的最佳解决方案是什么?我听说
Python
使用解析器可以做到这一点,我只是想知道我应该走哪条路,应该使用哪种语言?
浏览 1
提问于2013-06-14
得票数 4
1
回答
使用
Selenium
& Beautifulsoup
从
python
中的LinkedIn帖子中拉出评论计数
、
、
、
我正在开发一个
python
脚本,它使用
Selenium
& BeautifulSoup
通过
web
抓取
从
我个人的LinkedIn配置文件中提取性能
数据
。我可以
通过
Chrome成功地访问我的个人资料,并提取一些
数据
,但评论似乎很棘手。这是我到目前为止所知道的: postComments = [] #
beautiful
soup
instanc
浏览 11
提问于2021-09-22
得票数 0
1
回答
如何
在
Python
中使用
Selenium
和
BeautifulSoup4
抓取
多个
URL
、
、
、
对于
如何
用
Selenium
、BS4
和
UserAgent
抓取
多个
URL,我一直在尝试一些不同的解决方案,到目前为止,我已经能够
抓取
1个URL来提取我想要的内容。只是当涉及到1+地址时,我遇到了麻烦。如果您将
urls
参数更改为url,取消url变量的注释,去掉for url in
urls
并删除for content in sel_
soup
循环的缩进,您就会明白我的意思。我想创建一个循环来
抓取
,开始时,只有2个网页,当它
浏览 16
提问于2020-05-17
得票数 0
3
回答
“美丽的汤”查找()并不能找到类的所有结果
、
、
、
import re html = urlopen(spotify)print(main) 谢谢你的帮助
浏览 6
提问于2019-10-05
得票数 1
回答已采纳
2
回答
如何
从
存储在列表中的链接中提取信息?
、
、
我想要进入这个列表,并在这个列表中的链接后面获得特定的信息(名称,地址,电话,来自某个公司的邮件): ['https://allianz-entwicklung-klima.de/kompensationspartner/aera-group/', 'https://allianz-entwicklung-klima.de/kompensationspartner/bischoff-ditze-
浏览 15
提问于2021-09-15
得票数 0
回答已采纳
1
回答
如何
抓取
和
提取链接到n级,并再次
抓取
数据
并将其映射到
python
中的输出?
、
、
我正在学习
python
中的网络爬行
和
抓取
。我想要
抓取
数据
,在一个网站上有链接,而在这些链接里面有更多的链接。所以我想
抓取
数据
直到预定义的级别n。/")
soup
= BeautifulSoup(driver.page_source,"lxml")links=[] forurl in
soup
.find
浏览 40
提问于2019-12-17
得票数 0
2
回答
Python
抓取
查询
、
我编写了有史以来第一个
python
代码,用于
从
web
中
抓取
股息历史表,但是
soup
.select语句似乎没有
选择
任何内容,并导致索引错误。from bs4 import BeautifulSoup
soup
= Be
浏览 0
提问于2018-08-22
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
用Python做网页爬虫
Python基础教程 Beautiful Soup
python BeautifulSoup库自动抓取生成新文章
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券