腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(1344)
视频
沙龙
1
回答
Python
-
Beautifulsoup
-
仅
来自
最终
抓取
的
链接
的
数据
被
输
出到
文本文件
、
、
、
我试图从一个网站上
的
多个
链接
刮体育时间表。已正确找到并打印了URL,但只有
来自
上一次
抓取
的
URL
的
数据
才会输
出到
控制台和
文本文件
。我
的
代码如下:这为我提供了以下输出<code>B1</code>我有下面的旧代码,它
的
工作正常,并输出所有的
数据
从每个
抓取
浏览 24
提问于2020-08-01
得票数 0
回答已采纳
1
回答
尝试使用
python
解析html时重定向到主页
、
、
、
、
from urllib.request import urlopenimport requests page = requests.get(url)soup =
BeautifulSoup
(data, "html.parser") print我试图
抓取
的
页
浏览 0
提问于2016-11-02
得票数 0
1
回答
使用
Python
、Urllib从FTP站点解析/
抓取
表
、
、
、
、
我正在尝试解析/
抓取
来自
FTP站点
的
一些
数据
。具体来说:import urllib2 from bs4 import
Beauti
浏览 15
提问于2016-07-30
得票数 0
2
回答
如何只将股票名称和实时价格导
出到
.txt文件,中间不会有任何额外
的
行或不需要
的
数据
?
、
我从一个网站上
抓取
实时股票价格使用
BeautifulSoup
,并使用
Python
导
出到
一个
文本文件
。该代码返回价格以及其他行和信息。 如何只选择要导
出到
.txt文件
的
特定信息?我对
python
还不是很精通。尝试搜索stackoverflow,但找不到任何对我有用
的
东西。from bs4 import
BeautifulSoup
import time
浏览 13
提问于2019-10-11
得票数 0
回答已采纳
2
回答
Python
BeautifulSoup
解析
、
、
我正在尝试
抓取
一些内容(我是
Python
的
新手),但我遇到了一个障碍。我想要
抓取
的
代码是:soup.h2.a.con
浏览 0
提问于2011-12-23
得票数 2
回答已采纳
4
回答
屏幕
抓取
窗体结果
、
、
我最近
被
一个客户要求为他们
的
保险业务建立一个网站。作为这项工作
的
一部分,他们想要对他们
的
一个供应商
的
报价站点进行一些屏幕
抓取
。他们询问他们
的
API是否可以做到这一点,并被告知没有,但如果他们可以从他们
的
引擎中获得
数据
,他们可以随心所欲地使用它。 我
的
问题是:是否可以对表单提交到另一个站点
的
响应执行屏幕
抓取
?如果是这样,我应该注意
的
陷阱是什么?抛开明显
的</
浏览 1
提问于2009-08-03
得票数 3
回答已采纳
1
回答
使用
Python
和
BeautifulSoup
抓取
多个页面-网站url不起作用
、
、
、
我
的
python
代码成功地从https://www.groupeactual.eu/offre-emploi中
抓取
文本并将其保存到csv文件中。例如,使用上面的url,当我单击指向"page 2“
的
链接
时,整个url会发生变化,但当我在代码中使用该url时,我会得到
来自
page 1
的
结果。 如何更改我
的
代码以从所有列出
的
可用页面中
抓取
数据
?我
的</em
浏览 16
提问于2020-07-17
得票数 1
1
回答
如果
BeautifulSoup
无法到达一个站点,如何跳到下一个
链接
?
、
、
我目前正在编写一个
Python
项目,它需要执行以下操作:-the脚本从这些站点
抓取
信息,并将输出写入.txt文件中。我遇到
的
问题是,如果一个站点无法到达(例如,一个随机
链接
: oflexertzue.com),那么整个脚本就会停止,我必须重新启动它。,并将' exception‘输
出到
文本文件
中。以下是我目前为脚本编写
的
代码:import
浏览 3
提问于2022-07-18
得票数 0
回答已采纳
2
回答
请求响应中没有
数据
、
、
我刚接触
python
、
数据
抓取
和自动化。我正在尝试
抓取
URL中给出
的
网站。当我在浏览器中打开URL
链接
时,所有的
数据
都会显示出来,但是requests.get()方法
的
响应并没有给出这些
数据
。如果有人能告诉我出了什么问题,那将是非常有帮助
的
。import requestsfrom bs4 import
BeautifulSoup
URL = "https:
浏览 1
提问于2016-07-04
得票数 1
3
回答
用漂亮
的
汤和
python
3.x刮桌子
、
、
所以我是
python
的
新手,现在我还在尝试弄清楚所有东西是如何工作
的
,现在我正在用漂亮
的
汤
抓取
表中
的
数据
。我可以使用美汤导航到我想要
的
特定表,但提取实际
数据
让我感到困惑,我尝试
的
所有操作都失败了。/40665')tables = soup.findChildren
浏览 4
提问于2017-08-05
得票数 3
回答已采纳
1
回答
如何保存显示原始超
链接
文本
的
电子邮件
、
我们收到了
来自
第三方
的
自动电子邮件,其中包含了掩码形式
的
超
链接
(
链接
上写
的
是其他文本而不是地址)。Sub ShowAllHyperlinkAddresses(objMail As Outlook.MailItem) Dim iC
浏览 6
提问于2020-05-18
得票数 0
回答已采纳
1
回答
Web
抓取
新文章
、
在过去
的
几个月里,我一直在学习
python
和
BeautifulSoup
函数,试图将其主要用于网络
抓取
新闻文章,以供我自己研究之用。 然而,我一直在尝试从中文网站上打印出漂亮
的
文本内容。我应该使用哪个标签来获取文章
的
内容?
浏览 29
提问于2017-12-20
得票数 1
1
回答
将网站URL从
文本文件
迭代到
BeautifulSoup
w/
Python
、
、
我有一个.txt文件,在每一行上都有一个不同
的
链接
,我想迭代,然后解析成.txt "html.parser")。不过我有几个问题。我可以看到从
文本文件
中迭代
的
行,但是当我将它们分配给我
的
requests.get(websitelink)时,我以前工作过
的
代码(没有迭代)就不再打印我刮过
的
任何
数据
了。我收到
的
结果只有几行空白行。 我对
Python
和
BeautifulSoup
并不熟悉
浏览 2
提问于2019-06-08
得票数 0
回答已采纳
1
回答
使用
python
从javascript变量JSON.parse中提取
数据
、
、
对于
python
来说非常陌生,并且尝试在web上搜索网站表,但我认为表
数据
似乎
来自
带有JSON.parse
的
Javascript变量。但是,解析并不是我所习惯
的
,也不确定如何在
python
中使用它。代码
来自
,特别是var playersData = JSON.parse('\x5B\x7B\x22id\x3A,... (大约25万个字符)嵌套在一个脚本标记中。到目前为止,我已经成功地使用bs4
抓取
了网站,找到了特定
的
脚本,并
浏览 1
提问于2018-11-07
得票数 0
回答已采纳
1
回答
使用单个URL在多个页面上刮取表
、
、
、
我正试着从Fangraphs中
抓取
数据
。表格
被
分成21个页面,但所有页面都使用相同
的
url。我对webscraping (或者一般
的
python
)非常陌生,但是Fangraphs没有公共API,所以
抓取
页面似乎是我唯一
的
选择。我目前正在使用
BeautifulSoup
来解析超文本标记语言代码,我能够
抓取
初始表,但那只包含前30个球员,但我想要整个球员池。两天
的
网络搜索,我
被
卡住了。
浏览 21
提问于2020-04-18
得票数 1
回答已采纳
1
回答
屏幕刮擦提示:交互式图形
、
、
、
、
最近,我学习了一些关于如何将
BeautifulSoup
与
Python
结合使用
的
教程,并学习了如何简单地从网页中刮取文本和urls。我现在试着从下面的
链接
中
抓取
数据
, 在页面底部有一个交互式
的
图形生成器,我想从它中
抓取
所有的
数据
,而不必花费很多时间从所有可能生成
的
图形中缓慢地写下值。我尝试过使用我卑微
的
初学者技术,但在HTML中图形
数据
来自
何处并不明显-此外,HT
浏览 0
提问于2014-08-08
得票数 3
回答已采纳
2
回答
Python
:打印特定href中
的
数据
(带有ID标签)
、
、
我是
Python
的
新手,正在尝试构建我
的
第一个网络摩天大楼。我想转到一个页面,打开一系列子页面,在页面上找到一个特定
的
链接
(带有ID),然后打印
链接
数据
。我真正不确定
的
是,我需要做什么来
抓取
和解析
来自
特定
链接
的
href
数据
-因为我认为,其余
的
都在工作(加载子页面)。
抓取
器(假定)获取丹麦公社
的
所有urls并打印
浏览 2
提问于2012-07-30
得票数 0
3
回答
抓取
urls
的
抓取
顺序
、
我有个关于scrapy和
python
的
问题。我有几个
链接
。我使用循环在一个脚本中
抓取
每个脚本中
的
数据
。但
抓取
数据
的
顺序是随机
的
,或者至少与
链接
不匹配。所以我不能将每个子页面的url与输出
的
数据
进行匹配。 喜欢:
抓取
的
网址,data1,data2,data3。Data 1,data2,data3 =>这是可以
的</e
浏览 0
提问于2018-04-18
得票数 0
1
回答
Python
编码问题:学位符号和其他
、
、
我正在使用
BeautifulSoup
从网页上
抓取
数据
。我想将网站
数据
与.txt文档中
的
文本进行比较。然而,我似乎遇到了编码问题。,该文本文档
被
编码为“在没有BOM
的
情况下以UTF-8编码”。
文本文件
被
读取为当我比较这两个字符串时,它们不相等,但我希望它们相等。看看发生了什么:在Eclipse中,我拆
浏览 0
提问于2012-01-30
得票数 4
回答已采纳
1
回答
如何在docker容器中使用selenium设置
python
应用程序
、
、
我目前正在做一个项目,用
python
构建一个web scraper,然后将其停靠,这样应用程序就可以在任何机器上运行。我已经构建了
python
应用程序,使用selenium加载我正在处理
的
网页。我是否需要使用应用程序创建一个容器,并将其
链接
到另一个selenium容器?谢谢你
的
帮助! 我
的
代码从我编译
的
文本文件
中获取邮政编码列表,并使用这些代码在地图上
的
特定位置
抓取
。
抓取
数据
后,它
浏览 14
提问于2019-05-06
得票数 9
回答已采纳
点击加载更多
相关
资讯
如何抓取网页中的表格
《权力的游戏》最终季上线!谁是你最喜爱的演员?这里有一份Python教程
Python爬虫入门,快速抓取大规模数据
让Python告诉你当前最火的电影是什么
使用多个Python库开发网页爬虫(一)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券