腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
美丽
的
汤
在
实际
结束
前有
额外
的
</
body
>
、
、
、
我
在
我
的
一个测试用例中发现,当我从一首特定
的
诗中拉出html时,它会在
实际
的
诗
的
结尾之前包含一个
额外
的
</
body
>。我可以在网上查看这首诗
的
源代码,
在
诗
的
中间没有(正如预期
的
那样)。我用一个特定案例
的
url创建了一个例子,这样其他人就可以尝试复制这个问题:fro
浏览 4
提问于2016-09-19
得票数 1
回答已采纳
1
回答
如何在python中获取html页面中文本
的
偏移量
、
、
我正在做一个网页抓取,以提取一些文本使用
美丽
的
汤
。请提供您
的
想法和建议... 谢谢
浏览 5
提问于2016-06-08
得票数 2
2
回答
不统计文件中
的
正确字符
、
我有以下代码,它按预期运行,但在计算字符数和最长行
的
长度时有一些问题。下面是我
的
代码: n_chars = 0 n_lines = 0输入如下:
美丽
的
汤
,如此浓郁和青绿,
在
热腾腾
的
图腾中等待!对于这样
的
美味,谁不会屈尊呢?晚上
的
汤</e
浏览 11
提问于2018-08-13
得票数 0
回答已采纳
2
回答
使用python获取网页正文中
的
内容
、
我正在尝试扫描使用python
的
各种网站。下面的代码对我来说很好。import urllibhtmlfile =urllib.urlopen("http://google.com")regex='<
body
</
body
>'title= re.findall(pattern,htmltext)上面的代码给
浏览 4
提问于2014-03-05
得票数 5
回答已采纳
1
回答
如何在"br“之前提取文本?
、
、
、
我正在尝试提取应该在<br>之前
的
文本。我喜欢:<
body
><p>Here is a listing of C interview questions on “Variable<br>b) 6<br>d) 14</p></
body
浏览 1
提问于2015-12-08
得票数 3
回答已采纳
2
回答
Pyquery使html代码无效
、
、
"/><script type="text/javascript" src="tools.min.js"/></head><
body
/></html>同样
的
事情也发生在<iframe/>
浏览 1
提问于2011-02-19
得票数 1
回答已采纳
1
回答
with用python和漂亮
的
汤
抓取一个凌乱
的
网页
、
、
、
、
在
Python中使用“漂亮
的
汤
”和“请求”,这就是我试图获得公司名称
的
方法:import requests 然而,
美丽
的
汤
不会接受这条路。我也试过不带符号<e
浏览 4
提问于2014-11-28
得票数 2
回答已采纳
1
回答
Selenium不会在点击按钮后等待页面重新加载
、
、
、
我正在使用selenium从一个用JavaScript加载数据
的
中抓取体育比赛结果。我已经编写了一个简单
的
函数来获取html代码,并将其发送到
美丽
汤
,然后解析相关部分(见下文)。不幸
的
是,这不能正常工作-该函数只返回最初可见
的
结果: url="'http://www.flashscore.com/tennis/wta-singles/australian-open-2016/results
body</
浏览 1
提问于2017-01-18
得票数 0
1
回答
在
python中查找字符串
的
出现
、
、
、
、
我有一个很长
的
字符串,我已经通过
美丽
的
汤
分析,我需要关于从这个
汤
对象中提取数据
的
最佳方法
的
建议。什么是最有效
的
方法来定位这个,并得到它
的
数字。然后循环直到找到结尾),获取
浏览 3
提问于2014-05-27
得票数 0
回答已采纳
3
回答
如何刮除YouTube频道创建者并链接到他们
的
频道?
、
、
、
我试着用漂亮
汤
从视频页面中提取频道创建者
的
名字,以及他们频道
的
链接。我试过使用class_关键字参数。因此,我得到了[]。我该怎么办?我是否需要通过父母
的
div标签,然后“下去”,就像他们
在
“
美丽
汤
”中说
的
那样?对于特定
的
标记和类,我应该如何/可以使用soup.find呢?html.parser") videotitle = soup.find("meta", {"pro
浏览 2
提问于2020-02-06
得票数 2
回答已采纳
2
回答
用硒美
汤
寻找元素
、
、
、
根据不同
的
消息来源,
美丽
的
汤
比硒更快
的
抓取网页。我正在写一些
在
社交媒体评论中爬行
的
代码。我使用Selenium自动单击检索旧注释
的
按钮,并使用以下命令从注释中获取文本我知道feature没有允许我直接输入xpath来查找元素
的
特性在这种情况下,我是否应该摆脱对xpath
的
依赖,并尝试更轻松地使用可以由漂亮
的
汤
使用<em
浏览 18
提问于2019-07-24
得票数 0
回答已采纳
2
回答
无法使用Selenium检索表主体内容
、
、
、
、
试图通过
在
注册编号中添加值来获取表id = mytable中
的
body
内容。但没能得到。
body
= table.find('tbody') p
浏览 1
提问于2019-09-11
得票数 0
回答已采纳
1
回答
使用“另存为”下载
的
HTML与使用Python请求下载
的
HTML略有不同
、
、
、
但是,当我
在
实际
网站上测试我
的
网络爬行器时,输出略有偏差。,直到几个未闭合
的
标签。“另存为html”页具有正确
的
结束
标记,但“请求”页缺少某些标记
的
结尾。例如,另存为文档
的
所有标记都已关闭: <td>stuff</td>但是下载
的
请求文档缺少一些
结束
标记: <td>stuff &
浏览 0
提问于2019-05-13
得票数 0
1
回答
Python BeautifulSoup:
在
<br>标记之后提取分组文本
、
、
我试图使用BeautifulSoup将html文件解析为CSV中
的
文本项组,但我不确定如何解析该模式。我对蟒蛇和
美丽
的
汤
很陌生。html文件看起来有点像这样: <
body
> <br> <b>Group 1 title</b> <pre> Group 1 descriptionBlah blah blah &
浏览 3
提问于2022-08-22
得票数 0
回答已采纳
2
回答
在
页面上发现所有“Php”
的
出现忽略case BeautifulSoup
、
、
我希望
在
一个页面(忽略Php )上找到BeautifulSoup
在
Python3中发生
的
所有事件from BeautifulSoup import BeautifulSoup school_urls = ['somesite1.com','somesite2com'] posting_
浏览 4
提问于2017-01-25
得票数 0
0
回答
HTML不能在美
汤
浏览器中反映网页内容
、
、
我正在尝试从一个网站使用
美丽
的
汤
内容。在做一些测试时,我得到了以下输出(这只是最后一点): <my-app>“加载”部分就是我想要
的
。为什么这个html不能加载?如果我
在
Google中查看源代码,也会发生同样
的
事情。如果我看不到代码,我如何抓取
浏览 4
提问于2017-01-06
得票数 3
回答已采纳
1
回答
使用python漂亮
汤
无法使用json模式
在
html文件中获取<script>标记之间
的
引用
、
、
我需要使用json模式访问本地html文件中
的
json引用。引用位于文件中
的
第一个标记之间。</style><
body
> // Script section to load models into a JS Var "enum" : [ "ACTIVE", "INACTIVE", "
浏览 1
提问于2020-07-01
得票数 0
1
回答
从熊猫栏解码HTML
、
、
、
、
我有一个数据框架,其中一个列是西班牙语fos US Dolares中
的
货币名称,它是 我尝试使用不同
的
编码/解码库,如
美丽
汤
、HTMLParser和其他几个。 知道有什么问题吗?
浏览 0
提问于2018-01-29
得票数 1
回答已采纳
1
回答
用
美丽
汤
显示onmouseover属性中
的
文本
、
、
、
、
这个问题
的
不同版本已经提出: 我可以使用“
美丽
汤
”成功地获得onmouseover属性: <td class="right odds down"><div onmouseout="delayHideTipdelayHideTip()" onmouseover="pag
浏览 2
提问于2018-11-04
得票数 1
回答已采纳
1
回答
如何利用
美丽
汤
找到网页
的
主体
、
、
我想看看是否有任何内容
在
500多个网页上,使用
美丽
的
汤
。这是我写
的
is脚本。它起作用了,但在某个地方它停止了。如果我修正了错误,它会显示一个不同
的
错误。下面是我尝试过
的
代码。我只想确定页面上有身体。也许网站需要更多
的
时间。full_https_url, timeout=40)elems = soup.select('<e
浏览 1
提问于2022-10-31
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
已向开发者开放,Meta身体追踪API如何识别下半身?
来看看《推理学院》的小可爱!送你一篇完整的宠物攻略
高达280G大小的《GTA:罪恶都市》有多彪悍?还原童年原貌!
共享wifi代理项目盈利模式分析
纽约时报CEO:预计纸质报纸20年后消失
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券