腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
删除
被
抓取
的
数据
的
p
标记
?
、
、
、
我正在尝试这个代码片段来获取div中
的
p
。运行脚本时,输出包括其所有格式化
标记
。))<
p
>This is a log of activity related to
浏览 27
提问于2021-09-05
得票数 2
回答已采纳
1
回答
GoLang WebCrawling
删除
空
标记
、
我试图
抓取
网页,很少情况下我
的
HTML看起来像这样,包括\n和\t。<article> <
p
> <
p
><span></span></
p
>在有些情况下,如果我有\n或\t,我将<em
浏览 1
提问于2020-04-20
得票数 0
2
回答
提取
标记
内
的
所有内容,但不提取
标记
本身
、
、
我正在使用BeautifulSoup从网站
抓取
文本,但我只需要用于组织
的
<
p
>
标记
。但是,我不能使用text.findAll('
p
'),因为还有其他我不需要
的
<
p
>
标记
。我想要
的
文本都被包装在一个
标记
中(假设是body),但是当我解析它时,它也需要包含该
标记
。link = requests.get('link') text = bs4.
浏览 6
提问于2017-02-02
得票数 1
2
回答
不加载附加了innerHTML
的
脚本?
、
、
我将一个完整
的
超文本
标记
语言页面附加到一个div (
抓取
)。
如何
阻止它请求script和css文件?我尝试立即
删除
这些节点,但它们仍然
被
请求。 这是一个浏览器插件,我正在
抓取
JS
浏览 0
提问于2015-01-06
得票数 0
2
回答
Python :循环遍历元素,从函数中去掉空格
、
我正在尝试编写一个函数,我可以重用这个函数从
被
刮掉
的
元素中去掉空格。我正在
抓取
h2、li和
p
标签;它们目前以<tag> string </tag>
的
形式返回,我希望
删除
空白并使用*.get_text(strip=True)保存内容。h_content = soup.select('h2')将存储找到
的
所有h2
标记
。
p
_content = soup.select(
浏览 3
提问于2022-02-07
得票数 0
回答已采纳
3
回答
去掉不在标签中
的
html
、
、
我目前正在
抓取
一个网站,并有我需要
的
所有有用
的
数据
,尽管它附带了一些我不想要
的
数据
。示例:<
p
>Useful <a href="/foo">data</a></
p
> Rubbish <a href="/bar">data</a&g
浏览 11
提问于2011-02-15
得票数 1
回答已采纳
2
回答
获取其子
标记
值等于某项
的
html
标记
的
文本
、
我有一个我想要
抓取
的
网站,我有一部分网站
的
HTML是这样
的
: <em class="efg">Whatever:</em> <
p
class="abc xyz"> <em class="efg">Phone:<&
浏览 0
提问于2020-09-16
得票数 0
1
回答
在本地回购中没有清理旧
的
树枝
我们在linux上使用git,有时会创建用于修改
的
分支来进行测试,现在我们将这些分支检索到本地系统--分支
被
合并,并且在we接口中,这个分支在我
的
本地系统中不再可见--我从主分支执行git拉/ git谢谢你
的
帮助,盖伊
浏览 5
提问于2022-07-29
得票数 -1
1
回答
如何
从<a>输出字符串中移除<a>和所有其他html
标记
,而不是在PHP输入字符串时?
、
、
、
我想知道
如何
在PHP中从输出字符串中
删除
标记
。在输入时,我知道
的
strip_tags()可以
删除
它,但是从已经生成
的
输出中可以
删除
html
标记
,
如何
删除
它呢?例如,:截图:
浏览 4
提问于2011-04-20
得票数 0
2
回答
是否可以使用特定
的
类从html元素中刮取
数据
?
、
我想出了各种方法来
抓取
数据
。这里我从表td中刮取
数据
<?但是
如何
从具有特定类名
的
<
p
>
标记
中刮取
数据
呢?<
p
class="review_comment ieSucks" itemprop="description" lang="en"> Some text </<
浏览 3
提问于2014-03-26
得票数 3
回答已采纳
4
回答
美丽汤4:
删除
注释标签及其内容
、
、
、
、
我正在
抓取
的
页面包含这些HTML代码。
如何
删除
注释
标记
<!-- -->及其内容与bs4?cat dog sheep goat<
p
>NewPP limit reportPost‐expand include size: 4852/2097152Template argument siz
浏览 6
提问于2014-04-25
得票数 16
回答已采纳
1
回答
从html <body>元素中
抓取
数据
、
、
、
我正在使用JSoup,这是一个纯Java
的
超文本
标记
语言解析器库,用来从互联网上拉取和解析纯超文本
标记
语言页面(好吧,使用非常少
的
JS)。到目前为止,如果我想要
抓取
的
数据
被
附加到一个非常冗长
的
HTML元素(如<a href="....">或<span class="myclass myotherclass">等),那么一切都正常,但是我不知道
如何
以一种有
浏览 0
提问于2015-05-06
得票数 1
2
回答
替换包含某些内联元素
的
标记
(作为字符串)
、
我
的
意图是修改标签中
的
句子。tag</
p
></div> 这意味着我需要遍历节点,获取
标记
并获取所有文本样式
的
节点,但不获取子
标记
。我需要为每个具有完整文本
的
标记
执行此操作,直到所有内容都被修改。例如,
抓取
div#1
的
文本和样式节点是:"This is text in the TD with strong tag“,但正如
浏览 0
提问于2013-01-15
得票数 0
2
回答
如何
在网页
抓取
过程中获取
P
标签中
的
特定
数据
?
、
、
、
我试图从一个在
P
标签内有信息
的
网站上
抓取
数据
。我感兴趣
的
唯一
数据
是contact,它位于相同
的
P
标记
中。
如何
才能获得所需
的
数据
?
浏览 0
提问于2020-01-12
得票数 1
回答已采纳
2
回答
正则表达式[^<^>]*最多匹配6个字符;不匹配7个字符?
、
我一直在使用regexpal来测试我
的
正则表达式,我不明白为什么我现在测试
的
这个表达式失败了。(<
p
>\s*(?:(?:<font[^>]*>)*?(?:<a[^>]*>)*?(?:<strong[^>]*>)*?(?:</font>)*?(?:</a>)*?(?[^<
浏览 0
提问于2013-12-21
得票数 0
1
回答
:
删除
或忽略一个子元素?
、
、
因此,我有一个网站,我想刮,结构如下:// and so on...gets me th
浏览 2
提问于2016-12-18
得票数 0
回答已采纳
1
回答
在自定义适配器中,我必须设置
的
文件
的
title属性在哪里?
在我
的
适配器getDocContent()中,我从URL中检索文件,并将内容设置为响应
的
OutputStream,如。 因此,我想“我必须设置文件
的
title属性在哪里?这只是一个内容。”正如我所想
的
那样,在GSA搜索API上,文件不会被它
的
标题击中。也按文件扩展名筛选器。
浏览 2
提问于2016-03-16
得票数 0
2
回答
strip_tags -只
删除
特定
的
标记
(以及它们
的
内容)?
、
、
我使用strip_tags()函数,但我需要
删除
一些
标记
(以及它们
的
所有内容)。例如: <
p
class="test"> </
p
> Test B <div> </div>比方说,我需要去掉
P
和SPAN<
浏览 4
提问于2012-06-23
得票数 9
回答已采纳
2
回答
jQuery:从HTML页面获取所有链接,除非链接属于特定
的
类或id
、
、
、
<li><a href="#">Link2</a> </ul><div></div> <
p
><a href="#">Link5</a> </
p</em
浏览 2
提问于2015-12-13
得票数 2
回答已采纳
2
回答
如果要使用结构化
数据
标记
(JSON),是否应该
删除
描述/关键字元
标记
?
、
、
、
、
我为我
的
小企业运行一个静态HTML网站。它是在Artisteer 4中设计
的
,基本
的
HTML来自于它。如果我想使用结构化
数据
标记
(准确地说是JSON),我应该
删除
meta name=description和meta name=keywords吗?另一个问题是,我
的
设计软件提供了使用自定义元
标记
的
选项;这些
标记
会与JSON冲突吗? 页面中有一些开放图形标签!
浏览 0
提问于2018-12-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大数据是如何抓取个人信息的
删除的数据为什么能够被恢复?
如何让网站的图片快速被百度图片抓取?
删除的文件如何恢复?文件被误删除怎么办?
如何为你的机器学习项目抓取网页数据?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券