腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
提取
正
文中
的
所有
文本
/
p
标签
、
、
、
、
我
的
主要任务是
提取
以下名为“sample.xml”
的
XML文件中body标记
的
p
标记中
的
所有
文本
:<
p
>Vaaleissa ovat ehdokkaina <Person>Tuula Haatainen</Person>
浏览 32
提问于2021-02-13
得票数 0
回答已采纳
1
回答
用正则表达式
提取
文本
的
副词
、
我有一个
文本
,我想用regex
提取
文本
的
部分。例如,案文: widely <label>attractive(10)</
p
> 如果
标签
标签
之间存在部分,我想要
提取
标签
标签
之间
的
所有
文
浏览 1
提问于2013-12-13
得票数 0
回答已采纳
2
回答
如何从推
文中
仅
提取
英文HashTag
、
我正在使用twitter流API来获取实时
的
tweet,并且我正在检查lang。我正在从这些推
文中
提取
hashtags,但问题是当我从推
文中
提取
标签
时,我得到了英语和非英语
的
标签
。在获取tweettext.My
文本
以
提取
标签
之后,有没有办法从特定
的
tweettext代码中仅
提取
英文
标签
private String getHashTag(Stri
浏览 0
提问于2016-01-13
得票数 0
1
回答
scrapy :如何获取标题后面的
所有
段落?
、
、
我想
提取
所有
有标题
的
标签
文本
。</
p
> <
p
>My Second paragraph.</
p
> <a> There might be something else in middle </a&g
浏览 0
提问于2021-05-13
得票数 0
1
回答
NLTK中单个单词
的
标记
、
、
是否有一个
标签
可以在任何上下
文中
为一个单词返回一个
标签
? 我
的
要求是,我需要从非结构化
文本
中
提取
单词,在这些
文本
中,句子不会有结构化语法。POS taggers是用来处理句子
的
,并根据该句子中单词
的
上下文返回一个单词
的
标签
。因此,我要么必须使用另一个
标签
,为特定
的
单词每次给出相同
的
标记,要么在分块时使用
所有
可能
的</em
浏览 1
提问于2015-03-19
得票数 1
回答已采纳
3
回答
Jquery:如何
提取
两个HNs
标签
之间
的
所有
段落?
我需要
提取
2个HN之间
的
文本
普通文档是这样创建
的
:<
p
>paragraph 1</
p
><
p
>paragraph3</
p
> <
p<
浏览 0
提问于2019-08-12
得票数 2
1
回答
使用xpath过滤<script>中
的
文本
、
、
<div> <script>...</script> <script>...</script></div> 我想
提取
这个like:'string(/&
浏览 2
提问于2020-10-28
得票数 0
2
回答
如何在PHP中格式化纯
文本
的
简单HTML DOM解析器?
、
、
、
我正在尝试
提取
纯
文本
形式
的
网页内容--没有html
标签
。当然,HTML被删除了,但是句子经常合并到其他句子中,因为没有空格或句号来分隔来自一个HTML
标签
的
文本
结束
的
地方,以及来自下一个
标签
的
文本
开始
的
地方。="
P
">this is another paragraph</div> </body>
浏览 25
提问于2019-01-18
得票数 0
回答已采纳
1
回答
BS4抓取
所有
内容栏<h2>
标签
、
我目前正在写一个刮板卡在最后一点,讽刺
的
是,它看起来应该是最容易
的
。html是一个小弹出窗口,包含以下代码结构。saaa" value="000" /></html> 我希望
提取
的
这是
文本
我想<em
浏览 8
提问于2017-02-09
得票数 0
1
回答
情感分析中
的
软件
、
总之,我们有三种类型:
正
、中性、负。如果我在最后一层应用Softmax,我将得到每一篇文章
的
每一个类
的
概率。我们知道在Softmax中:我
的
问题是:假设我们有一个正面
标签
的
文本
。那么,我们是否必须按照这样
的
顺序得到这些概率:
浏览 0
提问于2021-11-27
得票数 1
回答已采纳
1
回答
如何从网站页面中
提取
文本
?
、
、
、
、
我试图从一些网站
的
网页中
提取
文本
,其HTML代码如下所示。对不起,我是个新手,不知道如何在HTML.The代码中选择一个特定
的
代码块,我在下面写
的
代码块与上面提到
的
实际代码块有点匹配。我正在尝试
提取
p
标记中
的
文本
以及h3下
的
strong标记中
的
文本
,并保持
文本
的
顺序,就像网站
的
page.Upon检查每个网页一样
浏览 5
提问于2022-03-09
得票数 0
回答已采纳
2
回答
如何在HAMLC注释中注释一行
、
、
、
、
想知道如何在HAMLC中注释一行。我试过但不起作用。它创建了一个<div> this is commented out </div>,在HAMLC上找不到很多资源。
浏览 5
提问于2015-09-25
得票数 0
回答已采纳
1
回答
使用BeautifulSoup
提取
带有嵌入链接
的
文本
、
、
、
我正在尝试
提取
一篇web文章
的
文本
,其中包含链接作为
文本
的
一部分。这方面的一个例子是:which</
p
>table.findAll('
p
', t
浏览 5
提问于2018-01-09
得票数 1
回答已采纳
1
回答
如何使用PHP (preg_match_all)从引号“content”中
提取
内容
、
我
正
试着从一个网站上
提取
一些信息。<
p
class="review"> "Desired text3" </
p
>事实上,我试过这个,但它根本行不通! preg_match_all('|<
p
class=\"adr
浏览 1
提问于2019-03-05
得票数 1
2
回答
Selenium不能
提取
文本
、
、
、
我
正
试着从这一页中
提取
一些
文本
。特别是,我想
提取
标签
之间
的
文本
。我使用Selenium和下面的代码,但是即使识别了对象,
文本
也是一个空字符串。下面是我使用
的
代码:你认为这会是什么问题?
浏览 13
提问于2022-04-14
得票数 1
回答已采纳
2
回答
仅剪贴式正文
文本
、
、
、
我尝试使用python Scrapy从正
文中
抓取
文本
,但还没有成功。 希望一些学者能够在这里帮助我从<body>标记中抓取
所有
的
文本
。
浏览 1
提问于2011-03-22
得票数 9
回答已采纳
1
回答
如何在android上
提取
xml
的
所有
文本
形式
的
特定标记
、
、
假设我有包含.xml文件
的
<root> <item> <
p
>text 2</
p
> <item><
p
&
浏览 4
提问于2014-04-24
得票数 0
回答已采纳
3
回答
使用BeuatifulSoup
提取
除其他
标签
外
的
div
标签
的
内容
、
我有下面的HTML内容,其中div
标签
看起来像下面 <div class="block">aaa <
p
> ccc</
p
> </div> 从上面我想
提取
文本
只作为"aaa“,而不是其他
标签
的
内容。当我这么做
的
时候 soup.find('div
浏览 35
提问于2020-11-17
得票数 0
回答已采纳
2
回答
Python正则表达式并多次查找
、
我想在我
的
文本
中找到
所有
的“文章”内容。两篇文章之间可能有一个“章节”,但现在我通过了它。这是我
的
文本
(没有\n): re.findall(r"""Article\s(?
P
<number>\d+)(?
P
<content&g
浏览 5
提问于2012-01-14
得票数 1
回答已采纳
5
回答
如何使用PHP从HTML文件中
提取
所有
文本
?
、
、
、
、
如何从HTML文件中
提取
所有
文本
但是,我不想
提取
样式和脚本标记之间
的
文本
现在,我有以下代码这很好用,但是它检索我不想检索
的
脚本和样式
标签
,以及另一个问题,我不确定它是否像alt那样检索属性,因为strip_tags函数可能会删除
所有
HTML
浏览 0
提问于2009-10-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
简单几行代码提取html文件中全部指定标签内的文本
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
Python爬虫教程:简书文章的抓取与存储
入门 NLP 项目前,你必须掌握哪些理论知识?
享学课堂浅谈Python3中BeautifulSoup的使用方法
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券