腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Perl
HTML
::
Element
如何
使用
look_down
提取
匹配
标记
后
的
下一个
标记
、
我正在
使用
HTML
::TreeBuilder来处理
HTML
文件。在这些文件中,我可以有定义列表,其中有术语"Database“和定义"Database Name”。模拟
的
html
如下所示: #!/usr/bin/
perl
-w use warnings;use feature qw( say ); my::TreeBuilder-
浏览 19
提问于2020-01-25
得票数 0
回答已采纳
3
回答
如何
在
html
树中向上移动节点并
提取
链接?
、
我知道我
的
题目不是那么描述性
的
,但让我在这里解释一下。} my @td_tag = $_[0]->
look_down</e
浏览 5
提问于2012-09-13
得票数 7
1
回答
perl
:返回数组或undef
的
循环函数
我正在为这个问题寻找合适
的
perl
-主义。我可以解决这个问题,但我得问问.foreach my $tag ( @{ $head->
look_down
('_tag', 'link') }
浏览 0
提问于2014-06-27
得票数 1
回答已采纳
2
回答
使用
HTML
::元素
提取
Unicode十六进制字符串
、
、
我在
Perl
中
使用
HTML
::TreeBuilder从
html
标记
中
提取
一些文本。然后,我
使用
$tree->
look_down
方法获取我想要
的
标记
。然而,我返回
的
文本可以是几种不同
的
语言,包括非拉丁字符.如果我这样做,我将得到字符
的
unicode十六进制字符串(如ْ),但也会得到
html
标记
(例如div
浏览 0
提问于2015-09-24
得票数 0
回答已采纳
1
回答
如何
最好地基于<br <div>
标记
解析/拆分<div>
HTML
::TreeBuilder /
HTML
::
Element
,但我不知道
如何
获取内容。我可以为'br‘
标记
执行一个
look_down
,但它只返回<br />
标记
本身。这并不奇怪,因为<br>元素不能包含内容,但我不知道应该
使用
什么语法。my $tree =
HTML
::TreeBuilder->new(); my @content = $tree->parse($
浏览 0
提问于2015-09-21
得票数 4
回答已采纳
3
回答
Perl
HTML
::TreeBuilder类“包含”条件
、
我试图
使用
Perls
HTML
::TreeBuilder从
HTML
页面中
提取
数据。我
的
选择器包括以下内容:但是,我要寻找
的
div有多个类,其中一个是
使用
这段代码,我无法找到div,需要列出类
的
所有才能成功
匹配
。是否有任何方法可
浏览 2
提问于2013-03-10
得票数 2
回答已采纳
3
回答
使用
Perl
解析
html
、
、
我有以下
HTML
- <strong>Date: </strong></div>for ( $tree->
look_down</em
浏览 2
提问于2011-07-21
得票数 1
回答已采纳
1
回答
HTML
::TagFilter根据类删除div
、
、
我正在尝试
使用
perl
脚本从服务器上
的
静态
html
文件中
提取
内容。我想
提取
特定div
的
内容。我知道div
的
类名("getme")。我可以
使用
HTML
::TreeBuilder->
look_down
找到div。
如何
删除div标签而只访问其中
的
内容?</div>
Perl</
浏览 0
提问于2012-05-30
得票数 1
回答已采纳
2
回答
Web crawler文本格式设置
、
、
我有以下代码来访问
HTML
表。my $table = $tree->
look_down
(_tag => "table", id => "moduleDetail");my @array; my $tree = <em
浏览 0
提问于2012-04-07
得票数 0
回答已采纳
1
回答
Perl
HTML
解析器
、
我在解析
HTML
文件时遇到了一些困难。这里是
HTML
文件
的
一部分,我想
提取
网站
的
名称:<span class="bold1">Name: </span>www.facebook.com<br /> <span class="bol
浏览 3
提问于2011-10-30
得票数 2
回答已采纳
1
回答
使用
HTML
::TreeBuilder在
html
文件中查找值
下面是我在
html
文件中
的
数据。我想
使用
"
html
::TreeBuilder“在
HTML
文件中查找值。cpanel_widget_progress_bar_percent" style="display: none">0</div> </td></tbody> <
浏览 0
提问于2012-09-27
得票数 0
回答已采纳
2
回答
人员描述
的
Web抓取
、
、
我曾尝试为公司管理团队创建一个抓取网络
的
程序。我遇到
的
问题是抓取这个人
的
描述。例如,在脸书
的
页面上,我希望看到马克·扎克伯格
的
描述。然而,由于
HTML
结构
的
所有差异,很难以接近100%
的
准确率来抓取它。我正在
使用
Perl
和许多我认为是高级
的
正则表达式。有没有更好
的
方法/工具来解决这个问题? 我最近
的
一次尝试是找到页面上最后出现的人
的
全名
浏览 4
提问于2010-11-19
得票数 1
1
回答
如何
像ctrl+f一样在按enter键时使输入
匹配
计数器?
、
、
、
我做了搜索和突出显示功能,比如ctrl+f,我正在试图弄清楚
如何
与
html
标记
数组交互。例如,我有下面这行代码,它会滚动到
匹配
用户输入
的
单词
的
第一个
匹配
项,并突出显示它(关键字被包装在<mark>
标记
中): //scroll to searched keywordif(<e
浏览 13
提问于2021-08-06
得票数 2
回答已采纳
4
回答
如何
根据类
提取
HTML
元素?
、
、
我刚刚开始
使用
Perl
,并编写了一个简单
的
脚本来进行一些web抓取。我
使用
WWW::Mechanize和
HTML
::TreeBuilder来完成大部分工作,但我遇到了一些麻烦。我有以下
HTML
: <thead>...所以,我试着:my @data = $tr
浏览 1
提问于2013-07-14
得票数 10
回答已采纳
1
回答
在
Perl
中
使用
HTML
::
Element
look_down
方法
、
我需要解析一个包含不同类型div
标记
的
HTML
文件。<div class=".."> 我认为我必须
使用
look_down
函数,但不知道
如何
区分所提到
的
div
标记
。
浏览 2
提问于2014-05-03
得票数 0
回答已采纳
2
回答
在
使用
WWW::<td>以获取<a>
标记
中
的
<td>时获取<td>文本
、
、
我对
Perl
-
HTML
的
东西很陌生。我正在尝试从
HTML
表中同时获取文本和链接。以下是
HTML
结构: <br></td> 我发现是从<a>部件获取所需内容
的
最简单模块,但我不知道
如何
从<
浏览 2
提问于2010-09-10
得票数 2
回答已采纳
4
回答
Regex:仅当
html
标记
包含特定
的
类id时才
匹配
它
、
在php中
使用
perl
regex
匹配
html
标记
。写下这段代码来
匹配
它: '#<table(.+
浏览 0
提问于2010-07-30
得票数 0
回答已采纳
1
回答
Perl
HTML
:TreeBuilder
标记
不等于
、
、
我
使用
来从
html
文件中
提取
数据。我需要做
的
是:因此,我正在搜索一个不等于'index.
html
‘和另一个
标记
的
href,但是很明显,!=>不是
HTML
::TreeBuilder
的
正确命令。我怎样才
浏览 4
提问于2014-09-13
得票数 0
回答已采纳
1
回答
检查(在
look_down
中)内容
的
使用
HTML
::TreeBuilder,我
使用
命令$root->
look_down
(_tag => 'a')获得第一个锚点。(2)
如何
在
HTML
中找到包含"Hallo“或"hallo”
的
锚?(3)
如何
在中找到不包含&
浏览 1
提问于2014-01-12
得票数 1
回答已采纳
2
回答
表中
的
C#正则表达式
html
表
、
、
、
我
使用
以下正则表达式:从
html
文档中
提取
表格(和标题)。我发现它在我们正在
使用
的
文档(
使用
word转换为过滤
的
html
)中工作得很好,但是我有一个问题,如果表中包含一个表,正则表达式将
匹配
初始表
的
开始
标记
和第二个表
的
结束<e
浏览 0
提问于2011-06-08
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用Python做网页爬虫
极刊・IC 攻城狮需要了解的 Markdown 都在这里
总结 BeautifulSoup
爬虫入门——详解Python是如何进行网页抓取!
PHP资料包
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券