Perl HTML::Element如何使用look_down提取匹配标记后的下一个标记_如何使用PHP提取HTML输入标记的值_如何使用python提取这个特定的html标记 - 腾讯云开发者社区

、

我正在使用HTML::TreeBuilder来处理HTML文件。在这些文件中，我可以有定义列表，其中有术语"Database“和定义"Database Name”。模拟的html如下所示： #!/usr/bin/perl -w use warnings;use feature qw( say ); my::TreeBuilder-

浏览 19提问于2020-01-25得票数 0

回答已采纳

3回答

如何在html树中向上移动节点并提取链接？

、

我知道我的题目不是那么描述性的，但让我在这里解释一下。} my @td_tag = $_[0]->look_down</e

浏览 5提问于2012-09-13得票数 7

1回答

perl:返回数组或undef的循环函数

我正在为这个问题寻找合适的perl-主义。我可以解决这个问题，但我得问问.foreach my $tag ( @{ $head->look_down('_tag', 'link') }

浏览 0提问于2014-06-27得票数 1

回答已采纳

2回答

使用HTML：：元素提取Unicode十六进制字符串

、、

我在Perl中使用HTML::TreeBuilder从html标记中提取一些文本。然后，我使用$tree->look_down方法获取我想要的标记。然而，我返回的文本可以是几种不同的语言，包括非拉丁字符.如果我这样做，我将得到字符的unicode十六进制字符串(如ْ)，但也会得到html标记(例如div

浏览 0提问于2015-09-24得票数 0

回答已采纳

1回答

如何最好地基于<br <div>标记解析/拆分<div>

HTML::TreeBuilder / HTML::Element，但我不知道如何获取内容。我可以为'br‘标记执行一个look_down，但它只返回<br />标记本身。这并不奇怪，因为<br>元素不能包含内容，但我不知道应该使用什么语法。my $tree = HTML::TreeBuilder->new(); my @content = $tree->parse($

浏览 0提问于2015-09-21得票数 4

回答已采纳

3回答

Perl HTML::TreeBuilder类“包含”条件

、

我试图使用Perls HTML::TreeBuilder从HTML页面中提取数据。我的选择器包括以下内容：但是，我要寻找的div有多个类，其中一个是使用这段代码，我无法找到div，需要列出类的所有才能成功匹配。是否有任何方法可

浏览 2提问于2013-03-10得票数 2

回答已采纳

3回答

使用Perl解析html

、、

我有以下HTML- <strong>Date: </strong></div>for ( $tree->look_down</em

浏览 2提问于2011-07-21得票数 1

回答已采纳

1回答

HTML::TagFilter根据类删除div

、、

我正在尝试使用perl脚本从服务器上的静态html文件中提取内容。我想提取特定div的内容。我知道div的类名("getme")。我可以使用HTML::TreeBuilder->look_down找到div。如何删除div标签而只访问其中的内容？</div>Perl</

浏览 0提问于2012-05-30得票数 1

回答已采纳

2回答

Web crawler文本格式设置

、、

我有以下代码来访问HTML表。my $table = $tree->look_down(_tag => "table", id => "moduleDetail");my @array; my $tree = <em

浏览 0提问于2012-04-07得票数 0

回答已采纳

1回答

Perl HTML解析器

、

我在解析HTML文件时遇到了一些困难。这里是HTML文件的一部分，我想提取网站的名称：<span class="bold1">Name: </span>www.facebook.com<br /> <span class="bol

浏览 3提问于2011-10-30得票数 2

回答已采纳

1回答

使用HTML::TreeBuilder在html文件中查找值

下面是我在html文件中的数据。我想使用" html ::TreeBuilder“在HTML文件中查找值。cpanel_widget_progress_bar_percent" style="display: none">0</div> </td></tbody> <

浏览 0提问于2012-09-27得票数 0

回答已采纳

2回答

人员描述的Web抓取

、、

我曾尝试为公司管理团队创建一个抓取网络的程序。我遇到的问题是抓取这个人的描述。例如，在脸书的页面上，我希望看到马克·扎克伯格的描述。然而，由于HTML结构的所有差异，很难以接近100%的准确率来抓取它。我正在使用Perl和许多我认为是高级的正则表达式。有没有更好的方法/工具来解决这个问题？我最近的一次尝试是找到页面上最后出现的人的全名

浏览 4提问于2010-11-19得票数 1

1回答

如何像ctrl+f一样在按enter键时使输入匹配计数器？

、、、

我做了搜索和突出显示功能，比如ctrl+f，我正在试图弄清楚如何与html标记数组交互。例如，我有下面这行代码，它会滚动到匹配用户输入的单词的第一个匹配项，并突出显示它(关键字被包装在<mark>标记中)： //scroll to searched keywordif(<e

浏览 13提问于2021-08-06得票数 2

回答已采纳

4回答

如何根据类提取HTML元素？

、、

我刚刚开始使用Perl，并编写了一个简单的脚本来进行一些web抓取。我使用WWW::Mechanize和HTML::TreeBuilder来完成大部分工作，但我遇到了一些麻烦。我有以下HTML： <thead>...所以，我试着：my @data = $tr

浏览 1提问于2013-07-14得票数 10

回答已采纳

1回答

在Perl中使用HTML::Element* look_down方法*

、

我需要解析一个包含不同类型div标记的HTML文件。<div class=".."> 我认为我必须使用look_down函数，但不知道如何区分所提到的div标记。

浏览 2提问于2014-05-03得票数 0

回答已采纳

2回答

在使用WWW：：<td>以获取<a>标记中的<td>时获取<td>文本

、、

我对Perl-HTML的东西很陌生。我正在尝试从HTML表中同时获取文本和链接。以下是HTML结构： <br></td> 我发现是从<a>部件获取所需内容的最简单模块，但我不知道如何从<

浏览 2提问于2010-09-10得票数 2

回答已采纳

4回答

Regex:仅当html标记包含特定的类id时才匹配它

、

在php中使用perl regex匹配html标记。写下这段代码来匹配它： '#<table(.+

浏览 0提问于2010-07-30得票数 0

回答已采纳

1回答

Perl HTML:TreeBuilder标记不等于

、、

我使用来从html文件中提取数据。我需要做的是：因此，我正在搜索一个不等于'index.html‘和另一个标记的href，但是很明显，!=>不是HTML::TreeBuilder的正确命令。我怎样才

浏览 4提问于2014-09-13得票数 0

回答已采纳

1回答

检查(在look_down中)内容的

使用HTML::TreeBuilder，我使用命令$root->look_down(_tag => 'a')获得第一个锚点。(2)如何在HTML中找到包含"Hallo“或"hallo”的锚？(3)如何在中找到不包含&

浏览 1提问于2014-01-12得票数 1

回答已采纳

2回答

表中的C#正则表达式html表

、、、

我使用以下正则表达式：从html文档中提取表格(和标题)。我发现它在我们正在使用的文档(使用word转换为过滤的html)中工作得很好，但是我有一个问题，如果表中包含一个表，正则表达式将匹配初始表的开始标记和第二个表的结束<e

浏览 0提问于2011-06-08得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云