使用Perl中的HTML::TreeBuilder提取特定span类的所有实例

文章/答案/技术大牛

发布

2回答

、、

尝试创建一个Perl脚本来打开HTML文件并提取<span class="postertrip">标记中包含的所有内容。示例HTML： <tbody> <td class="doubledash">>></td> <td

浏览 28提问于2020-06-07得票数 3

回答已采纳

2回答

perl提取</SPAN>和<br>之间的句子

、

我想提取介于SPAN和br之间的句子。我正在尝试使用HTML::TreeBuilder。而且我是perl的新手。任何帮助都将受到欢迎。</p> foreach $line (@lines) # Now create a new tree to parse the HTML from String$str my $tr = HTM

浏览 0提问于2014-01-09得票数 3

2回答

HTML::TreeBuilder::XPath findvalue不起作用

、、、

我尝试从下面的HTML中获取值"Buffalo“：<head>

浏览 1提问于2015-01-30得票数 0

1回答

Perl LWP内存泄漏？

、、

我有一个连续运行的爬虫(使用Perl )，我使用HTML::TreeBuilder对爬行的网页进行提取。我孜孜不倦地删除了我创建的HTML::TreeBuilder的每个实例，但是爬虫的内存占用却缓慢而稳定地上升(我正在看着它以10到30个字节的速度与每一个爬行的页面一起运行(我正在使用Val

浏览 0提问于2012-02-15得票数 0

回答已采纳

1回答

使用Perl解析html只适用于2行，而不适用于多行。

、

我已经编写了以下Perl脚本-<a href="http://foo.com/User">Use

浏览 1提问于2011-10-07得票数 2

回答已采纳

3回答

如何从HTML中提取亚马逊评论？

、

我一直在尝试编写一个perl脚本来废弃amazon并下载产品评论，但我一直无法做到。我一直使用perl模块LWP::Simple和HTML::TreeBuilder::XPath来实现这一点。对于HTML <spanI make a f

浏览 2提问于2015-04-01得票数 1

3回答

在Perl中用HTML替换特定的内联CSS

这是我第一次使用Stack Overflow，所以如果我做错了什么，请让我知道。我目前正在尝试写一个“刮板”，因为缺乏更好的术语，将提取html和替换某些内联CSS样式与HTML的副本。然后，我将使用regex删除所有非基本的HTML标记和所有属性。KISS绝对适用于这里。我读过这个问题：和其他一些关于使用HTML::TreeBuilder和其

浏览 0提问于2009-11-10得票数 3

回答已采纳

1回答

Perl HTML解析器

、

我在解析HTML文件时遇到了一些困难。这里是HTML文件的一部分，我想提取网站的名称：<span class="bold1">Name: </span>www.facebook.com<br

浏览 3提问于2011-10-30得票数 2

回答已采纳

1回答

HTML::TagFilter根据类删除div

、、

我正在尝试使用perl脚本从服务器上的静态html文件中提取内容。我想提取特定div的内容。我知道div的类名("getme")。我可以使用HTML::TreeBuilder->look_down找到div。如何删除div标签而只访问其中的内容？</div><

浏览 0提问于2012-05-30得票数 1

回答已采纳

2回答

如何用Perl解析HTML？

、

我也是编程和学习Perl的新手。abc : 130.65 TB<br>asw : 56.13 TB<br>这是来自网页的示例数据

浏览 0提问于2012-12-27得票数 1

1回答

as_html中的TagParser：

、

我在perl工作$value->as_html()我提取了HTML::TagParser中需要的标记，但现在唯一的选择是：它只给我没有HTML标签的文本或者，我是否可以将HTM

浏览 6提问于2015-07-23得票数 1

回答已采纳

3回答

如何安装perl模块并包含在Perl脚本中？

、

我是Perl的新手。我下载了HTML-TreeBuilder-XPath-0.14.tar.gz，我想知道如何安装它。如何将其包含在我的perl脚本中？我使用run命令打开了cpan，并使用install HTML-TreeBuilder-XPath-0.14命令安装了HTML-TreeBuilder-XPath0.1

浏览 1提问于2014-01-16得票数 2

回答已采纳

3回答

有类似Perl的LWP for Ruby的模块吗？

、、

在Perl中有一个更新这里是一个例子，我已经做了一个函数，从一个特定的网站提取URL。use LWP::

浏览 4提问于2011-11-25得票数 7

回答已采纳

1回答

perl -使用合成脚本时出现解析错误

、、

当我使用这个脚本时，它工作得很好我使用HTML::TreeBuilder来解析站点中的htmluse LWP::Simple;my $base; my $p = HTML::Tr

浏览 2提问于2018-04-26得票数 1

3回答

使用Perl解析html

、、

我有以下HTML- <strong>Date: </strong></div> 我一直在使用HTML::TreeBuilder来解析出html中使用标记或类的特定部分，但是前面提到的html让我很难只提取日期。look_down( '_tag&#

浏览 2提问于2011-07-21得票数 1

回答已采纳

4回答

使用HTML::TreeBuilder从HTML中提取文本

、、、、

我试图访问.html文件并提取<p>标记中的文本。从逻辑上讲，下面的代码应该可以工作。通过使用HTML::TreeBuilder。我解析html，然后使用<p> (“p”)在find_by_attribute中提取文本。但是我的脚本中出现了空目录。我漏掉什么了吗？use

浏览 6提问于2011-12-19得票数 0

回答已采纳

1回答

搜索并替换特定标记之间的内容

、

/usr/bin/perluse warnings; <html> <style> </html>$html=~s/classname/NEW/g;这在两个地方都取代了cl

浏览 3提问于2014-11-25得票数 1

回答已采纳

3回答

如何使用perl从html网页中提取特定信息

、

如果需要从一个html网页中提取"XYZ 81.6 (-0.1)“的信息，如何使用perl来实现？非常感谢。

浏览 0提问于2011-06-23得票数 3

1回答

用于提取链接的HTML* Treebuilder XPath*

、、、

我正在写一个基本的脚本，只是从一个网页上提取所有的链接。它是用Perl编写的，并利用了WWW::Mechanize和HTML::Treebuilder::Xpath模块，这两个模块我都是通过CPAN安装的。因此，脚本将解析整个web页面，并检查每个锚标记的href属性，提取链接并将其打印到控制台/将其写入文件。请注意，在下面的脚本中，我没有使用use strict，因为我

浏览 1提问于2012-07-31得票数 5

回答已采纳

1回答

驼鹿类

、

我想从WWW::Mechanize创建一个类，它使用WWW::Mechanize::TreeBuilder角色，如果主代码位于同一个模块文件中，那么这个类可以很好地工作。' => {}; is => 'ro', isa => 'JSON它以不同<

浏览 1提问于2016-04-28得票数 2

点击加载更多