情景:我发现很难从网站中提取特定的文本。
iMacros网站()上用于从iMacros中提取变量的模板示例如下:
TAG POS=1 TYPE=SPAN ATTR=CLASS:bdytxt&&TXT:* EXTRACT=HTM
但是,在下面的html代码中,特定元素<a href="..." target="_blank">text1</a>在ATTR部分中没有要指定的类。我正特别尝试从下面的示例中提取text1:
//This code is within an html page
<div class="
我有许多字符串,如果存在的话,我想从字符串中提取一个剧集名称。这里有几个例子
The Case of the Case
(#1.1)
Cameron Diaz/Mark Ronson & Bruno Mars (#40.7)
Cameron Diaz/Smashing Pumpkins (#24.1)
Candice Bergen/Cher (#13.5)
因此,一个完整的行由“剧集名称(#s.e)”组成,其中s是剧集编号,e是剧集编号,但正如您所看到的,有时可能没有剧集/剧集编号,有时可能没有剧集名称。
我有以下正则表达式
(.+ )(?! \(\#[0-9]+\.[0-9]+\))