首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Powershell :拆分HTML

Powershell :拆分HTML
EN

Stack Overflow用户
提问于 2017-01-20 09:10:11
回答 1查看 1.3K关注 0票数 1

我有一个自己生成的HTML文件(在本地目录中),所有的主体都在一行上:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<html><head><META http-equiv="Content-Type" content="text/html; charset=UTF-8"><title>server - path</title></head><body><H1>server - path</H1><hr>

<pre><A HREF="/logs/folder/">[To Parent Directory]</A><br><br>         jeudi 5 janvier 2017    19:38       116483 <A HREF="/folder/file1.csv">file1.csv</A><br>         jeudi 5 janvier 2017    19:39       138397 <A HREF="/folder/file2.csv">file2.csv</A></A><br></pre><hr></body></html>

我需要提取文件的名称和日期。我成功地读到了正确的一行。但我被阻止在<br>上拆线。

我尝试这样做:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$string = "first line<br>second line <br> third line<br> end<br>"
write-host $string
$separator = "<br>"
$option = [System.StringSplitOptions]::RemoveEmptyEntries
$string.Split($separator, $option)

但我有这样的结果:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
first line<br>second line <br> third line<br> end<br>
fi
st line
second line
thi
d line
end

我看到了HTML Agility Pack,但在我的示例中,我的页面中没有任何标记。

你有什么建议吗?谢谢!

EN

回答 1

Stack Overflow用户

发布于 2017-01-20 09:34:22

String.Split() method接受字符串<br>并将其视为[char]数组,在每次出现<br>时进行拆分。

改用基于正则表达式的-split运算符:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
PS C:\> $String -split $separator |Where-Object {$_}
first line
second line 
 third line
 end

Where-Object {$_}管道元素将过滤出空字符串

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41759827

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文