我需要读取html文件并将内容解析为字符串。
从这里开始
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="utf-8">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta http-equiv="x-ua-compatible" content="ie=edge">
<meta name="viewport" content="width=device-width, initial-scale=1">
<title>Index</title>
</head>
<body>
Index
</body>
</html>到这样的输出
$stringValue = "<!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML 1.0 Transitional//EN\"\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\">"...我尝试过使用$stringValue = $htmlFile | ConvertTo-Json,但它将一些字符转换为新代码(> = u003e),其中我希望保持特殊字符不变。
任何帮助都是非常感谢的。
发布于 2017-11-15 12:16:04
您可以使用下面的命令获取html文件的内容,并且可以将其存储在任何字符串变量中,如下所示。
[string]$Datas = Get-Content [HTML_file_Location]发布于 2017-11-15 12:13:51
试着把它读成UTF-16,看看输出是否按需要传递.这个答案显示了如何将其解读为UTF-16。
Reading a "string in little-endian UTF-16 encoding" with BinaryReader
https://stackoverflow.com/questions/47306996
复制相似问题