从 .Net 中的许多 HTML 文件中读取 xpath 值,可以使用以下步骤:
在 Visual Studio 中,右键单击项目名称,然后选择“管理 NuGet 程序包”。搜索并安装 HtmlAgilityPack 和 System.Xml.XPath.XDocument 库。
在代码文件中,引入以下命名空间:
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using HtmlAgilityPack;
using System.Xml.XPath;
public static List<string> GetXPathValuesFromHtmlFiles(string folderPath, string xpath)
{
List<string> xpathValues = new List<string>();
// 获取文件夹中的所有 HTML 文件
string[] htmlFiles = Directory.GetFiles(folderPath, "*.html");
// 遍历 HTML 文件
foreach (string htmlFile in htmlFiles)
{
// 读取 HTML 文件内容
string htmlContent = File.ReadAllText(htmlFile);
// 使用 HtmlAgilityPack 解析 HTML
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(htmlContent);
// 使用 XPath 查询
HtmlNodeCollection nodes = htmlDoc.DocumentNode.SelectNodes(xpath);
// 如果找到了匹配的节点,则提取 XPath 值
if (nodes != null)
{
foreach (HtmlNode node in nodes)
{
xpathValues.Add(node.InnerText);
}
}
}
return xpathValues;
}
string folderPath = @"C:\path\to\html\files";
string xpath = "//div[@class='example']/p";
List<string> xpathValues = GetXPathValuesFromHtmlFiles(folderPath, xpath);
// 输出结果
foreach (string value in xpathValues)
{
Console.WriteLine(value);
}
这样,您就可以从 .Net 中的许多 HTML 文件中读取 XPath 值了。
领取专属 10元无门槛券
手把手带您无忧上云