首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何从 .Net 中的许多 HTML 文件中读取 xpath 值?

从 .Net 中的许多 HTML 文件中读取 xpath 值,可以使用以下步骤:

  1. 安装 HtmlAgilityPack 和 System.Xml.XPath.XDocument 库

在 Visual Studio 中,右键单击项目名称,然后选择“管理 NuGet 程序包”。搜索并安装 HtmlAgilityPack 和 System.Xml.XPath.XDocument 库。

  1. 引入相关命名空间

在代码文件中,引入以下命名空间:

代码语言:csharp
复制
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using HtmlAgilityPack;
using System.Xml.XPath;
  1. 编写函数以读取 HTML 文件中的 XPath 值
代码语言:csharp
复制
public static List<string> GetXPathValuesFromHtmlFiles(string folderPath, string xpath)
{
    List<string> xpathValues = new List<string>();

    // 获取文件夹中的所有 HTML 文件
    string[] htmlFiles = Directory.GetFiles(folderPath, "*.html");

    // 遍历 HTML 文件
    foreach (string htmlFile in htmlFiles)
    {
        // 读取 HTML 文件内容
        string htmlContent = File.ReadAllText(htmlFile);

        // 使用 HtmlAgilityPack 解析 HTML
        HtmlDocument htmlDoc = new HtmlDocument();
        htmlDoc.LoadHtml(htmlContent);

        // 使用 XPath 查询
        HtmlNodeCollection nodes = htmlDoc.DocumentNode.SelectNodes(xpath);

        // 如果找到了匹配的节点,则提取 XPath 值
        if (nodes != null)
        {
            foreach (HtmlNode node in nodes)
            {
                xpathValues.Add(node.InnerText);
            }
        }
    }

    return xpathValues;
}
  1. 调用函数并传入 HTML 文件所在文件夹路径和 XPath 查询表达式
代码语言:csharp
复制
string folderPath = @"C:\path\to\html\files";
string xpath = "//div[@class='example']/p";

List<string> xpathValues = GetXPathValuesFromHtmlFiles(folderPath, xpath);

// 输出结果
foreach (string value in xpathValues)
{
    Console.WriteLine(value);
}

这样,您就可以从 .Net 中的许多 HTML 文件中读取 XPath 值了。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 领券