在C#中使用HtmlAgilityPack解析站点

是一种常见的技术，它可以帮助开发人员从HTML文档中提取数据并进行处理。HtmlAgilityPack是一个开源的.NET库，提供了一组API来解析和操作HTML文档。

HtmlAgilityPack的主要优势包括：

灵活性：HtmlAgilityPack可以处理各种HTML文档，包括不规范的文档。它可以自动修复HTML文档中的错误，并提供了一系列方法来遍历和操作文档的各个部分。
强大的选择器：HtmlAgilityPack支持XPath和CSS选择器，使开发人员能够轻松地定位和提取所需的HTML元素。
数据提取：使用HtmlAgilityPack，开发人员可以从HTML文档中提取所需的数据，例如链接、表格、图像等。这对于爬虫、数据挖掘和信息提取等应用非常有用。
网页内容分析：HtmlAgilityPack可以帮助开发人员分析网页的结构和内容。通过解析HTML文档，开发人员可以了解网页的布局、标签结构和内容组织，从而更好地理解和处理网页。

在C#中使用HtmlAgilityPack解析站点的步骤如下：

安装HtmlAgilityPack：可以通过NuGet包管理器安装HtmlAgilityPack。在Visual Studio中，右键单击项目，选择“管理NuGet程序包”，搜索并安装HtmlAgilityPack。
导入命名空间：在代码文件中导入HtmlAgilityPack的命名空间，以便可以使用其中的类和方法。例如：using HtmlAgilityPack;
加载HTML文档：使用HtmlWeb类加载要解析的HTML文档。例如：HtmlWeb web = new HtmlWeb(); HtmlDocument doc = web.Load("http://example.com");
使用XPath或CSS选择器定位元素：使用SelectNodes或SelectSingleNode方法结合XPath或CSS选择器来定位所需的HTML元素。例如：HtmlNodeCollection nodes = doc.DocumentNode.SelectNodes("//div[@class='content']");
提取和处理数据：通过遍历和操作HtmlNodeCollection对象，提取和处理所需的数据。例如：foreach (HtmlNode node in nodes) { // 处理节点数据 }

对于C#中使用HtmlAgilityPack解析站点，腾讯云没有直接相关的产品或服务。HtmlAgilityPack是一个第三方库，可以与任何云计算平台或服务器进行集成使用。

在c#中模拟无限滚动以获得页面的完整html

、、

有很多网站使用这种(imo)恼人的“无限滚动”风格。这方面的例子有tumblr、twitter、9gag等网站。最近，我尝试用HtmlAgilityPack程序从这些站点上抓取一些图片。就像这样： HtmlWeb web = new HtmlWeb(); HtmlDocument doc = web.Load(url); var primary = doc.DocumentNode.SelectNodes("//img[@class='badge-item-img']"); var picstring = primary.Select(r => r.

浏览 3提问于2013-07-24得票数 7

2回答

下载页面之前的C# HtmlAgilityPack超时

、

我想用htmlagilitypack解析C#上的站点，我正在尝试这个make string url = "https://russiarunning.com/events?d=run"; var web = new HtmlWeb(); var doc = web.Load(url); 但是我遇到了一个问题-网站内容加载超时约1000ms，因此，当使用web.Load (url)时，我下载了没有内容的页面。如何用htmlagilitypack在下载页面前超时？

浏览 0提问于2019-01-10得票数 0

1回答

需要澄清一下如何开始使用HTML敏捷包

我的背景当涉及到HTML清洗时，我是个新手。自从我用C#为html编写代码以来，已经过去了四年了。我以前用C#编写的另一个代码是用来操作Server数据库中的数据的。我为开始使用HTML (HAP)所做的工作我花了几天的时间试图理解从各种在线资源中找到的关于如何开始使用HTML敏捷包的说明。我到目前为止发现的一些情况如下： Www.4guysrolla.com/半篇文章/011211-1.aspx olussier.net/2010/03/30/easily-parse-html-documents-in-csharp/ stackoverflow.com/questions

浏览 2提问于2013-01-03得票数 2

回答已采纳

1回答

如何在Java中显示网站中的特定文本行？

我正在尝试重新创建一个我用Java制作的C#程序。我在C#程序中使用了htmlagilitypack和XPaths来显示来自网站的文本。有没有Java库可以让我使用XPaths，或者有没有更好的方法？谢谢!

浏览 0提问于2015-10-23得票数 0

2回答

为C#程序员提供更好的web抓取(HTMLAgilityPack或Python+beautifulsoup)选项

、、、

我是一个.NET程序员。我需要在一个网络抓取项目上工作。我想了解一下HTMLAgilityPack和BeautifulSoup的区别。很多人说，BeautifulSoup比HTMLAgilityPack好多了。但要做到这一点，我需要学习Python。所以，我的问题是，对我来说，学习Python和BeautifulSoup或者继续学习C#和HTMLAgilityPack是合理的吗？任何其他建议都是受欢迎的。

浏览 5提问于2012-10-17得票数 2

回答已采纳

1回答

C# HTMLAgilityPack VS用于从HTMLAgilityPack中提取链接的正则表达式

、、、

我正在编写一个C#网络爬虫，当我运行分析时，我可以看到HTMLAgilityPack's LoadHTML方法使用了10%的程序--总体CPU使用量。我想试着降低这个。我确信正则表达式会更快，但是当我查看链接提取示例时，我看到每个人都说应该避免使用像HTMLAgilityPack这样的html解析器。正如我所需要做的那样，从HTML中提取链接就是使用HTMLAgilityPack而不是kill？选择HTML解析器的理由是否适用于我的情况，因为我只使用它来提取链接？下载的HTML与WebClient进行比较。使用href\\s*=\\s*(?:[\"'](?&

浏览 3提问于2017-04-28得票数 1

回答已采纳

1回答

HTMLAgilityPack - XPath -动态表空引用

、、、、

我使用的是HTMLAgilityPack，但是在这个特定的网站上，XPath在应该返回值的时候会返回一个空值。我尝试了各种XPath，但似乎都不起作用。如果有人能找出问题所在。我还想指出的是，网站表格是动态的，如果它有什么不同的话。此外，我在XPath Helper Chrome插件中测试了XPath，它显示了正确的值，但在HTMLAgilityPack中返回null。 string Url = "http://weather.deltixlab.com"; HtmlWeb web = new HtmlWeb(); HtmlDocument doc = web.Load(Ur

浏览 0提问于2017-05-21得票数 0

1回答

如何将httpRequest和HtmlAgilityPack结合使用？

、、、

因此，我试图登录到一个页面，并从页面中获取一些数据，但我的问题是填写这些登录信息。我尝试过什么？在url中发布数据。只需将postname添加到类似于：http://stackoverflow.com?postLogin=myUsername&postPassword=myPassword的值中即可。我用这个网址发送了一个请求。这给了我一个错误。我在浏览器上查了网址。它似乎确实填写了用户名，而不是密码文本框(我已经写了正确的帖子名称)。我还看到有人建议使用HtmlAgilityPack填写数据(标记为“答案”)。但是，经过更多的搜索后，似乎不可能单独使用HtmlAgilityPac

浏览 1提问于2012-11-05得票数 1

1回答

HTMLAgilityPack Asp.net C#错误处理

、、、

Uri url3 = new Uri("http://www.bigpara.com/borsa/gunun-ozeti/"); WebClient client3 = new WebClient(); string html3 = client3.DownloadString(url3); HtmlAgilityPack.HtmlDocument dokuman3 = new HtmlAgilityPack.HtmlDocument(); dokuman3.LoadHtml(html3); 大家好，我想问你们一些关于htmlagilit

浏览 1提问于2013-08-19得票数 0

3回答

计算HTML文件中的所有节点

有没有一种简单的方法来计算HTML文件中的节点？我还需要计算特定类型的节点，比如div等。如果可能的话，我希望在不使用像HTMLAgilityPack这样的外部库的情况下这样做。而且，我正在处理的HTML不能保证格式良好和有效。有没有办法在C#中做到这一点？谢谢。

浏览 0提问于2011-11-07得票数 0

回答已采纳

1回答

如何提取脚本标记中的属性值？

、、、、

General 我目前正在使用HTML和Javascript，以便使用网站的变化值(温度、股票价值、货币汇率、.)对于C#应用程序。 (我故意忽略了。) 规范我有一个网站和它的源代码。我想要的值在脚本标记中。 <script type="text/ng-template" id="TmplLiveEventDetails"> <div class="lii-progress"> <span ng-bind="liveEvent.eventStateText"></

浏览 1提问于2016-10-26得票数 3

2回答

使用C#在html文档中抓取JavaScript动态生成的数据

、、、、

如何使用C#在html文档中抓取由JavaScript动态生成的数据？使用C#库中的WebRequest和HttpWebResponse，我能够以字符串的形式获得整个C#源代码，但困难的是，我需要的数据并不包含在源代码中；这些数据是由JavaScript动态生成的。另一方面，如果我想要的数据已经在源代码中，那么我可以使用正则表达式轻松地获取它们。我已经下载了HtmlAgilityPack，但我不知道它是否能处理由JavaScript动态生成项目的情况…… 非常感谢!

浏览 2提问于2014-06-10得票数 11

回答已采纳

1回答

做某事之前，C#检查节点

、

我正在寻找大约一个小时，但显然我的搜索技能不是最好的，所以我必须在这里问我的问题。我正在使用htmlAgilityPack，我选择了这样的日期 HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument(); HtmlAgilityPack.HtmlDocument htmlDocTDs = new HtmlAgilityPack.HtmlDocument(); HtmlAgilityPack.HtmlDocument htmlDocLink = new HtmlAgilityPa

浏览 4提问于2016-03-04得票数 0

回答已采纳

1回答

如何获取/抓取HTML文本和图像到Windows phone？

、、

您好，我想知道，如何在Windows phone中抓取列表(ul，li)中的HTML站点的文本。我想做一个rss阅读器。请详细说明，我是新来的HTMLAgilityPack。谢谢。

浏览 1提问于2013-08-16得票数 0

1回答

有在Windows 7中解析HTML的库吗？

、、、

我正在寻找一个好的C#的Windows 7的HTML解析器。HTMLAgilityPack给Windows 7带来了一些问题，请回复。

浏览 1提问于2012-06-05得票数 1

2回答

模拟点击html？

、

我正在使用HtmlAgilityPack从这个中获取一些足球事件。我正在捕捉的事件在All选项卡中。从本质上讲，我所做的就是得到所有事件所在的表，如下所示： string url = "http://it.soccerway.com/"; string data = new WebClient().DownloadString(url); var doc = new HtmlDocument(); doc.LoadHtml(data); var table = doc.DocumentNode.SelectSingleNode("//table[@class='

浏览 7提问于2016-09-02得票数 1

回答已采纳

1回答

使用XPATH的HtmlAgilityPack槽

、、

我有一段html，我正在尝试使用HtmlAgilityPack进行解析。下面是我感兴趣的代码(很抱歉使用了一张图片，但它更清晰，更清楚地显示了我想要的要点)：我想做的事情很简单，但我想不出来。我想要的是选择在图像中高亮显示的div和id = content。要在HtmlAgilitypack中使用c#来完成这一任务，我将使用： HtmlDocument doc = new HtmlDocument(); //creating HtmlAgilityPack document doc.LoadHtml(htmlstring); //loading html var content

浏览 4提问于2014-03-22得票数 0

回答已采纳

1回答

使用HtmlAgilityPack解析网站不会返回在浏览器上看到的值

、

在解析站点时，https://holfuy.com/en/weather/1284 HtmlAgilityPack返回"-“以获取相关数据。 string url = "https://holfuy.com/en/weather/1284"; var web = new HtmlWeb(); web.PreRequest += request => { request.CookieContainer = new System.Net.CookieContainer(); return true;

浏览 30提问于2021-03-29得票数 0

回答已采纳

3回答

HtmlAgilityPack登录后

、、

我正在尝试使用HtmlAgilityPack (站点：)登录站点。现在，我不知道该怎么做。我尝试通过以下方式设置Html表单值 m_HtmlDoc.DocumentNode.SelectSingleNode("//input[@name='EMAIL']").SetAttributeValue("value", "myemail.com"); 然后，我提交表单， m_HtmlWeb.Load("http://example.com/", "POST"); 不过，这是行不通的。它不是在登录或者其他

浏览 0提问于2011-06-30得票数 20

回答已采纳

4回答

使用C#和.NET框架进行屏幕抓取、Web抓取、Web获取、Web数据提取等

、、、、

我正在开发一个用于网络采集、网络抓取、网络数据提取、屏幕抓取等功能的Microsoft .NET Application in C#，不管你怎么称呼它。对于解析HTML，我尝试合并HTML，但它并不像我想象的那么简单。我已经包括了一些规格和图像，我有到目前为止，并希望得到您的意见，我可以继续下去。基本上，我想做一些类似于Visual开膛手使用的布局，但我不知道他们是如何做到的。有什么想法吗？ Specifications: 我的目标是使一个非常用户友好的点击式应用程序下载数据和图像从网上。我希望使用web浏览器加载HTML页面，并将分析过的数据和图像链接输出到文本框中。用户可以指定需要哪些HT

浏览 6提问于2012-02-28得票数 3

回答已采纳

1回答

如何从网页中拉出字符串并显示出来？

、、、

我想在C#中制作一个桌面天气应用程序。我要它把天气从weather.com拉出来。我对这门学科很陌生。我正在使用HtmlAgilityPack.dll。我尝试了以下代码来提取今天的天气(度)： string webUrl = "http://www.weather.com/weather/today/l/90025:4:US"; HtmlWeb HTMLweb = new HtmlWeb(); HtmlAgilityPack.HtmlDocument doc = HTMLweb.Load(webUrl); string degrees = doc.DocumentNode.Se

浏览 7提问于2015-04-18得票数 0

回答已采纳

1回答

我在url上获取WebException，为什么呢？

我有这样的代码： private List<string> webCrawler(string url, int levels) { HtmlAgilityPack.HtmlDocument doc; HtmlWeb hw = new HtmlWeb(); List<string> webSites; List<string> csFiles = new List<string>(); csFiles.Add

浏览 2提问于2012-09-11得票数 0

回答已采纳

1回答

使用WebClient仅获取一个表

、

所以我一直在尝试自学C#，这里的很多东西都很有帮助。我已经完成了一些基础工作，现在我正在尝试使用WebClient和HtmlAgilityPack。因此，当我在寻找一个可以处理数据的网站时，我找到了NWS每小时的预报(波士顿被选为随机城市)：有没有办法只抓桌子？现在我得到了整个网站，如果我只得到这个表，似乎玩起来会更容易。谢谢!

浏览 1提问于2013-02-24得票数 1

回答已采纳

1回答

HtmlAgilityPack中的NullReferenceException

、

我正在尝试使用xpath从下面提到的url中提取link string url = "http://www.album-cover-art.org/search.php?q=Ruin+-+Live+Album+Version+Lamb+of+God" 我的代码： HtmlAgilityPack.HtmlWeb web = new HtmlAgilityPack.HtmlWeb(); HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument(); htmlDoc = web.Load(url);

浏览 1提问于2012-04-14得票数 5

回答已采纳

1回答

HtmlAgilityPack节点和属性的所有值的列表

、、、、

因此，我刚刚开始使用HtmlAgilityPack for C#，所以我仍然在学习，并且开始研究如何使用SelectNodes和属性。因此，我看到了一些例子，比如link.Attributes("href")、htmlDoc.DocumentNode.SelectNodes( "//a@href“)等等，但是仅仅通过查看它，我就不知道”//a@href“做了什么，我也无法找到一个列表或文档来说明我可以使用的所有值以及如何使用它们。我已经尝试过搜索我自己，但是我没有找到任何有用的东西，HtmlAgilityPack附带的文档也没有帮助我。我猜更多的是我，只是不知道我在寻

浏览 2提问于2014-02-23得票数 0

回答已采纳

2回答

定位HTML标记

、

我正在尝试自动化web表单的测试。为此，我需要知道如何使用C#在HTML页面中动态定位输入标记，然后为它们赋值。我不想使用XPath，因为每次我都会使用不同的web表单。我希望将web表单的URL传递给Selenium，然后自动填充字段。我听说过HTMLAgilityPack。这对我有帮助吗？如果是这样，我该如何使用它？我很感谢你的帮助。

浏览 1提问于2013-01-17得票数 0

1回答

从HtmlAgilityPack.HtmlDocument中的某个节点获取图像绝对URL

、、、、

我想从互联网上获取一些网页，并使用HtmlAgilityPack在C#中获取页面上某些图像的绝对URL。问题是..。该网站将首先将URL重定向到其他网站，然后<img>标记中的<img>属性是相关的URL。目前，我有这样的代码： using HtmlAgilityPack; HtmlDocument webpageDocument = new HtmlWeb().Load("http://xyz.example.com/"); HtmlNodeCollection nodes = webpageDocument.DocumentNode.Sel

浏览 5提问于2017-04-29得票数 1

1回答

c# htmlagility，页未找到

、

我试着用Htmlagility C#加载以下网站的页面源，它总是返回"Page“，但是当我在普通浏览器(chrome)中打开它时，它会显示所有内容。 HtmlAgilityPack.HtmlWeb web = new HtmlWeb(); HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); doc = web.Load("http://www.alfatah.pk/");

浏览 1提问于2018-11-24得票数 0

回答已采纳

2回答

Html敏捷包实现

、

我目前在汇编中的一个C#程序上工作，我正试图在我的程序中实现谷歌翻译。我意识到我必须在我的程序中使用HTMLAgilityPack才能使它工作。我发现和是HTMLAgilityPack，但是当他说 1)构建HTMLAgilityPack解决方案。 2)在您的应用程序中，在HTMLAgilityPack\Debug (或Realease) \bin文件夹中添加对HTMLAgilityPack.dll的引用。我不知道他想让我做什么。到目前为止，我已经下载并解压缩了HTMLAgilityPack文件夹。在文件夹中，我有以下文件： Net20, Net40, Net40-client, Net45,

浏览 1提问于2012-09-28得票数 2

回答已采纳

1回答

当HtmlAgilityPack.Document试图加载以exe结尾的链接时，我该怎么办？

这是一项功能： private static HtmlAgilityPack.HtmlDocument getHtmlDocumentWebClient(string url, bool useProxy, string proxyIp, int proxyPort, string usename, string password) { HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); WebClient client = new WebC

浏览 1提问于2012-09-20得票数 0

回答已采纳

1回答

如何在C#中从html中提取信息？

、、、

谁能教我用C#从html中提取信息吗？我正在C#中使用C#类库。我想从中提取主要内容和图像。这是部分网站代码， <html xmlns="http://www.w3.org/1999/xhtml" class="feature_chompcommentimages feature_s3upload feature_switch feature_powwowtest" xmlns:fb="http://www.facebook.com/2008/fbml"> <head> **当天的遗迹:谷歌图像搜索获得知识图

浏览 3提问于2012-07-03得票数 0

回答已采纳

1回答

HTML敏捷包忽略<br>标签

、、、、

我用C#编写了下面的代码来检索网页中表格的内容(在获得权限之后)。它几乎可以完美地工作，但有些单元格包含多个值，如下所示 _______ | 10 | | 11 | | 12 | |___13__| 但是我得到的值是10111213。这里有一个链接，以便您可以在需要时查看表代码，以获得进一步的清晰愿景: ttps://ug3.technion.ac.il/rishum/course/104031 WebClient webClient = new WebClient(); string page = webClient.DownloadString("https

浏览 14提问于2019-10-03得票数 0

2回答

用HttpAgilityPack抓取产品页面-不是所有的产品

、、、

上下文：我正在C#中开发一个桌面应用程序，用于从少数域的单个网页中抓取/分析产品信息。我使用HtmlAgilityPack来捕获和解析页面以获取所需的数据。我为不同的域编码不同的解析规则。发行：一个特定领域的页面，当通过浏览器显示时，可能会显示60-80个产品。然而，当我通过HtmlAgilityPack进行解析时，最多只能得到20个产品。查看Firefox中的原始html“查看页面源”，似乎也只有20个相关的产品div存在。我的结论是，剩余的产品必须通过脚本加载，也许是为了减轻服务器上的负载。事实上，我有时可以在浏览器中看到这种情况，因为在另外20个产品加载时，会有一个短暂的暂停，然后

浏览 1提问于2015-12-10得票数 0

回答已采纳

4回答

如何处理邮件客户端邮件链接中的符号？

、

我有一个ASP.NET/C#应用程序，其中一部分在HTML电子邮件中将WWW链接转换为mailto链接。例如，如果我有一个链接，如： www.site.com 它被重写为：这非常好，直到我遇到带有符号的URL，这会导致主题被截断。例如，链接： www.site.com?val1=a&val2=b 显示为：这正是我想要的，但是当单击时，它会创建一条消息： subject=www.site.com?val1=a 它删除了&val2，因为它是mailto命令中的分隔符。所以，我尝试过其他各种方法来解决这个问题，但都没有成功。我已

浏览 8提问于2009-06-08得票数 8

回答已采纳

1回答

为什么HtmlAgilityPack SelectSingleNode没有找到div

、、、

在现实世界的C#脚本中，我尝试了每个置换(尽管希望有人会告诉我我错过了一个置换)，我理解对于XPath值是可行的，但总是返回null。将其带回到似乎是最简单的SelectSingleNode使用方式，但由于某种原因，它只返回<body>的一个值。因此，医生指定： HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); 这是我第一次研究XPath，而且我对HtmlAgilityPack的经验有限。因此，这无疑是我的一个非常基本的缺点。然而： HtmlAgilityPack.HtmlNode nod

浏览 2提问于2013-11-20得票数 1

回答已采纳

1回答

从html获取特定数据

、

我想从html中获取特定的数据。我在使用c#和HtmlAgilityPack 下面是HTML示例： <p class="heading"><span>Greeting!</span> <p class='verse'>Hi!<br> // Hello!</p><p class='verse'>Hello!<br> // i want to get this g Hi!</p>

浏览 2提问于2014-01-19得票数 1

回答已采纳

2回答

包括引用的程序集，而不必将应用程序放在与引用的程序集相同的目录中

、、

我在我的C# winform应用程序中使用HTMLAgilityPack。我使用Visual Studio从我的硬盘驱动器加载HTMLAgilityPack，作为引用的程序集。然后，我构建我的应用程序并将输出的可执行文件复制到一个新目录。如果HTMLAgilityPack与我的输出可执行文件不在同一目录中，则在尝试运行我的可执行文件时会出现一个错误，指出“找不到引用。”有没有办法将引用嵌入到可执行文件中，这样用户在移动文件时就不需要随身携带HTMLAgilityPack了？我期待你的回复，埃文

浏览 0提问于2011-09-12得票数 2

回答已采纳

1回答

如何解析div，因为我需要在h3标记中进行超链接

、

[你好，开发人员，因为我长期以来一直在解决这个问题，但没有取得任何有成效的结果，这使得我在StackOverflow获得了高级人员的帮助，因为我在c#控制台应用程序中使用HtmlAgilityPack进行web抓取，因为我已经附加了图像，我想解析div，从开始一直到h3标签包含超链接为止，我如何使用HTML敏捷性包来实现它？我尝试过多种解决方案来解析，但没有结果。附加图像也是代码在这里： static string url = "https://www.rozee.pk/job/jsearch/q/all/fc/1184/fin/1/";

浏览 0提问于2019-06-06得票数 0

1回答

C#从HTML解析XML并保存到文件

、、

从C#执行GET之后，它返回嵌入在HTML中的XML代码，类似于以下内容： <!DOCTYPE html> <html lang="en"> <head> <meta name="viewport" content="initial-scale=1, width=device-width"> <title>config</title> </head> <body> <CO

浏览 4提问于2021-02-20得票数 2

回答已采纳

2回答

HtmlAgilityPack -如何理解页面重定向和加载重定向页面

、、

使用HtmlAgilityPack和c# 4.0时，您如何确定页面是否被重定向。我正在使用这个方法来加载页面。 HtmlDocument hdMyDoc = hwWeb.Load(srPageUrl); 和示例重定向结果，我想返回的内部html <meta http-equıv="refresh" content="0;URL=http://www.pratikev.com/fractalv33/pratikEv/pages/home.jsp"> c# 4.0

浏览 0提问于2011-10-16得票数 2

回答已采纳

1回答

c# -解析Html并对行进行排序

我对C#相当陌生，我想解析一个HTML，并根据第一列对行进行排序。下面是一个样本表： <table> <tr> <td> Xyz </td> <td> 123 </td> </tr> <tr> <td> Abc </td> <td> 789 </td> </tr> <tr> <td> Ghi </td&

浏览 4提问于2016-05-13得票数 0

回答已采纳

1回答

不能在多线程中使用HtmlAgilityPack

、、、

我将HtmlAgilityPack与Parallel.Invoke结合使用，特别是我有一个名为Table wich的类包含以下实现： public class Table { HtmlDocument doc = new HtmlDocument(); public void Foo1() { doc.LoadHtml("some html"); } public void Foo2() { doc.LoadHtml("some html"); } public void Fo

浏览 2提问于2018-05-22得票数 0

3回答

如何使用C#在<form></form>之间提取数据

、、、

我曾尝试使用regex来完成此任务，但它似乎根本不起作用。我用PHP，Javascript尝试了同样的正则表达式模式，它的效果非常好。我不知道为什么它不能与C#一起工作。下面是我的代码示例： Regex mysReg = new Regex(@"<form[^>]*action=""do\.php""[^>]*>(.*)<\/form>", RegexOptions.IgnoreCase | RegexOptions.Multiline); MatchCollection f

浏览 1提问于2011-03-23得票数 0

回答已采纳

1回答

抓取包含错误内容的网页时出现问题

、、、

我已经编写了c#代码，它利用HtmlAgilityPack库来抓取位于：的页面。不幸的是，该页面包含格式错误的内容。我在如何抓取这一页上陷入了僵局。我当前的代码(如下所示)在解析HTML时冻结： HtmlNodeCollection cityRecords = _htmlDocument.DocumentNode.SelectNodes("//table[@class='boldtable']//tr[position() != 1]"); CityNodes = (from node in cityRecords.Descendants()

浏览 0提问于2009-12-15得票数 0

回答已采纳

1回答

单独访问样式属性

、

我在c#中使用HtmlAgilityPack。我创建了一个带有如下属性的div元素， HtmlNode div = HtmlNode.CreateNode("<div></div>"); div.Attributes.Add("style","width:100px;height:100px;color:red;position:absolute;"); 现在我想知道在HtmlAgilityPack by中有没有什么方法，我可以像在jQuery中那样单独访问样式属性： $("div").w

浏览 2提问于2012-07-14得票数 1

回答已采纳

1回答

如何使用c#获取检查元素代码

、

我想从URL获取文本，但文本不显示在源代码中。我只能在inspect元素中看到它。无论如何，在C#中获取页面的Inspect元素的内容。我尝试使用c#的htmlagilitypack，但给出了空异常。 Class1 class1obj = new Class1(); HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url); request.Method = "GET"; HttpWebResponse response = (HttpWebResponse)request.GetResponse()

浏览 0提问于2014-02-25得票数 2

1回答

从内存加载程序集的简单方法

、、

我有一个应用程序使用一些外部组装--是的(比如htmlAgilityPack等)。我可以在不复杂修改应用程序的情况下(在主代码启动之前)从内存加载这个程序集吗？例如，从服务器程序集(如字节数组)下载主应用程序，加载它并启动主代码。如何不用硬修改应用程序代码来解决这个问题？已添加。例如，我正在使用来自HtmlAgilityPack的HtmlAgilityPack。如果im不设置对HtmlAgilityPack应用程序的引用，则不会对其进行复合。如何在代码中使用Assembly.Load加载HtmlAgilityPack并在应用程序中使用它的类型？

浏览 4提问于2014-03-07得票数 1

回答已采纳

3回答

HTMLagilitypack无法解析内容

、、

我使用我的C#项目Geckofx和Htmlagilitypack来解析一些网站(例如Xing，LinkedIn)。由于LinkedIn已经更新了他们的网页，所以无法解析信息。因为信息是在页面加载之后使用ajax加载的。这就是为什么，我需要的信息不是在源代码中准备的，这使得HtmlAgilityPack无法获取信息。例如，请参阅页面：如何解析内容？

浏览 15提问于2017-03-14得票数 1

2回答

htmlagility pack无法获取本地托管页面

、、

我尝试运行以下代码： public void Init(Url rootUrl) { var web = new HtmlWeb(); this.doc = web.Load(rootUrl.Value); } 使用以下参数： {<System.Security.Policy.Url version="1"> <Url>http://localhost:85/HCM/HCM.html</Url> </System.Security.Policy.Url&

浏览 0提问于2012-03-21得票数 0

回答已采纳

1回答

使用XPath从其他站点检索数据

、、

我正试图在Xpath的帮助下使用HTML从其他站点检索数据。我已经成功地从一个站点添加了数据，但是当我更改URL和XPath以从另一个站点检索数据时，它不起作用。这是我的工作代码： string Url = "http://www.uok.edu.pk/faculties/computerscience/bs.php"; HtmlAgilityPack.HtmlWeb web = new HtmlWeb(); HtmlAgilityPack.HtmlDocument doc = web.Load(Url); var headers = doc.Document

浏览 2提问于2014-10-30得票数 0

回答已采纳