我试图自动获取网页使用LWP::UserAgent,但我得到403禁止的错误,而如果我从控制台使用wget,https://dreaminislam.com/a/或curl,我得到的页面正常。如何为LWP::UserAgent设置正确的选项以获取该页面,并类似于模拟真实浏览器。以下是示例代码。use HTTP::CookieJar::LWP ();
use L
我使用MediaWiki应用程序接口来获取搜索结果。我只想抓取第一个结果的URL,即标记为“Url”的XML元素。最终,我还会对XML做其他事情,但我想,在得到这个问题的答案后,我会意识到我做错了什么,并能够做其他事情。是我正在使用的页面。require HTTP::Request;require XML::Simple;
my $url<