使用Cro或HTTP::UserAgent时获取url get stucks的内容

文章/答案/技术大牛

发布

2回答

web-scraping、raku、cro

我想获取的内容，然而，Cro::HTTP::Client和HTTP::UserAgent只是失败了，而WWW获得了内容，我不知道为什么。如果我将$url更改为，所有三个模块都可以正常工作：use Cro::HTTP::Client; my $resp =awa

浏览 10提问于2018-12-16得票数 5

回答已采纳

2回答

角2-下载文件表格Rest (CSV)

angular

当我的onclick按钮启动这个函数。blob = new Blob([response], { type: 'text/csv' }); const url= window.URL.createObjectURL(blob); }, download() { r

浏览 0提问于2019-09-11得票数 1

回答已采纳

1回答

理解Cro请求/响应周期和内存使用

raku、rakudo、cro

我对Cro如何处理客户端请求感到有点困惑，特别是为什么某些请求似乎会导致Cro的内存使用量急剧膨胀。use Cro::HTTP::Server; get -> { content“来响应GET请求--这当然不应该费钱。然而，如果我导航到l

浏览 9提问于2022-05-10得票数 12

回答已采纳

1回答

Perl LWP::UserAgent模拟浏览器

perl、web-scraping、webbrowser-control、lwp-useragent

我试图自动获取网页使用LWP::UserAgent，但我得到403禁止的错误，而如果我从控制台使用wget，https://dreaminislam.com/a/或curl，我得到的页面正常。如何为LWP::UserAgent设置正确的选项以获取该页面，并类似于模拟真实浏览器。以下是示例代码。use HTTP::CookieJar::LWP (); use L

浏览 18提问于2019-09-09得票数 1

回答已采纳

1回答

获取URL的HTTP错误。Status=403

android、jsoup

我在试着从网站上获取数据。当我在Intellij IDEA中使用这段代码时，一切都很好，但是当我在Android和真正的设备中使用这段代码时，我得到： private static final String URL = "http://www.op

浏览 3提问于2017-11-14得票数 2

回答已采纳

2回答

呈现时与原始页面不同的cURL Html输出

php、html、curl、file-get-contents

我正在做一个项目，涉及到使用cURL或file_get_contents获取页面。问题是，当我尝试回显获取的html时，输出似乎与原始页面不同，并不是所有的图像都显示出来。我想知道有没有解决的办法。我的代码 //Get the url $url = "http://www.

浏览 0提问于2010-08-19得票数 4

回答已采纳

9回答

"TypeError:类型为‘响应’的对象没有len()“

python、web-scraping、beautifulsoup

当我试图执行代码时它给出了错误消息。TypeError:类型为“Response”的对象没有len() response = requests.get(url) html = re

浏览 11提问于2016-04-19得票数 40

回答已采纳

2回答

使用LWP获取网页内容

perl、lwp

我试图使用LWP::UserAgent来收集网页的内容，但由于某种原因，当我运行脚本时，会看到一个Windows弹出消息： use LWP::UserAgent; my $oHTTPA

浏览 1提问于2012-03-05得票数 0

2回答

使用浏览器和WebRequest C#返回不同结果的YouTube视频信息

c#、youtube、webrequest

我正在使用webrequests通过URL http://youtube.com/get_video_info?video_id={ID HERE}从YouTube上获取视频数据当我使用浏览器访问URL时，它会下载响应文件，并且所有需要的数据都会显示出来。但是，当我使用HttpWebRequest下载带有适当UserAgent的响应时，会丢失很多数据

浏览 35提问于2017-07-17得票数 0

回答已采纳

2回答

php:使用cURL获取url内容(json)

php、json、curl、facebook

我想用cURL访问 (显然也可以通过“http”访问)来获取文件的内容，更具体地说:我需要“名称”(它是json)。因为我的use服务器上禁用了allow_url_fopen，所以我不能使用get_file_contents！所以我试着这样做：$page = 'http://graph.facebook.com/19165649929?) Gecko/2006120

浏览 0提问于2010-08-29得票数 4

回答已采纳

1回答

如何在JSoup中使用CSS选择器来选择包含图像的所有元素，包括在data-src (HTML5 dataset)属性中？

java、html、css-selectors、jsoup

我正在尝试使用JSoup来解析任何web页面，并以编程方式识别内容块元素，这些元素被定义为任何多次出现且包含文本、链接和图像的元素。在我到达之前，一切都很顺利。此页面上的图像不是在<img>标记中显示，而是在类似data-background="http://cdn.fansided.com/wp-content/blogs.dir/314/files/2015/01/8O7hjxQ-268x1

浏览 2提问于2015-04-06得票数 1

1回答

XML::Simple不抓取单个XML节点

perl、xml-parsing、mediawiki-api

我使用MediaWiki应用程序接口来获取搜索结果。我只想抓取第一个结果的URL，即标记为“Url”的XML元素。最终，我还会对XML做其他事情，但我想，在得到这个问题的答案后，我会意识到我做错了什么，并能够做其他事情。是我正在使用的页面。require HTTP::Request;require XML::Simple; my $url<

浏览 0提问于2012-12-16得票数 2

回答已采纳

2回答

Mojo::UserAgent和JavaScript

javascript、perl、mojolicious、mojo-useragent

我想知道是否可以用Mojo::UserAgent来做类似下面这样的事情：my $ua = Mojo::UserAgent->new;->截获HTTP请求->将HTTP请求发送到web客户端

浏览 6提问于2018-09-10得票数 9

1回答

Cro WebSocket客户端看不到服务器何时关闭

raku、cro

客户端use Cro::WebSocket::Client; constant TIMEOUT-TO-CONNECT::HTTP::Router;use Cro::HTTP::Router::WebSocket; rou

浏览 2提问于2018-07-20得票数 9

2回答

使用远程调用获取页面的内容

php、http、url、fsockopen

：$port = (preg_match("/^https\:\/\//", $url) > 0 ?443 : 80); $headers .= "Host: $url"; $headers .= "

浏览 0提问于2012-05-29得票数 3

回答已采纳

1回答

将actionscript中的变量插入到MySQL表中

php、mysql、flash、uploadify、user-agent

我使用$_SERVER‘’HTTP_USER_AGENT‘将上传文件到我网站的用户的浏览器和操作系统插入到一个MySQL表中。我使用的是uploadifive，对于不支持HTML5的浏览器，它会后退到使用flash (uploadify)。当使用Flash时，操作系统和浏览器不是使用$_SERVER‘’HTTP_USER_AGENT‘返回的，而是我看到的<

浏览 1提问于2012-06-04得票数 2

6回答

PHP获取URL或页面的内容

php、html、curl

我正在尝试创建一个PHP脚本，可以从外部服务器请求数据，如HTML内容，然后对收到的内容做一些事情。下面是我试图实现的一个通用示例： echo $myFetche

浏览 2提问于2011-05-12得票数 13

回答已采纳

1回答

PHP - `get_headers`返回有效URL的“400个坏请求”和“403个禁忌”？

php、get-headers

描述底部的工作解决方案！在大多数情况下，一切都很好，但是有三个URL会导致问题(可能更多，还有更广泛的测试)。返回以下内容：| 0 ............................其中任何一个都不会引发警告或

浏览 3提问于2016-08-24得票数 7

回答已采纳

2回答

无法使用beautifulSoup访问某些内容

python、parsing、beautifulsoup、bs4

我在访问这个网页中的特定价值时遇到了一些问题(这是一个出售旧东西的法语网站)。我正在尝试获取某个特定项目的访问量。这是链接：from bs4 import BeautifulSoupimport requests header = {'user-agent' : ua.

浏览 3提问于2017-07-13得票数 0

1回答

不返回正确内容的wordpress JSON插件

php、jquery、ajax、json、wordpress

我用静态html为我的站点创建了一个移动应用程序，现在我希望使用ajax来获取我的帖子、页面、标题、图像等。从我的wordpress原始网站。为此，我认为最好的解决方案是使用JSON插件-> 有人知道问题出在哪里吗？": [ ], "<

浏览 5提问于2014-10-20得票数 0

回答已采纳

点击加载更多