腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
wget
进行
递归
文件
下载
不起作用
根据我对
wget
手册的了解,下面的方法应该是可行的:
wget
-r -l1 -np -nd -A.* -R "index.html*" http://s3.amazonaws.com/gp.gms/blat/ 但是,我没有在没有明显自动生成的index.html
文件
的情况下获得blat
文件
夹中的所有
文件
,而是在这个
文件
和我尝试过的几十个变体中得到了404not found错误。我可以很容易地
下载
这4
浏览 30
提问于2019-03-31
得票数 0
1
回答
Wget
在网页的子链接中
下载
多个
文件
、
、
我正在尝试
使用
wget
下载
许多
文件
(约30,000),所有
文件
都在以下网页中:然而,在我点击Fits之后,实际的数据在一个子链接下,然后在这个子链接下显示一些
文件
。例如,第一个
文件
的sublink如下所示: http://galex.stsci.edu/gr6
浏览 0
提问于2018-02-19
得票数 0
1
回答
如何在linux中用
wget
或其他工具
下载
一个网站的子域?
、
、
、
我想
下载
的所有段落。它有很多页。例如,那么如何
使用
wget
或linux中的其他工具来
下载
它们呢?目前,我
使用
以下参数,但它
不起作用
。
wget
--
递归
--无source.yeeyan.org --页面必需--html-扩展--转换链接--限制
文件
名=窗口--域yeeyan.org --无父
wget
浏览 3
提问于2012-05-25
得票数 5
1
回答
Wget
在遵循重定向后不会
递归
下载
、
、
下面是我
使用
wget
的方法:此重定向到。当我像上面那样运行
wget
时,它遵循重定向,但随后只
下载
该页面-而不是
递归
地
下载
所有页面。我已经尝试过--max-redirects=1和--domains=www.btlregion.ru,但它
不起作用
。 如果我直接在上调用
wget
,
递归
下载
就
浏览 0
提问于2013-11-17
得票数 9
回答已采纳
1
回答
递归
时,
wget
将头添加到
下载
的
文件
中
、
、
我正在尝试从Apache服务器
下载
一个数据集。我
使用
以下命令
递归
地
使用
wget
下载
文件
,只
下载
扩展名为.vts的
文件
:但是,
wget
似乎在
下载
的
文件
开始时添加了行: ETag: 514256db-7df6c3567d200“接受-范围:字节内容-长度: 1098002907变:接受-编码连接:关闭<V
浏览 7
提问于2021-12-06
得票数 0
1
回答
如何
使用
wget
通过html链接
下载
文件
?
、
、
我试图
使用
wget
从一个网站从数据库
下载
文件
。提供者现在只提供对以前的ftp服务器的web访问,我可以很容易地
使用
wget
下载
任何我想要的
文件
。我很难理解如何
使用
wget
进行
此操作;我试图
使用
命令从级别3的各个目录中
递归
下载
这些
文件
。
wget
-nd -nc -nH -r -np -A .tar.gz &quo
浏览 0
提问于2023-01-16
得票数 0
3
回答
wget
- -nc选项是否跳过
下载
现有
文件
?
我正在用
wget
下载
一个网站。命令如下:当我们
递归
下载
网站时,-nc选项会跳过
下载
已有的
文件
吗?
浏览 2
提问于2012-12-20
得票数 2
1
回答
我怎样才能穿越所有的符号链接呢?
、
、
、
问题背景 我试图备份/镜像所有的,并且有数以千计的符号/硬链接到其他
文件
夹和服务器。我试过
使用
wget
浏览 2
提问于2017-03-04
得票数 0
回答已采纳
2
回答
如何
使用
wget
从index.html创建URL列表?
、
因此,
wget
具有
递归
下载
文件
的能力,但是它一次只
下载
一个
文件
。有什么想法吗?
浏览 0
提问于2014-08-05
得票数 3
回答已采纳
1
回答
在
使用
wget
时限制离开主机页的
递归
我想做的是在站点(主机)上
递归
到5的深度,然后当我跳转到另一个主机时,
递归
限制为2页。我似乎在手册中找不到任何这样的选择,我只是运气不好吗?
浏览 7
提问于2014-05-06
得票数 2
回答已采纳
2
回答
为什么"
wget
-r -e robots=off -e robots=off“不是
递归
的?
、
我正在尝试
递归
下载
http://ccachicago.org,并得到一个
文件
,即根index.html。我已经看过用
wget
递归
下载
,并开始
使用
推荐的-e robots=off,但它的行为仍然相同。 如何
使用
wget
或其他工具
下载
站点的副本?
浏览 0
提问于2014-01-27
得票数 5
回答已采纳
4
回答
什么是一个好的网络爬虫来
下载
HTML页面?
、
我正在寻找一个网络爬虫/蜘蛛
下载
个别页面。支持这一点的好产品(最好是免费的)是什么?
浏览 1
提问于2011-10-18
得票数 3
回答已采纳
2
回答
用
wget
递归
下载
下面的
wget
命令有问题:
wget
-nd -r -l 10 http://web.archive.org/web/20110726051510/http://feedparser.org/docs/它应该
递归
地
下载
原始web上的所有链接文档,但是它只
下载
两个
文件
(index.html和robots.txt)。如何实现这网页的
递归
下载
?
浏览 0
提问于2011-11-25
得票数 35
回答已采纳
2
回答
不带扩展名的
wget
递归
文件
、
、
我正试着用
wget
建立一个网站。我希望
进行
递归
下载
,并将其存储在一个
文件
夹中,但避免
使用
查询
文件
;Home?query --在本例中是Home。为此,我尝试了一种模式的--reject,但我无法使它工作。这是
wget
:--page-requisites \--no-host-directories \--convert-links注意:为了避免<em
浏览 0
提问于2013-05-21
得票数 2
回答已采纳
1
回答
wget
没有
下载
304未修改的
文件
、
我正在尝试
使用
wget
递归
下载
一个网站:它只
下载
某些
文件
,而保留其他
文件
。经过仔细检查,我发现它不会
下载
返回304 Not Modified的
浏览 0
提问于2020-09-19
得票数 2
回答已采纳
1
回答
如何从URL
递归
下载
网页及其链接内容?
、
、
、
我想
使用
wget
递归
下载
一个网页。
递归
地说,我指的是它可能指向的所有其他
文件
也应该
下载
。原因是我希望能够在离线的情况下合理地看到它的内容。我需要
下载
的网页也链接到同一网站上的其他网页,我希望我也可以
下载
它们。 用
wget
可以做到这一点吗?有什么旗子吗?
浏览 0
提问于2013-07-22
得票数 5
回答已采纳
1
回答
如何在特定的TLD上
递归
获取?
、
、
、
可以
使用
wget
从特定的TLD
递归
下载
文件
吗? 具体来说,我正在尝试
下载
的全文。法规的实际文本存储在多个域的多个
文件
中-所以我想从开始
递归
下载
,但只跟踪.gov和.us域的链接。
浏览 2
提问于2012-05-09
得票数 3
回答已采纳
2
回答
使用
python捕获
wget
错误
、
、
、
我有一个脚本,它
使用
python和
wget
下载
一个网站,然后对
文件
执行一些任务。我
使用
os.system("
wget
-m -w 2 -P " directory)行调用
wget
,
递归
下载
域中的每个页面。这可以很好地工作,但现在有必要监控
wget
在
下载
文件
时出现的错误(想象一下试图访问页面时出现的404错误)。 这不是获得退出代码的问题,而是查看
wget
浏览 0
提问于2014-12-05
得票数 0
1
回答
我如何
下载
一个非公开的Google站点?
、
、
、
我想
下载
一个谷歌网站的所有网页的HTML,只能通过登录到谷歌访问。谷歌没有为新的谷歌网站()提供API。让事情变得更复杂的是,我的谷歌登录要求
使用
。我尝试在火狐中
进行
身份验证,通过火狐扩展保存我的cookie,然后
使用
wget
: --load-cookies=cookies.txt \ --no-host-directories我还尝试了在火狐内部通过,它可以生成一个
wget
命令,等同于火狐对
下载
所做的事情。我的想法是将<
浏览 5
提问于2020-05-29
得票数 0
2
回答
有没有什么方法可以让我在cURL中获得这种行为?
、
、
、
我的意思是,当浏览器加载一个页面时,它也会
下载
所有相关的内容...有人能告诉我如何
使用
curl来做这件事吗?我不介意它甚至将二进制数据转储到终端上...我正在尝试对我的服务器
进行
基准测试(保持它最初的简单性,以测试bug……可能在这之后,我会
使用
像ab)这样的专用工具。
浏览 0
提问于2010-02-04
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券