Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用wget下载需要用户名和密码认证的网站或者ftp服务器文件

用wget下载需要用户名和密码认证的网站或者ftp服务器文件

作者头像
生信技能树
发布于 2018-03-09 02:35:05
发布于 2018-03-09 02:35:05
13K01
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:1
代码可运行

虽然我以前经常写爬虫,但毕竟是代码活,复用性非常低,每次得耗十几分钟解析网页并且写好代码。而熟悉linux的朋友都应该了解wget这个神器,有了url之后一行命令即可完成下载。

但真实的需求往往是,需要下载某个ftp服务器里面的多个文件,甚至该ftp服务器需要用户名和密码登录,比如公司给你提供的测序数据结果:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Host: sftp.biotrainee.com.cn or 123.123.123.123Username: 80-78395743Password: 8L5973452TJ0t4tQMPort: 22

诚然,我们可以用winscp或者filezilla等客户端软件下载,但是更多时候我们的数据量非常大,需要直接在服务器用命令行工具下载。

这个时候,就需要学习wget的高级技巧了。

比如之前卫计委搞了一个全国范围的基因检测实验室考察活动,放出的测试数据就是这样下载的:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget -c -r -np -k -L -p --ftp-user=NCCLBIPT --ftp-password=nccl123456 ftp://211.103.138.229/Illumina_file/Illumina_B17NC/*
再比如http服务器:

斯坦福大学的生物信息学算法课程里面推荐阅读的的所有pdf格式的paper 课程的网址是:http://ai.stanford.edu/~serafim/CS374_2011/ 可以看到,这个网站推荐的文献分成8大类,本身这个网站打开就需要登录用户名和密码: 用户名是CS374-2011加上密码AlgorithmsInBiology

每一篇文献的单独地址是http://ai.stanford.edu/~serafim/CS3742011/papers/Miscellaneoustopics/Self-assemblyofDNA/selfhealingand_proofreading.pdf 类似的格式。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget -c -r -np -k -L -p  -A.pdf --http-user=CS374-2011 --http-passwd=AlgorithmsInBiology http://ai.stanford.edu/~serafim/CS374_2011/papers/

我这里简单解释一下这些参数的意思:

-c -r -np -k -L -p -A.pdf

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
-c 断点续传-r 递归下载,下载指定网页某一目录下(包括子目录)的所有文件-nd 递归下载时不创建一层一层的目录,把所有的文件下载到当前目录(特殊要求会选择这个参数)-np 递归下载时不搜索上层目录,如wget -c -r www.xxx.org/pub/path/没有加参数-np,就会同时下载path的上一级目录pub下的其它文件 (所以一定要加上这个参数,不然会下载太多东西的)-k 将绝对链接转为相对链接,下载整个站点后脱机浏览网页,最好加上这个参数-L 递归时不进入其它主机,如wget -c -r www.xxx.org/-p 下载网页所需的所有文件,如图片等-A 指定要下载的文件样式列表,多个样式用逗号分隔

至于最后的--http-user=CS374-2011 --http-passwd=AlgorithmsInBiology 就是登录该课程网站需要的用户名和密码

是不是很好用呀,赶快去试一试吧

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-12-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
wget命令详解——批量下载等
(1)支持断点下传功能 (2)同时支持FTP和HTTP下载方式 (3)支持代理服务器 (4)设置方便简单 (5)程序小,完全免费 wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。 1、下载整个http或者ftp站点。
Qicloud
2022/01/28
13.2K0
wget命令详解(断点续传,批量下载)
[导读](1)支持断点下传功能 (2)同时支持FTP和HTTP下载方式 (3)支持代理服务器 (4)设置方便简单 (5)程序小,完全免费 wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:wget [参数列表] URL。下面就...
用户3765803
2019/03/05
14.1K0
Wget 大法wget 指定路径,指定文件名下载
图片 今天用到了Wget,突然一时间想不起来wget的下载到指定目录是哪个参数了,特地把所有参数都弄来,以防又忘记了。毕竟脚本是写了之后,半年都不用改,坑! 有
用户2353021
2020/05/09
10.6K0
python wget下载文件
-P PREFIX 将文件保存在目录(--directory-prefix=PREFIX)
py3study
2020/01/09
5.5K0
wget命令详解,断点续传[通俗易懂]
(1)支持断点下传功能 (2)同时支持FTP和HTTP下载方式 (3)支持代理服务器 (4)设置方便简单 (5)程序小,完全免费
全栈程序员站长
2022/09/05
10.1K0
linux的wget命令
Linux wget是一个下载文件的工具,它用在命令行下。对于Linux用户是必不可少的工具,尤其对于网络管理员,经常要下载一些软件或从远程服务器恢复备份到本地服务器。如果我们使用虚拟主机,处理这样的事务我们只能先从远程服务器下载到我们电脑磁盘,然后再用ftp工具上传到服务器。这样既浪费时间又浪费精力,那不没办法的事。而到了Linux VPS,它则可以直接下载到服务器而不用经过上传这一步。wget工具体积小但功能完善,它支持断点下载功能,同时支持FTP和HTTP下载方式,支持代理服务器和设置起来方便简单。下面我们以实例的形式说明怎么使用wget。
狼啸风云
2019/11/05
4.2K0
重新认识wget
Wget是平时经常会用到的一个工具,这个工具其实有着非常丰富的参数和配置,能够实现很强大的功能。比较常用的一个就是抓站或者为网站做镜像。
大江小浪
2018/07/25
1.1K0
Linux下载工具wget使用
wget http://www.minjieren.com/wordpress-3.1-zh_CN.zip 
kl博主
2023/11/18
7600
wget常用命令详解
一、wget常用命令详解 wget命令是Linux系统用于从Web下载文件的命令行工具,支持 HTTP、HTTPS及FTP协议下载文件, 而且wget还提供了很多选项,例如下载多个文件、后台下载,使用代理等等,使用非常方便。 接下来就介绍一下wget的使用方法。 wget命令的使用 语法格式 wget [options] [url] #示例,默认下载目录当前目录下 wget https://down.sandai.net/thunder11/XunLeiWebSetup11
懿曲折扇情
2022/08/24
2.3K0
Linux wget 命令用法详解
Linux系统中的wget是一个下载文件的工具,它用在命令行下。对于Linux用户是必不可少的工具,我们经常要下载一些软件或从远程服务器恢复备份到本地服务器。wget支持HTTP,HTTPS和FTP协议,可以使用HTTP代理。所谓的自动下载是指,wget可以在用户退出系统的之后在后台执行。这意味这你可以登录系统,启动一个wget下载任务,然后退出系统,wget将在后台执行直到任务完成,相对于其它大部分浏览器在下载大量数据时需要用户一直的参与,这省去了极大的麻烦。
用户6543014
2019/10/25
5.3K0
WGet使用指南
wget是一个从网络上自动下载文件的自由工具。它支持HTTP,HTTPS和FTP协议,可以使用HTTP代理.
一见
2018/08/07
1.1K0
每天一个linux命令(61):wget命令
http://www.cnblogs.com/peida/archive/2013/03/18/2965369.html
bear_fish
2018/09/20
2.4K0
windows安装wget命令_linux安装命令install
今天给服务器安装新LNMP环境时,wget 时提示 -bash:wget command not found,很明显没有安装wget软件包。一般linux最小化安装时,wget不会默认被安装。
全栈程序员站长
2022/08/03
5.7K0
wget常用参数
****前言**** 一句话:wget不仅功能强大,使用极其简单的。 ---- ****wget特性**** 支持断点下传功能【important】 同时支持FTP和HTTP下载方式 支持代理服务器 设置方便简单 程序小,更是开源 ---- ****基本语法**** wget [参数列表] URL。 ---- ****常用参数**** 1、简单wget $wget http://www.example.com 2、递归下载 - 【下载整个网站资源】 $wget -r http://www.example
AlicFeng
2018/06/08
1.2K0
Linux网络下载管理工具(lftp, ftp, lftpget, wget)「建议收藏」
在Linux运维开发工作中,经常会使用到ftp工具,近来发现了一款比较趁手的工具,望读者喜欢。
全栈程序员站长
2022/09/03
2.4K0
Linux网络下载管理工具(lftp, ftp, lftpget, wget)「建议收藏」
linux应用之wget命令详解
wget是linux最常用的下载命令, 一般的使用方法是: wget + 空格 + 要下载文件的url路径
用户5640963
2019/07/26
2.1K0
文件查找下载命令
描述:在后台数据库中按文件名搜索,速度更快,通过/var/lib/mlocate内数据库记载找出用户输入的关键字文件名,它的更新速率默认是一天一次,Linux版本的不同名字不同Mac下在/var/db/locate.datebase; 根据距上次更新后更改的文件数目多少,速度不同并且只能通过文件名来搜索
全栈工程师修炼指南
2020/12/17
2.6K0
文件查找下载命令
客户端如何查找FTP服务器的用户名和密码
在互联网的早期阶段,FTP(文件传输协议)是一种非常常用的技术,它允许用户在计算机之间传输文件。然而,由于网络安全和隐私的考虑,许多FTP服务器现在都使用认证系统来限制用户的访问。因此,为了连接到FTP服务器,您通常需要知道用户名和密码。这篇文章将指导您如何在客户端查找FTP服务器的用户名和密码。
德迅云安全--陈琦琦
2023/11/03
2K0
win10系统下搭建FTP服务器(完成文件上传与下载)
FTP (File Transfer Protocol) 可说是最古老的协议之一了,主要是用来进行文件的传输,尤其是大型文件的传输使用 FTP 更是方便。
DS小龙哥
2022/01/17
35.1K0
win10系统下搭建FTP服务器(完成文件上传与下载)
Linux工具之curl与wget高级使用
# curl –s –o baidu.html www.baidu.com |iconv -f utf-8  #减少输出信息
子润先生
2021/06/17
1.2K0
相关推荐
wget命令详解——批量下载等
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验