wget
上一篇 / 下一篇 2010-10-30 09:36:11 / 个人分类:测试经验
查看( 991 ) /
评论( 0 )
Wget是一个十分常用命令行下载工具,多数Linux发行版本都默认包含这个工具。如果没有安装可在http: //www.gnu.org /software/wget/wget.html下载最新版本,并使用如下命令编译安装: #tar zxvf wget- 1.9.1.tar.gz #cd wget-1.9.1 #./configure #make #make install 它的用法很简单.51Testing软件测试网6V8h8UU6|)H o8j
51Testing软件测试网 C)d \:p6H;M,|&O
1)支持断点下传功能;这一点,也是网络蚂蚁和FlashGet当年最大的卖点,现在,Wget也可以使用此功能,那些网络不是太好的用户可以放心了;51Testing软件测试网$cBUqx#tV
(2)同时支持FTP和HTTP下载方式;尽管现在大部分软件可以使用HTTP方式下载,但是,有些时候,仍然需要使用FTP方式下载软件;
tx5^/yR0 (3)支持代理服务器;对安全强度很高的系统而言,一般不会将自己的系统直接暴露在互联网上,所以,支持代理是下载软件必须有的功能;51Testing软件测试网 TG^J,w+a
(4)设置方便简单;可能,习惯图形界面的用户已经不是太习惯命令行了,但是,命令行在设置上其实有更多的优点,最少,鼠标可以少点很多次,也不要担心是否错点鼠标;
B!p!i{ mv2K0W0 (5)程序小,完全免费;程序小可以考虑不计,因为现在的硬盘实在太大了;完全免费就不得不考虑了,即使网络上有很多所谓的免费软件,但是,这些软件的广告却不是我们喜欢的;51Testing软件测试网F+c8Bs;VzG5yTw
51Testing软件测试网+V}qQa/v.C
wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。
Z-D e A]C0 1、下载整个http或者ftp站点。51Testing软件测试网7i(BKuU2Zw
H TF;RnA5O)I0 51Testing软件测试网h-t+h(hDr8r] N^
wget http://place.your.url/here51Testing软件测试网 W L)I Z#~)U%c#z.XpV
这个命令可以将http://place.your.url/here 首页下载下来。使用-x会强制建立服务器上一模一样的目录,如果使用-nd参数,那么服务器上下载的所有内容都会加到本地当前目录。51Testing软件测试网:_[p w gw'~3e
N$U$FS._{b0 wget -r http://place.your.url/here
Pv'?0_?Mt!s7T|0 这个命令会按照递归的方法,下载服务器上所有的目录和文件,实质就是下载整个网站。这个命令一定要小心使用,因为在下载的时候,被下载网站指向的所有地址 同样会被下载,因此,如果这个网站引用了其他网站,那么被引用的网站也会被下载下来!基于这个原因,这个参数不常用。可以用-l number参数来指定下载的层次。例如只下载两层,那么使用-l 2。
Bx8A#G&Y:D6h]j&Q0X0
6gqo-T0Nd4D'zB0 要是您想制作镜像站点,那么可以使用-m参数,例如:wget -m http://place.your.url/here
W)J*{Bf0 这时wget会自动判断合适的参数来制作镜像站点。此时,wget会登录到服务器上,读入robots.txt并按robots.txt的规定来执行。51Testing软件测试网+T&Q6u?,q7QR,o
N[8L`u-kH0 2、断点续传。51Testing软件测试网8n'}?JMi/}1Lm
gL H v%h?0
Y(PAv.lJv0 当文件特别大或者网络特别慢的时候,往往一个文件还没有下载完,连接就已经被切断,此时就需要断点续传。wget的断点续传是自动的,只需要使用-c参数,例如:51Testing软件测试网L K,u2m?~3p
wget -c http://the.url.of/incomplete/file
9b"_;Z9ls|| Z.Ujv)T^0 使用断点续传要求服务器支持断点续传。-t参数表示重试次数,例如需要重试100次,那么就写-t 100,如果设成-t 0,那么表示无穷次重试,直到连接成功。-T参数表示超时等待时间,例如-T 120,表示等待120秒连接不上就算超时。51Testing软件测试网W9b?][
51Testing软件测试网e ]Z-kt P&i)f
3、批量下载。51Testing软件测试网/U3d&PD6A|
51Testing软件测试网^b&m/w4nv6A)X6D
/j0Tu.| D+vB0 如果有多个文件需要下载,那么可以生成一个文件,把每个文件的URL写一行,例如生成文件download.txt,然后用命令:wget -i download.txt51Testing软件测试网/ujvrMz7mK"C
这样就会把download.txt里面列出的每个URL都下载下来。(如果列的是文件就下载文件,如果列的是网站,那么下载首页)51Testing软件测试网I!G e? PJ
(XNsVJ/?SC8D0 4、选择性的下载。
^Fq:e+Vh0Q a+cV0 51Testing软件测试网5Q"J%|sVY
9Omj-g B:c0 可以指定让wget只下载一类文件,或者不下载什么文件。例如:
1Z"G {3Z'h0E0 wget -m --reject=gif http://target.web.site/subdirectory51Testing软件测试网,c/NT'os.ie
表示下载http://target.web.site/subdirectory,但是忽略gif文件。--accept=LIST 可以接受的文件类型,--reject=LIST拒绝接受的文件类型。51Testing软件测试网5U!w.D2S @!?D&O
#F4uH1J"a!o0 5、密码和认证。51Testing软件测试网&RiKJI
9H!eVnM3b:Z4b0
m;X5To\k0 wget只能处理利用用户名/密码方式限制访问的网站,可以利用两个参数:
R] `-PJ W+q0 --http-user=USER设置HTTP用户51Testing软件测试网?"Pl3Z4TqL.`/g
--http-passwd=PASS设置HTTP密码51Testing软件测试网r2SojL.ST)V v
对于需要证书做认证的网站,就只能利用其他下载工具了,例如curl。51Testing软件测试网Vg$a!R0}H
5t\g/kK3r B+bN0 6、利用代理服务器进行下载。51Testing软件测试网DAm7}F
51Testing软件测试网Bq9G8^/p
51Testing软件测试网 C)d \:p6H;M,|&O
1)支持断点下传功能;这一点,也是网络蚂蚁和FlashGet当年最大的卖点,现在,Wget也可以使用此功能,那些网络不是太好的用户可以放心了;51Testing软件测试网$cBUqx#tV
(2)同时支持FTP和HTTP下载方式;尽管现在大部分软件可以使用HTTP方式下载,但是,有些时候,仍然需要使用FTP方式下载软件;
tx5^/yR0 (3)支持代理服务器;对安全强度很高的系统而言,一般不会将自己的系统直接暴露在互联网上,所以,支持代理是下载软件必须有的功能;51Testing软件测试网 TG^J,w+a
(4)设置方便简单;可能,习惯图形界面的用户已经不是太习惯命令行了,但是,命令行在设置上其实有更多的优点,最少,鼠标可以少点很多次,也不要担心是否错点鼠标;
B!p!i{ mv2K0W0 (5)程序小,完全免费;程序小可以考虑不计,因为现在的硬盘实在太大了;完全免费就不得不考虑了,即使网络上有很多所谓的免费软件,但是,这些软件的广告却不是我们喜欢的;51Testing软件测试网F+c8Bs;VzG5yTw
51Testing软件测试网+V}qQa/v.C
wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。
Z-D e A]C0 1、下载整个http或者ftp站点。51Testing软件测试网7i(BKuU2Zw
H TF;RnA5O)I0 51Testing软件测试网h-t+h(hDr8r] N^
wget http://place.your.url/here51Testing软件测试网 W L)I Z#~)U%c#z.XpV
这个命令可以将http://place.your.url/here 首页下载下来。使用-x会强制建立服务器上一模一样的目录,如果使用-nd参数,那么服务器上下载的所有内容都会加到本地当前目录。51Testing软件测试网:_[p w gw'~3e
N$U$FS._{b0 wget -r http://place.your.url/here
Pv'?0_?Mt!s7T|0 这个命令会按照递归的方法,下载服务器上所有的目录和文件,实质就是下载整个网站。这个命令一定要小心使用,因为在下载的时候,被下载网站指向的所有地址 同样会被下载,因此,如果这个网站引用了其他网站,那么被引用的网站也会被下载下来!基于这个原因,这个参数不常用。可以用-l number参数来指定下载的层次。例如只下载两层,那么使用-l 2。
Bx8A#G&Y:D6h]j&Q0X0
6gqo-T0Nd4D'zB0 要是您想制作镜像站点,那么可以使用-m参数,例如:wget -m http://place.your.url/here
W)J*{Bf0 这时wget会自动判断合适的参数来制作镜像站点。此时,wget会登录到服务器上,读入robots.txt并按robots.txt的规定来执行。51Testing软件测试网+T&Q6u?,q7QR,o
N[8L`u-kH0 2、断点续传。51Testing软件测试网8n'}?JMi/}1Lm
gL H v%h?0
Y(PAv.lJv0 当文件特别大或者网络特别慢的时候,往往一个文件还没有下载完,连接就已经被切断,此时就需要断点续传。wget的断点续传是自动的,只需要使用-c参数,例如:51Testing软件测试网L K,u2m?~3p
wget -c http://the.url.of/incomplete/file
9b"_;Z9ls|| Z.Ujv)T^0 使用断点续传要求服务器支持断点续传。-t参数表示重试次数,例如需要重试100次,那么就写-t 100,如果设成-t 0,那么表示无穷次重试,直到连接成功。-T参数表示超时等待时间,例如-T 120,表示等待120秒连接不上就算超时。51Testing软件测试网W9b?][
51Testing软件测试网e ]Z-kt P&i)f
3、批量下载。51Testing软件测试网/U3d&PD6A|
51Testing软件测试网^b&m/w4nv6A)X6D
/j0Tu.| D+vB0 如果有多个文件需要下载,那么可以生成一个文件,把每个文件的URL写一行,例如生成文件download.txt,然后用命令:wget -i download.txt51Testing软件测试网/ujvrMz7mK"C
这样就会把download.txt里面列出的每个URL都下载下来。(如果列的是文件就下载文件,如果列的是网站,那么下载首页)51Testing软件测试网I!G e? PJ
(XNsVJ/?SC8D0 4、选择性的下载。
^Fq:e+Vh0Q a+cV0 51Testing软件测试网5Q"J%|sVY
9Omj-g B:c0 可以指定让wget只下载一类文件,或者不下载什么文件。例如:
1Z"G {3Z'h0E0 wget -m --reject=gif http://target.web.site/subdirectory51Testing软件测试网,c/NT'os.ie
表示下载http://target.web.site/subdirectory,但是忽略gif文件。--accept=LIST 可以接受的文件类型,--reject=LIST拒绝接受的文件类型。51Testing软件测试网5U!w.D2S @!?D&O
#F4uH1J"a!o0 5、密码和认证。51Testing软件测试网&RiKJI
9H!eVnM3b:Z4b0
m;X5To\k0 wget只能处理利用用户名/密码方式限制访问的网站,可以利用两个参数:
R] `-PJ W+q0 --http-user=USER设置HTTP用户51Testing软件测试网?"Pl3Z4TqL.`/g
--http-passwd=PASS设置HTTP密码51Testing软件测试网r2SojL.ST)V v
对于需要证书做认证的网站,就只能利用其他下载工具了,例如curl。51Testing软件测试网Vg$a!R0}H
5t\g/kK3r B+bN0 6、利用代理服务器进行下载。51Testing软件测试网DAm7}F
51Testing软件测试网Bq9G8^/p