歡迎您光臨本站 註冊首頁

Wget使用大全和使用技巧

←手機掃碼閱讀     火星人 @ 2014-03-25 , reply:0

wget 使用大全

1)支持斷點下傳功能(2)同時支持FTP和HTTP下載方式(3)支持代理伺服器(4)設置方便簡單;5)程序小,完全免費;

命令格式:

wget [參數列表] [目標軟體、網頁的網址]

1、啟動類參數

這一類參數主要提供軟體的一些基本信息;

-V,--version 顯示軟體版本號然後退出;
-h,--help顯示軟體幫助信息;
-e,--execute=COMMAND 執行一個 「.wgetrc」命令

以上每一個功能有長短兩個參數,長短功能一樣,都可以使用。需要注意的是,這裡的-e參數是執行一個.wgettrc的命令,.wgettrc命令其實是一個參數列表,直接將軟體需要的參數寫在一起就可以了。

2、文件處理參數

這類參數定義軟體log文件的輸出方式等;

-o,--output-file=FILE 將軟體輸出信息保存到文件;
-a,--append-output=FILE將軟體輸出信息追加到文件;
-d,--debug顯示輸出信息;
-q,--quiet 不顯示輸出信息;
-i,--input-file=FILE 從文件中取得URL;

以上參數對於攻擊者比較有用,我們來看看具體使用;


例1:下載192.168.1.168首頁並且顯示下載信息
wget -d http://192.168.1.168

例2:下載192.168.1.168首頁並且不顯示任何信息
wget -q http://192.168.1.168

例3:下載filelist.txt中所包含的鏈接的所有文件
wget -i filelist.txt


wget -np -m -l5 http://jpstone.bokee.com //不下載本站所鏈接的其它站點內容,5級目錄結構
3、下載參數

下載參數定義下載重複次數、保存文件名等;

-t,--tries=NUMBER 是否下載次數(0表示無窮次)
-O --output-document=FILE下載文件保存為別的文件名
-nc, --no-clobber 不要覆蓋已經存在的文件
-N,--timestamping只下載比本地新的文件
-T,--timeout=SECONDS 設置超時時間
-Y,--proxy=on/off 關閉代理

例:下載192.168.1.168的首頁並將下載過程中的的輸入信息保存到test.htm文件中
wget -o test.htm http://192.168.1.168

4、目錄參數

目錄參數主要設置下載文件保存目錄與原來文件(伺服器文件)的目錄對應關係;

-nd --no-directories 不建立目錄
-x,--force-directories 強制建立目錄
可能現在我們對這裡的目錄還不是很了解,我們來看一個舉例

例:下載192.168.1.168的首頁,並且保持網站結構
wget -x http://192.168.1.168


5、HTTP參數

HTTP參數設置一些與HTTP下載有關的屬性;

--http-user=USER設置HTTP用戶
--http-passwd=PASS設置HTTP密碼
--proxy-user=USER設置代理用戶
--proxy-passwd=PASS設置代理密碼

以上參數主要設置HTTP和代理的用戶、密碼;

6、遞歸參數設置

在下載一個網站或者網站的一個目錄的時候,我們需要知道的下載的層次,這些參數就可以設置;
-r,--recursive 下載整個網站、目錄(小心使用)
-l,--level=NUMBER 下載層次

例:下載整個網站
wget -r http://192.168.1.168

7、遞歸允許與拒絕選項參數

下載一個網站的時候,為了盡量快,有些文件可以選擇下載,比如圖片和聲音,在這裡可以設置;

-A,--accept=LIST 可以接受的文件類型
-R,--reject=LIST拒絕接受的文件類型
-D,--domains=LIST可以接受的域名
--exclude-domains=LIST拒絕的域名
-L,--relative 下載關聯鏈接
--follow-ftp 只下載FTP鏈接
-H,--span-hosts 可以下載外面的主機
-I,--include-directories=LIST允許的目錄
-X,--exclude-directories=LIST 拒絕的目錄


如何設定wget所使用的代理伺服器
wget可以使用用戶設置文件".wgetrc"來讀取很多設置,我們這裡主要利用這個文件來是
設置代理伺服器。使用者用什麼用戶登錄,那麼什麼用戶主目錄下的".wgetrc"文件就起
作用。例如,"root"用戶如果想使用".wgetrc"來設置代理伺服器,"/root/.wgetrc"就起
作用,下面給出一個".wgetrc"文件的內容,讀者可以參照這個例子來編寫自己的"wgetrc"文件:
http-proxy = 111.111.111.111:8080
ftp-proxy = 111.111.111.111:8080
這兩行的含義是,代理伺服器IP地址為:111.111.111.111,埠號為:80。第一行指定
HTTP協議所使用的代理伺服器,第二行指定FTP協議所使用的代理伺服器。



WGet使用指南
wget是一個從網路上自動下載文件的自由工具。它支持HTTP,HTTPS和FTP協議,可以使用HTTP代理.

所謂的自動下載是指,wget可以在用戶退出系統的之後在後台執行。這意味這你可以登錄系統,啟動一個wget下載任務,然後退出系統,wget將在後台執行直到任務完成,相對於其它大部分瀏覽器在下載大量數據時需要用戶一直的參與,這省去了極大的麻煩。

wget 可以跟蹤HTML頁面上的鏈接依次下載來創建遠程伺服器的本地版本,完全重建原始站點的目錄結構。這又常被稱作」遞歸下載」。在遞歸下載的時候,wget 遵循Robot Exclusion標準(/robots.txt). wget可以在下載的同時,將鏈接轉換成指向本地文件,以方便離線瀏覽。

wget 非常穩定,它在帶寬很窄的情況下和不穩定網路中有很強的適應性.如果是由於網路的原因下載失敗,wget會不斷的嘗試,直到整個文件下載完 畢。如果是服 務器打斷下載過程,它會再次聯到伺服器上從停止的地方繼續下載。這對從那些限定了鏈接時間的伺服器上下載大文件非常有用。

wget的常見用法
wget的使用格式

Usage: wget [OPTION]... [URL]...用wget做站點鏡像:
wget -r -p -np -k http://dsec.pku.edu.cn/~usr_name/
# 或者
wget -m http://www.tldp.org/LDP/abs/html/在不穩定的網路上下載一個部分下載的文件,以及在空閑時段下載
wget -t 0 -w 31 -c http://dsec.pku.edu.cn/BBC.avi -o down.log &
# 或者從filelist讀入要下載的文件列表
wget -t 0 -w 31 -c -B ftp://dsec.pku.edu.cn/linuxsoft - i filelist.txt -o down.log &上面的代碼還可以用來在網路比較空閑的時段進行下載。我的用法是:在mozilla中 將不方便當時下載的URL鏈接拷貝到內存中然後粘貼到文件filelist.txt中,在晚上要出去系統前執行上面代碼的第二條。

使用代理下載
wget -Y on -p -k https://sourceforge.net/projects/wvware/代理可以在環境變數或wgetrc文件中設定

# 在環境變數中設定代理
export PROXY=http://211.90.168.94:8080/
# 在~/.wgetrc中設定代理
http_proxy = http://proxy.yoyodyne.com:18023/
ftp_proxy = http://proxy.yoyodyne.com:18023/wget各種選項分類列表
啟動
-V, --version 顯示wget的版本後退出
-h, --help 列印語法幫助
-b, --background 啟動後轉入後台執行
-e, --execute=COMMAND 執行`.wgetrc'格式的命令,wgetrc格式參見/etc/wgetrc或~/.wgetrc記錄和輸入文件
-o, --output-file=FILE 把記錄寫到FILE文件中
-a, --append-output=FILE 把記錄追加到FILE文件中
-d, --debug 列印調試輸出
-q, --quiet 安靜模式(沒有輸出)
-v, --verbose 冗長模式(這是預設設置)
-nv, --non-verbose 關掉冗長模式,但不是安靜模式
-i, --input-file=FILE 下載在FILE文件中出現的URLs
-F, --force-html 把輸入文件當作HTML格式文件對待
-B, --base=URL 將URL作為在-F -i參數指定的文件中出現的相對鏈接的前綴
--sslcertfile=FILE 可選客戶端證書
--sslcertkey=KEYFILE 可選客戶端證書的KEYFILE
--egd-file=FILE 指定EGD socket的文件名下載
--bind-address=ADDRESS 指定本地使用地址(主機名或IP,當本地有多個IP或名字時使用)
-t, --tries=NUMBER 設定最大嘗試鏈接次數(0 表示無限制).
-O --output-document=FILE 把文檔寫到FILE文件中
-nc, --no-clobber 不要覆蓋存在的文件或使用.#前綴
-c, --continue 接著下載沒下載完的文件
--progress=TYPE 設定進程條標記
-N, --timestamping 不要重新下載文件除非比本地文件新
-S, --server-response 列印伺服器的回應
--spider 不下載任何東西
-T, --timeout=SECONDS 設定響應超時的秒數
-w, --wait=SECONDS 兩次嘗試之間間隔SECONDS秒
--waitretry=SECONDS 在重新鏈接之間等待1...SECONDS秒
--random-wait 在下載之間等待0...2*WAIT秒
-Y, --proxy=on/off 打開或關閉代理
-Q, --quota=NUMBER 設置下載的容量限制
--limit-rate=RATE 限定下載輸率目錄
-nd --no-directories 不創建目錄
-x, --force-directories 強制創建目錄
-nH, --no-host-directories 不創建主機目錄
-P, --directory-prefix=PREFIX 將文件保存到目錄 PREFIX/...
--cut-dirs=NUMBER 忽略 NUMBER層遠程目錄HTTP 選項
--http-user=USER 設定HTTP用戶名為 USER.
--http-passwd=PASS 設定http密碼為 PASS.
-C, --cache=on/off 允許/不允許伺服器端的數據緩存 (一般情況下允許).
-E, --html-extension 將所有text/html文檔以.html擴展名保存
--ignore-length 忽略 `Content-Length'頭域
--header=STRING 在headers中插入字元串 STRING
--proxy-user=USER 設定代理的用戶名為 USER
--proxy-passwd=PASS 設定代理的密碼為 PASS
--referer=URL 在HTTP請求中包含 `Referer: URL'頭
-s, --save-headers 保存HTTP頭到文件
-U, --user-agent=AGENT 設定代理的名稱為 AGENT而不是 Wget/VERSION.
--no-http-keep-alive 關閉 HTTP活動鏈接 (永遠鏈接).
--cookies=off 不使用 cookies.
--load-cookies=FILE 在開始會話前從文件 FILE中載入cookie
--save-cookies=FILE 在會話結束后將 cookies保存到 FILE文件中FTP 選項
-nr, --dont-remove-listing 不移走 `.listing'文件
-g, --glob=on/off 打開或關閉文件名的 globbing機制
--passive-ftp 使用被動傳輸模式 (預設值).
--active-ftp 使用主動傳輸模式
--retr-symlinks 在遞歸的時候,將鏈接指向文件(而不是目錄)遞歸下載
-r, --recursive 遞歸下載--慎用!
-l, --level=NUMBER 最大遞歸深度 (inf 或 0 代表無窮).
--delete-after 在現在完畢后局部刪除文件
-k, --convert-links 轉換非相對鏈接為相對鏈接
-K, --backup-converted 在轉換文件X之前,將之備份為 X.orig
-m, --mirror 等價於 -r -N -l inf -nr.
-p, --page-requisites 下載顯示HTML文件的所有圖片遞歸下載中的包含和不包含(accept/reject)
-A, --accept=LIST 分號分隔的被接受擴展名的列表
-R, --reject=LIST 分號分隔的不被接受的擴展名的列表
-D, --domains=LIST 分號分隔的被接受域的列表
--exclude-domains=LIST 分號分隔的不被接受的域的列表
--follow-ftp 跟蹤HTML文檔中的FTP鏈接
--follow-tags=LIST 分號分隔的被跟蹤的HTML標籤的列表
-G, --ignore-tags=LIST 分號分隔的被忽略的HTML標籤的列表
-H, --span-hosts 當遞歸時轉到外部主機
-L, --relative 僅僅跟蹤相對鏈接
-I, --include-directories=LIST 允許目錄的列表
-X, --exclude-directories=LIST 不被包含目錄的列表
-np, --no-parent 不要追溯到父目錄


Wget使用技巧

wget的使用形式是:
wget [參數列表] URL
首先來介紹一下wget的主要參數:
· -b:讓wget在後台運行,記錄文件寫在當前目錄下"wget-log"文件中;
· -t [nuber of times]:嘗試次數,當wget無法與伺服器建立連接時,嘗試連接多少次
。比如"-t
120"表示嘗試120次。當這一項為"0"的時候,指定嘗試無窮多次直到連接成功為止,這個
設置非常有用,當對方伺服器突然關機或者網路突然中斷的時候,可以在恢復正常後繼續
下載沒有傳完的文件;
· -c:斷點續傳,這也是個非常有用的設置,特別當下載比較大的文件的時候,如果中
途意外中斷,那麼連接恢復的時候會從上次沒傳完的地方接著傳,而不是又從頭開始,使
用這一項需要遠程伺服器也支持斷點續傳,一般來講,基於UNIX/Linux的Web/FTP伺服器
都支持斷點續傳;
· -T [number of seconds]:超時時間,指定多長時間遠程伺服器沒有響應就中斷連接
,開始下一次嘗試。比如"-T
120"表示如果120秒以後遠程伺服器沒有發過來數據,就重新嘗試連接。如果網路速度比
較快,這個時間可以設置的短些,相反,可以設置的長一些,一般最多不超過900,通常
也不少於60,一般設置在120左右比較合適;
· -w [number of seconds]:在兩次嘗試之間等待多少秒,比如"-w 100"表示兩次嘗試
之間等待100秒;
· -Y on/off:通過/不通過代理伺服器進行連接;
· -Q [byetes]:限制下載文件的總大小最多不能超過多少,比如"-Q2k"表示不能超過2K
位元組,"-Q3m"表示最多不能超過3M位元組,如果數字後面什麼都不加,就表示是以位元組為單
位,比如"-Q200"表示最多不能超過200位元組;
· -nd:不下載目錄結構,把從伺服器所有指定目錄下載的文件都堆到當前目錄里;
· -x:與"-nd"設置剛好相反,創建完整的目錄結構,例如"wget -nd
http://www.gnu.org"將創建在當前目錄下創建"www.gnu.org"子目錄,然後按照伺服器
實際的目錄結構一級一級建下去,直到所有的文件都傳完為止;
· -nH:不創建以目標主機域名為目錄名的目錄,將目標主機的目錄結構直接下到當前目
錄下;
· --http-user=username
· --http-passwd=password:如果Web伺服器需要指定用戶名和口令,用這兩項來設定;
· --proxy-user=username
· --proxy-passwd=password:如果代理伺服器需要輸入用戶名和口令,使用這兩個選項

· -r:在本機建立伺服器端目錄結構;
· -l [depth]:下載遠程伺服器目錄結構的深度,例如"-l 5"下載目錄深度小於或者等
於5以內的目錄結構或者文件;
· -m:做站點鏡像時的選項,如果你想做一個站點的鏡像,使用這個選項,它將自動設
定其他合適的選項以便於站點鏡像;
· -np:只下載目標站點指定目錄及其子目錄的內容。這也是一個非常有用的選項,我們
假設某個人的個人主頁裡面有一個指向這個站點其他人個人主頁的連接,而我們只想下載
這個人的個人主頁,如果不設置這個選項,甚至--有可能把整個站點給抓下來,這顯然是
我們通常不希望的;
ü 如何設定wget所使用的代理伺服器
wget可以使用用戶設置文件".wgetrc"來讀取很多設置,我們這裡主要利用這個文件來是
設置代理伺服器。使用者用什麼用戶登錄,那麼什麼用戶主目錄下的".wgetrc"文件就起
作用。例如,"root"用戶如果想使用".wgetrc"來設置代理伺服器,"/root/.wgert"就起
作用,下面給出一個".wge
trc"文件的內容,讀者可以參照這個例子來編寫自己的"wgetrc"文件:
http-proxy = 111.111.111.111:8080
ftp-proxy = 111.111.111.111:8080
這兩行的含義是,代理伺服器IP地址為:111.111.111.111,埠號為:80。第一行指定
HTTP協議所使用的代理伺服器,第二行指定FTP協議所使用的代理伺服器。




wget 使用實例:
wget是一個命令行工具,用於批量下載文件,支持HTTP和FTP。究竟比其他的工具好在哪裡?看看內容吧 :)

wget基本上所有的Linux版本都自己帶了,但是有多少人在用呢?呵呵,如果你沒有用過,不妨試試。Windows下面的用戶可以使用GNUwin32的項目,wget,基本功能完全一致。好吧,我們來以幾個簡單的例子看看wget的威力。

如果我們想下載ftp裡面某個目錄裡面的所有文件,我們也可以不用ftp這個笨蛋,呵呵,可以享受cute ftp等圖形化工具的拖一個目錄的輕鬆了。如


wget -r ftp://10.8.8.8/movie/

呵呵,等吧!下完了,發覺有些不對勁,怎麼出來個10.8.8.8的目錄,進去看看,又是一個movie,哦,wget將目錄結構和網站標題都給記錄下來了,不要??沒有問題!比如說還是這個例子

wget -r -nd ftp://10.8.8.8/movie/

結果什麼目錄都沒有了,faint!怎麼會這樣?呵呵,你如果想要這樣就讓它這樣吧,否則使用

wget -r -nH ftp://10.8.8.8/movie/

恩?movie也不要?OK,那就這樣

wget -r -nH --cut-dirs=1 ftp://10.8.8.8/movie/

這有什麼用啊?cuteftp比他好用多了,而且,你這斷了線能連嗎?呵呵,不好意思,可以連

wget -c -r -nH --cut-dirs=1 ftp://10.8.8.8/movie/


但 是cuteftp能做下面的事情嗎?比如,現在很多網站使用Apache建站,並不提供ftp服務,但是Apache有一個indexing功能,可以提 供一個類似於ftp的界面,好多文件我想下啊,怎麼辦?由於是HTTP協議,CuteFTP無能為力了,倒是flash get等有什麼get all這 種功能,不知道他們對於目錄處理怎麼樣。但是wget一點問題都沒有,不信?我們拿CTAN為例(例子並不恰當,CTAN有FTP服務),我們下載這裡面 所有的宏包,呵呵

wget -r -k http://www.txia.com/blog

-k表示將連接轉換為本地連接。但是現在同樣有上面的問題啊,那就把你需要的加上吧,另外也許你根本不需要向下走那麼多層,比如,我們就要到第二層,那麼

wget -r -l2 -k http://www.txia.com/blog

現在新的問題是,由於網頁有一個排序功能,很討厭,因為下載的時候把網頁重複了好多次,那麼我們可使用-A和-R開關控制下載類型,並且可以使用通配符,呵呵,現在隨心所欲了吧

wget -r -R '*.htm*\?*' -k http://www.txia.com/blog

這次沒有那種網頁了吧?-R的意義在於拒絕下載匹配類型的文件,-A表示僅僅接受的文件類型,如-A '*.gif'將僅下載gif圖片,如果有多個允許或者不允許,可以使用,分開。

那 么,我們現在在使用代理伺服器,怎麼辦呢?呵呵,很高興你選擇了wget,你可以使用它的配置文件,環境變數來利用代理。這裡推薦使用環境變數,如在 bash裡面我們可以把天天用的proxy加到.bash_profile裡面,這是Linux標準寫法(很多軟體都用的,什麼apt-get,yum 等等)

export http_proxy=http://10.20.30.40:8080

然後,proxy就默認打開了,如果需要暫時關閉,可以使用

wget --proxy=off -r -k http://www.txia.com/blog

當然,寫一個.wgetrc文件也可以,該文件可以從/usr/local/etc裡面找到,裡面有很詳細的註釋,我就不多說了。

下載網頁的時候比較麻煩的事情是,有的網頁被同時指向了很多遍,那麼為了避免多次下載,我們使用

wget -nc -r -k http://www.txia.com/blog

可以避免這件事情。為了不被有的連接指向非http://www.txia.com/blog內層目錄,我們還應該加上

wget -nc -np -r -k http://www.txia.com/blog

避免下載非該目錄裡面的文件,這也避免了到不同的host上面去。當然,如果你希望有這個功能,在多個host之間跳來跳去的下載,可以使用

wget -nc -np -H -r -k http://www.txia.com/blog

使得可以在多個host之間span,同時-I和-X可以使得我們僅僅跟蹤某些目錄或者不跟蹤某些目錄。如果某些HTML裡面你需要的東西不是由這種東西作出來的,你就得使用--follow-tags和--ignore-tags了。

嘿,我有個文件裡面都是連接,怎麼辦?要是不是html你只需要

wget -i your.file

如果是,那也不繁

wget -F -i your.file



wget 使用指南
wget是一個從網路上自動下載文件的自由工具。它支持HTTP,HTTPS和FTP協議,可以使用HTTP代理.

所謂的自動下載是指,wget可以在用戶退出系統的之後在後台執行。這意味這你可以登錄系統,啟動一個wget下載任務,然後退出系統,wget將在後台執行直到任務完成,相對於其它大部分瀏覽器在下載大量數據時需要用戶一直的參與,這省去了極大的麻煩。

wget 可以跟蹤HTML頁面上的鏈接依次下載來創建遠程伺服器的本地版本,完全重建原始站點的目錄結構。這又常被稱作"遞歸下載"。在遞歸下載的時候,wget 遵循Robot Exclusion標準(/robots.txt). wget可以在下載的同時,將鏈接轉換成指向本地文件,以方便離線瀏覽。

wget 非常穩定,它在帶寬很窄的情況下和不穩定網路中有很強的適應性.如果是由於網路的原因下載失敗,wget會不斷的嘗試,直到整個文件下載完畢。如果是服務 器打斷下載過程,它會再次聯到伺服器上從停止的地方繼續下載。這對從那些限定了鏈接時間的伺服器上下載大文件非常有用。

wget的常見用法
wget的使用格式

Usage: wget [OPTION]... [URL]...

用wget做站點鏡像:
wget -r -p -np -k http://dsec.pku.edu.cn/~usr_name/
- r 表示遞歸下載,會下載所有的鏈接,不過要注意的是,不要單獨使用這個參數,因為如果你要下載的網站也有別的網站的鏈接,wget也會把別的網站的東西 下載下來,所以要加上 -np這個參數,表示不下載別的站點的鏈接. -k表示將下載的網頁里的鏈接修改為本地鏈接.-p獲得所有顯示網頁所需的元素,比 如圖片什麼的.

# 或者
wget -m http://www.tldp.org/LDP/abs/html/


在不穩定的網路上下載一個部分下載的文件,以及在空閑時段下載
wget -t 0 -w 31 -c http://dsec.pku.edu.cn/BBC.avi -o down.log &
# 或者從filelist讀入要下載的文件列表
wget -t 0 -w 31 -c -B ftp://dsec.pku.edu.cn/linuxsoft -i filelist.txt -o down.log &

上面的代碼還可以用來在網路比較空閑的時段進行下載。我的用法是:在mozilla中將不方便當時下載的URL鏈接拷貝到內存中然後粘貼到文件filelist.txt中,在晚上要出去系統前執行上面代碼的第二條。

使用代理下載
wget -Y on -p -k https://sourceforge.net/projects/wvware/

代理可以在環境變數或wgetrc文件中設定
# 在環境變數中設定代理
export PROXY=http://211.90.168.94:8080/
# 在~/.wgetrc中設定代理
http_proxy = http://proxy.yoyodyne.com:18023/
ftp_proxy = http://proxy.yoyodyne.com:18023/

wget各種選項分類列表
啟動
-V, --version 顯示wget的版本後退出
-h, --help 列印語法幫助
-b, --background 啟動後轉入後台執行
-e, --execute=COMMAND 執行`.wgetrc'格式的命令,wgetrc格式參見/etc/wgetrc或~/.wgetrc

記錄和輸入文件
-o, --output-file=FILE 把記錄寫到FILE文件中
-a, --append-output=FILE 把記錄追加到FILE文件中
-d, --debug 列印調試輸出
-q, --quiet 安靜模式(沒有輸出)
-v, --verbose 冗長模式(這是預設設置)
-nv, --non-verbose 關掉冗長模式,但不是安靜模式
-i, --input-file=FILE 下載在FILE文件中出現的URLs
-F, --force-html 把輸入文件當作HTML格式文件對待
-B, --base=URL 將URL作為在-F -i參數指定的文件中出現的相對鏈接的前綴
--sslcertfile=FILE 可選客戶端證書
--sslcertkey=KEYFILE 可選客戶端證書的KEYFILE
--egd-file=FILE 指定EGD socket的文件名

下載
--bind-address=ADDRESS 指定本地使用地址(主機名或IP,當本地有多個IP或名字時使用)
-t, --tries=NUMBER 設定最大嘗試鏈接次數(0 表示無限制).
-O --output-document=FILE 把文檔寫到FILE文件中
-nc, --no-clobber 不要覆蓋存在的文件或使用.#前綴
-c, --continue 接著下載沒下載完的文件
--progress=TYPE 設定進程條標記
-N, --timestamping 不要重新下載文件除非比本地文件新
-S, --server-response 列印伺服器的回應
--spider 不下載任何東西
-T, --timeout=SECONDS 設定響應超時的秒數
-w, --wait=SECONDS 兩次嘗試之間間隔SECONDS秒
--waitretry=SECONDS 在重新鏈接之間等待1...SECONDS秒
--random-wait 在下載之間等待0...2*WAIT秒
-Y, --proxy=on/off 打開或關閉代理
-Q, --quota=NUMBER 設置下載的容量限制
--limit-rate=RATE 限定下載輸率

目錄
-nd --no-directories 不創建目錄
-x, --force-directories 強制創建目錄
-nH, --no-host-directories 不創建主機目錄
-P, --directory-prefix=PREFIX 將文件保存到目錄 PREFIX/...
--cut-dirs=NUMBER 忽略 NUMBER層遠程目錄

HTTP 選項
--http-user=USER 設定HTTP用戶名為 USER.
--http-passwd=PASS 設定http密碼為 PASS.
-C, --cache=on/off 允許/不允許伺服器端的數據緩存 (一般情況下允許).
-E, --html-extension 將所有text/html文檔以.html擴展名保存
--ignore-length 忽略 `Content-Length'頭域
--header=STRING 在headers中插入字元串 STRING
--proxy-user=USER 設定代理的用戶名為 USER
--proxy-passwd=PASS 設定代理的密碼為 PASS
--referer=URL 在HTTP請求中包含 `Referer: URL'頭
-s, --save-headers 保存HTTP頭到文件
-U, --user-agent=AGENT 設定代理的名稱為 AGENT而不是 Wget/VERSION.
--no-http-keep-alive 關閉 HTTP活動鏈接 (永遠鏈接).
--cookies=off 不使用 cookies.
--load-cookies=FILE 在開始會話前從文件 FILE中載入cookie
--save-cookies=FILE 在會話結束后將 cookies保存到 FILE文件中

FTP 選項
-nr, --dont-remove-listing 不移走 `.listing'文件
-g, --glob=on/off 打開或關閉文件名的 globbing機制
--passive-ftp 使用被動傳輸模式 (預設值).
--active-ftp 使用主動傳輸模式
--retr-symlinks 在遞歸的時候,將鏈接指向文件(而不是目錄)

遞歸下載
-r, --recursive 遞歸下載--慎用!
-l, --level=NUMBER 最大遞歸深度 (inf 或 0 代表無窮).
--delete-after 在現在完畢后局部刪除文件
-k, --convert-links 轉換非相對鏈接為相對鏈接
-K, --backup-converted 在轉換文件X之前,將之備份為 X.orig
-m, --mirror 等價於 -r -N -l inf -nr.
-p, --page-requisites 下載顯示HTML文件的所有圖片

遞歸下載中的包含和不包含(accept/reject)
-A, --accept=LIST 分號分隔的被接受擴展名的列表
-R, --reject=LIST 分號分隔的不被接受的擴展名的列表
-D, --domains=LIST 分號分隔的被接受域的列表
--exclude-domains=LIST 分號分隔的不被接受的域的列表
--follow-ftp 跟蹤HTML文檔中的FTP鏈接
--follow-tags=LIST 分號分隔的被跟蹤的HTML標籤的列表
-G, --ignore-tags=LIST 分號分隔的被忽略的HTML標籤的列表
-H, --span-hosts 當遞歸時轉到外部主機
-L, --relative 僅僅跟蹤相對鏈接
-I, --include-directories=LIST 允許目錄的列表
-X, --exclude-directories=LIST 不被包含目錄的列表
-np, --no-parent 不要追溯到父目錄

問題
在遞歸下載的時候,遇到目錄中有中文的時候,wget創建的本地目錄名會用URL編碼規則處理。如"天網防火牆"會被存為"%CC%EC%CD%F8%B7%C0%BB%F0%C7%BD",這造成閱讀上的極大不方便。

[ 本帖最後由 wingsmart 於 2008-9-14 04:01 編輯 ]

[火星人 ] Wget使用大全和使用技巧已經有664次圍觀

http://coctec.com/docs/linux/show-post-164360.html