rsync中文手冊-用rsync實現網站鏡像和備份

←手機掃碼閱讀     火星人 @ 2014-03-25 , reply:0

簡介
對於選擇Linux 作為應用平台的的中小型企業或網站來說,往往面臨如何實現數據遠程備份或者網站鏡象的問題,雖然有商業化的備份和鏡象產品可供選擇,但這些產品的價格往往過於昂貴。因此如何利用自由軟體高效實現遠程備份和網站鏡象就成為一個值得討論的話題。
通過網路進行遠程數據備份或者網站鏡象的最簡單的方法就是使用wget,但是這種方式每次都需要將所有數據都重新在網路上傳輸一遍,而不考慮哪些文件是經過更新的,因此效率非常低下。尤其在需要備份的數據量很大的時候,往往需要花費數個小時來在網路上進行數據傳輸。
因此這裡就介紹一種高效的網路遠程備份和鏡象工具-rsync,它可以滿足絕大多數要求不是特別嚴格的備份需求。
rsync是類unix系統下的數據鏡像備份工具,從軟體的命名上就可以看出來了——remote sync。它的特性如下:
可以鏡像保存整個目錄樹和文件系統。
可以很容易做到保持原來文件的許可權、時間、軟硬鏈接等等。
無須特殊許可權即可安裝。
優化的流程,文件傳輸效率高。
可以使用rcp、ssh等方式來傳輸文件,當然也可以通過直接的socket連接。
支持匿名傳輸,以方便進行網站鏡象。
軟體下載
rysnc的主頁地址為:
http://rsync.samba.org/
目前最新版本為2.4.6。可以選擇從原始網站下載:http://rsync.samba.org/ftp/rsync/。也可以選擇從本站下載:rsync 2.4.6。
編譯安裝
rsync的編譯安裝非常簡單,只需要以下簡單的幾步:
[root@www rsync-2.4.6]# ./configure
[root@www rsync-2.4.6]# make
[root@www rsync-2.4.6]# make install
但是需要注意的是必須在伺服器A和B上都安裝rsync,其中A伺服器上是以伺服器模式運行rsync,而B上則以客戶端方式運行rsync。這樣在web伺服器A上運行rsync守護進程,在B上定時運行客戶程序來備份web伺服器A上需要備份的內容。
rsync伺服器
1、rsync伺服器的啟動
在web伺服器A上需要以守護進程方式來啟動rsync伺服器,只需要運行:
[root@www rsync-2.4.6]# /usr/local/bin/rsync --daemon
即可啟動。rsync默認服務埠為873,伺服器在該埠接收客戶的匿名或者認證方式的備份請求。
如果要在啟動時把服務起來,有幾種不同的方法,比如:
a、加入inetd.conf
編輯/etc/services,加入rsync 873/tcp,指定rsync的服務埠是873。編加/etc/inetd.conf,加入rsync stream tcp nowait root /bin/rsync rsync --daemon
註:對於xinetd,設置方法類似。
b、加入rc.local
編輯/etc/rc.d/rc.local,在最後添加:
/usr/local/bin/rsync --daemon
2、rsync的配置
對於rsync伺服器來說,最重要和複雜的就是它的配置了。rsync伺服器的配置文件為/etc/rsyncd.conf,其控制認證、訪問、日誌記錄等等。
該文件是由一個或多個模塊結構組成。一個模塊定義以方括弧中的模塊名開始,直到下一個模塊定義開始或者文件結束,模塊中包含格式為name = value的參數定義。每個模塊其實就對應需要備份的一個目錄樹,比方說在我們的實例環境中,有三個目錄樹需要備份:/www/、 /home/web_user1/和/home/web_user2/,那麼就需要在配置文件中定義三個模塊,分別對應三個目錄樹。
配置文件是行為單位的,也就是每個新行都表示一個新的註釋、模塊定義或者參數賦值。以#開始的行表示註釋,以"\"結束的行表示下面一行是該行的繼續。參數賦值中等號后可能是一個大小寫不敏感的字元串、一個以trure/false表示的布爾值。
全局參數
在文件中[modlue]之前的所有參數都是全局參數,當然也可以在全局參數部分定義模塊參數,這時候該參數的值就是所有模塊的默認值。
motd file
"motd file"參數用來指定一個消息文件,當客戶連接伺服器時該文件的內容顯示給客戶,默認是沒有motd文件的。
log file
"log file"指定rsync的日誌文件,而不將日誌發送給syslog。
pid file
指定rsync的pid文件。
syslog facility
指定rsync發送日誌消息給syslog時的消息級別,常見的消息級別是:uth, authpriv, cron, daemon, ftp, kern, lpr, mail, news, security, sys-log, user, uucp, local0, local1, local2, local3,local4, local5, local6和local7。默認值是daemon。
模塊參數
在全局參數之後就需要定義一個或多個模塊了,模塊中可以定義以下參數:
comment
給模塊指定一個描述,該描述連同模塊名在客戶連接得到模塊列表時顯示給客戶。默認沒有描述定義。
path
指定該模塊的供備份的目錄樹路徑,該參數是必須指定的。
use chroot
如 果"use chroot"指定為true,那麼rsync在傳輸文件以前首先chroot到path參數所指定的目錄下。這樣做的原因是實現額外的安全防護,但是缺點是需要以roots許可權,並且不能備份指向外部的符號連接所指向的目錄文件。默認情況下chroot值為true。
max connections
指定該模塊的最大併發連接數量以保護伺服器,超過限制的連接請求將被告知隨後再試。默認值是0,也就是沒有限制。
lock file
指定支持max connections參數的鎖文件,默認值是/var/run/rsyncd.lock。
read only
該選項設定是否允許客戶上載文件。如果為true那麼任何上載請求都會失敗,如果為false並且伺服器目錄讀寫許可權允許那麼上載是允許的。默認值為true。
list
該選項設定當客戶請求可以使用的模塊列表時,該模塊是否應該被列出。如果設置該選項為false,可以創建隱藏的模塊。默認值是true。
uid
該選項指定當該模塊傳輸文件時守護進程應該具有的uid,配合gid選項使用可以確定哪些可以訪問怎麼樣的文件許可權,默認值是"nobody"。
gid
該選項指定當該模塊傳輸文件時守護進程應該具有的gid。默認值為"nobody"。
exlude
用來指定多個由空格隔開的多個模式列表,並將其添加到exclude列表中。這等同於在客戶端命令中使用--exclude來指定模式,不過配置文件中指定的exlude模式不會傳遞給客戶端,而僅僅應用於伺服器。一個模塊只能指定一個exlude選項,但是可以在模式前面使用"-"和"+"來指定是 exclude還是include。
但是需要注意的一點是該選項有一定的安全性問題,客戶很有可能繞過exlude列表,如果希望確保特定的文件不能被訪問,那就最好結合uid/gid選項一起使用。
exlude from
指定一個包含exclude模式的定義的文件名,伺服器從該文件中讀取exlude列表定義。
include
用來指定多個由空格隔開的多個rsync並應該exlude的模式列表。這等同於在客戶端命令中使用--include來指定模式,結合 include和 exlude可以定義複雜的exlude/include規則。一個模塊只能指定一個include選項,但是可以在模式前面使用"-"和"+"來指定是 exclude還是include。
include from
指定一個包含include模式的定義的文件名,伺服器從該文件中讀取include列表定義。
auth users
該選項指定由空格或逗號分隔的用戶名列表,只有這些用戶才允許連接該模塊。這裡的用戶和系統用戶沒有任何關係。如果"auth users"被設置,那麼客戶端發出對該模塊的連接請求以後會被rsync請求challenged進行驗證身份這裡使用的 challenge/response認證協議。用戶的名和密碼以明文方式存放在"secrets file"選項指定的文件中。默認情況下無需密碼就可以連接模塊(也就是匿名方式)。
secrets file
該選項指定一個包含定義用戶名:密碼對的文件。只有在"auth users"被定義時,該文件才有作用。文件每行包含一個username:passwd對。一般來說密碼最好不要超過8個字元。沒有默認的 secures file名,需要限式指定一個。(例如:/etc/rsyncd.secrets)
strict modes
該選項指定是否監測密碼文件的許可權,如果該選項值為true那麼密碼文件只能被rsync伺服器運行身份的用戶訪問,其他任何用戶不可以訪問該文件。默認值為true。
hosts allow
該選項指定哪些IP的客戶允許連接該模塊。客戶模式定義可以是以下形式:
o xxx.xxx.xxx.xxx,客戶主機只有完全匹配該IP才允許訪問。例如:192.167.0.1
o a.b.c.d/n,屬於該網路的客戶都允許連接該模塊。例如:192.168.0.0/24
o a.b.c.d/e.f.g.h,屬於該網路的客戶都允許連接該模塊。例如:192.168.0.0/255.255.255.0
o 一個主機名,客戶主機只有擁有該主機名才允許訪問,例如:backup.linuxaid.com.cn。
o *.linuxaid.com.cn,所有屬於該域的主機都允許。
默認是允許所有主機連接。
hosts deny
指定不允許連接rsync伺服器的機器,可以使用hosts allow的定義方式來進行定義。默認是沒有hosts deny定義。
ignore errors
指定rsyncd在判斷是否運行傳輸時的刪除操作時忽略server上的IP錯誤,一般來說rsync在出現IO錯誤時將將跳過--delete操作,以防止因為暫時的資源不足或其它IO錯誤導致的嚴重問題。
ignore nonreadable
指定rysnc伺服器完全忽略那些用戶沒有訪問許可權的文件。這對於在需要備份的目錄中有些文件是不應該被備份者得到的情況是有意義的。
transfer logging
使rsync伺服器使用ftp格式的文件來記錄下載和上載操作在自己單獨的日誌中。
log format
通過該選項用戶在使用transfer logging可以自己定製日誌文件的欄位。其格式是一個包含格式定義符的字元串,可以使用的格式定義符如下所示:
o %h 遠程主機名
o %a 遠程IP地址
o %l 文件長度字元數
o %p 該次rsync會話的進程id
o %o 操作類型:"send"或"recv"
o %f 文件名
o %P 模塊路徑
o %m 模塊名
o %t 當前時間
o %u 認證的用戶名(匿名時是null)
o %b 實際傳輸的位元組數
o %c 當發送文件時,該欄位記錄該文件的校驗碼
默認log格式為:"%o %h [%a] %m (%u) %f %l",一般來說,在每行的頭上會添加"%t [%p] "。在源代碼中同時發布有一個叫rsyncstats的perl腳本程序來統計這種格式的日誌文件。
timeout
通過該選項可以覆蓋客戶指定的IP超時時間。通過該選項可以確保rsync伺服器不會永遠等待一個崩潰的客戶。超時單位為秒鐘,0表示沒有超時定義,這也是默認值。對於匿名rsync伺服器來說,一個理想的數字是600。
refuse options
通過該選項可以定義一些不允許客戶對該模塊使用的命令參數列表。這裡必須使用命令全名,而不能是簡稱。但發生拒絕某個命令的情況時伺服器將報告錯誤信息然後退出。如果要防止使用壓縮,應該是:"dont compress = *"。
dont compress
用來指定那些不進行壓縮處理再傳輸的文件,默認值是
*.gz *.tgz *.zip *.z *.rpm *.deb *.iso *.bz2 *.tbz
rsync客戶命令
在對rsync伺服器配置結束以後,下一步就需要在客戶端發出rsync命令來實現將伺服器端的文件備份到客戶端來。rsync是一個功能非常強大的工具,其命令也有很多功能特色選項,我們下面就對它的選項一一進行分析說明。
首先,rsync的命令格式可以為:
rsync [OPTION]... SRC [SRC]... [USER@]HOST:DEST
rsync [OPTION]... [USER@]HOST:SRC DEST
rsync [OPTION]... SRC [SRC]... DEST
rsync [OPTION]... [USER@]HOST::SRC [DEST]
rsync [OPTION]... SRC [SRC]... [USER@]HOST::DEST
rsync [OPTION]... rsync://[USER@]HOST[:PORT]/SRC [DEST]
rsync有六種不同的工作模式:
拷貝本地文件;當SRC和DES路徑信息都不包含有單個冒號":"分隔符時就啟動這種工作模式。
使用一個遠程shell程序(如rsh、ssh)來實現將本地機器的內容拷貝到遠程機器。當DST路徑地址包含單個冒號":"分隔符時啟動該模式。
使用一個遠程shell程序(如rsh、ssh)來實現將遠程機器的內容拷貝到本地機器。當SRC地址路徑包含單個冒號":"分隔符時啟動該模式。
從遠程rsync伺服器中拷貝文件到本地機。當SRC路徑信息包含"::"分隔符時啟動該模式。
從本地機器拷貝文件到遠程rsync伺服器中。當DST路徑信息包含"::"分隔符時啟動該模式。
列遠程機的文件列表。這類似於rsync傳輸,不過只要在命令中省略掉本地機信息即可。
1、用法
在使用rsync傳輸文件時,需要指定一個源和一個目的,其中一個可能是遠程機器的資源信息。例如:
rsync *.c foo:src/
表示將傳輸當前目錄下所有以.c結尾的文件到機器foo的src目錄下。如果任何文件已經存在於遠程系統,則會調用遠程更新協議來實現僅僅傳輸那些更新過的文件。
rsync -avz foo:src/bar /data/tmp
該命令則遞歸地傳輸機器foo上的src/bar目錄下的所有內容到本地/data/tmp/bar目錄中。文件以歸檔模式進行傳輸,以確保符號鏈結、屬性、許可權、屬主等信息在傳輸中都被保存。此外,可以使用壓縮技術來加快數據傳輸:
rsync -avz foo:src/bar/ /data/tmp
路徑信息以"/"結尾時表示拷貝該目錄,而不以"/"結尾表示拷貝該目錄。當配合使用--delete選項時這兩種情況的區別將會表現出來。
也可以以本地模式來使用rsync,如果SRC和DST路徑中都沒有任何":"符號則表示該命令運行在本地模式,等同於cp命令。
rsync somehost.mydomain.com::
這種模式則將會列出somehost.mydomain.com.可以訪問的所有模塊信息。
選項說明
-v, --verbose 詳細模式輸出
-q, --quiet 精簡輸出模式
-c, --checksum 打開校驗開關,強制對文件傳輸進行校驗
-a, --archive 歸檔模式,表示以遞歸方式傳輸文件,並保持所有文件屬性,等於-rlptgoD
-r, --recursive 對子目錄以遞歸模式處理
-R, --relative 使用相對路徑信息
rsync foo/bar/foo.c remote:/tmp/
則在/tmp目錄下創建foo.c文件,而如果使用-R參數:
rsync -R foo/bar/foo.c remote:/tmp/
則會創建文件/tmp/foo/bar/foo.c,也就是會保持完全路徑信息。
-b, --backup 創建備份,也就是對於目的已經存在有同樣的文件名時,將老的文件重新命名為~filename。可以使用--suffix選項來指定不同的備份文件前綴。
--backup-dir 將備份文件(如~filename)存放在在目錄下。
-suffix=SUFFIX 定義備份文件前綴
-u, --update 僅僅進行更新,也就是跳過所有已經存在於DST,並且文件時間晚於要備份的文件。(不覆蓋更新的文件)
-l, --links 保留軟鏈結
-L, --copy-links 想對待常規文件一樣處理軟鏈結
--copy-unsafe-links 僅僅拷貝指向SRC路徑目錄樹以外的鏈結
--safe-links 忽略指向SRC路徑目錄樹以外的鏈結
-H, --hard-links 保留硬鏈結
-p, --perms 保持文件許可權
-o, --owner 保持文件屬主信息
-g, --group 保持文件屬組信息
-D, --devices 保持設備文件信息
-t, --times 保持文件時間信息
-S, --sparse 對稀疏文件進行特殊處理以節省DST的空間
-n, --dry-run現實哪些文件將被傳輸
-W, --whole-file 拷貝文件,不進行增量檢測
-x, --one-file-system 不要跨越文件系統邊界
-B, --block-size=SIZE 檢驗演算法使用的塊尺寸,默認是700位元組
-e, --rsh=COMMAND 指定替代rsh的shell程序
--rsync-path=PATH 指定遠程伺服器上的rsync命令所在路徑信息
-C, --cvs-exclude 使用和CVS一樣的方法自動忽略文件,用來排除那些不希望傳輸的文件
--existing 僅僅更新那些已經存在於DST的文件,而不備份那些新創建的文件
--delete 刪除那些DST中SRC沒有的文件
--delete-excluded 同樣刪除接收端那些被該選項指定排除的文件
--delete-after 傳輸結束以後再刪除
--ignore-errors 及時出現IO錯誤也進行刪除
--max-delete=NUM 最多刪除NUM個文件
--partial 保留那些因故沒有完全傳輸的文件,以是加快隨後的再次傳輸
--force 強制刪除目錄,即使不為空
--numeric-ids 不將數字的用戶和組ID匹配為用戶名和組名
--timeout=TIME IP超時時間,單位為秒
-I, --ignore-times 不跳過那些有同樣的時間和長度的文件
--size-only 當決定是否要備份文件時,僅僅察看文件大小而不考慮文件時間
--modify-window=NUM 決定文件是否時間相同時使用的時間戳窗口,默認為0
-T --temp-dir=DIR 在DIR中創建臨時文件
--compare-dest=DIR 同樣比較DIR中的文件來決定是否需要備份
-P 等同於 --partial
--progress 顯示備份過程
-z, --compress 對備份的文件在傳輸時進行壓縮處理
--exclude=PATTERN 指定排除不需要傳輸的文件模式
--include=PATTERN 指定不排除而需要傳輸的文件模式
--exclude-from=FILE 排除FILE中指定模式的文件
--include-from=FILE 不排除FILE指定模式匹配的文件
--version 列印版本信息
--address 綁定到特定的地址
--config=FILE 指定其他的配置文件,不使用默認的rsyncd.conf文件
--port=PORT 指定其他的rsync服務埠
--blocking-io 對遠程shell使用阻塞IO
-stats 給出某些文件的傳輸狀態
--progress 在傳輸時現實傳輸過程
--log-format=FORMAT 指定日誌文件格式
--password-file=FILE 從FILE中得到密碼
--bwlimit=KBPS 限制I/O帶寬,KBytes per second
-h, --help 顯示幫助信息
實例分析
這裡假設有兩台伺服器:A和B。其中A是主web伺服器,具有域名www.linuxaid.com.cn(202.99.11.120),B伺服器是備份機,其域名為backup.linuxaid.com.cn(202.99.11.121)。其中A的web內容存放在以下幾個地方: /www/和 /home/web_user1/和/home/web_user2/。我們需要在備份機B上建立對這幾個目錄內容的備份。
伺服器配置實例
那麼在www.linuxaid.com.cn上創建rsyncd的配置文件/etc/rsyncd.conf,內容如下:
uid = nobody
gid = nobody
use chroot = no
max connections = 4
pid file = /var/run/rsyncd.pid
lock file = /var/run/rsync.lock
log file = /var/log/rsyncd.log
[www]
path = /www/
ignore errors
read only = true
list = false
hosts allow = 202.99.11.121
hosts deny = 0.0.0.0/32
auth users = backup
secrets file = /etc/backserver.pas
[web_user1]
path = /home/web_user1/
ignore errors
read only = true
list = false
hosts allow = 202.99.11.121
hosts deny = 0.0.0.0/32
uid = web_user1
gid = web_user1
auth users = backup
secrets file = /etc/backserver.pas
[web_user2]
path = /home/web_user2/
ignore errors
read only = true
list = false
hosts allow = 202.99.11.121
hosts deny = 0.0.0.0/32
uid = web_user2
gid = web_user2
auth users = backup
secrets file = /etc/backserver.pas
這裡定義有四個三個模塊,分別對應於三個需要備份的目錄樹。這裡只允許202.99.11.121備份本機的數據,並且需要認證。三個模塊授權的備份用戶都為backup,並且用戶信息保存在文件/etc/backserver.pas中,其內容如下:
backup:bk_passwd
並且該文件只能是root用戶可讀寫的,否則rsyncd啟動時會出錯。這些文件配置完畢以後,就需要在A伺服器上啟動rsyncd伺服器:
rsync --daemon
客戶命令示例
/usr/local/bin/rsync -vzrtopg --delete --exclude "logs/" --exclude "conf/ssl.*/" --progress backup@202.99.11.120::www /backup/www/ --password-file=/etc/rsync.pass
上面這個命令行中-vzrtopg里的v是verbose,z是壓縮,r是recursive,topg都是保持文件原有屬性如屬主、時間的參數。-- progress是指顯示出詳細的進度情況,--delete是指如果伺服器端刪除了這一文件,那麼客戶端也相應把文件刪除,保持真正的一致。-- exclude "logs/" 表示不對/www/logs目錄下的文件進行備份。--exclude "conf/ssl.*/"表示不對/www/conf/ssl.*/目錄下的文件進行備份。
backup@202.99.11.120::www 表示對該命令是對伺服器202.99.11.120中的www模塊進行備份,backup表示使用backup來對該模塊進行備份。
--password-file=/etc/rsync.pass來指定密碼文件,這樣就可以在腳本中使用而無需互動式地輸入驗證密碼了,這裡需要注意的是這份密碼文件許可權屬性要設得只有root可讀。
這裡將備份的內容存放在備份機的/backup/www/目錄下。
[root@linuxaid /]# /usr/local/bin/rsync -vzrtopg --delete --exclude "logs/" --exclude "conf/ssl.*/" --progress backup@202.99.11.120::www /backup/www/ --password-file=/etc/rsync.pass
receiving file list ... done
./
1
785 (100%)
1.py
4086 (100%)
2.py
10680 (100%)
a
0 (100%)
ip
3956 (100%)
./
wrote 2900 bytes read 145499 bytes 576.34 bytes/sec
total size is 2374927 speedup is 45.34
對其它兩個模塊操作的命令分別為:
/usr/local/bin/rsync -vzrtopg --delete --progress backup@202.99.11.120::web_user1 /backup/web_user1/ --password-file=/etc/rsync.pass
/usr/local/bin/rsync -vzrtopg --delete --progress backup@202.99.11.120::web_user2 /backup/web_user2/ --password-file=/etc/rsync.pass
可以將客戶命令通過crontab -e命令來實現自動備份,如crontab -e:




[火星人 ] rsync中文手冊-用rsync實現網站鏡像和備份已經有497次圍觀

http://coctec.com/docs/linux/show-post-159651.html