一、简介
rsync 是一个常用的 Linux 应用程序,用于文件同步。
它可以在本地计算机与远程计算机之间,或者两个本地目录之间同步文件(但不支持两台远程计算机之间的同步)。它也可以当作文件复制工具,替代cp
和mv
命令。
它名称里面的r
指的是 remote,rsync 其实就是"远程同步"(remote sync)的意思。与其他文件传输工具(如 FTP 或 scp)不同,rsync 的最大特点是会检查发送方和接收方已有的文件,仅传输有变动的部分(默认规则是文件大小或修改时间有变动)。
二、安装
如果本机或者远程计算机没有安装 rsync,可以用下面的命令安装。
# Debian $ sudo apt-get install rsync # Red Hat $ sudo yum install rsync # Arch Linux $ sudo pacman -S rsync
注意,传输的双方都必须安装 rsync。
三、基本用法
3.1 -r
参数
本机使用 rsync 命令时,可以作为cp
和mv
命令的替代方法,将源目录同步到目标目录。
$ rsync -r source destination
上面命令中,-r
表示递归,即包含子目录。注意,-r
是必须的,否则 rsync 运行不会成功。source
目录表示源目录,destination
表示目标目录。
如果有多个文件或目录需要同步,可以写成下面这样。
$ rsync -r source1 source2 destination
上面命令中,source1
、source2
都会被同步到destination
目录。
3.2 -a
参数
-a
参数可以替代-r
,除了可以递归同步以外,还可以同步元信息(比如修改时间、权限等)。由于 rsync 默认使用文件大小和修改时间决定文件是否需要更新,所以-a
比-r
更有用。下面的用法才是常见的写法。
$ rsync -a source destination
目标目录destination
如果不存在,rsync 会自动创建。执行上面的命令后,源目录source
被完整地复制到了目标目录destination
下面,即形成了destination/source
的目录结构。
如果只想同步源目录source
里面的内容到目标目录destination
,则需要在源目录后面加上斜杠。
$ rsync -a source/ destination
上面命令执行后,source
目录里面的内容,就都被复制到了destination
目录里面,并不会在destination
下面创建一个source
子目录。
3.3 -n
参数
如果不确定 rsync 执行后会产生什么结果,可以先用-n
或--dry-run
参数模拟执行的结果。
$ rsync -anv source/ destination
上面命令中,-n
参数模拟命令执行的结果,并不真的执行命令。-v
参数则是将结果输出到终端,这样就可以看到哪些内容会被同步。
3.4 --delete
参数
默认情况下,rsync 只确保源目录的所有内容(明确排除的文件除外)都复制到目标目录。它不会使两个目录保持相同,并且不会删除文件。如果要使得目标目录成为源目录的镜像副本,则必须使用--delete
参数,这将删除只存在于目标目录、不存在于源目录的文件。
$ rsync -av --delete source/ destination
上面命令中,--delete
参数会使得destination
成为source
的一个镜像。
四、排除文件
4.1 --exclude
参数
有时,我们希望同步时排除某些文件或目录,这时可以用--exclude
参数指定排除模式。
$ rsync -av --exclude='*.txt' source/ destination # 或者 $ rsync -av --exclude '*.txt' source/ destination
上面命令排除了所有 TXT 文件。
注意,rsync 会同步以"点"开头的隐藏文件,如果要排除隐藏文件,可以这样写--exclude=".*"
。
如果要排除某个目录里面的所有文件,但不希望排除目录本身,可以写成下面这样。
$ rsync -av --exclude 'dir1/*' source/ destination
多个排除模式,可以用多个--exclude
参数。
$ rsync -av --exclude 'file1.txt' --exclude 'dir1/*' source/ destination
多个排除模式也可以利用 Bash 的大扩号的扩展功能,只用一个--exclude
参数。
$ rsync -av --exclude={'file1.txt','dir1/*'} source/ destination
如果排除模式很多,可以将它们写入一个文件,每个模式一行,然后用--exclude-from
参数指定这个文件。
$ rsync -av --exclude-from='exclude-file.txt' source/ destination
4.2 --include
参数
--include
参数用来指定必须同步的文件模式,往往与--exclude
结合使用。
$ rsync -av --include="*.txt" --exclude='*' source/ destination
上面命令指定同步时,排除所有文件,但是会包括 TXT 文件。
五、远程同步
5.1 SSH 协议
rsync 除了支持本地两个目录之间的同步,也支持远程同步。它可以将本地内容,同步到远程服务器。
$ rsync -av source/ username@remote_host:destination
也可以将远程内容同步到本地。
$ rsync -av username@remote_host:source/ destination
rsync 默认使用 SSH 进行远程登录和数据传输。
由于早期 rsync 不使用 SSH 协议,需要用-e
参数指定协议,后来才改的。所以,下面-e ssh
可以省略。
$ rsync -av -e ssh source/ user@remote_host:/destination
但是,如果 ssh 命令有附加的参数,则必须使用-e
参数指定所要执行的 SSH 命令。
$ rsync -av -e 'ssh -p 2234' source/ user@remote_host:/destination
上面命令中,-e
参数指定 SSH 使用2234端口。
5.2 rsync 协议
除了使用 SSH,如果另一台服务器安装并运行了 rsync 守护程序,则也可以用rsync://
协议(默认端口873)进行传输。具体写法是服务器与目标目录之间使用双冒号分隔::
。
$ rsync -av source/ 192.168.122.32::module/destination
注意,上面地址中的module
并不是实际路径名,而是 rsync 守护程序指定的一个资源名,由管理员分配。
如果想知道 rsync 守护程序分配的所有 module 列表,可以执行下面命令。
$ rsync rsync://192.168.122.32
rsync 协议除了使用双冒号,也可以直接用rsync://
协议指定地址。
$ rsync -av source/ rsync://192.168.122.32/module/destination
六、增量备份
rsync 的最大特点就是它可以完成增量备份,也就是默认只复制有变动的文件。
除了源目录与目标目录直接比较,rsync 还支持使用基准目录,即将源目录与基准目录之间变动的部分,同步到目标目录。
具体做法是,第一次同步是全量备份,所有文件在基准目录里面同步一份。以后每一次同步都是增量备份,只同步源目录与基准目录之间有变动的部分,将这部分保存在一个新的目标目录。这个新的目标目录之中,也是包含所有文件,但实际上,只有那些变动过的文件是存在于该目录,其他没有变动的文件都是指向基准目录文件的硬链接。
--link-dest
参数用来指定同步时的基准目录。
$ rsync -a --delete --link-dest /compare/path /source/path /target/path
上面命令中,--link-dest
参数指定基准目录/compare/path
,然后源目录/source/path
跟基准目录进行比较,找出变动的文件,将它们拷贝到目标目录/target/path
。那些没变动的文件则会生成硬链接。这个命令的第一次备份时是全量备份,后面就都是增量备份了。
下面是一个脚本示例,备份用户的主目录。
#!/bin/bash # A script to perform incremental backups using rsync set -o errexit set -o nounset set -o pipefail readonly SOURCE_DIR="${HOME}" readonly BACKUP_DIR="/mnt/data/backups" readonly DATETIME="$(date '+%Y-%m-%d_%H:%M:%S')" readonly BACKUP_PATH="${BACKUP_DIR}/${DATETIME}" readonly LATEST_LINK="${BACKUP_DIR}/latest" mkdir -p "${BACKUP_DIR}" rsync -av --delete \ "${SOURCE_DIR}/" \ --link-dest "${LATEST_LINK}" \ --exclude=".cache" \ "${BACKUP_PATH}" rm -rf "${LATEST_LINK}" ln -s "${BACKUP_PATH}" "${LATEST_LINK}"
上面脚本中,每一次同步都会生成一个新目录${BACKUP_DIR}/${DATETIME}
,并将软链接${BACKUP_DIR}/latest
指向这个目录。下一次备份时,就将${BACKUP_DIR}/latest
作为基准目录,生成新的备份目录。最后,再将软链接${BACKUP_DIR}/latest
指向新的备份目录。
七、配置项
-a
、--archive
参数表示存档模式,保存所有的元数据,比如修改时间(modification time)、权限、所有者等,并且软链接也会同步过去。
--append
参数指定文件接着上次中断的地方,继续传输。
--append-verify
参数跟--append
参数类似,但会对传输完成后的文件进行一次校验。如果校验失败,将重新发送整个文件。
-b
、--backup
参数指定在删除或更新目标目录已经存在的文件时,将该文件更名后进行备份,默认行为是删除。更名规则是添加由--suffix
参数指定的文件后缀名,默认是~
。
--backup-dir
参数指定文件备份时存放的目录,比如--backup-dir=/path/to/backups
。
--bwlimit
参数指定带宽限制,默认单位是 KB/s,比如--bwlimit=100
。
-c
、--checksum
参数改变rsync
的校验方式。默认情况下,rsync 只检查文件的大小和最后修改日期是否发生变化,如果发生变化,就重新传输;使用这个参数以后,则通过判断文件内容的校验和,决定是否重新传输。
--delete
参数删除只存在于目标目录、不存在于源目标的文件,即保证目标目录是源目标的镜像。
-e
参数指定使用 SSH 协议传输数据。
--exclude
参数指定排除不进行同步的文件,比如--exclude="*.iso"
。
--exclude-from
参数指定一个本地文件,里面是需要排除的文件模式,每个模式一行。
--existing
、--ignore-non-existing
参数表示不同步目标目录中不存在的文件和目录。
-h
参数表示以人类可读的格式输出。
-h
、--help
参数返回帮助信息。
-i
参数表示输出源目录与目标目录之间文件差异的详细情况。
--ignore-existing
参数表示只要该文件在目标目录中已经存在,就跳过去,不再同步这些文件。
--include
参数指定同步时要包括的文件,一般与--exclude
结合使用。
--link-dest
参数指定增量备份的基准目录。
-m
参数指定不同步空目录。
--max-size
参数设置传输的最大文件的大小限制,比如不超过200KB(--max-size='200k'
)。
--min-size
参数设置传输的最小文件的大小限制,比如不小于10KB(--min-size=10k
)。
-n
参数或--dry-run
参数模拟将要执行的操作,而并不真的执行。配合-v
参数使用,可以看到哪些内容会被同步过去。
-P
参数是--progress
和--partial
这两个参数的结合。
--partial
参数允许恢复中断的传输。不使用该参数时,rsync
会删除传输到一半被打断的文件;使用该参数后,传输到一半的文件也会同步到目标目录,下次同步时再恢复中断的传输。一般需要与--append
或--append-verify
配合使用。
--partial-dir
参数指定将传输到一半的文件保存到一个临时目录,比如--partial-dir=.rsync-partial
。一般需要与--append
或--append-verify
配合使用。
--progress
参数表示显示进展。
-r
参数表示递归,即包含子目录。
--remove-source-files
参数表示传输成功后,删除发送方的文件。
--size-only
参数表示只同步大小有变化的文件,不考虑文件修改时间的差异。
--suffix
参数指定文件名备份时,对文件名添加的后缀,默认是~
。
-u
、--update
参数表示同步时跳过目标目录中修改时间更新的文件,即不同步这些有更新的时间戳的文件。
-v
参数表示输出细节。-vv
表示输出更详细的信息,-vvv
表示输出最详细的信息。
--version
参数返回 rsync 的版本。
-z
参数指定同步时压缩数据。
八、参考链接
- How To Use Rsync to Sync Local and Remote Directories on a VPS, Justin Ellingwood
- Mirror Your Web Site With rsync, Falko Timme
- Examples on how to use Rsync, Egidio Docile
- How to create incremental backups using rsync on Linux, Egidio Docile
(完)
AlbertWei 说:
学习了,很实用
2020年8月26日 15:09 | # | 引用
pasiso 说:
3.2 -a 参数 这一节里面疑似rsync笔误
-----------------------------------------------
目标目录destination如果不存在,rsyce 会自动创建。
2020年8月27日 00:22 | # | 引用
阮一峰 说:
@pasiso:
谢谢指出,已经更正。
2020年8月27日 08:48 | # | 引用
cnfczn 说:
有个地方rsync拼错了,打成了rsyce
2020年8月27日 08:50 | # | 引用
dykingdy 说:
rsync + inotify结合使用,可以实现两台机器的文件同步
2020年8月27日 15:44 | # | 引用
Kevin 说:
正要用,阮老师就发出来了,太及时了。
2020年8月28日 09:15 | # | 引用
Jerry 说:
学习了 ~
2020年9月 1日 09:49 | # | 引用
田鹏 说:
"上面脚本中,上一次备份的目录${BACKUP_DIR}/${DATETIME}是基准目录,每一次同步都会生成一个新目录,然后将${BACKUP_DIR}/latest指向这个新目录,作为下一次的基准目录,再删除上一次的基准目录"
这里描述有点问题:
删除的不是上一次的基准目录,是latest软连接,然后重建latest到本次建立目录,每次的目录都会保留,只有latest会不断变化。
2020年9月 1日 12:04 | # | 引用
阮一峰 说:
@田鹏:
谢谢指出,已经更正了。
2020年9月 1日 14:58 | # | 引用
noah_ 说:
Mac好像自带的,刚才复制15000多张图片和视频到Nas上,Finder怎么也搞不定,等很久也没反应。cp和mv和提示数量太多。结果rsync一下就搞定...
2020年9月 1日 22:55 | # | 引用
大李子 说:
如果是同步到远程(比如用rsync协议) ,--link-dest 该怎么设置呢? 试了好久都提示 --link-dest arg does not exist:
2020年9月 4日 18:00 | # | 引用
usiantein 说:
谢谢阮老师,非常实用。
2020年10月21日 14:36 | # | 引用
马丁2003 说:
请问windows下有无推荐的rsync客户端?
2020年11月 7日 00:12 | # | 引用
大鱼 说:
在A、B两个服务器之间相互保持图片文件夹的同步,假如A服务器现在增加了一个图片,同步给B服务器,B服务器上的监听服务发现B的图片多了,又会同步给A。这种岂不是循环了,请问是如何解决的?
2020年11月15日 23:36 | # | 引用
冰翼 说:
Ubuntu 18.04 测试,直接 rsync -a --delete 是可以增量同步的,第二次执行同步会打印 sending incremental file list,并且只有修改或新增的文件被同步了。所以增量备份应该不需要使用 --link-dest 参数。
我使用的完整命令是 sudo rsync -a --delete --exclude=".cache" --progress -v source dest
2020年12月24日 17:39 | # | 引用
liwf 说:
--remove-source-files这个参数有问题
比如我要同步a目录下有b这个子目录,b里面有文件1
加上这个参数会把文件1同步到远端
但是源里面的这个b目录还在,而只是删掉了b里面的文件1,也就是说保留了空目录b
2021年4月28日 09:47 | # | 引用
猎魔人 说:
装虚拟机
2021年5月29日 15:02 | # | 引用
且夕夕 说:
请问rsync在同步时需要保证源目录中的文件没有在写入吗?
2021年7月22日 16:12 | # | 引用
解子 说:
rsync 怎么能够验证本地和远程服务器的两个文件是否一致,有没有什么命令之类的东西可以直接验证并返回一个可视化的结果
2021年8月 3日 19:48 | # | 引用
Ted Wang 说:
@冰翼:
看说明,作者是使用了 --link-test 生成了类似时光机一样的链式多版本(按日期)备份,基准目录是起到一个压缩存储作用。跟版本库的原理是类似的。与增量同步是不一样的。
2021年8月 8日 16:05 | # | 引用
从水之道 说:
请问阮老师:
--exclude="${HOME}/.local/share/Trash/*"
添加了这项之后,为什么备份的时候还是会备份Trash/下的文件?
2021年9月14日 12:25 | # | 引用
0315 说:
--remove-source-files 备份文件夹后,删除src文件,但是src目录结构还存在,这就很蛋疼,不知道src子路径下会不会存在某个文件未同步,为什么不是删掉整个src,却要保留目录结构?
2021年10月22日 11:18 | # | 引用
feasin 说:
很实用,讲解很详细
2021年11月25日 16:37 | # | 引用
荟八大圣 说:
为什么说 rsync不支持两台远程计算机之间的同步 呢?我理解只要是能找到对应计算机的话都是可以使用rrsync的,远程计算机有什么特殊的地方吗?
2022年1月19日 16:45 | # | 引用
zjh 说:
syncctoy
2022年1月20日 22:45 | # | 引用
吊车尾 说:
我也不知道有没有类似命令,但你说的怎么能够验证本地和远程文件是否一致:博主开头就说了“默认规则是文件大小或修改时间有变动”,我记得这个规则是可以手动调整配置的,你可以了解了解!
2022年1月23日 01:46 | # | 引用
Joey 说:
rsync -av --include="*.txt" --exclude='*' source/ destination
这个名只会同步第一层目录下的 txt 文件,不会递归同步
2022年2月26日 11:41 | # | 引用
sappine 说:
有个问题,有没有可能让rsync只覆盖更大的目标文件,忽略从A主机复制到B主机时,发现目标文件已经存在于B,且字节数更大的情况。
2022年3月 2日 16:25 | # | 引用
魏先生 说:
请教一下:只同步指定目录下的 2022开头的文件该如何实现
2022年3月 7日 18:05 | # | 引用
User 说:
@冰翼:
这样你就没办法保存历史版本
2022年5月 6日 11:23 | # | 引用
R 说:
哪位大神知道,如果目标目录存在相同名字的文件夹,就直接覆盖掉 是怎么设置??
2022年5月30日 15:14 | # | 引用
conorzhong 说:
只能是相对路径
2022年7月25日 10:41 | # | 引用
ssk 说:
正在学习rsync,读了,并试验了最后一段脚本。这似乎就实现了macOS的time machine功能了?
2022年10月 7日 00:51 | # | 引用
零一居士 说:
增量备份会全局扫描吗?
2022年11月16日 10:21 | # | 引用
CommandNotFound ⚡️ 坑否 说:
rsync 同步大文件的时候,CPU过高,这个有什么参数可以调吗
2023年2月27日 14:16 | # | 引用
刘云飞 说:
阮老师您好,我在使用命令“rsync -avx [email protected]:/ PCComputer
”同步A开发板根文件到个人PC电脑的时候,发现有些文件夹拷贝过来是空的,比如/dev,/sys,/proc。这是什么原因导致这个结果呀,谢谢阮老师的回复。
2023年8月24日 10:01 | # | 引用
wuhulamb 说:
可以打开windows的sshd服务,然后在linux上用rsync将windows上的文件/文件夹拷到linux上,代码示例如下:
rsync -av [email protected]:/D/xxx/yyy/ zzz # 将windows上D:\xxx\yyy里面的文件同步到linux的zzz文件夹下
本质上还是利用了OpenSSH在windows和linux之间进行的通信,和在linux上远程登录windows有几分相像。
以上是我个人的理解,如果有误,还望诸君不吝赐教。
2023年12月10日 00:53 | # | 引用
zen010101 说:
第六小节的代码,似乎不是每次都是增量。我们模拟一下脚本的执行过程:
1. 第一次执行,生成 dir1 为全量文件,latest 链接到 dir1
2. 第二次执行,生成 dir2 为增量文件,相对于 dir1 , latest 链接到 dir2
3. 第三次执行,问题来了,生成 dir3 是相对于 dir2 的增量,实际上就是 dir1 + 【实际增量】,而我想原本目的是 dir3 只保存 【实际增量】 吧?
4. 第四次执行,同第二步,生成的 dir4 是增量,相当于 dir2 + 【实际增量】
5. 第五次执行,同第三步,又生成了 dir5, 相当于 dir1 + dir3 + 【实际增量】
这个脚本的意义何在呢?
2024年4月13日 13:55 | # | 引用
Dov 说:
我的前端Node开发的一个app,要使用rsync进行文件的同步与备份。主管要求安装了app就能使用,用户不需要另外再在自己的电脑上安装rsync命令行工具。请问这种情况有什么好的解决方案吗?
2024年4月15日 11:17 | # | 引用
刘浩文 说:
把rsync也打包进软件安装目录下
2024年6月21日 11:52 | # | 引用
刘浩文 说:
如果单独使用--partial,而不搭配--append或--append-verify,会有哪些潜在的风险吗,有人遇到过吗?
2024年6月21日 11:54 | # | 引用