一次性操作多个文件时,命令行提供通配符(wildcards),用一种很短的文本模式(通常只有一个字符),简洁地代表一组路径。
通配符又叫做 globbing patterns。因为 Unix 早期有一个/etc/glob
文件保存通配符模板,后来 Bash 内置了这个功能,但是这个名字被保留了下来。
通配符早于正则表达式出现,可以看作是原始的正则表达式。它的功能没有正则那么强大灵活,但是胜在简单和方便。
本文介绍 Bash 的各种通配符。
一、? 字符
?
字符代表单个字符。
# 存在文件 a.txt 和 b.txt $ ls ?.txt a.txt b.txt
上面命令中,?
表示单个字符,所以会同时匹配a.txt
和b.txt
。
如果匹配多个字符,就需要多个?
连用。
# 存在文件 a.txt、b.txt 和 ab.txt $ ls ??.txt ab.txt
上面命令中,??
匹配了两个字符。
注意,?
不能匹配空字符。也就是说,它占据的位置必须有字符存在。
二、* 字符
*
代表任意数量的字符。
# 存在文件 a.txt、b.txt 和 ab.txt $ ls *.txt a.txt b.txt ab.txt # 输出所有文件 $ ls *
上面代码中,*
匹配任意长度的字符。
*
可以匹配空字符。
# 存在文件 a.txt、b.txt 和 ab.txt $ ls a*.txt a.txt ab.txt
三、[...] 模式
[...]
匹配方括号之中的任意一个字符,比如[aeiou]
可以匹配五个元音字母。
# 存在文件 a.txt 和 b.txt $ ls [ab].txt a.txt b.txt $ ls *[ab].txt ab.txt a.txt b.txt
[start-end]
表示一个连续的范围。
# 存在文件 a.txt、b.txt 和 c.txt $ ls [a-c].txt a.txt b.txt c.txt # 存在文件 report1.txt、report2.txt 和 report3.txt $ ls report[0-9].txt report1.txt report2.txt report3.txt
四、[^...]
和 [!...]
[^...]
和[!...]
表示匹配不在方括号里面的字符(不包括空字符)。这两种写法是等价的。
# 存在文件 a.txt、b.txt 和 c.txt $ ls [^a].txt b.txt c.txt
这种模式下也可以使用连续范围的写法[!start-end]
。
$ echo report[!1-3].txt report4.txt report5.txt
上面代码中,[!1-3]
表示排除1、2和3。
五、{...} 模式
{...}
表示匹配大括号里面的所有模式,模式之间使用逗号分隔。
$ echo d{a,e,i,u,o}g dag deg dig dug dog
它可以用于多字符的模式。
$ echo {cat,dog} cat dog
{...}
与[...]
有一个很重要的区别。如果匹配的文件不存在,[...]
会失去模式的功能,变成一个单纯的字符串,而{...}
依然可以展开。
# 不存在 a.txt 和 b.txt $ ls [ab].txt ls: [ab].txt: No such file or directory $ ls {a,b}.txt ls: a.txt: No such file or directory ls: b.txt: No such file or directory
上面代码中,如果不存在a.txt
和b.txt
,那么[ab].txt
就会变成一个普通的文件名,而{a,b}.txt
可以照样展开。
大括号可以嵌套。
$ echo {j{p,pe}g,png} jpg jpeg png
大括号也可以与其他模式联用。
$ echo {cat,d*} cat dawg dg dig dog doug dug
上面代码中,会先进行大括号扩展,然后进行*
扩展。
六、{start..end} 模式
{start..end}
会匹配连续范围的字符。
$ echo d{a..d}g dag dbg dcg ddg $ echo {11..15} 11 12 13 14 15
如果遇到无法解释的扩展,模式会原样输出。
$ echo {a1..3c} {a1..3c}
这种模式与逗号联用,可以写出复杂的模式。
$ echo .{mp{3..4},m4{a,b,p,v}} .mp3 .mp4 .m4a .m4b .m4p .m4v
七、注意点
通配符有一些使用注意点,不可不知。
(1)通配符是先解释,再执行。
Bash 接收到命令以后,发现里面有通配符,会进行通配符扩展,然后再执行命令。
$ ls a*.txt ab.txt
上面命令的执行过程是,Bash 先将a*.txt
扩展成ab.txt
,然后再执行ls ab.txt
。
(2)通配符不匹配,会原样输出。
Bash 扩展通配符的时候,发现不存在匹配的文件,会将通配符原样输出。
# 不存在 r 开头的文件名 $ echo r* r*
上面代码中,由于不存在r
开头的文件名,r*
会原样输出。
下面是另一个例子。
$ ls *.csv ls: *.csv: No such file or directory
另外,前面已经说过,这条规则对{...}
不适用
(3)只适用于单层路径。
上面所有通配符只匹配单层路径,不能跨目录匹配,即无法匹配子目录里面的文件。或者说,?
或*
这样的通配符,不能匹配路径分隔符(/
)。
如果要匹配子目录里面的文件,可以写成下面这样。
$ ls */*.txt
(4)可用于文件名。
Bash 允许文件名使用通配符。这时,引用文件名的时候,需要把文件名放在单引号里面。
$ touch 'fo*' $ ls fo*
上面代码创建了一个fo*
文件,这时*
就是文件名的一部分。
八、参考链接
(完)
FaiChou 说:
问题请教:
这是我发起的一个讨论,
https://www.v2ex.com/t/453798
gitignore 中*.json 为何能递归匹配所有文件夹下 json 文件.
git官网中有这么一段:
https://git-scm.com/docs/gitignore#_pattern_format
Otherwise, Git treats the pattern as a shell glob: "*" matches anything except "/",
但是经过我的实验 *.json 可以成功ignore掉 a/b/c.json , 与官网描述相悖.
2018年9月20日 18:51 | # | 引用
码中人 说:
*nux 中 星号*能进文件名,挺扯的,应该是设计失误。
2018年9月20日 19:19 | # | 引用
flw 说:
这有啥扯的,用 GUI 的人根本不知道通配符的存在,这样对他们来说很方便。转义字符就是这时候用的。
2018年9月21日 00:44 | # | 引用
码中人 说:
先不说用GUI的人如何就不知通配符了?不是可以,就是对的。文件名有约束既又避免了复杂度,又符合现实情况。
2018年9月21日 10:07 | # | 引用
gaojiren 说:
find中的匹配模式是正则还是这种?
2018年9月21日 10:36 | # | 引用
Wei 说:
我觉得不需要读到Otherwise这一段,它之前一段是解释
If the pattern does not contain a slash /, Git treats it as a shell glob pattern and checks for a match against the pathname relative to the location of the .gitignore file (relative to the toplevel of the work tree if not from a .gitignore file).
*.json 不含有/, 用 *.json 去匹配 "a/b/c.json" 看来是可以匹配的。。这里确实有点费解。
2018年9月25日 05:52 | # | 引用
Wei 说:
If the pattern does not contain a slash /, Git treats it as a shell glob pattern and checks for a match against the pathname relative to the location of the .gitignore file (relative to the toplevel of the work tree if not from a .gitignore file).
@Faichou
2018年9月25日 06:01 | # | 引用
Map 说:
ls **/*.txt does a recursive match at least in bash. You can refer to https://stackoverflow.com/a/28199633/5734474.
2018年9月27日 12:10 | # | 引用
royaso 说:
又水了一期,没啥含量哎
没匹配到就输出原样glob,其实bash有选项可以关掉
2018年10月10日 07:31 | # | 引用
FaiChou 说:
不含有 / 的都被认作 shell glob, 但是 shell glob 中 * not match / .
似乎是无解了.
2018年10月18日 21:45 | # | 引用
我爱程序员 说:
为何我执行上面的命令,和作者给的不同呢?请教各位大佬。
[[email protected] parallel]# echo {cat,d*}
cat d*
2018年11月25日 21:46 | # | 引用
puzzlex 说:
没匹配到任何东西呗,文章也说了,没匹配到任何东西的话,原样输出
2018年11月30日 17:55 | # | 引用
六爷 说:
你好,博主,请问一下,为什么`[0-9]*`不能匹配空串,按我的理解`[0-9]*`表示的是匹配0个或多个`[0-9]`
2021年11月22日 19:31 | # | 引用