正则字符匹配规则
^
行首的意思$
结尾处*
通配符\b
匹配一个单词边界,单词与空格之间的位置,\w+\b
切开成每个单词\d
表示数字,\d{5}
五位数字,[0-9]
数字0~9\w
字母,数字,下划线-
匹配短破折号\r
或者\n
换行符\t
制表符
\\
\本身\s
空格,制表符,换页符等空白字符中的任意一个.
匹配除了换行符以外的任意字符[ab5@]
匹配a
或b
或5
或@
[^abc]
匹配除了a
b
c
以外的任意一个字符[f-k]
匹配f
到k
之间的任意一个字母(包含f
k
)[^A-F0-3]
匹配A
F
和0
3
以外的任意一个字符{n}
表达式重复n
次,比如\w{2}
==\w\w
或者a{4}
==aaaa
{m,n}
表达式重复最少m
次 最多重复n
次, 比如ha{2,3}
=>可匹配到haa
haaa
{m,}
贪婪模式,表达式至少重复m次,比如\w\d{3,}
=>可匹配g123
b456789
… 数字可以重复3个以上?
匹配0次或者1次, 比如qw?
—>qqqw
=> qq,qq,qw =>q?,q?,qw 匹配结果就是 q, q, qw+
至少匹配一次以上,a+b
=> 匹配到ab
aab
aaab
|
修饰表达式或语句,不是匹配左边就是右边,两个条件均可()
修饰一个整体,括号内的表达式可以单独获取\x
表示编号在0~255范围内的字符,空格可以表示成\x20
\u
\uxxxx
表示16进制的数,比如:\x4E2D
\S
匹配一个非空白字符 ,\s
匹配一个空白字符\D
匹配非数字字符\W
匹配所有字母,数字,下划线以外的字符\B
匹配非单词边界?:
可以理解为函数封装的形式, 比如(?:(\w)\1)+
这个规则去匹配e233t66i34p
=>结果是33
66
,?:
是封装了一个(\w)
这样不会调用,而使用\1
就是调用这句表达式
需要加反斜杠转义的字符
^
$
()
{}
[]
.
?
+
*
|
常用正则
[\u4e00-\u9fa5]
匹配中文字符[^\x00-\xff]
匹配双字节字符(包括汉子在内)\n\s*\r
匹配空白行[\w!#$%&’+/=?^_`{|}~-]+(?:.[\w!#$%&’+/=?^_`{|}~-]+)@(?:[\w](?:[\w-][\w])?.)+\w? 匹配邮箱
[a-zA-z]+://[^\s]*
匹配网址\d{3}-\d{8}|\d{4}-\{7,8}
匹配电话号码 (PS. 新出的手机号已经不适用了)^(\d{6})(\d{4})(\d{2})(\d{2})(\d{3})([0-9]|X)$
匹配身份证号