在正则表达式中
+号,表示匹配前面一个字符出现1次或多次。
-号,表示匹配前一个字符与后一个字符中间的所有字符。
*号,表示匹配前一个字符0次或多次。
这些都是正则表达式中的元字符
你如果要匹配他们,你得加上\
[\+\-\*/] 这样就可以了。
在正则表达式中
+号,表示匹配前面一个字符出现1次或多次。
-号,表示匹配前一个字符与后一个字符中间的所有字符。
*号,表示匹配前一个字符0次或多次。
这些都是正则表达式中的元字符
你如果要匹配他们,你得加上\
[\+\-\*/]
这样就可以了
String IP4 = "[\\+\\-\\*\\/]";。
String s = "123+456*789/123";。
String[] ss = s.split(IP4);。
for (int i = 0; i < ss.length; i++) {。
System.out.println(ss[i]);。
}
正则表达式在各个编程语言体系中都有使用,其各个规则大概是相同的,但某些语法是根据各个语言体系自己来实现的,比如在java中判断匹配规则是通过“matches”来实现判断,则在shell中则是使用“=~”
什么是正则表达式呢?正则表达式就是能用某种模式去匹配一类字符串的公式,它是由一串字符和元字符构成字符串。所谓元字符,就是用以阐述字符表达式的内容、转换和描述各种操作信息字符。
正则表达式中的元字符表示
“.”(一个点)符号,用于匹配除换行符以外的任意字符。
[root@localhost ~]# grep 'r..t' /etc/passwd。
[root@localhost ~]# grep 'r.t' /etc/passwd。
“* ”符号,用于前一个字符0次或者多次。
[root@localhost ~]# grep 'r*t' /etc/passwd。
“{n,m}”符号,可用于重复匹配前一个字符,但却不能精确地控制的重复次数。
“{n}” 匹配前面的字符n次。
[root@localhost ~]# grep 'ro\{2\}' /etc/passwd。
“{n,}” 匹配前面的字符至少n次以上(含n次)
[root@localhost ~]# grep 'ro\{2,\}' /etc/passwd。
“{n,m}” 匹配前面的字符n到m次。
[root@localhost ~]# grep 'ro\{1,2\}' /etc/passwd。
"^"符号 匹配的是以字符开头的行。
[root@localhost ~]# grep ^root /etc/passwd。
“$”符号 用于匹配尾部
[root@localhost ~]# grep 'r.*h$' /etc/passwd。
[root@localhost ~]# grep 'r.*h' /etc/passwd。
"[]"符号 用于匹配方括号内出现的任意字符。
“\”符号 用于转义字符
“<”符号和“>”符号 用于界定单词的左边界和右边界。
“\d”符号 匹配一个数字,等价于[0-9] 使用grep匹配这种正则表达式时可能会遇到无法匹配的问题。
#成功匹配
[root@localhost ~]# echo 123|grep [0-9]。
123
#并未匹配
[root@localhost ~]# echo 123|grep "\d"。
#匹配成功 这是因为“\d”是一种Perl兼容模式的表达式,又称作 PCRE,要想使用这种模式的匹配符,需要加上-P参数。
[root@localhost ~]# echo 123|grep -P "\d"。
123
“\b”符号 匹配单词的边界
“\B”符号 匹配非单词的边界。
“\w”符号 匹配字母、数字和下划线,等价于[A-Za-z0-9]。
“\w”符号 匹配非字母、非数字和非下划线,等价于[^A-Za-z0-9]。
“\n” 符号 匹配一个换行符。
“\r”符号 匹配一个回车符
“\t”匹配一个制表符
“\f”匹配一个换页符
“\s”匹配任何空白字符
“\S”匹配任何非空白字符
正则表达式还能表示电话号码,身份证号码,域名格式,邮箱格式等等,都是根据元字符进行拼装组装,就如英语单词千千万都是用字母组成的一样,用的时候要根据各个规则进行灵活处置。
利用正则表达式怎么截取字符串呢?
expr - 求一个表达式的值。
可以运算加减乘除,俨然是个多功能计算器,字符串表达式的优先级高于数值表达式和逻辑关系表达式。
运算有很多,本次只针对字符串截取来几个小demo。
‘STRING : REGEX’
执行模式匹配。两端参数会转换为字符格式,且第二个参数被视为正则表达式(GNU基本正则),它默认会隐含前缀"^"。随后将第一个参数和正则模式做匹配。
如果匹配成功,且REGEX使用了’(‘和’)’,则此表达式返回匹配到的,如果未使用’(‘和’)’,则返回匹配的字符数。
如果匹配失败,如果REGEX中使用了’(‘和’)’,则此表达式返回空字符串,否则返回为0。
只有第一个’(…)‘会引用返回的值;其余的’(…)‘只在正则表达式分组时有意义。
在正则表达式中,’+’,’?‘和’|'分表代表匹配一个或多个,0个或1个以及两端任选其一的意思。
#返回匹配的个数
[root@localhost ~]# expr aaa : 'a\+'。
#返回匹配的内容
[root@localhost ~]# expr abc : 'a\(.\)c' 。
#返回匹配的内容
[root@localhost ~]# expr service-core-0.0.1-SNAPSHOT.jar : '\(.*[0-9]\)'。
#返回长度
[root@localhost ~]# expr length 'length test is length'。
21
#返回截取的长度
[root@localhost ~]# expr substr abcde 2 4。
bcde
#加分运算 记得要有空格,不然会原样输出 。
[root@localhost ~]# expr 1 + 2。
#除发运算
[root@localhost ~]# expr 12 / 2。
#求模运算
[root@localhost ~]# expr 12 % 5。
#乘法运算 *作为特殊字符要进行转译 。
[root@localhost ~]# expr 12 \* 5。
60
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
对于怎么判断这个值是否符合正则表达式则用。
#注意不能添加符号,只写表达式即可,添加符号会产生错误。
if [[ $file =~ .jar$ ]]。
then
echo "true"。
else
echo false
fi
以上是shell中使用正则表达式所引出来的,不会的多去查,Linux命令就是那么多,使用多了也就记住了,有人说Linux是积沙成塔的过程,慢慢积累,多看帮助文档, info、man用起来。
.点
匹配任何单个字符。例如正则表达式r.t匹配这些字符串:rat、rut、r。
t,但是不匹配root。
匹配行结束符。例如正则表达式weasel$。
能够匹配字符串"he's
weasel"的末尾
但是不能匹配字符串"they
are
bunch
of
weasels."
匹配一行的开始。例如正则表达式^when。
in能够匹配字符串"when
in
the
course
of
human
events"的开始,但是不能匹配"what。
and
when
in
the"
匹配0或多个正好在它之前的那个字符。例如正则表达式.*意味着能够匹配任意数量的任何字符。
这是引用符,用来将这里列出的这些元字符当作普通的字符来进行匹配。例如正则表达式\$被用来匹配美元符号,而不是行尾,类似的,正则表达式\.用来匹配点字符,而不是任何字符的通配符。
[c1-c2]
[^c1-c2]
匹配括号中的任何一个字符。例如正则表达式r[aou]t匹配rat、rot和rut,但是不匹配ret。可以在括号中使用连字符-来指定字符的区间,例如正则表达式[0-9]可以匹配任何数字字符;还可以制定多个区间,例如正则表达式[a-za-z]可以匹配任何大小写字母。另一个重要的用法是“排除”,要想匹配除了指定区间之外的字符——也就是所谓的补集——在左边的括号和第一个字符之间使用^字符,例如正则表达式[^269a-z]。
将匹配除了2、6、9和所有大写字母之外的任何字符。
\<
\>
匹配词(word)的开始(\<)和结束(\>)。例如正则表达式\<the\>能够匹配字符串"for。
the
wise"中的"the",但是不能匹配字符串"otherwise"中的"the"。注意:这个元字符不是所有的软件都支持的。
\(
\)
将
\(
和
\)
之间的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域(一个正则表达式中最多可以保存9个),它们可以用。
\1
到\9
的符号来引用。
将两个匹配条件进行逻辑“或”(or)运算。例如正则表达式(him|her)。
匹配"it
belongs
to
him"和"it
belongs
to
her",但是不能匹配"it
belongs
to
them."。注意:这个元字符不是所有的软件都支持的。
匹配1或多个正好在它之前的那个字符。例如正则表达式9+匹配9、99、999等。注意:这个元字符不是所有的软件都支持的。
匹配0或1个正好在它之前的那个字符。注意:这个元字符不是所有的软件都支持的。
\{i\}
\{i,j\}
匹配指定数目的字符,这些字符是在它之前的表达式定义的。例如正则表达式a[0-9]\{3\}。
能够匹配字符"a"后面跟着正好3个数字字符的串,例如a123、a348等,但是不匹配a1234。而正则表达式[0-9]\{4,6\}。
匹配连续的任意4个、5个或者6个数字字符。注意:这个元字符不是所有的软件都支持的。