正则表达式
目录
10.1 语法规则
10.1.1 创建方法
1、直接量
2、构造方法RegExp()
10.1.2 三个属性i,g,m
10.1.3 方括号
10.1.4 元字符
10.1.5 量词
10.2 正则对象方法
10.3 正则实例属性
10.4 支持正则表达式的String对象的方法
10.5 贪婪匹配与非贪婪匹配
正则表达式的笔试题一:
方法一去除头尾空格:str.trim()
方法二去除所有空格:正则表达式 str. replace (/\s*/g,"");
方法三去除头尾空格:正则表达式
//前后空格var str=" hello "var reg=/(^\s+)|(\s+$)/gvar re=str.replace(reg,"")console.log(re)
正则表达式的笔试题二:
判断自循环重复次数或者是否存在
是否存在 indexOf和match两种方法
var str="helloabxh"var reg=/lo/// var re=str.indexOf("lo")var re=str.match(reg)console.log(re)//重复次数--indexOfvar str="helloabc"var count=0var temp=0while(str.indexOf("lo",temp)!=-1){count++temp=str.indexOf("lo",temp)+1}console.log(count) //1//重复次数--方法二正则表达式--matchvar str="helloalbxh"var reg=/l/gvar re=str.match(reg)console.log(re.length) //3
正则表达式必会: test、exec
字符串必会: match、replace、search、split
正则表达式属于字符串的相关操作,正则是一个对象,可以用consoloe.dir() 去看
正则表达式RegExp(Regular Expression):匹配 特殊字符或有特殊搭配原则的字符 的最佳选择。
eg:匹配“XYXY”格式字符串。xxyy xyzz
小知识点:
转义字符\,在反斜杠\后边放的紧挨着得字符被强制转化成文本
eg:\"-----实现在双引号里再放双引号\r-----行结束符,即回车\.-----就是.的意思\t-----制表符,键盘得tab键
多行字符串
eg: \------还可以转义回车(换行)符号,实现js语法上的多行字符串
换行的转义字符
eg:\n------实现换行
10.1 语法规则
10.1.1 创建方法
两种创建方式:
1、直接量
其本身是一个对象,表达的意义是一种规则。
(1)在两个斜杠中间写规则。
var reg=/abc/;var str="abcd";reg.test(str) ; //true 检查在字符串str中有没有符合reg规则得字符(看str是否包含reg)
(2)在正则表达式得双斜杠后边还可以加字母i、g、m,表达其属性。
i===》ignorcase,忽略大小写
var reg=/abce/i;var str="ABCEd";reg.test(str) ;
2、构造方法RegExp()
使用new操作符,new RegExp();
var reg=new RegExp("abc");var str="abcd";reg.test(str);
在new RegExp("abc")函数里边也可以添加属性i、g、m
var reg=new RegExp("abc","im");var str="abcd";
使用new操作符,可以将已经存在的正则表达式用来给函数RegExp()传参,构造新的正则表达式。
reg与reg1值相同,但两个两个值相互独立,即reg!=reg1
var reg=/abce/m;var reg1=new RegExp(reg);
若去除new操作符,将已经存在的正则表达式用来给函数RegExp()传参,只是传递引用,不能构建新的正则表达式,极少的用法。
//reg与reg1只是对同一个正则表达式的引用
var reg=/abce/m;var reg1=RegExp(reg);reg.abc=3;console.log(reg1.abc);//3
10.1.2 三个属性i,g,m
正则表达式的属性(也称修饰符),可以在全局搜索中不区分大小写:
i ---》(ignoreCase )执行匹配时忽略大小写 g---》(global)执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)
使用字符串的match方法 :查找是否有匹配值
var reg=/ab/;var str="ababababab";str.match(reg);//["ab"],只查找到第一个匹配值便返回reg=/ab/g;str.match(reg);//["ab","ab","ab","ab","ab"],全局查找,把所有匹配值均返回
m---》(multiline)执行多行匹配
^: 以什么开头的$: 表示结尾
var reg=/a/g;var str="abcdea";str.match(reg);//["a","a"]reg=/^a/g;//插入符^指的是以字母a为开头str.match(reg);//["a"]str="abcde\na";str.match(reg);//["a"],还没有多行匹配属性reg=/^a/gm;str.match(reg);//["a","a"]var reg=/ac$/var str="achdkc"var re=reg.test(str)console.log(re) //false
10.1.3 方括号
A--a 也是一个范围
方括号用于查找某个范围内的字符:
一个中括号代表一位,中括号里边的内容代表的是这一位可以取值的范围
//eg1: var reg = /[1234567890][1234567890][1234567890]/g;var str = "12309u98723zpoixcuypiouqwer";var re=str.match(reg);console.log(re) //['123', '987']//eg2:var reg = /[ab][cd][d]/g;var str = "abcd";str.match(reg)var re=str.match(reg);console.log(re) //['bcd']//eg3:var reg = /[0-9A-Za-z][cd][d]/g; //相当于var reg=/[0-9A-z][cd][d]/gvar str = "ab1cd";str.match(reg);var re=str.match(reg);console.log(re) //['1cd']
插入符^放到[]里边表示"非"的意思
//eg:var reg=/[^a][^b]/g;//插入符^放到[]里边表示"非"的意思var str="ab1cd";str.match(reg);
在括号里可以加入"|"表示"或"的意思,"|"操作符两边放匹配规则
var reg=/(abc|bcd)/g;var str="abc";str.match(reg);//["abc"];//该规则既能匹配出字符串"abc"str="bcd";str.match(reg);//["bcd"];//该规则又能匹配出字符串"bcd"reg = /(abc|bcd)[0-9]/g; //匹配规则可以任意组合str = "bcd2";var re=str.match(reg);console.log(re) //['bcd2']
10.1.4 元字符
元字符是拥有特殊含义的字符,元字符也可以组合放进中括号里去使用,一个元字符代表一位(\d|\D)
"\w"---->[0-9A-z_],(word)单词字符,字母字符
var reg=/\wcd2/g;var str="bcd2";str.match(reg);//["bcd2"]//"\W"---->[^\w],即\W是\w的补集reg=/\Wcd2/g;str.match(reg);str="b*cd2";str.match(reg);
若要在正则表达式里匹配反斜杠\,直接写/\/是不行的,需要加上转义字符/\\/
"\d"---->[0-9]
//"\D"---->[^\d]var reg=/\d\d\d/g;var str="123";str.match(reg);
"\s"---->匹配空白字符 空白字符包括:空格符[ ]、制表符\t、回车符\r、换行符\n、垂直换行符\v、换页符\f
//附:"\S"---->[^\s]
"\b"---->匹配单词边界(border)
//"\B"---->非单词边界var reg=/\bcde/g;//单词边界后边是cde字符串var str="abc cde fgh";str.match(reg);str="abc cde fgh";reg=/\bcde\b/g;str.match(reg);reg=/\bcde\b/g;str="abc cdefgh";str.match(reg);str="abc cdefgh";reg=/\bcde\B/g;//匹配规则换成\B就可以了str.match(reg);
"\t"---->匹配制表符
var reg=/\tc/g;var str="abcde";//c字母前有一个tab键str.match(reg);//null,无法匹配视觉效果上的一个tabstr="ab\tcde"; str.match(reg);//[" c"]//即"\t"只能匹配字符"\t",控制台对\t的打印以转义序列制表符"\t"的方式打印//所以最后结果是[" c"]//其他"\n"、"\f"、"\v"类似于"\t"的使用//"."---->[^/r/n],匹配"非"行结束符和换行符
unicode编码,\uXXXXXX,一般为6位16进制码
不需要记住哪个字符对应是哪个Unicode编码,要用到的时候可借助“Unicode在线编码转换器”
var reg=/\u8eab\u4f53\u597d/g;var str="身体好";str.match(reg);//["身体好"]reg=/[\u4000-\u9000]/g;//也可使用区间去定义规则str="身体好";str.match(reg);//["身","体","好"]var reg=/[/u0000-/uffff]/g;//能够代表几乎一切字符reg=/[\s\S]/g;//这才能够代表匹配一切
10.1.5 量词
量词,代表数量的词(下面表达式的n代表的是一个匹配规则,n后边符号的符号定义量词规则)。
贪婪匹配。
var reg=/\w+/g;//匹配\w类的字符出现一次或多次的字符串var str="abcvfskhfls";str.match(reg);//["abcvfskhfls"],贪婪匹配原则reg=/\w*/g;//匹配\w类的字符出现零次或多次的字符串str="abc";str.match(reg);//["abc",""]//全局匹配到"abc"之后,逻辑上从那以后还有段距离//这段距离符合规则"出现零次或多次的字符串",所以匹配出来一个空字符串//贪婪匹配原则var reg=/\d*/g;var str="abc";str.match(reg);//["","","",""]//该原则对字母a/b/c是无法匹配出来的,所以匹配出空字符串""//最后再在最后一个光标位匹配出一个空字符串来,所以一共4个空字符串
n? ---->0个或1个
var reg=/\w?/g;var str="aaaaa";str.match(reg);//["a","a","a","a","a",""],最后还会有一个空字符串""
//若要在正则表达式里匹配问号?,直接写/?/是不行的,需要加上转义字符,写成/\?/
^n ----> 匹配以n 为开头的字符串n n$ ----> 匹配以n 为结尾的字符串n
var reg=/ed$/g;//以ed为结尾时匹配var str="abcded";str.match(reg);//["ed"]var reg=/^abc$/g;//以该abc开头,且以同一abc为结尾的字符串var str="abcabc";str.match(reg);//nullvar reg=/^abc$/g;//以该abc开头,且以同一abc为结尾的字符串var str="abc";str.match(reg);//["abc"]
?=n ----->n只参与条件限定,限定其后紧接指定字符串n 的字符串,但并不参与选择
?!n ----->n只参与条件限定,限定其后没有紧接指定字符串n 的字符串,但并不参与选择
//正向预查 正向断言var str="aabaaaa";var reg=/aa(?=b)/g;//b只参与条件限定,并不参与选择str.match(reg);//["aa"],此时只有一个a 它的后面有紧跟字符bvar str="aabaaaa";var reg=/aa(?!b)/g;str.match(reg);//[aa,aa],此时有4个a 它的后面没有紧跟字符b
练习一:写一个正则表达式,检验字符串首尾是否含有数字。
练习二:写一个正则表达式,检验字符串首尾是否含都有数字。
//答:
var reg=/^\d|\d$/g;var str="123abc";str.match(reg);//["1"]
//答:1dgadk3 1
var reg=/(^\d[\s\S]*\d$|^\d$)/g;//[\s\S]指开始与结束字符中间为任意字符,*指出现0到多次var str="123abc123";str.match(reg);//["123abc123"]
10.2 正则对象方法
reg.exec(); ---->executive,执行匹配
它会将上次匹配的下标存入,下次就从那个下标开始
var reg=/ab/g;var str="abababab";reg.exec(str);//["ab"],尽管具有global属性,仍然只返回一个"ab"//再继续reg.exec(str);//["ab"]reg.exec(str);//["ab"]reg.exec(str);//["ab"]reg.exec(str);//nullreg.exec(str);//["ab"]reg.exec(str);//["ab"]
10.3 正则实例属性
1、ignoreCase 是否设置了i
2、global 是否设置了g
3、multiline 是否设置了m
4、source 字面量形式对应的字符串
5、lastIndex 开始搜索下一个匹配项的字符位置,默认0
var reg=/^\d[\s\S]*\d$/g;reg.ignoreCase;//false,检测是否含有i 属性reg.global;//true,检测是否含有g 属性reg.multiline;//false,检测是否含有m 属性reg.source;//"^\d[\s\S]*\d$",匹配内容体
lastIndex 与exec 方法相搭配使用,查找光标位置
var reg=/ab/g;var str="abababab";console.log(reg.lastIndex);//0console.log(reg.exec(str));//["ab",index:0,input:"abababab"]console.log(reg.lastIndex);//2console.log(reg.exec(str));//["ab",index:2,input:"abababab"]console.log(reg.lastIndex);//4console.log(reg.exec(str));//["ab",index:4,input:"abababab"]console.log(reg.lastIndex);//6console.log(reg.exec(str));//["ab",index:6,input:"abababab"]console.log(reg.lastIndex);//8console.log(reg.exec(str));//nullconsole.log(reg.lastIndex);//0console.log(reg.exec(str));//["ab",index:0,input:"abababab"]//reg.lastIndex是可手动修改的reg.lastIndex=0;//reg.lastIndex重置0console.log(reg.exec(str));//["ab",index:0,input:"abababab"],与上面结果中的index相同//若匹配规则不含有global属性,那在允许exec()方法后lastIndex值始终为0var reg=/ab/;var str="abababab";console.log(reg.lastIndex);//0console.log(reg.exec(str));//["ab",index:0,input:"abababab"]console.log(reg.lastIndex);//0console.log(reg.exec(str));//["ab",index:0,input:"abababab"]
补充:"\num" 反向引用,指的是要引用的第num个括号里的表达式值
var str="aaaa";var reg=/(\w)\1/g;//括号"()"后边的"\1"为反向引用第一个括号的值reg=/(\w)\1\1\1/g;//3个"\1"代表后边还要引用第一个括号里的值3次
reg=/(\w)\1\1\1/g;str="aaaa";str.match(reg);//["aaaa"]reg=/(\w)\1\1\1/g;str="aaaabbbb";str.match(reg);//["aaaa","bbbb"]//要匹配"XXYY"格式的字符串reg=/(\w)\1(\w)\2/;//"\2"代表引用第二个括号里的值str="aabb";str.match(reg);//["aabb"]console.log(reg.exec(str));//["aabb","a","b",index:0,input:"aabb"]//上边结果中的"a","b"是类数组的数据位,即两个"\w"所匹配到的值
10.4 支持正则表达式的String对象的方法
str.match(reg) ---->在规则中是否含有global 属性时的表现是不同的(与reg.exec(str)的微小区别)
reg=/(\w)\1(\w)\2/;//无global属性,反向索引str="aabbgghh";str.match(reg);//["aabb","a","b",index:0,input:"aabb"]reg=/(\w)\1(\w)\2/g;//具有global属性str="aabbgghh";console.log(str.match(reg));//["aabb","gghh"]
str.search(reg) ---->匹配后返回的是所匹配字符串的位置,匹配不到时返回-1
reg=/(\w)\1(\w)\2/g;str="edbaabbbbee";str.search(reg);str.search(reg);//3,与lastIndex无关,只返回第一个符合匹配规则的索引位置reg=/(\w)\1(\w)\2/g;str="abc";str.search(reg);//-1
str.split(reg) ---->按照正则表达式拆分字符串
var str="dai1akhd2gkhs";var reg=/\d/g;console.log(str.split(reg));//["dai","akhd","gkhs"],即将分隔符两侧的字符串进行拆分var str="dai1akhd2gkhs";var reg=/(\d)/g;//"()"代表记录反向引用,将匹配表达式也返回回来,很少这样用console.log(str.split(reg));//["dai","1","akhd","2","gkhs"]
str.replace(reg,str1) ---->字符串替换;最实用的方法。
两个参数,参数1放正则表达式,参数2放欲替换成的字符串
//坑:
var str="aa";console.log(str.replace("a","b")) //ba,只会替换匹配到的第一个var str="abcdedfa";var reg=/a/;str.replace(reg,"b"); //ba,跟上边一样没写"g"还是只替换一个
//精华:
var str="abcdedfa";var reg=/a/g;str.replace(reg,"b");//总结://若参数1为字符串(非正则表达式),那将不具有全局替换的能力,只能替换第一个匹配的位置//只有正则表达式的global属性才具有全局替换的能力
练习一:将但凡匹配"XXYY"格式的字符串均替换成"YYXX"
//答:
var reg=/(\w)\1(\w)\2/g;var str="aabb";str.replace(reg,"$2$2$1$1");//bbaa
//$1代表匹配规则里第一个匹配表达式的值,$2代表匹配规则里第二个匹配表达式的值//若要替换成为"$"符号,直接写是不行的,因为它带有语法意义//在它前边再加一个$即可达到转义效果,实现用$符进行替换
练习二:将"XYXY"格式的字符串均替换成"YXYX"
//答:
var reg=/(\w)(\w)\1\2/g;var str="abab";str.replace(reg,"$2$1$2$1");//baba
str.replace(reg,str1) ---->str1的位置还可以放置函数,该函数由系统调用;故可自定义替换格式。
上面练习一也可以答题如下:
//答:
var reg=/(\w)\1(\w)\2/g;var str="aabbccdd";console.log(str.replace(reg,function($,$1,$2){//形参$代表该函数会接受匹配结果,如"aabb"//形参$1代表该函数会接收匹配规则里第一个子匹配表达式的匹配结果//形参$2代表该函数会接收匹配规则里第二个子匹配表达式的匹配结果return $2+$2+$1+$1;}))//上边函数在返回值时就可以对返回结果进行自定义,如:return $2+$2+$1+$1+"abc".
练习三:将"the-first-name"替换成驼峰式写法"theFirstName"
var reg=/-(\w)/g;//能匹配到["-f", "-n"],加括号之后才能使用$1 进行引用str="the-first-name";console.log(str.replace(reg,"$1"))//thefirstname,还没能转换成大写console.log(str.replace(reg,function($,$1){//function的形参不能只写一个,因为实参是按照顺序传递的return $1.toUpperCase();}))//theFirstName//每匹配依次,function执行依次
10.5 贪婪匹配与非贪婪匹配
贪婪匹配即照着"量词"规则中要求的更多个的情况去做匹配
var str="aaaaa";var reg=/a+/g;str.match(reg);//["aaaaa"]
非贪婪匹配,在"量词"规则后边多加一个问号"?"
var str="aaaaa";var reg=/a+?/g;str.match(reg);//["a","a","a","a","a"]var str="aaaaa";var reg=/a??/g;//第一个问号代表0~1个,第二个问号代表能取0就不取1去做匹配str.match(reg);//["","","","","",""]
//实用:匹配用双大括号括起来的字符var l=/\{\{(.+)\}\}/g;var r=/\{\{(.+?)\}\}/g;var str=`{{name}}--{{msg}}`str.match(l);//["{{name}}--{{msg}}"]str.match(r);//["{{name}}", "{{msg}}"]
练习一:
//题: var str="aaaaaabbbbbbbccccc";//将字符串转换成"abc",字符串去重//答:var reg=/(\w)\1*/g;//其中\1*代表反向引用{0,Infinity}个console.log(str.replace(reg,"$1"));//"abc"
练习二:
//题:var str="100000000000";//将数字转换成科学计数法表示,从后往前每隔三位添一个逗号//答://分析1:从后往前查,需要用到结束符,$//分析2:结果中,逗号后边的数都将是3的倍数,(\d{3})+//分析3:使用正向预查,?=//分析4:添逗号,即将空""替换成逗号,所以正向预查前边不写任何东西代表匹配空var reg=/(?=(\d{3})+$)/g;console.log(str.replace(reg,","));//",100,000,000,000"//所以要替换的""还要加限定,它后边跟的不能是单词边界\Bvar reg=/(?=(\B)(\d{3})+$)/g;console.log(str.replace(reg,","));//"100,000,000,000"
巩固一下:
是否带有小数
var objRegExp= /^\d+\.\d+$/;
校验是否中文名称组成
var reg=/^[\u4E00-\u9FA5]{2,4}$/;
校验是否全由8位数字组成
var reg=/^[0-9]{8}$/;
校验电话码格式
var reg= /^((0\d{2,3}-\d{7,8})|(1[35847]\d{9}))$/;
校验邮件地址是否合法
9391493618639@
var reg=/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/;
10 正则表达式 (笔试题 语法规则 正则对象方法 正则实例属性 支持正则表达式的String对象的方法 贪婪匹配与非贪婪匹配)
如果觉得《10 正则表达式 (笔试题 语法规则 正则对象方法 正则实例属性 支持正则表达式的》对你有帮助,请点赞、收藏,并留下你的观点哦!