浅谈js中的正则表达式
栏目: JavaScript · 发布时间: 7年前
内容简介:很多时候多会被正则表达式搞的晕头转向,最近抽出时间对正则表达式进行了系统的学习,整理如下:两种方法,一种是直接写,由包含在斜杠之间的模式组成;另一种是调用两种方法的创建代码如下:
很多时候多会被正则表达式搞的晕头转向,最近抽出时间对正则表达式进行了系统的学习,整理如下:
正则表达式的创建
两种方法,一种是直接写,由包含在斜杠之间的模式组成;另一种是调用 RegExp
对象的构造函数。
两种方法的创建代码如下:
// 直接创建
const regex1 = /ab+c/;
const regex2 = /^[a-zA-Z]+[0-9]*\W?_$/gi;
// 调用构造函数
const regex3 = new RegExp('ab+c');
const regex4 = new RegExp(/^[a-zA-Z]+[0-9]*\W?_$/, "gi");
const regex5 = new RegExp('^[a-zA-Z]+[0-9]*\W?_$', 'gi');
复制代码
可以看出,调用 RegExp
构造函数创建正则表达式时,第一个参数可以是字符串,也可以是直接创建的正则表达式。
需要注意的是: RegExp
实例继承的 toLocaleString()
和 toString)()
方法都会返回正则表达式的字面量,与创建正则表达式的方式无关。
例如:
const ncname = '[a-zA-Z_][\\w\\-\\.]*';
const qnameCapture = '((?:' + ncname + '\\:)?' + ncname + ')';
const startTagOpen = new RegExp('^<' + qnameCapture);
// '/^<((?:[a-zA-Z_][\w\-\.]*\:)?[a-zA-Z_][\w\-\.]*)/'
startTagOpen.toString();
复制代码
正则表达式中的特殊字符
-
\(反斜杠)- 在非特殊字符前加反斜杠表示下一个字符是特殊的;
- 将其后的特殊字符转译为字面量;
注意:在使用
RegExp构造函数时要将\转译,因为\在字符串里也是转译字符。 -
^[]
例:
/^A/.exec('an A') // null /^A/.exec('An E') // ["A", index: 0, input: "An E"] 复制代码 -
$匹配输入的结束
/t$/.exec('eater') // null /t$/.exec('eat') // ["t", index: 2, input: "eat"] 复制代码 -
*,+,.(小数点)*:匹配前一个表达式0次或多次。等价于{0,};+:匹配前面一个表达式1次或者多次。等价于{1,};.:匹配除换行符之外的任何单个字符; -
?(问号){0,1} * + ? {}例子:
/\d+/.exec('123abc') // ["123", index: 0, input: "123abc"] /\d+?/.exec('123abc') // ["1", index: 0, input: "123abc"] 复制代码 -
(x)匹配
x并且记住匹配项,括号表示捕获括号;例:
/(foo) (bar) \1 \2/.test('bar foo bar foo'); // false /(bar) (foo) \1 \2/.test('bar foo bar foo'); // true /(bar) (foo) \1 \2/.test('bar foo'); // false /(bar) (foo) \1 \2/.test('bar foo foo bar'); // false /(bar) (foo) \2 \1/.test('bar foo foo bar'); // true 'bar foo bar foo'.replace( /(bar) (foo)/, '$2 $1' ); // "foo bar bar foo" 复制代码模式
/(foo) (bar) \1 \2/中的(foo)和(bar)匹配并记住字符串foo bar foo bar中前两个单词。模式中的\1和\2匹配字符串的后两个单词。注意:
\1、\2、\n是用在正则表达式的匹配环节,在正则表达式的替换环节,则要使用像$1、$2、$n这样的语法。例如,'bar foo'.replace( /(...) (...)/, '$2 $1' )。 -
(?:x)匹配
x但是不记住匹配项,这种叫作非捕获括号;例:
'foo'.match(/foo{1,2}/) // ["foo", index: 0, input: "foo"] 'foo'.match(/(?:foo){1,2}/) // ["foo", index: 0, input: "foo"] 'foofoo'.match(/(?:foo){1,2}/) // ["foofoo", index: 0, input: "foofoo"] 'foofoo'.match(/foo{1,2}/) // ["foo", index: 0, input: "foofoo"] 复制代码使用场景:示例表达式
/(?:foo){1,2}/。如果表达式是/foo{1,2}/,{1,2}将只对foo的最后一个字符’o‘生效。如果使用非捕获括号,则{1,2}会匹配整个foo单词。 -
x(?=y),x(?!y),x|yx(?=y):匹配'x'仅仅当'x'后面跟着'y';x(?!y):匹配'x'仅仅当'x'后面不跟着'y';x|y: 匹配x或y;这两种匹配的结果都不包含y。
例:
'JackSprat'.match(/Jack(?=Sprat)/) // ["Jack", index: 0, input: "JackSprat"] 'JackWprat'.match(/Jack(?=Sprat)/) // null 'JackWprat'.match(/Jack(?=Sprat|Wprat)/) // ["Jack", index: 0, input: "JackWprat"] /\d+(?!\.)/.exec("3.141") // ["141", index: 2, input: "3.141"] 复制代码 -
{n},{n,m}:{n}:匹配了前面一个字符刚好发生了n次;{n,m}:匹配前面的字符至少n次,最多m次。如果 n 或者 m 的值是0, 这个值被忽略;例:
/a{2}/.exec('candy') // null /a{2}/.exec('caandy') // ["aa", index: 1, input: "caandy"] /a{2}/.exec('caaandy') // ["aa", index: 1, input: "caaandy"] /a{1,3}/.exec('candy') // ["a", index: 1, input: "candy"] /a{1,3}/.exec('caandy') // ["aa", index: 1, input: "caandy"] /a{1,3}/.exec('caaandy') // ["aaa", index: 1, input: "caaandy"] /a{1,3}/.exec('caaaandy') // ["aaa", index: 1, input: "caaaandy"] 复制代码 -
[xyz],[^xyz][xyz]:一个字符集合。匹配方括号的中任意字符;[^xyz]:一个反向字符集。匹配任何没有包含在方括号中的字符;这两种匹配都可以使用破折号(-)来指定一个字符范围,特殊符号在字符集中没有了特殊意义。
例:
function escapeRegExp(string){ return string.replace(/([.*+?^=!:${}()|[\]\/\\])/g, "\\$&"); //$&表示整个被匹配的字符串 } 复制代码例子中的
.*+?^=!:${}()都表示字面量,并没有特殊意义 -
其他
\b:匹配一个词的边界。一个匹配的词的边界并不包含在匹配的内容中。换句话说,一个匹配的词的边界的内容的长度是0;\B: 匹配一个非单词边界;例:
/\bm/.exec('moon') // ["m", index: 0, input: "moon"] /\bm/.exec('san moon') // ["m", index: 4, input: "san moon"] /oo\b/.exec('moon') // null /\B../.exec('noonday') // ["oo", index: 1, input: "noonday"] /y\B../.exec('possibly yesterday') // /y\B../.exec('possibly yesterday') 复制代码\d:匹配一个数字,等价于[0-9];\D:匹配一个非数字字符,等价于[^0-9];\f:匹配一个换页符 (U+000C);\n:匹配一个换行符 (U+000A);\r:匹配一个回车符 (U+000D);\s:匹配一个空白字符,包括空格、制表符、换页符和换行符,等价于[ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff];\S:匹配一个非空白字符,等价于[^ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff];\w:匹配一个单字字符(字母、数字或者下划线),等价于[A-Za-z0-9_];\W:匹配一个非单字字符,等价于[^A-Za-z0-9_];
正则表达式标志
g
:全局搜索;
i
:不区分大小写;
m
:多行搜索;
正则表达式使用
RegExp
有 exec()
和 test()
方法;
exec
匹配的结果为:匹配结果、捕获结果, index
和 input
。
test
匹配的结果为 true
或 false
,效率比 exec
要高。
String
有 match()
, replace()
, search()
, split()
方法;
match
匹配的结果同 RegExp
的 exec
, replace
根据正则表达式替换, search
查找所以位置, split
根据正则表达式分割字符串。
其中,当 replace
有 function
时,参数说明如下:
index input
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Python核心编程(第3版)
[美] Wesley Chun / 孙波翔、李斌、李晗 / 人民邮电出版社 / 2016-5 / CNY 99.00
《Python核心编程(第3版)》是经典畅销图书《Python核心编程(第二版)》的全新升级版本,总共分为3部分。第1部分为讲解了Python的一些通用应用,包括正则表达式、网络编程、Internet客户端编程、多线程编程、GUI编程、数据库编程、Microsoft Office编程、扩展Python等内容。第2部分讲解了与Web开发相关的主题,包括Web客户端和服务器、CGI和WSGI相关的We......一起来看看 《Python核心编程(第3版)》 这本书的介绍吧!