浅谈js中的正则表达式

栏目: JavaScript · 发布时间: 6年前

内容简介:很多时候多会被正则表达式搞的晕头转向,最近抽出时间对正则表达式进行了系统的学习,整理如下:两种方法,一种是直接写,由包含在斜杠之间的模式组成;另一种是调用两种方法的创建代码如下:

很多时候多会被正则表达式搞的晕头转向,最近抽出时间对正则表达式进行了系统的学习,整理如下:

正则表达式的创建

两种方法,一种是直接写,由包含在斜杠之间的模式组成;另一种是调用 RegExp 对象的构造函数。

两种方法的创建代码如下:

// 直接创建
const regex1 = /ab+c/;
const regex2 = /^[a-zA-Z]+[0-9]*\W?_$/gi;

// 调用构造函数
const regex3 = new RegExp('ab+c');
const regex4 = new RegExp(/^[a-zA-Z]+[0-9]*\W?_$/, "gi");
const regex5 = new RegExp('^[a-zA-Z]+[0-9]*\W?_$', 'gi');
复制代码

可以看出,调用 RegExp 构造函数创建正则表达式时,第一个参数可以是字符串,也可以是直接创建的正则表达式。

需要注意的是: RegExp 实例继承的 toLocaleString()toString)() 方法都会返回正则表达式的字面量,与创建正则表达式的方式无关。

例如:

const ncname = '[a-zA-Z_][\\w\\-\\.]*';
const qnameCapture = '((?:' + ncname + '\\:)?' + ncname + ')';
const startTagOpen = new RegExp('^<' + qnameCapture);
      
// '/^<((?:[a-zA-Z_][\w\-\.]*\:)?[a-zA-Z_][\w\-\.]*)/'
startTagOpen.toString();  
复制代码

正则表达式中的特殊字符

  • \ (反斜杠)

    1. 在非特殊字符前加反斜杠表示下一个字符是特殊的;
    2. 将其后的特殊字符转译为字面量;

    注意:在使用 RegExp 构造函数时要将\转译,因为 \ 在字符串里也是转译字符。

  • ^

    []
    

    例:

    /^A/.exec('an A')        // null
    /^A/.exec('An E')        // ["A", index: 0, input: "An E"]
    复制代码
  • $

    匹配输入的结束

    /t$/.exec('eater')        // null
    /t$/.exec('eat')          // ["t", index: 2, input: "eat"]
    复制代码
  • * , + , . (小数点)

    * :匹配前一个表达式0次或多次。等价于 {0,}

    + :匹配前面一个表达式1次或者多次。等价于 {1,}

    . :匹配除换行符之外的任何单个字符;

  • ? (问号)

    {0,1}
    * + ? {}
    

    例子:

    /\d+/.exec('123abc')        // ["123", index: 0, input: "123abc"]
    /\d+?/.exec('123abc')       // ["1", index: 0, input: "123abc"]
    复制代码
  • (x)

    匹配 x 并且记住匹配项,括号表示捕获括号;

    例:

    /(foo) (bar) \1 \2/.test('bar foo bar foo');   // false
    /(bar) (foo) \1 \2/.test('bar foo bar foo');   // true
    /(bar) (foo) \1 \2/.test('bar foo');           // false
    /(bar) (foo) \1 \2/.test('bar foo foo bar');   // false
    /(bar) (foo) \2 \1/.test('bar foo foo bar');   // true
    
    'bar foo bar foo'.replace( /(bar) (foo)/, '$2 $1' );    // "foo bar bar foo"
    复制代码

    模式 /(foo) (bar) \1 \2/ 中的 (foo)(bar) 匹配并记住字符串 foo bar foo bar 中前两个单词。模式中的 \1\2 匹配字符串的后两个单词。

    注意: \1\2\n 是用在正则表达式的匹配环节,在正则表达式的替换环节,则要使用像 $1$2$n 这样的语法。例如, 'bar foo'.replace( /(...) (...)/, '$2 $1' )

  • (?:x)

    匹配 x 但是不记住匹配项,这种叫作非捕获括号;

    例:

    'foo'.match(/foo{1,2}/)                // ["foo", index: 0, input: "foo"]
    'foo'.match(/(?:foo){1,2}/)            // ["foo", index: 0, input: "foo"]
    'foofoo'.match(/(?:foo){1,2}/)         // ["foofoo", index: 0, input: "foofoo"]
    'foofoo'.match(/foo{1,2}/)             // ["foo", index: 0, input: "foofoo"]
    复制代码

    使用场景:示例表达式 /(?:foo){1,2}/ 。如果表达式是 /foo{1,2}/{1,2} 将只对 foo 的最后一个字符 ’o‘ 生效。如果使用非捕获括号,则 {1,2} 会匹配整个 foo 单词。

  • x(?=y) , x(?!y) , x|y

    x(?=y) :匹配'x'仅仅当'x'后面跟着'y';

    x(?!y) :匹配'x'仅仅当'x'后面不跟着'y';

    x|y : 匹配x或y;

    这两种匹配的结果都不包含y。

    例:

    'JackSprat'.match(/Jack(?=Sprat)/)            // ["Jack", index: 0, input: "JackSprat"]
    'JackWprat'.match(/Jack(?=Sprat)/)            // null
    'JackWprat'.match(/Jack(?=Sprat|Wprat)/)      // ["Jack", index: 0, input: "JackWprat"]
    /\d+(?!\.)/.exec("3.141")                     // ["141", index: 2, input: "3.141"]
    复制代码
  • {n} , {n,m} :

    {n} :匹配了前面一个字符刚好发生了n次;

    {n,m} :匹配前面的字符至少n次,最多m次。如果 n 或者 m 的值是0, 这个值被忽略;

    例:

    /a{2}/.exec('candy')         // null
    /a{2}/.exec('caandy')        // ["aa", index: 1, input: "caandy"]
    /a{2}/.exec('caaandy')       // ["aa", index: 1, input: "caaandy"]
    
    /a{1,3}/.exec('candy')       // ["a", index: 1, input: "candy"]
    /a{1,3}/.exec('caandy')      // ["aa", index: 1, input: "caandy"]
    /a{1,3}/.exec('caaandy')     // ["aaa", index: 1, input: "caaandy"]
    /a{1,3}/.exec('caaaandy')    // ["aaa", index: 1, input: "caaaandy"]
    复制代码
  • [xyz] , [^xyz]

    [xyz] :一个字符集合。匹配方括号的中任意字符;

    [^xyz] :一个反向字符集。匹配任何没有包含在方括号中的字符;

    这两种匹配都可以使用破折号(-)来指定一个字符范围,特殊符号在字符集中没有了特殊意义。

    例:

    function escapeRegExp(string){
        return string.replace(/([.*+?^=!:${}()|[\]\/\\])/g, "\\$&"); 
        //$&表示整个被匹配的字符串
    }
    复制代码

    例子中的 .*+?^=!:${}() 都表示字面量,并没有特殊意义

  • 其他

    \b :匹配一个词的边界。一个匹配的词的边界并不包含在匹配的内容中。换句话说,一个匹配的词的边界的内容的长度是0;

    \B : 匹配一个非单词边界;

    例:

    /\bm/.exec('moon')                        // ["m", index: 0, input: "moon"]
        /\bm/.exec('san moon')                    // ["m", index: 4, input: "san moon"]
        /oo\b/.exec('moon')                       // null
        /\B../.exec('noonday')                    // ["oo", index: 1, input: "noonday"]
        /y\B../.exec('possibly yesterday')        // /y\B../.exec('possibly yesterday')
    复制代码

    \d :匹配一个数字,等价于 [0-9]

    \D :匹配一个非数字字符,等价于 [^0-9]

    \f :匹配一个换页符 (U+000C);

    \n :匹配一个换行符 (U+000A);

    \r :匹配一个回车符 (U+000D);

    \s :匹配一个空白字符,包括空格、制表符、换页符和换行符,等价于 [ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]

    \S :匹配一个非空白字符,等价于 [^ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]

    \w :匹配一个单字字符(字母、数字或者下划线),等价于 [A-Za-z0-9_]

    \W :匹配一个非单字字符,等价于 [^A-Za-z0-9_]

正则表达式标志

g :全局搜索;

i :不区分大小写;

m :多行搜索;

正则表达式使用

RegExpexec()test() 方法;

exec 匹配的结果为:匹配结果、捕获结果, indexinput

test 匹配的结果为 truefalse ,效率比 exec 要高。

Stringmatch()replace()search()split() 方法;

match 匹配的结果同 RegExpexecreplace 根据正则表达式替换, search 查找所以位置, split 根据正则表达式分割字符串。

其中,当 replacefunction 时,参数说明如下:

index
input

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Web程序设计

Web程序设计

塞巴斯塔 / 2010-1 / 69.00元

《Web程序设计(第5版)》全面介绍了建立和维护Web站点必需的工具和技术,包括Internet和万维网的起源与演变、Web客户端和服务器端开发中的基本概念,以及与Web开发相关的主要编程语言和工具等。《Web程序设计(第5版)》对第4版的内容做了大量细致的修改并且新增了许多内容,如介绍了Flash的使用、Ajax工具包和其安全性,以及与ASP.NET AJAX的相关内容。 《Web程序设计......一起来看看 《Web程序设计》 这本书的介绍吧!

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试