ECMAScript正则表达式6个最新特性
栏目: JavaScript · 发布时间: 6年前
内容简介:译者按:还没学好ES6?ECMAScript 2018已经到来啦!1999年,ECMAScript 3添加了对正则表达式的支持。16年之后,ECMAScript 6(即ECMAScript 2015或者ES6)引入了Unicode模式(u选项),
译者按:还没学好ES6?ECMAScript 2018已经到来啦!
- 原文 : ECMAScript regular expressions are getting better!
- 作者 : Mathias Bynens : Google V8引擎开发者
- 译者 : Fundebug
为了保证可读性,本文采用意译而非直译。另外,本文版权归原作者所有,翻译仅用于学习。
1999年,ECMAScript 3添加了对正则表达式的支持。
16年之后,ECMAScript 6(即ECMAScript 2015或者ES6)引入了Unicode模式(u选项), sticky模式(y选项) 以及 RegExp.prototype.flags的getter方法 。
这篇博客将介绍ECMAScript正则表达式的最新 特性 :
- dotAll模式(s选项)
- Lookbehind断言
- Named capture groups
- Unicode property escapes
- String.prototype.matchAll
- 规范RegExp遗留特性
1. dotAll模式(s选项)
这个特性已经在ECMAScript 2018正式发布了。
默认情况下, .
可以匹配任意字符,除了换行符:
/foo.bar/u.test('foo\nbar'); // false 复制代码
另外, .
不能匹配Unicode字符,需要使用 u
选项启用Unicode模式才行。
ES2018引入了 dotAll模式
,通过 s
选项可以启用,这样, .
就可以匹配换行符了。
/foo.bar/su.test('foo\nbar'); // true 复制代码
2. Lookbehind断言
这个特性已经在ECMAScript 2018正式发布了。
ECMAScript目前仅支持lookahead断言。
下面示例是Positive lookahead,匹配字符串“42 dollars”中紧跟着是"dollars"的数字:
const pattern = /\d+(?= dollars)/u; const result = pattern.exec('42 dollars'); console.log(result[0]); // 打印42 复制代码
下面示例是Negative lookahead,匹配字符串“42 pesos”中紧跟着的不是"dollars"的数字:
const pattern = /\d+(?! dollars)/u; const result = pattern.exec('42 pesos'); console.log(result[0]); // 打印42 复制代码
ES2018添加了 lookbehind断言 。
下面示例是Positive lookbehind,匹配字符串“$42”中前面是"$"的数字:
const pattern = /(?<=\$)\d+/u; const result = pattern.exec('$42'); console.log(result[0]); // 打印42 复制代码
下面示例是Negative lookbehind,匹配字符串“$42”中前面不是是"$"的数字:
const pattern = /(?<!\$)\d+/u; const result = pattern.exec('€42'); console.log(result[0]); // 打印42 复制代码
Fundebug专注于网页、微信小程序、微信小游戏,支付宝小程序,React Native,Node.js和 Java 线上BUG实时监控,欢迎免费试用
3. Named capture groups
这个特性已经在ECMAScript 2018正式发布了。
目前,正则表达式中小括号匹配的分组是通过数字编号的:
const pattern = /(\d{4})-(\d{2})-(\d{2})/u; const result = pattern.exec('2017-01-25'); console.log(result[0]); // 打印"2017-01-25" console.log(result[1]); // 打印"2017" console.log(result[2]); // 打印"01" console.log(result[3]); // 打印"25" 复制代码
这样很方便,但是可读性很差,且不易维护。一旦正则表达式中小括号的顺序有变化时,我们就需要更新对应的数字编号。
ES2018添加 named capture groups , 可以指定小括号中匹配内容的名称,这样可以提高代码的可读性,也便于维护。
const pattern = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/u; const result = pattern.exec('2017-01-25'); console.log(result.groups.year); // 打印"2017" console.log(result.groups.month); // 打印"01" console.log(result.groups.day); // 打印"25" 复制代码
4. Unicode property escapes
这个特性已经在ECMAScript 2018正式发布了。
Unicode标准为每一个字符分配了多个属性。比如,当你要匹配希腊语字符时,则可以搜索Script_Extensions属性为Greek的字符。
Unicode property escapes 使得我们可以使用ECMAScript正则表达式直接匹配Unicode字符的属性:
const regexGreekSymbol = /\p{Script_Extensions=Greek}/u; console.log(regexGreekSymbol.test('π')); // 打印true 复制代码
5. String.prototype.matchAll
这个特性还处在Stage 3 Draft
g和y选项通常用于匹配一个字符串,然后遍历所有匹配的子串,包括小括号匹配的分组。 String.prototype.matchAll 让这个操作变得更加简单了。
const string = 'Magic hex numbers: DEADBEEF CAFE 8BADF00D'; const regex = /\b[0-9a-fA-F]+\b/g; for (const match of string.matchAll(regex)) { console.log(match); } 复制代码
每一个迭代所返回的match对象与regex.exec(string)所返回的结果相同:
// Iteration 1: [ 'DEADBEEF', index: 19, input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D' ] // Iteration 2: [ 'CAFE', index: 28, input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D' ] // Iteration 3: [ '8BADF00D', index: 33, input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D' ] 复制代码
注意,这个特性还处在Stage 3 Draft,因此还存在变化的可能性,示例代码是根据最新的提案写的。另外,浏览器也还没有支持这个特性。String.prototype.matchAll最快可以被加入到ECMAScript 2019中。
6. 规范RegExp遗留特性
这个提案还处在Stage 3 Draft
这个提案 规范了RegExp的遗留特性 ,比如 RegExp.prototype.compile 方法以及它的静态属性从 RegExp.$1 到 RegExp.$9 。虽然这些特性已经弃用(deprecated)了,但是为了兼容性我们不能将他们去。因此,规范这些RegExp遗留特性是最好的方法。因此,这个提案有助于保证兼容性。
以上所述就是小编给大家介绍的《ECMAScript正则表达式6个最新特性》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Usability for the Web
Tom Brinck、Darren Gergle、Scott D. Wood / Morgan Kaufmann / 2001-10-15 / USD 65.95
Every stage in the design of a new web site is an opportunity to meet or miss deadlines and budgetary goals. Every stage is an opportunity to boost or undercut the site's usability. Thi......一起来看看 《Usability for the Web》 这本书的介绍吧!