正则表达式是JavaScript中用于匹配、查找、替换字符串模式的工具,通过RegExp构造函数或字面量(如/abc/)配合test()、match()、replace()等方法实现文本处理;基础包括字符类(如\d、\w)、量词(*、+、?等,默认贪婪)、分组与捕获(()、(?:…)、\1);实用技巧有修饰符(i/g/m)、锚点(^/$/\b)、优先用字符类替代.;示例含手机号/^1[3-9]\d{9}$/和简单HTML标签提取。

正则表达式(Regular Expression,简称 regex 或 regexp)是 JavaScript 中用于匹配、查找、替换字符串中特定模式的工具。它不是 JavaScript 独有,但 JS 提供了 RegExp 构造函数和字面量语法(如 /abc/),配合字符串方法(test()、match()、replace()、split() 等)实现强大文本处理能力。
正则基础:字符、量词与分组
复杂匹配建立在基础语法之上。掌握以下三类元素是关键:
-
字符类:如
[a-z]匹配任意小写字母,\d等价于[0-9],\w匹配字母、数字或下划线;.匹配除换行符外的任意字符(需注意点号的“贪婪”特性)。 -
量词:控制重复次数。
*(0 次或多次)、+(1 次或多次)、?(0 或 1 次)、{n}(恰好 n 次)、{n,}(至少 n 次)、{n,m}(n 到 m 次)。默认为“贪婪匹配”,加?可转为“惰性匹配”,例如.*?。 -
分组与捕获:
(...)创建捕获组,可用于提取子串或复用模式;(?:...)是非捕获组,仅用于逻辑分组不保存匹配结果;\1、\2引用前面捕获组的内容(反向引用),适合匹配重复结构,比如/(\w+)\s+\1/可匹配连续两个相同单词。
处理复杂模式的实用技巧
真实场景中的模式往往嵌套、可选、边界敏感。避免“写完就跑”,建议分步构建并验证:
-
使用修饰符控制匹配行为:常用
i(忽略大小写)、g(全局匹配,不止第一个)、m(多行模式,使^和$匹配每行起止);例如/hello/gi能找到所有不区分大小写的 "hello"。 -
锚点与边界确保精准定位:
^和$锁定行首行尾,\b匹配单词边界(如/\bcat\b/不会误中 "category");\B则匹配非单词边界。 -
优先使用字符类而非点号:比如邮箱本地部分允许字母、数字、点、下划线、短横线,但不能以点开头或结尾,也不能连续出现点——这时写
[a-zA-Z0-9._-]+比.+更安全、更可控。
常见复杂场景示例
几个典型例子说明如何组合上述要素:
标签: javascript java html js go 正则表达式 工具 邮箱
还木有评论哦,快来抢沙发吧~