正则表达式

本文最后更新于:2024年11月17日 晚上

正则表达式的概述

正则表达式是用于匹配字符串中字符组合的模式。在 JavaScript 中,正则表达式也是对象

正则表通常被用来检索,替换那些符合某个模式(规则)的文本,例如验证表单:用户名表只能输入英文字母,数字或者下划线,昵称输入框可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一些敏感词汇(替换),或从字符串中获取我们想要的特定部分(提取)等

正则表达式的特点
  1. 灵活性,逻辑性和功能性非常的强

  2. 可以迅速地用简单的方式达到字符串的复制控制

  3. 对于刚接触的人来说,比较难懂,比如:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w*$

  4. 实际开发,一般都是直接复制写好的正则表达式,但是要求会使用正则表达式并且根据实际情况修改正则表达式

创建正则表达式

在 JavaScript 中可以通过两种方法来创建正则表达式

  1. 通过调用 RegExp 对象的构造函数创建

var x = new RegExp(/表达式/);

  1. 通过字面量创建

var x = /表达式/;

测试正则表达式 test

test()正则对象方法,用于检测字符串是否符合该规则,该对象会返回 true 或 false ,其参数是测试字符串

regexObj.test(str);

  1. regexObj 是写的正则表达式
  2. str 我们要测试的文本
  3. 就是检测 str 文本是否符合我们写的正则表达式规范

正则表达式中的特殊字符

一个正则表达式==可以由简单的字符构成==,比如/abc/,==也可以是简答和特殊字符的组合==,比如/ab*c/。其中特殊字符也被称为==元字符==,在正则表达式中是具有特殊意义的专用符号。如 ^ $ + - 等

边界符

正则表达式中的边界符(位置符)用来==提示字符所处的位置==,主要有两个字符

边界符 说明
^ 表示匹配行首的文本(以谁开始)
$ 表示匹配行尾的文本(以谁结尾)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
//边界符
var rg = /abc/; //正则表达式里面不需要加引号 不管是数字还是字符串
// /abc/ 只要包含有 abc这个字符串返回的都是true
console.log(rg.test("abc"));
console.log(rg.test("abcd"));
console.log(rg.test("aabc"));
console.log("----------------------------");
var reg = /^abc/;
console.log(rg.test("abc")); //true
console.log(rg.test("abcd")); //true
console.log(rg.test("aabc")); //false
console.log("-------------");
结尾同理;
var reg = /^abc$/; //精确匹配 要求必须是 abc字符串才符合规范
console.log(rg.test("abc")); //true
console.log(rg.test("abcd")); //false
console.log(rg.test("aabc")); //false
console.log(rg.test("abcabc")); //false

如果 ^ 和 $ 在一起就表示必须是精确匹配

字符类

[]表示有一系列字符可供选择,只要匹配其中一个就可以了

[-] 表示范围

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
var rg = /[abc]/; //只要包含有a 或者 有b 或者有c 都返回为true
consloe.log(rg.test('andy')); //true
var rg1 = /^[abc]$/; //三选一 只有是a 或者是b 或者是c 这三个字母才返回true
console.log(rg1.test('a')); //true
console.log(rg1.test('b')); //true
console.log(rg1.test('c')); //true
console.log(rg1.test('aa')); //false
console.log(rg1.test('abc')); //false
console.log(rg1.test('bb')); //false

consloe.log('--------------');
var rg2 = /^[a-z]$/; //26个英文字母任何一个字母返回 true
console.log(rg2.test('a')); //true
console.log(rg2.test('z')); //true
console.log(rg2.test('A')); //false
//字符组合
var reg = /^[a-zA-Z0-9]$/ 英文字母和数字

如果中括号里面有^ 表示取反的意思 千万别和边界符 混淆了

var reg1 = /^[^ a-z]$/;也就是不能取这些

量词符

量词符是用来设定某个模式出现的次数

量词 说明
* 重复零次或更多次
+ 重复一次或更多次
重复零次或一次
{n} 重复 n 次
{n,} 重复 n 次或更多次
{n,m} 重复 n 到 m 次
1
2
3
4
5
6
7
8
// * 相当于 >=0 可以出现0次或者很多次
var reg = /^a*$/;
console.log("a"); //true
console.log(""); //true
console.log("aaa"); //true

//+ 相当于 >=1 可以出现1次或者很多次
//{3} 就是三次 {3,} 是大于等于3次 {3,16} 就是3到16次

预定义类

预定义类指的是某些常见模式的简写模式

预定义类 说明
\d 匹配 0-9 之间的任一数字,相当于[0-9]
\D 匹配所有 0-9 以外的字符,相当于[^0-9]
\w 匹配任意的字母,数字,下划线,相当于[A-Za-z0-9_]
\W 除所有字母,数字,下划线以外的字符
\s 匹配空格(包括换行符,制表符,空格符),相等于[\t\r\n\v\f]
\S 匹配非空格的字符

正则表达式中的替换

replace()方法可以实现替换字符串操作,用来替换掉参数可以是一个字符串或是一个正则表达式

stringObject.replace(refexp/substr,replacement)

  1. 第一个参数:被替换的字符串或者正则表达式
  2. 第二个参数:替换为的字符串
  3. 返回值是一个替换完毕的新字符串

正则表达式参数

/表达式/[switch] /andy/g

switch(也称为修饰符)按照什么样的模式来匹配,有三种值

  • g:全局匹配
  • i:忽略大小写
  • gi:全局匹配 + 忽略大小写

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!