MySQL 正则表达式用法详解与示例

Mysql 教程


正则表达式是描述搜索模式的特殊字符串。它是一个强大的工具,提供了一种简洁而灵活的方法,用于根据模式识别文本字符串(如字符和单词)。它有自己的语法,由正则表达式处理器解释。正则表达式在几乎所有平台上都被广泛使用,从编程语言到数据库,包括MySQL。

正则表达式使用反斜杠作为转义字符,如果使用了双反斜杠,则应在模式匹配中考虑该转义字符。正则表达式不区分大小写。在MySQL中缩写为REGEX或REGEXP。

使用正则表达式的好处是,我们不局限于搜索基于固定模式的字符串,该模式在LIKE操作符中包含百分号(%)和下划线(_)。正则表达式有更多元字符,在执行模式匹配时允许更多的灵活性和控制。

我们之前已经学习了通配符,它允许我们获得与正则表达式类似的结果。因此,我们可能会问,如果我们能得到与通配符相同的结果,为什么还要学习正则表达式呢?这是因为正则表达式允许我们以比通配符更复杂的方式搜索数据。

在 MySQL 中使用正则表达式的基本语法:

SELECT column_lists
FROM table_name
WHERE field_name REGEXP ‘pattern’ ;

下表中的正则模式可应用于 REGEXP 操作符中。

模式描述
^匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 ‘\n’ 或 ‘\r’ 之后的位置。
$匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性,$ 也匹配 ‘\n’ 或 ‘\r’ 之前的位置。
.匹配除 “\n” 之外的任何单个字符。要匹配包括 ‘\n’ 在内的任何字符,请使用像 ‘[.\n]’ 的模式。
[…]字符集合。匹配所包含的任意一个字符。例如, ‘[abc]’ 可以匹配 “plain” 中的 ‘a’。
[^…]负值字符集合。匹配未包含的任意字符。例如, ‘[^abc]’ 可以匹配 “plain” 中的’p’。
p1|p2|p3匹配 p1 或 p2 或 p3。例如,’z|food’ 能匹配 “z” 或 “food”。'(z|f)ood’ 则匹配 “zood” 或 “food”。
*匹配前面的子表达式零次或多次。例如,zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}。
+匹配前面的子表达式一次或多次。例如,’zo+’ 能匹配 “zo” 以及 “zoo”,但不能匹配 “z”。+ 等价于 {1,}。
{n}n 是一个非负整数。匹配确定的 n 次。例如,’o{2}’ 不能匹配 “Bob” 中的 ‘o’,但是能匹配 “food” 中的两个 o。
{n,m}m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。

了解以上的正则需求后,我们就可以根据自己的需求来编写带有正则表达式的SQL语句。以下我们将列出几个小实例(表名:person_tbl )来加深我们的理解:

查找name字段中以’st’为开头的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP '^st';

查找name字段中以’ok’为结尾的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP 'ok$';

查找name字段中包含’mar’字符串的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP 'mar';

查找name字段中以元音字符开头或以’ok’字符串结尾的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP '^[aeiou]|ok$';

Mysql 教程


相关