MongoDB 正则表达式
在 MongoDB 中,正则表达式用于模式匹配,主要用于在文档中的字符串中搜索模式。它是一种将模式与字符序列匹配的通用方法。$regex 运算符用作正则表达式以在字符串中查找模式。
在 MongoDB 中,我们可以通过两种不同的方式进行模式匹配:
- 使用 $regex 运算符进行模式匹配
- 没有 $regex 运算符的模式匹配
使用 $regex 运算符进行模式匹配
在 MongoDB 中,$regex 运算符提供了在查询中进行模式匹配的功能。换句话说,$regex 运算符用于搜索文档中的特定字符串。
语法格式
{ <field>: { $regex: /pattern/, $options: ‘<options>’ } }
{ <field>: { $regex: ‘pattern’ , $options: ‘<options>’ } }
<option> 可与正则表达式一起使用:
- “i”字符用于匹配字符串中的小写和大写模式。
- “^”和“$”符号用于在文档中搜索特定模式。“^”符号用来保证字符串以某个字符开始,$用来保证字符串以某个字符结尾。
- “x”字符用于忽略字符串中的所有空白字符。
考虑以下 posts 集合的文档结构,该文档包含了文章内容和标签:
{
"post_text": "enjoy the mongodb articles on runoon",
"tags": [
"mongodb",
"runoon"
]
}
使用正则表达式
以下命令使用正则表达式查找包含 runoon 字符串的文章:
>db.posts.find({post_text:{$regex:"runoon"}})
以上查询也可以写为:
>db.posts.find({post_text:/runoon/})
不区分大小写的正则表达式
如果检索需要不区分大小写,我们可以设置 $options 为 $i。
以下命令将查找不区分大小写的字符串 runoon:
>db.posts.find({post_text:{$regex:"runoon",$options:"$i"}})
集合中会返回所有包含字符串 runoon 的数据,且不区分大小写:
{
"_id" : ObjectId("53493d37d852429c10000004"),
"post_text" : "hey! this is my post on runoon",
"tags" : [ "runoon" ]
}
数组元素使用正则表达式
我们还可以在数组字段中使用正则表达式来查找内容。 这在标签的实现上非常有用,如果你需要查找包含以 run 开头的标签数据(ru 或 run 或 runoon), 你可以使用以下代码:
>db.posts.find({tags:{$regex:"run"}})
优化正则表达式查询
- 如果你的文档中字段设置了索引,那么使用索引相比于正则表达式匹配查找所有的数据查询速度更快。
- 如果正则表达式是前缀表达式,所有匹配的数据将以指定的前缀字符串为开始。例如: 如果正则表达式为 ^tut ,查询语句将查找以 tut 为开头的字符串。
这里面使用正则表达式有两点需要注意:
正则表达式中使用变量。一定要使用eval将组合的字符串进行转换,不能直接将字符串拼接后传入给表达式。否则没有报错信息,只是结果为空!实例如下:
var name=eval("/" + 变量值key +"/i");
以下是模糊查询包含title关键词, 且不区分大小写:
title:eval("/"+title+"/i") // 等同于 title:{$regex:title,$Option:"$i"}