个人技术分享

MongoDB聚合运算符:$substrBytes


$substrBytes聚合运算符返回字符串的子串,子串是从指定的索引位置(以UTF-8字节为标准)开始并包含指定数量的字符,索引是从零开始。

语法

{ $substrBytes: [ <string>, <start>, <length> ] }

第一个参数为字符串表达式,第二和第三个参数为整数表达式。

使用

  • 如果<start>为负数,$substrBytes返回空字符串""
  • 如果<length>为负数,$substrBytes返回从指定索引开始并包含字符串其余部分的子串。
  • $substrBytes只针对ASSII字符串的操作是明确的,其他编码的字符串要注意其适用性。

举例

inventory集合有下列文档:

{ "_id" : 1, "item" : "ABC1", "quarter": "13Q1", "description" : "product 1" }
{ "_id" : 2, "item" : "ABC2", "quarter": "13Q4", "description" : "product 2" }
{ "_id" : 3, "item" : "XYZ1", "quarter": "14Q2", "description" : null }

下面的聚合操作使用 $substrBytes 运算符将quarter字段拆分拆分为yearSubstringquarterSubstrin字段:

db.inventory.aggregate(
   [
     {
       $project:
          {
            item: 1,
            yearSubstring: { $substrBytes: [ "$quarter", 0, 2 ] },
            quarterSubtring: { $substrBytes: [ "$quarter", 2, -1 ] }
          }
      }
   ]
)

操作返回下面的结果:

{ "_id" : 1, "item" : "ABC1", "yearSubstring" : "13", "quarterSubtring" : "Q1" }
{ "_id" : 2, "item" : "ABC2", "yearSubstring" : "13", "quarterSubtring" : "Q4" }
{ "_id" : 3, "item" : "XYZ1", "yearSubstring" : "14", "quarterSubtring" : "Q2" }