块连接查询解析器

有两个查询解析器支持块连接。这些解析器允许索引和搜索已索引为嵌套文档的关系内容。

以下查询解析器的示例用法假定已索引以下文档

<add>
  <doc>
    <field name="id">1</field>
    <field name="content_type">parent</field>
    <field name="title">Solr has block join support</field>
    <doc>
      <field name="id">2</field>
      <field name="content_type">child</field>
      <field name="comments">SolrCloud supports it too!</field>
    </doc>
  </doc>
  <doc>
    <field name="id">3</field>
    <field name="content_type">parent</field>
    <field name="title">New Lucene and Solr release</field>
    <doc>
      <field name="id">4</field>
      <field name="content_type">child</field>
      <field name="comments">Lots of new features</field>
    </doc>
  </doc>
</add>

块连接子查询解析器

此解析器包装一个与某些父文档匹配并返回这些文档的子文档的查询。

此解析器的语法为:q={!child of=<blockMask>}<someParents>

  • 内部子查询字符串 (someParents) 必须是一个将与某些父文档匹配的查询

  • of 参数必须是一个查询字符串,用作块掩码 — 通常是一个与所有可能的父文档集匹配的查询

结果查询将匹配所有与 <blockMask> 查询不匹配,并且是 <someParents> 匹配的文档的子文档(或后代)的所有文档。

使用上面的示例文档,我们可以构造一个查询,例如 q={!child of="content_type:parent"}title:lucene。我们只得到一个文档作为响应

<result name="response" numFound="1" start="0">
  <doc>
    <str name="id">4</str>
    <arr name="content_type"><str>child</str></arr>
    <str name="comments">Lots of new features</str>
  </doc>
</result>

someParents 的查询**必须**匹配块掩码匹配的文档的严格子集,否则您的查询可能会导致错误

Parent query must not match any docs besides parent filter.
Combine them as must (+) and must-not (-) clauses to find a problem doc.

如果您遇到此类错误,可以搜索 q=+(someParents) -(blockMask) 来查找原因。

过滤和标记

{!child} 还支持 filtersexcludeTags 本地参数,如下所示

?q={!child of=<blockMask> filters=$parentfq excludeTags=certain}<someParents>
&parentfq=BRAND:Foo
&parentfq=NAME:Bar
&parentfq={!tag=certain}CATEGORY:Baz

这等效于

q={!child of=<blockMask>}+<someParents> +BRAND:Foo +NAME:Bar

请注意 filters 中用于引用查询的 "$" 语法;逗号分隔的标签 excludeTags 允许通过标签排除某些查询。总的来说,这个思路类似于在 facets 中排除 fq。请注意,过滤应用于子句 (<someParents>),并且交集结果将与子项连接。

所有子项语法

当省略子句 (<someParents>) 时,它被解析为用于子文档的分段缓存过滤器。更准确地说,q={!child of=<blockMask>} 等效于 q=*:* -<blockMask>

块连接父查询解析器

此解析器接受一个匹配子文档的查询,并返回它们的父文档。

此解析器的语法类似于 child 解析器:q={!parent which=<blockMask>}<someChildren>

  • 内部子查询字符串 (someChildren) 必须是一个会匹配某些子文档的查询

  • which 参数必须是一个查询字符串,用作块掩码 —— 通常是一个匹配所有可能的父文档的集合的查询

生成的查询将匹配所有确实匹配 <blockMask> 查询且是由 <someChildren> 匹配的文档的父文档(或祖先)的文档。

再次使用上面的示例文档,我们可以构建一个如下的查询 q={!parent which="content_type:parent"}comments:SolrCloud。我们在响应中得到此文档

<result name="response" numFound="1" start="0">
  <doc>
    <str name="id">1</str>
    <arr name="content_type"><str>parent</str></arr>
    <arr name="title"><str>Solr has block join support</str></arr>
  </doc>
</result>

someChildren 的查询不得匹配块掩码匹配的任何文档,否则您的查询可能会导致错误

Child query must not match same docs with parent filter.
Combine them as must clauses (+) to find a problem doc.

您可以搜索 q=+(blockMask) +(someChildren) 来查找原因。

过滤和标记

{!parent} 查询支持 filtersexcludeTags 本地参数,如下所示

?q={!parent which=<blockMask> filters=$childfq excludeTags=certain}<someChildren>
&childfq=COLOR:Red
&childfq=SIZE:XL
&childfq={!tag=certain}PRINT:Hatched

这等效于

q={!parent which=<blockMask>}+<someChildren> +COLOR:Red +SIZE:XL

请注意 filters 中用于引用查询的 "$" 语法。excludeTags 中逗号分隔的标签允许通过标签排除某些查询。总的来说,这个思路类似于在 facets 中排除 fq。请注意,过滤首先应用于子句 (<someChildren>),并且交集结果将与父项连接。

使用块连接父查询解析器进行评分

您可以选择使用 score 本地参数来返回子查询的分数。此参数使用的值定义聚合类型,可以是 avg(平均值)、max(最大值)、min(最小值)和 total (sum)(总和)。隐式默认值为 none,它返回 0.0

所有父项语法

当省略子句 (<someChildren>) 时,它被解析为用于所有父文档的分段缓存过滤器,或者更准确地说,q={!parent which=<blockMask>} 等效于 q=<blockMask>

块掩码:ofwhich 本地参数

作为 ofwhich 参数指定的“块掩码”查询的目的是标识索引中应该被视为“父级”(或它们的祖先)的所有文档的集合,以及应该被视为“子级”的文档。这很重要,因为在“磁盘上”的索引中,关系被展平为文档的“块”,因此需要 of / which 参数作为针对平面文档块的“掩码”来标识每个分层关系的边界。

在上面的示例查询中,我们能够使用非常简单的 doc_type:parent 块掩码,因为我们的数据非常简单:每个文档要么是 parent,要么是 child。因此,此查询字符串很容易区分所有文档。

一个常见的错误是尝试使用比所有父文档集合更具限制性的 which 参数来过滤匹配的父文档,如下面的错误示例所示

// BAD! DO NOT USE!
q={!parent which="title:join"}comments:support

这种类型的查询通常不会按您预期的方式工作。由于 which 参数仅标识某些“父”文档,因此生成的查询可以匹配它不应该匹配的“父”文档,因为它会错误地将所有与 which="title:join" 块掩码不匹配的文档标识为索引中下一个“父”文档(确实匹配此掩码)的子文档。

当将父/子文档与没有子项的“简单”文档混合,并且不匹配用于标识“父”文档的查询时,也会出现类似的麻烦情况。例如,如果我们将以下文档添加到现有的父/子示例文档中

<add>
  <doc>
    <field name="id">0</field>
    <field name="content_type">plain</field>
    <field name="title">Lucene and Solr are cool</field>
  </doc>
</add>

... 那么我们简单的 doc_type:parent 块掩码将不再足够。相反,我们需要使用 *:* -doc_type:childdoc_type:(simple parent),以防止我们的“简单”文档被错误地视为相邻“父”文档的“子”文档。

搜索嵌套子文档部分包含更多关于使用非平凡的文档层次结构指定块掩码查询的详细示例。