文档屏幕

“文档”屏幕提供了一个简单的表单,允许您直接从浏览器执行各种 Solr 索引命令,并支持多种格式。

image
图 1.“文档”屏幕

该屏幕允许您:

  • 提交 JSON、CSV 或 XML 格式的 Solr 特定文档以进行索引

  • 上传文档(JSON、CSV 或 XML 格式)以进行索引

  • 通过选择字段和字段值来构建文档

还有其他加载数据的方法,另请参阅以下部分:

常用字段

  • RequestHandler:第一步是定义 RequestHandler。默认情况下,将定义 /update。将请求处理程序更改为 /update/extract 以使用 Solr Cell。

  • 文档类型:选择文档类型以定义要加载的文档的格式。其余参数可能会根据所选的文档类型而变化。

  • 文档:输入与所选的 文档类型 相对应的格式正确的 Solr 文档。XML 和 JSON 文档必须采用 Solr 特定的格式,将显示一个小型示例文档。CSV 文件应具有与模式中定义的字段相对应的标题。更多详细信息可以在使用更新处理程序进行索引中找到。

  • Commit Within:指定提交文档到可用于搜索之间的时间间隔,单位为毫秒。

  • 覆盖:如果为 true,则新文档将替换 id 字段中具有相同值的现有文档。如果为 false,则可以添加多个具有相同 id 的文档。

在生产环境中,将 Overwrite 设置为 false 的情况非常罕见,默认值为 true

CSV、JSON 和 XML 文档

当使用这些文档类型时,其功能类似于通过 curl 或类似方式提交文档。文档结构必须采用适合文档类型的 Solr 特定格式。当您选择各种类型时,“文档”文本框中会显示示例。

这些选项只会添加或覆盖文档;对于其他更新任务,请参阅 Solr 命令选项。

文档生成器

文档生成器提供了一个类似于向导的界面来输入文档的字段。

文件上传

“文件上传”选项允许选择准备好的文件并上传它。如果为 Request-Handler 选项使用 /update,则只能使用 XML、CSV 和 JSON。

可以使用 ExtractingRequestHandler(又名 Solr Cell)索引其他文档类型(例如,Word、PDF 等)。您必须将 RequestHandler 修改为 /update/extract,该处理程序必须在您的 solrconfig.xml 文件中定义,并包含您所需的默认值。您还应添加“提取请求处理程序参数”字段中所示的 &literal.id,以便为所选文件提供唯一的 id。更多信息可以在 使用 Solr Cell 和 Apache Tika 进行索引 中找到。

Solr 命令

“Solr 命令”选项允许您使用带有 XML 或 JSON 格式命令的 /update 请求处理程序来执行特定操作。以下是一些示例:

  • 删除文档

  • 仅更新文档的某些字段

  • 在索引上发出提交命令