QuerySolr
描述:
通过查询Solr将结果以XML格式或记录方式输出
标签:
Apache, Solr, Get, Query, Records, 查询, 获得, 记录
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 参数还支持 表达式语言, 并且 如果将一个参数认定为"敏感", 表示是加密状态. 在输入一个敏感参数时, 确保 orchsym.properties 文件中存在属性设置 orchsym.sensitive.props.key.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
Solr类型 | 标准 | - 云(集群) - 标准 | Solr实例类型,云 或 标准. |
Solr地址 | 对于标准类型的Solr,则指定为Solr URL(比如: http://localhost:8984/solr/gettingstarted), 或者是云类型的Solr则是ZooKeeper地址(比如: localhost:9983). 支持表达式语言 (仅支持变量) | ||
集合 | 指定Solr集合名字, 仅用于Solr是云类型的时候 支持表达式语言 (支持流属性和变量) | ||
Return Type | XML | - XML - Records | Output format of Solr results. Write Solr documents to FlowFiles as XML or using a Record Writer |
记录输出 | 控制器服务API: RecordSetWriterFactory 实现: CSVRecordSetWriter FreeFormTextRecordSetWriter AvroRecordSetWriter JsonRecordSetWriter XMLRecordSetWriter ParquetRecordSetWriter ScriptedRecordSetWriter | 用于将Solr文档输出到数据流的配置,如果《返回类型》为记录,则必须设置该参数 支持表达式语言 (支持流属性和变量) | |
Solr Query | : | Solr Query, e. g. field:value 支持表达式语言 (支持流属性和变量) | |
请求路径 | /select | 指定一个请求路径, 比如 /query 支持表达式语言 (支持流属性和变量) | |
字段列表 | 指定由逗号分隔的包含到结果中的字段列表,比如:field1,field2 支持表达式语言 (支持流属性和变量) | ||
字段排序 | 指定由逗号分隔的字段排序设置,比如:field1 asc, field2 desc 支持表达式语言 (支持流属性和变量) | ||
起始点 | 指定返回结果集的位移 支持表达式语言 (支持流属性和变量) | ||
行数 | 指定单个请求返回的结果数量 支持表达式语言 (支持流属性和变量) | ||
返回结果总数 | 仅排名靠前结果 | - 全部 - 仅排名靠前结果 | 指定返回Solr文档的总数限制。 如果设置“仅排名靠前结果”,则仅会发送单个请求到Solr然后将结果作为单个数据流输出,如果选择“全部”,则所有匹配的多个请求查询结果将输出到多个数据流。 无论哪个选项,都依赖于《行数》设置的限制来返回 |
Kerberos证书服务 | 控制器服务API: KerberosCredentialsService 实现: KeytabCredentialsService | 指定用于Kerberos认证的证书服务配置 | |
用户名 | 当Solr配置为基本认证时使用的用户名 支持表达式语言 (仅支持变量) | ||
密码 | 当Solr配置为基本认证时使用的用户密码 敏感状态 支持表达式语言 (仅支持变量) | ||
SSL服务 | 控制器服务API: SSLContextService 实现: StandardRestrictedSSLContextService StandardSSLContextService | 用于获得SSL安全连接的SSL服务配置。当通过https通信时,必须设置该值 | |
Socket超时 | 10 seconds | 等待Solr Socket连接读取数据的时长。 设置为0,表示无限 | |
连接超时 | 10 seconds | 建立Solr连接的等待时长,设置值为0,表示无限 | |
最大连接数 | 10 | 允许Solr客户端建立连接的最大数 | |
单主机最大连接数 | 5 | 允许Solr客户端建立单主机连接的最大数 | |
ZooKeeper客户端超时 | 10 seconds | 等待ZooKeeper连接读取数据的时长。仅用于云类型的Solr | |
ZooKeeper连接超时 | 10 seconds | 建立ZooKeeper连接的等待时长,仅用于云类型的Solr |
连线:
名字 | 描述 |
---|---|
stats | Solr索引的状态信息输出 |
results | Solr查询的结果输出 |
facets | 分面搜索结果输出 |
failure | 查询失败输出到此连线 |
original | 原始输入数据流输出到此连线 |
读取属性:
未提供。
写入属性:
名字 | 描述 |
---|---|
solr.connect | Solr连接串 |
solr.collection | Solr集合名 |
solr.query | 发生到Solr的语句 |
solr.cursor.mark | 用于Solr滚动的光标标记 |
solr.status.code | Solr请求的状态码。状态代码0表示已成功处理请求 |
solr.query.time | 处理查询所用的时间(毫秒, ms) |
solr.start | 查询的起始参数(结果偏移量) |
solr.rows | 查询返回的Solr文档数 |
solr.number.results | 匹配查询的Solr文档数 |
mime.type | 数据格式的MIME类型 |
querysolr.exeption.class | 当处理失败抛出的Java异常类 |
querysolr.exeption.message | 当处理失败时抛出的Java异常信息 |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
输入流要求:
组件允许提供输入流。
系统资源考量:
未提供。