Skip to main content

GetSolr

描述:

通过查询Solr将结果以XML格式或记录方式输出

标签:

Apache, Solr, Get, Pull, Records, 获取, 拉取, 记录

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 参数还支持 表达式语言, 并且 如果将一个参数认定为"敏感", 表示是加密状态. 在输入一个敏感参数时, 确保 orchsym.properties 文件中存在属性设置 orchsym.sensitive.props.key.

名字默认值允许值列表描述
Solr类型标准
- 云(集群)Solr云实例
- 标准单独的Solr实例
Solr实例类型,云 或 标准.
Solr地址对于标准类型的Solr,则指定为Solr URL(比如: http://localhost:8984/solr/gettingstarted), 或者是云类型的Solr则是ZooKeeper地址(比如: localhost:9983).

支持表达式语言 (仅支持变量)
集合指定Solr集合名字, 仅用于Solr是云类型的时候

支持表达式语言 (仅支持变量)
返回类型XML
- XML
- 记录
将Solr文档输出到数据流的格式是XML,还是使用记录输出
记录输出控制器服务API:
RecordSetWriterFactory
实现:
CSVRecordSetWriter
FreeFormTextRecordSetWriter
AvroRecordSetWriter
JsonRecordSetWriter
XMLRecordSetWriter
ParquetRecordSetWriter
ScriptedRecordSetWriter
用于将Solr文档输出到数据流的配置,如果《返回类型》为记录,则必须设置该参数

支持表达式语言 (仅支持变量)
Solr语句用于执行Solr的语句
日期字段指定用于过滤结果的日期字段名
初始过滤日期过滤结果的日期值。将不读取早于该日期的文档,格式必须与solr的日期模式相对应: 'YYYY-MM-DDThh:mm:ssZ'
返回字段列表指定由逗号分隔的字段返回列表
分批数量100指定每次Solr查询的行数
Kerberos证书服务控制器服务API:
KerberosCredentialsService
实现:
KeytabCredentialsService
指定用于Kerberos认证的证书服务配置
用户名当Solr配置为基本认证时使用的用户名

支持表达式语言 (仅支持变量)
密码当Solr配置为基本认证时使用的用户密码

敏感状态
支持表达式语言 (仅支持变量)
SSL服务控制器服务API:
SSLContextService
实现:
StandardRestrictedSSLContextService
StandardSSLContextService
用于获得SSL安全连接的SSL服务配置。当通过https通信时,必须设置该值
Socket超时10 seconds等待Solr Socket连接读取数据的时长。 设置为0,表示无限
连接超时10 seconds建立Solr连接的等待时长,设置值为0,表示无限
最大连接数10允许Solr客户端建立连接的最大数
单主机最大连接数5允许Solr客户端建立单主机连接的最大数
ZooKeeper客户端超时10 seconds等待ZooKeeper连接读取数据的时长。仅用于云类型的Solr
ZooKeeper连接超时10 seconds建立ZooKeeper连接的等待时长,仅用于云类型的Solr

连线:

名字描述
success成功查询Solr的结果输出到此连线

读取属性:

未提供。

写入属性:

未提供。

状态管理:

范围描述
CLUSTER存储指定日期字段的最新日期,以便同一数据不会被多次提取。

限制:

该组件没有限制

输入流要求:

组件禁止提供输入流。

系统资源考量:

未提供。