PutSolrRecord
描述:
将输入数据流的记录创建索引并写入Solr
标签:
Apache, Solr, Put, Send, Record, 发送, 写入, 记录
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 参数还支持 表达式语言, 并且 如果将一个参数认定为"敏感", 表示是加密状态. 在输入一个敏感参数时, 确保 orchsym.properties 文件中存在属性设置 orchsym.sensitive.props.key.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
Solr类型 | 标准 | - 云(集群) - 标准 | Solr实例类型,云 或 标准. |
Solr地址 | 对于标准类型的Solr,则指定为Solr URL(比如: http://localhost:8984/solr/gettingstarted), 或者是云类型的Solr则是ZooKeeper地址(比如: localhost:9983). 支持表达式语言 (仅支持变量) | ||
集合 | 指定Solr集合名字, 仅用于Solr是云类型的时候 支持表达式语言 (支持流属性和变量) | ||
更新路径 | /update | 指定将数据流记录发送到Solr的路径 支持表达式语言 (支持流属性和变量) | |
记录读取服务 | 控制器服务API: RecordReaderFactory 实现: ParquetReader GrokReader SyslogReader Syslog5424Reader CSVReader AvroReader JsonPathReader JsonTreeReader ScriptedReader XMLReader | 指定用于解析输入数据和决定数据Schema的记录读取服务配置 | |
索引字段列表 | 指定写入Solr的由逗号分隔的记录字段列表 支持表达式语言 (支持流属性和变量) | ||
提交毫秒 | 5000 | 指定提交的毫秒数 支持表达式语言 (支持流属性和变量) | |
Kerberos证书服务 | 控制器服务API: KerberosCredentialsService 实现: KeytabCredentialsService | 指定用于Kerberos认证的证书服务配置 | |
用户名 | 当Solr配置为基本认证时使用的用户名 支持表达式语言 (仅支持变量) | ||
密码 | 当Solr配置为基本认证时使用的用户密码 敏感状态 支持表达式语言 (仅支持变量) | ||
SSL服务 | 控制器服务API: SSLContextService 实现: StandardRestrictedSSLContextService StandardSSLContextService | 用于获得SSL安全连接的SSL服务配置。当通过https通信时,必须设置该值 | |
Socket超时 | 10 seconds | 等待Solr Socket连接读取数据的时长。 设置为0,表示无限 | |
连接超时 | 10 seconds | 建立Solr连接的等待时长,设置值为0,表示无限 | |
最大连接数 | 10 | 允许Solr客户端建立连接的最大数 | |
单主机最大连接数 | 5 | 允许Solr客户端建立单主机连接的最大数 | |
ZooKeeper客户端超时 | 10 seconds | 等待ZooKeeper连接读取数据的时长。仅用于云类型的Solr | |
ZooKeeper连接超时 | 10 seconds | 建立ZooKeeper连接的等待时长,仅用于云类型的Solr | |
分批数量 | 500 | 指定每批要索引的Solr文档数 支持表达式语言 (支持流属性和变量) |
动态参数:
名字 | 值 | 描述 |
---|---|---|
A Solr request parameter name | A Solr request parameter value | 指定额外的请求参数传递给Solr 不支持表达式语言 |
连线:
名字 | 描述 |
---|---|
success | 成功发送Solr的结果输出到此连线 |
failure | 由于除Solr之外的任何原因而失败的数据流输出到此连线 |
connection_failure | 由于Solr不可访问而失败输出到此连线 |
读取属性:
未提供。
写入属性:
未提供。
状态管理:
该组件不保存状态。
限制:
该组件没有限制
输入流要求:
组件必须提供输入流。
系统资源考量:
未提供。