Skip to main content

ScrollElasticsearchHttp

描述:

通过设置特殊的连接参数来分页查询Elasticsearch。 该组件打算被限定在主节点上运行,并被设计为处理数据量巨大的结果集。必须先清除状态,然后才能运行另一个查询。返回结果的每一页,并将其包装在类似这样的JSON对象中: { "hits" : [ <doc1>, <doc2>, <docn> ] }. 注意,文档每页的所有内容将被读取到内存中,然后输出

标签:

elasticsearch, query, scroll, read, get, http, 查询, 滚动, 读取, 获得

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 参数还支持 表达式语言, 并且 如果将一个参数认定为"敏感", 表示是加密状态. 在输入一个敏感参数时, 确保 orchsym.properties 文件中存在属性设置 orchsym.sensitive.props.key.

名字默认值允许值列表描述
URL用于连接的ES URL,包含 scheme (http等), 主机和端口号. REST API的默认端口号为9200

支持表达式语言 (仅支持变量)
SSL服务控制器服务API:
SSLContextService
实现:
StandardRestrictedSSLContextService
StandardSSLContextService
用于提供客户端TLS/SSL连接的证书信息服务。 仅当ElasticSearch节点已使用TLS/SSL进行安全保护时,此服务才适用
用户名用于访问ES集群的用户名

支持表达式语言 (仅支持变量)
密码用于访问ES集群的用户密码

敏感状态
支持表达式语言 (仅支持变量)
连接超时5 secsES的REST API连接的最大等待时间

支持表达式语言 (仅支持变量)
响应超时15 secsES的REST API响应的最大等待时间

支持表达式语言 (仅支持变量)
代理配置控制器服务API:
ProxyConfigurationService
实现:
StandardProxyConfigurationService
指定网路请求的代理配置服务。如果设置,它将影响每个组件配置的代理设置。 支持代理: SOCKS, HTTP + AuthN
代理主机指定代理主机的名字或IP地址

支持表达式语言 (仅支持变量)
代理端口号指定代理主机的端口号

支持表达式语言 (仅支持变量)
代理用户名指定代理服务的访问用户名

支持表达式语言 (仅支持变量)
代理用户密码指定代理服务的访问用户密码

敏感状态
支持表达式语言 (仅支持变量)
查询语句指定在ElasticSearch中执行的Lucene风格的查询语句(比如: genre:blues AND -artist:muddy)

支持表达式语言 (仅支持变量)
时效1m指定每此搜索保留在内存中的滚动时效

支持表达式语言 (仅支持变量)
页面大小20指定当分页查询时每页返回多少文档

支持表达式语言 (仅支持变量)
索引名用于读取的索引名。如果设置为“_all”,则查询将匹配所有的索引

支持表达式语言 (仅支持变量)
类型查询语句类型(可选),用于Elasticsearch检索和查询。如果置空,则查询将匹配所有类型

支持表达式语言 (仅支持变量)
字段列表指定要从文档中读取且由逗号分隔字段列表。如果置空,则整个文档将被读取

支持表达式语言 (仅支持变量)
排序排序参数 (比如, timestamp:asc). 如果置空,则按默认文档顺序

支持表达式语言 (仅支持变量)

动态参数:

名字描述
A URL query parameterThe value to set it to在用于处理的ElasticSearch URL中添加指定的属性名称/值作为查询参数
支持表达式语言 (仅支持变量)

连线:

名字描述
success成功从Elasticsearch读取的数据将输出到此连线
failure所有不能成功Elasticsearch查询的数据将输出到此连线。注意,仅支持有输入数据流在失败时才会路由到此连线

读取属性:

未提供。

写入属性:

名字描述
es.index包含文档的索引
es.type文档类型

状态管理:

范围描述
LOCAL在每个成功的分页查询之后,最新的scroll_id将作为下次分页调用的输入。完成整个查询后,finishedQuery状态将设置为true,除非清除此设置,否则处理器将不会执行。

限制:

该组件没有限制

输入流要求:

组件禁止提供输入流。

系统资源考量:

未提供。