ScrollElasticsearchHttp
描述:
通过设置特殊的连接参数来分页查询Elasticsearch。 该组件打算被限定在主节点上运行,并被设计为处理数据量巨大的结果集。必须先清除状态,然后才能运行另一个查询。返回结果的每一页,并将其包装在类似这样的JSON对象中: { "hits" : [ <doc1>, <doc2>, <docn> ] }
. 注意,文档每页的所有内容将被读取到内存中,然后输出
标签:
elasticsearch, query, scroll, read, get, http, 查询, 滚动, 读取, 获得
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 参数还支持 表达式语言, 并且 如果将一个参数认定为"敏感", 表示是加密状态. 在输入一个敏感参数时, 确保 orchsym.properties 文件中存在属性设置 orchsym.sensitive.props.key.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
URL | 用于连接的ES URL,包含 scheme (http等), 主机和端口号. REST API的默认端口号为9200 支持表达式语言 (仅支持变量) | ||
SSL服务 | 控制器服务API: SSLContextService 实现: StandardRestrictedSSLContextService StandardSSLContextService | 用于提供客户端TLS/SSL连接的证书信息服务。 仅当ElasticSearch节点已使用TLS/SSL进行安全保护时,此服务才适用 | |
用户名 | 用于访问ES集群的用户名 支持表达式语言 (仅支持变量) | ||
密码 | 用于访问ES集群的用户密码 敏感状态 支持表达式语言 (仅支持变量) | ||
连接超时 | 5 secs | ES的REST API连接的最大等待时间 支持表达式语言 (仅支持变量) | |
响应超时 | 15 secs | ES的REST API响应的最大等待时间 支持表达式语言 (仅支持变量) | |
代理配置 | 控制器服务API: ProxyConfigurationService 实现: StandardProxyConfigurationService | 指定网路请求的代理配置服务。如果设置,它将影响每个组件配置的代理设置。 支持代理: SOCKS, HTTP + AuthN | |
代理主机 | 指定代理主机的名字或IP地址 支持表达式语言 (仅支持变量) | ||
代理端口号 | 指定代理主机的端口号 支持表达式语言 (仅支持变量) | ||
代理用户名 | 指定代理服务的访问用户名 支持表达式语言 (仅支持变量) | ||
代理用户密码 | 指定代理服务的访问用户密码 敏感状态 支持表达式语言 (仅支持变量) | ||
查询语句 | 指定在ElasticSearch中执行的Lucene风格的查询语句(比如: genre:blues AND -artist:muddy) 支持表达式语言 (仅支持变量) | ||
时效 | 1m | 指定每此搜索保留在内存中的滚动时效 支持表达式语言 (仅支持变量) | |
页面大小 | 20 | 指定当分页查询时每页返回多少文档 支持表达式语言 (仅支持变量) | |
索引名 | 用于读取的索引名。如果设置为“_all”,则查询将匹配所有的索引 支持表达式语言 (仅支持变量) | ||
类型 | 查询语句类型(可选),用于Elasticsearch检索和查询。如果置空,则查询将匹配所有类型 支持表达式语言 (仅支持变量) | ||
字段列表 | 指定要从文档中读取且由逗号分隔字段列表。如果置空,则整个文档将被读取 支持表达式语言 (仅支持变量) | ||
排序 | 排序参数 (比如, timestamp:asc). 如果置空,则按默认文档顺序 支持表达式语言 (仅支持变量) |
动态参数:
名字 | 值 | 描述 |
---|---|---|
A URL query parameter | The value to set it to | 在用于处理的ElasticSearch URL中添加指定的属性名称/值作为查询参数 支持表达式语言 (仅支持变量) |
连线:
名字 | 描述 |
---|---|
success | 成功从Elasticsearch读取的数据将输出到此连线 |
failure | 所有不能成功Elasticsearch查询的数据将输出到此连线。注意,仅支持有输入数据流在失败时才会路由到此连线 |
读取属性:
未提供。
写入属性:
名字 | 描述 |
---|---|
es.index | 包含文档的索引 |
es.type | 文档类型 |
状态管理:
范围 | 描述 |
---|---|
LOCAL | 在每个成功的分页查询之后,最新的scroll_id将作为下次分页调用的输入。完成整个查询后,finishedQuery状态将设置为true,除非清除此设置,否则处理器将不会执行。 |
限制:
该组件没有限制
输入流要求:
组件禁止提供输入流。
系统资源考量:
未提供。