ScanHBase
描述:
从HBase表中扫描并读取行数据。可以通过指定一个rowkey值范围来从hbase表中获取行数据。
标签:
hbase, scan, fetch, get
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
HBase客户端服务 | 控制器服务API: HBaseClientService 实现: HBase_1_1_2_ClientService | 指定用于访问HBase的配置服务 | |
表名 | 指定读取HBase的表名 支持表达式语言 (支持流属性和变量) | ||
授权 | 用于给HBase扫描的授权列表。如果没有单元的可见性标签,将忽略。 支持表达式语言 (支持流属性和变量) | ||
开始rowkey | 指定开始扫描的rowkey 支持表达式语言 (支持流属性和变量) | ||
结束rowkey | 指定结束扫描的rowkey 支持表达式语言 (支持流属性和变量) | ||
时间范围最小值 | 时间范围的最小值和最大值要么都提供,要么都为空 支持表达式语言 (支持流属性和变量) | ||
时间范围最大值 | 时间范围的最小值和最大值要么都提供,要么都为空 支持表达式语言 (支持流属性和变量) | ||
行数限制 | 指定扫描的最大行数 支持表达式语言 (支持流属性和变量) | ||
扫描顺序 | 反向 | - 正向(向前) - 反向 | 设置此扫描是否为反向扫描。默认情况下为正常,即向前扫描。 |
输出分批数量 | 0 | 限制单个数据流内容中的行数。设置为0以避免多个数据流输出 支持表达式语言 (支持流属性和变量) | |
过滤 | 指定用于扫描的过滤表达式,比如 "ValueFilter( =, 'binaryprefix:commit' )"。与《列》冲突,如果设置了,则会被忽略。 支持表达式语言 (支持流属性和变量) | ||
列 | 指定读取由逗号分隔的<colFamily>:<colQualifier> 对,为了返回所有列,可不指定列名(qualifier),仅提供列族(Family) <colFamily1>,<colFamily2> .支持表达式语言 (支持流属性和变量) | ||
JSON格式 | 全部行 | - 全部行 - 列名与值对 | 指定HBase行数据转换为JSON文档的方式 |
编码 | UTF-8 | 指定用于编码行的JSON输出 | |
解码 | UTF-8 | 指定用于解码从HBase读取的数据 |
连线:
名字 | 描述 |
---|---|
success | 成功从HBase读取的数据输出到此连线 |
failure | 从HBase读取数据失败输出到此连线 |
original | 原始数据流输出到此连线,甚至没有任何行数据读出 |
读取属性:
未提供。
写入属性:
名字 | 描述 |
---|---|
hbase.table | 获取行数据的表名 |
mime.type | 当《目标输出》设置为数据流内容输出时,设置为application/json,否则不设置 |
hbase.rows.count | 数据流内容中的行数 |
scanhbase.results.found | 指示在提供条件的给定hbase表中是否至少找到一行。可能为null,当读取失败 |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
输入流要求:
组件必须提供输入流。
系统资源考量:
未提供。