Skip to main content

ScanHBase

描述:

从HBase表中扫描并读取行数据。可以通过指定一个rowkey值范围来从hbase表中获取行数据。

标签:

hbase, scan, fetch, get

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.

名字默认值允许值列表描述
HBase客户端服务控制器服务API:
HBaseClientService
实现:
HBase_1_1_2_ClientService
指定用于访问HBase的配置服务
表名指定读取HBase的表名

支持表达式语言 (支持流属性和变量)
授权用于给HBase扫描的授权列表。如果没有单元的可见性标签,将忽略。

支持表达式语言 (支持流属性和变量)
开始rowkey指定开始扫描的rowkey

支持表达式语言 (支持流属性和变量)
结束rowkey指定结束扫描的rowkey

支持表达式语言 (支持流属性和变量)
时间范围最小值时间范围的最小值和最大值要么都提供,要么都为空

支持表达式语言 (支持流属性和变量)
时间范围最大值时间范围的最小值和最大值要么都提供,要么都为空

支持表达式语言 (支持流属性和变量)
行数限制指定扫描的最大行数

支持表达式语言 (支持流属性和变量)
扫描顺序反向
- 正向(向前)
- 反向
设置此扫描是否为反向扫描。默认情况下为正常,即向前扫描。
输出分批数量0限制单个数据流内容中的行数。设置为0以避免多个数据流输出

支持表达式语言 (支持流属性和变量)
过滤指定用于扫描的过滤表达式,比如 "ValueFilter( =, 'binaryprefix:commit' )"。与《列》冲突,如果设置了,则会被忽略。

支持表达式语言 (支持流属性和变量)
指定读取由逗号分隔的<colFamily>:<colQualifier>对,为了返回所有列,可不指定列名(qualifier),仅提供列族(Family) <colFamily1>,<colFamily2>.

支持表达式语言 (支持流属性和变量)
JSON格式全部行
- 全部行创建JSON文档为: {&quot;row&quot;:&lt;row-id&gt;, &quot;cells&quot;:[{&quot;fam&quot;:&lt;col-fam&gt;, &quot;qual&quot;:&lt;col-val&gt;, &quot;val&quot;:&lt;value&gt;, &quot;ts&quot;:&lt;timestamp&gt;}]}.
- 列名与值对创建JSON文档为: {&quot;&lt;col-qual&gt;&quot;:&quot;&lt;value&gt;&quot;, &quot;&lt;col-qual&gt;&quot;:&quot;&lt;value&gt;&quot;.
指定HBase行数据转换为JSON文档的方式
编码UTF-8指定用于编码行的JSON输出
解码UTF-8指定用于解码从HBase读取的数据

连线:

名字描述
success成功从HBase读取的数据输出到此连线
failure从HBase读取数据失败输出到此连线
original原始数据流输出到此连线,甚至没有任何行数据读出

读取属性:

未提供。

写入属性:

名字描述
hbase.table获取行数据的表名
mime.type当《目标输出》设置为数据流内容输出时,设置为application/json,否则不设置
hbase.rows.count数据流内容中的行数
scanhbase.results.found指示在提供条件的给定hbase表中是否至少找到一行。可能为null,当读取失败

状态管理:

该组件不保存状态。

限制:

该组件没有限制

输入流要求:

组件必须提供输入流。

系统资源考量:

未提供。