Skip to main content

PutHBaseCell

描述:

将输入数据流的内容作为单个HBase单元的值写入HBase

标签:

hadoop, hbase

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.

名字默认值允许值列表描述
HBase客户端服务控制器服务API:
HBaseClientService
实现:
HBase_1_1_2_ClientService
指定用于访问HBase的配置服务
表名指定读取的HBase的表名

支持表达式语言 (支持流属性和变量)
行标识指定用于插入数据的HBase数据的行ID

支持表达式语言 (支持流属性和变量)
行数据类型字符串
- 字符串将行id的值存储为UTF-8字符串
- 二进制将行id的值存储为二进制字节数组。它期望行id是一个二进制格式的字符串
指定将数据插入HBase时使用的行ID的数据类型。默认行为是将行id转换为UTF-8字节数组。 选择Binary将把二进制格式的字符串转换为正确的byte[]表示形式,如果在HBase中使用二进制行键,则应该使用二进制选项
列族指定用于插入数据的列族

支持表达式语言 (支持流属性和变量)
列名指定用于插入的列名

支持表达式语言 (支持流属性和变量)
时间戳指定创建HBase单元的时间戳,置空则HBase默认用当前时间

支持表达式语言 (支持流属性和变量)
分批数量25一次执行中要处理的数据流的最大数量。 流文件将按表进行分组,每个表执行一个写入操作

动态参数:

名字描述
visibility.<COLUMN FAMILY>visibility label for <COLUMN FAMILY>Visibility label for everything under that column family when a specific label for a particular column qualifier is not available.
支持表达式语言 (支持流属性和变量)
visibility.<COLUMN FAMILY>.<COLUMN QUALIFIER>visibility label for <COLUMN FAMILY>:<COLUMN QUALIFIER>.Visibility label for the specified column qualifier qualified by a configured column family.
支持表达式语言 (支持流属性和变量)

连线:

名字描述
success输入数据流成功存储到HBase的数据输出到此连线
failure数据不能写入到HBase将输出到此连线

读取属性:

未提供。

写入属性:

未提供。

状态管理:

该组件不保存状态。

限制:

该组件没有限制

输入流要求:

组件必须提供输入流。

系统资源考量:

资源描述
MEMORY此组件的实例可能会导致系统资源的大量使用。多个实例或高并发性设置可能导致性能下降。