PutHBaseCell
描述:
将输入数据流的内容作为单个HBase单元的值写入HBase
标签:
hadoop, hbase
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
HBase客户端服务 | 控制器服务API: HBaseClientService 实现: HBase_1_1_2_ClientService | 指定用于访问HBase的配置服务 | |
表名 | 指定读取的HBase的表名 支持表达式语言 (支持流属性和变量) | ||
行标识 | 指定用于插入数据的HBase数据的行ID 支持表达式语言 (支持流属性和变量) | ||
行数据类型 | 字符串 | - 字符串 - 二进制 | 指定将数据插入HBase时使用的行ID的数据类型。默认行为是将行id转换为UTF-8字节数组。 选择Binary将把二进制格式的字符串转换为正确的byte[]表示形式,如果在HBase中使用二进制行键,则应该使用二进制选项 |
列族 | 指定用于插入数据的列族 支持表达式语言 (支持流属性和变量) | ||
列名 | 指定用于插入的列名 支持表达式语言 (支持流属性和变量) | ||
时间戳 | 指定创建HBase单元的时间戳,置空则HBase默认用当前时间 支持表达式语言 (支持流属性和变量) | ||
分批数量 | 25 | 一次执行中要处理的数据流的最大数量。 流文件将按表进行分组,每个表执行一个写入操作 |
动态参数:
名字 | 值 | 描述 |
---|---|---|
visibility.<COLUMN FAMILY> | visibility label for <COLUMN FAMILY> | Visibility label for everything under that column family when a specific label for a particular column qualifier is not available. 支持表达式语言 (支持流属性和变量) |
visibility.<COLUMN FAMILY>.<COLUMN QUALIFIER> | visibility label for <COLUMN FAMILY>:<COLUMN QUALIFIER>. | Visibility label for the specified column qualifier qualified by a configured column family. 支持表达式语言 (支持流属性和变量) |
连线:
名字 | 描述 |
---|---|
success | 输入数据流成功存储到HBase的数据输出到此连线 |
failure | 数据不能写入到HBase将输出到此连线 |
读取属性:
未提供。
写入属性:
未提供。
状态管理:
该组件不保存状态。
限制:
该组件没有限制
输入流要求:
组件必须提供输入流。
系统资源考量:
资源 | 描述 |
---|---|
MEMORY | 此组件的实例可能会导致系统资源的大量使用。多个实例或高并发性设置可能导致性能下降。 |