AvroRecordSetWriter
描述:
写入二进制Avro格式的记录内容。
标签:
avro, result, set, writer, serializer, record, recordset, row, 记录, 写入, 序列化
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
Schema写入策略 | 内嵌Avro Schema | - 内嵌Avro Schema - 设置 'schema.name' 属性 - 设置 'avro.schema' 属性 - HWX Schema引用属性 - HWX Schema编码内容引用 - Confluent Schema编码内容引用 - 不写Schema | 指定如何将记录的Schema添加到数据中 |
Schema Cache | 控制器服务API: RecordSchemaCacheService 实现: VolatileSchemaCache | Specifies a Schema Cache to add the Record Schema to so that Record Readers can quickly lookup the schema. | |
Schema访问策略 | 继承记录的Schema | - 使用 'Schema名字' 属性 - 继承记录的Schema - 使用 'Schema内容' 属性 | 指定如何从数据中获得Schema信息 |
Schema注册服务 | 控制器服务API: SchemaRegistry 实现: AvroSchemaRegistry ConfluentSchemaRegistry HortonworksSchemaRegistry | 指定Schema注册服务 | |
Schema名字 | ${schema.name} | 指定从Schema注册服务中获取相应Schema的名字 支持表达式语言 (支持流属性和变量) | |
Schema版本 | 指定从Schema注册服务中获取相应Schema的版本,如果未指定,则表示最新版本的Schema 支持表达式语言 (支持流属性和变量) | ||
Schema分支 | 当从Schema注册服务中获取相应Schema时,需指定的Schema分支名字。如果指定的<Schema注册服务>不支持分支管理,则该参数将被忽略。 支持表达式语言 (支持流属性和变量) | ||
Schema内容 | ${avro.schema} | Avro格式的Schema内容 支持表达式语言 (支持流属性和变量) | |
压缩格式 | 不压缩 | - BZIP2 - DEFLATE - 不压缩 - SNAPPY - LZO | 当写Avro文件时使用的压缩格式,默认不压缩 |
Cache Size | 1000 | Specifies how many Schemas should be cached | |
Encoder Pool Size | 32 | Avro Writers require the use of an Encoder. Creation of Encoders is expensive, but once created, they can be reused. This property controls the maximum number of Encoders that can be pooled and reused. Setting this value too small can result in degraded performance, but setting it higher can result in more heap being used. This property is ignored if the Avro Writer is configured with a Schema Write Strategy of 'Embed Avro Schema'. 支持表达式语言 (仅支持变量) |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
系统资源考量:
未提供。