AvroReader
描述:
解析Avro数据并返回每个Avro记录作为单独的记录对象。Avro数据可以包含Schema本身或者可以从<Schema访问策略>设置提供的方法进行提取。
标签:
avro, parse, record, row, reader, delimited, comma, separated, values, 记录, 解析
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
Schema访问策略 | 使用内置的Avro Schema | - 使用 'Schema名字' 属性 - 使用 'Schema内容' 属性 - HWX Schema引用属性 - HWX Schema编码内容引用 - Confluent Schema编码内容引用 - 使用内置的Avro Schema | 指定如何从数据中获得Schema信息 |
Schema注册服务 | 控制器服务API: SchemaRegistry 实现: AvroSchemaRegistry ConfluentSchemaRegistry HortonworksSchemaRegistry | 指定Schema注册服务 | |
Schema名字 | ${schema.name} | 指定从Schema注册服务中获取相应Schema的名字 支持表达式语言 (支持流属性和变量) | |
Schema版本 | 指定从Schema注册服务中获取相应Schema的版本,如果未指定,则表示最新版本的Schema 支持表达式语言 (支持流属性和变量) | ||
Schema分支 | 当从Schema注册服务中获取相应Schema时,需指定的Schema分支名字。如果指定的<Schema注册服务>不支持分支管理,则该参数将被忽略。 支持表达式语言 (支持流属性和变量) | ||
Schema内容 | ${avro.schema} | Avro格式的Schema内容 支持表达式语言 (支持流属性和变量) | |
Cache Size | 1000 | Specifies how many Schemas should be cached |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
系统资源考量:
未提供。