Skip to main content

XMLReader

描述:

读取XML内容并创建记录对象。第二级的XML数据将作为每个记录。

标签:

xml, record, reader, parser, 记录, 解析

参数:

如下列表中，必填参数则标识为加粗. 其他未加粗参数，则表示为可选参数。表中同时提到参数默认值设置, 并且参数还支持表达式语言.

名字	默认值	允许值列表	描述
Schema访问策略	Infer Schema	- 使用 'Schema名字' 属性 - 使用 'Schema内容' 属性 - HWX Schema引用属性 - HWX Schema编码内容引用 - Confluent Schema编码内容引用 - Infer Schema	指定如何从数据中获得Schema信息
Schema注册服务		控制器服务API: SchemaRegistry 实现: AvroSchemaRegistry ConfluentSchemaRegistry HortonworksSchemaRegistry	指定Schema注册服务
Schema名字	${schema.name}		指定从Schema注册服务中获取相应Schema的名字支持表达式语言 (支持流属性和变量)
Schema版本			指定从Schema注册服务中获取相应Schema的版本，如果未指定，则表示最新版本的Schema 支持表达式语言 (支持流属性和变量)
Schema分支			当从Schema注册服务中获取相应Schema时，需指定的Schema分支名字。如果指定的<Schema注册服务>不支持分支管理，则该参数将被忽略。支持表达式语言 (支持流属性和变量)
Schema内容	${avro.schema}		Avro格式的Schema内容支持表达式语言 (支持流属性和变量)
Schema Inference Cache		控制器服务API: RecordSchemaCacheService 实现: VolatileSchemaCache	Specifies a Schema Cache to use when inferring the schema. If not populated, the schema will be inferred each time. However, if a cache is specified, the cache will first be consulted and if the applicable schema can be found, it will be used instead of inferring the schema.
期望数组记录	否	- 否 - 是 - 使用'xml.stream.is.array'属性	指定是否将记录读取为单条记录还是多条包装的记录。因为XML没有提供直接从文件流中读取一系列XML元素的方法。
属性前缀			如果设置，则XML中的属性名前增加前缀后添加到记录中支持表达式语言 (支持流属性和变量)
内容的字段名			如果标签包含内容 (比如content)被定义为Schema中的嵌套记录，标签名字将作为记录中字段名，值将作为相应的字段值。如果标签还包含内容和属性(比如 content)，则将同时解析到记录中。支持表达式语言 (支持流属性和变量)
日期格式			指定当读写日期(Date)字段时使用的格式，如果不指定，默认将假定日期字段为基于纪元的毫秒数（即格林威治时间1970年1月1号午夜）。如果指定，则日期格式必须匹配Java 简单日期格式规范 (比如 MM/dd/yyyy，具体为 01/01/2017)。
时间格式			指定当读写时间(Time)字段时使用的格式。如果不指定，默认将假定日期字段为基于纪元的毫秒数（即格林威治时间1970年1月1号午夜）。如果指定，则日期格式必须匹配Java 简单日期格式规范 (比如 HH:mm:ss，具体为 18:04:15)。
时间戳格式			指定当读写时间戳(Timestamp)字段时使用的格式。如果不指定，默认将假定日期字段为基于纪元的毫秒数（即格林威治时间1970年1月1号午夜）。如果指定，则日期格式必须匹配Java 简单日期格式规范 (比如 MM/dd/yyyy HH:mm:ss，具体为01/01/2017 18:04:15）。

状态管理:

该组件不保存状态。

限制:

该组件没有限制

系统资源考量:

未提供。

描述: