CSVRecordSetWriter
描述:
将记录作为CSV数据写入。 首行将包含列名(除非<包含头部>设置为不包含),所有后续行都是与记录字段对应的值。
标签:
csv, result, set, recordset, record, writer, serializer, row, tsv, tab, separated, delimited
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
Schema写入策略 | 不写Schema | - 设置 'schema.name' 属性 - 设置 'avro.schema' 属性 - HWX Schema引用属性 - HWX Schema编码内容引用 - Confluent Schema编码内容引用 - 不写Schema | 指定如何将记录的Schema添加到数据中 |
Schema Cache | 控制器服务API: RecordSchemaCacheService 实现: VolatileSchemaCache | Specifies a Schema Cache to add the Record Schema to so that Record Readers can quickly lookup the schema. | |
Schema访问策略 | 继承记录的Schema | - 使用 'Schema名字' 属性 - 继承记录的Schema - 使用 'Schema内容' 属性 | 指定如何从数据中获得Schema信息 |
Schema注册服务 | 控制器服务API: SchemaRegistry 实现: AvroSchemaRegistry ConfluentSchemaRegistry HortonworksSchemaRegistry | 指定Schema注册服务 | |
Schema名字 | ${schema.name} | 指定从Schema注册服务中获取相应Schema的名字 支持表达式语言 (支持流属性和变量) | |
Schema版本 | 指定从Schema注册服务中获取相应Schema的版本,如果未指定,则表示最新版本的Schema 支持表达式语言 (支持流属性和变量) | ||
Schema分支 | 当从Schema注册服务中获取相应Schema时,需指定的Schema分支名字。如果指定的<Schema注册服务>不支持分支管理,则该参数将被忽略。 支持表达式语言 (支持流属性和变量) | ||
Schema内容 | ${avro.schema} | Avro格式的Schema内容 支持表达式语言 (支持流属性和变量) | |
日期格式 | 指定当读写日期(Date)字段时使用的格式,如果不指定,默认将假定日期字段为基于纪元的毫秒数(即格林威治时间1970年1月1号午夜)。如果指定,则日期格式必须匹配Java 简单日期格式规范 (比如 MM/dd/yyyy, 具体为 01/01/2017)。 | ||
时间格式 | 指定当读写时间(Time)字段时使用的格式。如果不指定,默认将假定日期字段为基于纪元的毫秒数(即格林威治时间1970年1月1号午夜)。 如果指定,则日期格式必须匹配Java 简单日期格式规范 (比如 HH:mm:ss, 具体为 18:04:15)。 | ||
时间戳格式 | 指定当读写时间戳(Timestamp)字段时使用的格式。如果不指定,默认将假定日期字段为基于纪元的毫秒数(即格林威治时间1970年1月1号午夜)。 如果指定,则日期格式必须匹配Java 简单日期格式规范 (比如 MM/dd/yyyy HH:mm:ss, 具体为01/01/2017 18:04:15)。 | ||
CSV格式 | 自定义格式 | - 自定义格式 - RFC 4180 - Microsoft Excel - Tab分隔 - MySQL格式 - Informix Unload - Informix Unload Escape Disabled | 指定使用那种CSV数据的格式或使用自定义格式。 |
值分隔符 | , | 用于CSV记录值之间的分隔字符 支持表达式语言 (支持流属性和变量) | |
包含头部 | 包含 | - 包含 - 不包含 | 指定是否将CSV列名写入文件的首行 |
引用字符 | " | 为了不转义字符,用来将值引用的字符。 支持表达式语言 (支持流属性和变量) | |
转义字符 | \ | 用于转义的字符,否则这些字符对CSV解析器具有特定含义。 支持表达式语言 (支持流属性和变量) | |
注释标记 | 用于表示注释的字符。从这个注释开始的任何行都将被忽略。 支持表达式语言 (支持流属性和变量) | ||
Null字符串 | 用于指定字符串值,当处理一个CSV值时,是作为null字段还是普通值 | ||
整理字段 | 是 | - 是 - 否 | 是否移除字段值前后的空白字符 |
引用模式 | 最小引用 | - 引用所有值 - 最小引用 - 引用非数字值 - 不引用值 | 当写入时,指定如何引用字段 |
记录分隔符 | \n | 指定用于分隔记录的分隔字符 | |
包含末尾分隔符 | 不包含 | - 包含 - 不包含 | 如果包含,将向写入的每个CSV记录添加一个末尾分隔符。否则,将省略末尾分隔符。 |
字符编码 | UTF-8 | 用于读写CSV文件的字符集编码 |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
系统资源考量:
未提供。