SplitRecord
描述:
将原始输入流的数据拆分为多个相同格式且较小的数据流输出
标签:
split, generic, schema, json, csv, avro, log, logs, freeform, text, 拆分, 记录
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
读取服务 | 控制器服务API: RecordReaderFactory 实现: ParquetReader GrokReader SyslogReader Syslog5424Reader CSVReader AvroReader JsonPathReader JsonTreeReader ScriptedReader XMLReader | 指定用于读取传入数据的服务 | |
写入服务 | 控制器服务API: RecordSetWriterFactory 实现: CSVRecordSetWriter FreeFormTextRecordSetWriter AvroRecordSetWriter JsonRecordSetWriter XMLRecordSetWriter ParquetRecordSetWriter ScriptedRecordSetWriter | 指定用于写出传入数据的服务 | |
拆分记录条数 | 指定写入每个“split”或“segment”数据流的记录条数 支持表达式语言 (支持流属性和变量) |
连线:
名字 | 描述 |
---|---|
failure | 如果无法将数据流从配置的输入格式转换为配置的输出格式,将未更改的输入流输出到此连线。 |
splits | 原始数据流成功被分割后,将每个较小的数据流输出到此连线 |
original | 输入数据流分割成功后,原始数据流将被输出此连线。 |
读取属性:
未提供。
写入属性:
名字 | 描述 |
---|---|
mime.type | 将mime.type属性设置为写入服务指定的MIME类型 |
record.count | 数据流中记录条数 |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
输入流要求:
组件必须提供输入流。
系统资源考量:
未提供。