Skip to main content

SplitRecord

描述:

将原始输入流的数据拆分为多个相同格式且较小的数据流输出

标签:

split, generic, schema, json, csv, avro, log, logs, freeform, text, 拆分, 记录

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.

名字默认值允许值列表描述
读取服务控制器服务API:
RecordReaderFactory
实现:
ParquetReader
GrokReader
SyslogReader
Syslog5424Reader
CSVReader
AvroReader
JsonPathReader
JsonTreeReader
ScriptedReader
XMLReader
指定用于读取传入数据的服务
写入服务控制器服务API:
RecordSetWriterFactory
实现:
CSVRecordSetWriter
FreeFormTextRecordSetWriter
AvroRecordSetWriter
JsonRecordSetWriter
XMLRecordSetWriter
ParquetRecordSetWriter
ScriptedRecordSetWriter
指定用于写出传入数据的服务
拆分记录条数指定写入每个“split”或“segment”数据流的记录条数

支持表达式语言 (支持流属性和变量)

连线:

名字描述
failure如果无法将数据流从配置的输入格式转换为配置的输出格式,将未更改的输入流输出到此连线。
splits原始数据流成功被分割后,将每个较小的数据流输出到此连线
original输入数据流分割成功后,原始数据流将被输出此连线。

读取属性:

未提供。

写入属性:

名字描述
mime.type将mime.type属性设置为写入服务指定的MIME类型
record.count数据流中记录条数

状态管理:

该组件不保存状态。

限制:

该组件没有限制

输入流要求:

组件必须提供输入流。

系统资源考量:

未提供。