Skip to main content

PartitionRecord

描述:

接收面向记录的数据(即可由配置的记录读取器读取的数据),并根据传入数据流中的每个记录评估一个或多个记录路径。然后,将每个记录与其他“LIKE记录”组合在一起,并为每组“LIKE记录”创建一个数据流。两条记录“类似记录”的含义由用户定义的属性决定。用户必须输入至少一个用户定义的属性,该属性的值为RecordPath。如果两个记录对所有已配置的RecordPath具有相同的值,则这两个记录被视为相同。因为我们知道给定Output 数据流中的所有记录对于RecordPath指定的字段都具有相同的值,因此将为每个字段添加一个属性。有关详细信息和示例,请参阅“使用”页上的其他详细信息。

标签:

record, partition, recordpath, rpath, segment, split, group, bin, organize, 记录, 隔离, 记录路径, 路径, 划分, 分离, 容器, 组织

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置.

名字默认值允许值列表描述
记录读取服务控制器服务API:
RecordReaderFactory
实现:
ParquetReader
GrokReader
SyslogReader
Syslog5424Reader
CSVReader
AvroReader
JsonPathReader
JsonTreeReader
ScriptedReader
XMLReader
指定用于读取传入数据的控制器服务。
记录输出服务控制器服务API:
RecordSetWriterFactory
实现:
CSVRecordSetWriter
FreeFormTextRecordSetWriter
AvroRecordSetWriter
JsonRecordSetWriter
XMLRecordSetWriter
ParquetRecordSetWriter
ScriptedRecordSetWriter
指定用于写出记录的控制器服务。

动态参数:

名字描述
The name given to the dynamic property is the name of the attribute that will be used to denote the value of the associted RecordPath.A RecordPath that points to a field in the Record.每个动态属性表示一个RecordPath,该路径将根据传入数据流中的每条记录进行计算。为记录确定RecordPath的值时,将向传出数据流添加一个属性。属性的名称与此属性的名称相同。属性的值与RecordPath指向的记录中字段的值相同。请注意,如果为RecordPath返回的值为NULL或不是标量值(即,该值是Array、Map或Record),则不会添加任何属性。
支持表达式语言 (支持流属性和变量)

连线:

名字描述
success已成功分区的数据流将路由到此连线
failure如果数据流无法从配置的输入格式分区为配置的输出格式,则未更改的FlowFile将被路由到此连线
original一旦传入数据流中的所有记录都已分区,原始数据流将路由到此连线。

读取属性:

未提供。

写入属性:

名字描述
record.count传出数据流中的记录数
mime.type配置的记录编写器指示的MIME类型是特殊的
<dynamic property name>For each dynamic property that is added, an attribute may be added to the FlowFile. See the description for Dynamic Properties for more information.

状态管理:

该组件不保存状态。

限制:

该组件没有限制

输入流要求:

组件必须提供输入流。

系统资源考量:

未提供。

参考:

ConvertRecord, QueryRecord, SplitRecord, UpdateRecord