Skip to main content

CalculateRecordStats

描述:

一个可以计算记录集合中记录数量的组件, 也可以根据记录集子集上的用户定义标准提供计数。

标签:

record, stats, metrics

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.

名字默认值允许值列表描述
记录读取器控制器服务API:
RecordReaderFactory
实现:
ParquetReader
GrokReader
SyslogReader
Syslog5424Reader
CSVReader
AvroReader
JsonPathReader
JsonTreeReader
ScriptedReader
XMLReader
用于读取记录的记录读取器。
record-stats-limit10将每个记录路径返回的单个统计信息的数量限制到前N个结果.

支持表达式语言 (支持流属性和变量)

连线:

名字描述
success如果一个流文件被处理成功了,它就会经过这条线。
failure如果一个流文件被处理失败了,它就会经过这条线。

读取属性:

未提供。

写入属性:

名字描述
record.count在流文件中设置的记录中的记录数。
recordStats.<User Defined Property Name>.countA count of the records that contain a value for the user defined property.
recordStats.<User Defined Property Name>.<value>.countEach value discovered for the user defined property will have its own count attribute. Total number of top N value counts to be added is defined by the limit configuration.

状态管理:

该组件不保存状态。

限制:

该组件没有限制

输入流要求:

组件必须提供输入流。

系统资源考量:

未提供。