CalculateRecordStats
描述:
一个可以计算记录集合中记录数量的组件, 也可以根据记录集子集上的用户定义标准提供计数。
标签:
record, stats, metrics
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
记录读取器 | 控制器服务API: RecordReaderFactory 实现: ParquetReader GrokReader SyslogReader Syslog5424Reader CSVReader AvroReader JsonPathReader JsonTreeReader ScriptedReader XMLReader | 用于读取记录的记录读取器。 | |
record-stats-limit | 10 | 将每个记录路径返回的单个统计信息的数量限制到前N个结果. 支持表达式语言 (支持流属性和变量) |
连线:
名字 | 描述 |
---|---|
success | 如果一个流文件被处理成功了,它就会经过这条线。 |
failure | 如果一个流文件被处理失败了,它就会经过这条线。 |
读取属性:
未提供。
写入属性:
名字 | 描述 |
---|---|
record.count | 在流文件中设置的记录中的记录数。 |
recordStats.<User Defined Property Name>.count | A count of the records that contain a value for the user defined property. |
recordStats.<User Defined Property Name>.<value>.count | Each value discovered for the user defined property will have its own count attribute. Total number of top N value counts to be added is defined by the limit configuration. |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
输入流要求:
组件必须提供输入流。
系统资源考量:
未提供。