Skip to main content

CountText

描述:

统计输入数据流的文本内容的各种指标。 请求的结果将记录为属性。生成的数据流不会修改其内容。

标签:

count, text, line, word, character, 计算, 文本, 行数, 字数, 单词

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置.

名字默认值允许值列表描述
计算行数计算
- 计算
- 不计算
将计算输入数据流中文本的行数。
计算非空行不计算
- 计算
- 不计算
将计算输入数据流中文本的非空行数。
计算单词不计算
- 计算
- 不计算
将计算输入数据流中文本的单词数(以空格为界的字母数字字符组),通常的逻辑分隔符 [_-.] 不作为单词,除非启用《符号拆分单词》
计算字符数不计算
- 计算
- 不计算
将计算输入数据流中文本的字符数 (包含空格和符号,但是不包含换行符和回车符)
符号拆分单词禁止
- 拆分
- 禁止
决定是否依据普通逻辑分隔符 [ _ - . ] 拆分单词为独立的单词 (比如, split-words-on-symbols 被看做4个单词).
编码UTF-8
- ISO-8859-1
- UTF-8
- UTF-16
- UTF-16LE
- UTF-16BE
- US-ASCII
指定文本字符的编码

连线:

名字描述
success原始数据流的内容将不被修改并添加相应统计指标的属性输出到此连线
failure由于某种原因导致统计失败,原始输入数据流输出到此失败连线

读取属性:

未提供。

写入属性:

名字描述
text.line.count统计行数
text.line.nonempty.count统计非空行数
text.word.count单词数
text.character.count字符数

状态管理:

该组件不保存状态。

限制:

该组件没有限制

输入流要求:

组件必须提供输入流。

系统资源考量:

未提供。

参考:

SplitText