CountText
描述:
统计输入数据流的文本内容的各种指标。 请求的结果将记录为属性。生成的数据流不会修改其内容。
标签:
count, text, line, word, character, 计算, 文本, 行数, 字数, 单词
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
计算行数 | 计算 | - 计算 - 不计算 | 将计算输入数据流中文本的行数。 |
计算非空行 | 不计算 | - 计算 - 不计算 | 将计算输入数据流中文本的非空行数。 |
计算单词 | 不计算 | - 计算 - 不计算 | 将计算输入数据流中文本的单词数(以空格为界的字母数字字符组),通常的逻辑分隔符 [_-.] 不作为单词,除非启用《符号拆分单词》 |
计算字符数 | 不计算 | - 计算 - 不计算 | 将计算输入数据流中文本的字符数 (包含空格和符号,但是不包含换行符和回车符) |
符号拆分单词 | 禁止 | - 拆分 - 禁止 | 决定是否依据普通逻辑分隔符 [ _ - . ] 拆分单词为独立的单词 (比如, split-words-on-symbols 被看做4个单词). |
编码 | UTF-8 | - ISO-8859-1 - UTF-8 - UTF-16 - UTF-16LE - UTF-16BE - US-ASCII | 指定文本字符的编码 |
连线:
名字 | 描述 |
---|---|
success | 原始数据流的内容将不被修改并添加相应统计指标的属性输出到此连线 |
failure | 由于某种原因导致统计失败,原始输入数据流输出到此失败连线 |
读取属性:
未提供。
写入属性:
名字 | 描述 |
---|---|
text.line.count | 统计行数 |
text.line.nonempty.count | 统计非空行数 |
text.word.count | 单词数 |
text.character.count | 字符数 |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
输入流要求:
组件必须提供输入流。
系统资源考量:
未提供。