Skip to main content

ValidateCsv

描述:

根据用户指定的csv格式的模板来验证数据流的内容。详情可参考包含该组件的一些演示示例的附加文档。

标签:

csv, schema, validation, 模板, 验证

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.

名字默认值允许值列表描述
Schema用于验证的模板组件。建议使用时将列出要应用的单元处理器以逗号为分隔符。模板定义中允许使用下列单元组件\uff1a[ParseBigDecimal转十进制,ParseBool转布尔,ParseChar转字符,ParseDate转日期,ParseDouble转小数,ParseInt转整型,ParseLong转长整型,Optional可选:DMinMax最小极限值,Equals等于,ForbiSubStr,LMinMax最大极限值,NotNull非空,Null空,RequireHashCode具备哈希编码,RequireSubStr具备字符串分割,Strlen字符串长度,StrminMax字符串索引值,StrNotNullOrEx字符串非空,StrRegEx正则表达式,唯一,UniqueHashCode唯一哈希编码,IsIncludeIn]。注\uff1a单元处理器不能嵌套,除非使用可选的。

支持表达式语言 (支持流属性和变量)
验证头验证
- 验证
- 禁止
验证是否传入的数据流需要包含头部
分隔符字符,数据流中的分隔字符,例如: ,

支持表达式语言 (支持流属性和变量)
引号字符"文件中的引号字符 例如: "

支持表达式语言 (支持流属性和变量)
行尾符\n数据流中的行尾字符,例如: \n

支持表达式语言 (支持流属性和变量)
验证策略全部内容
- 逐行验证如果发现错误,输入CSV文件将被分成两个数据流:一个路由到包含所有正确行的“有效”关系路径,另一个路由到包含所有不正确行的“无效”关系路径。在模式定义中使用唯一的单元处理器时,如果选择此选项,请注意:第一个事件将被视为有效,而下一个事件将被视为无效。
- 全部内容一旦在CSV文件中发现错误,验证将停止,整个数据流将被路由到“无效”关系路径。此选项提供最佳性能
当将输入文件路由到输出关系时要应用的策略。

连线:

名字描述
valid根据模板验证成功的数据流被路由到此连线
invalid根据模板验证失败的数据流被路由到此连线

读取属性:

未提供。

写入属性:

名字描述
count.valid.lines如果逐行验证,则从源数据中提取有效行数。
count.invalid.lines如果逐行验证,则从源数据中提取无效行数。
count.total.lines如果逐行验证,则从源数据中提取总行数。
validation.error.message对于路由为无效的数据流,第一次验证的错误消息。

状态管理:

该组件不保存状态。

限制:

该组件没有限制

输入流要求:

组件必须提供输入流。

系统资源考量:

未提供。