SplitXml
描述:
将XML文件分割为多个单独的流文件, 每一个都包含原始根元素的子元素或孙元素
标签:
xml, split
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
分割深度 | 1 | 表示开始分割XML片段的XML嵌套深度.深度 1 表示分割根节点的子节点, 而深度2表示分割根节点的子节点的子节点等等. |
连线:
名字 | 描述 |
---|---|
failure | 如果流文件处理失败(例如,流文件不是一个合法的xml文件), 会被路由到这条连线 |
original | 原始的流文件被分割成碎片. 如果流文件处理失败, 没有任何东西被发送到这条连线 |
split | 原始流文件的碎片会被路由到这条连线 |
读取属性:
未提供。
写入属性:
名字 | 描述 |
---|---|
fragment.identifier | 从同一个父流文件生成的所有分割流文件都将为该属性添加相同的随机生成UUID |
fragment.index | 一个递增1的序号数字,指示从单个父流文件创建的拆分流文件的顺序 |
fragment.count | 从父流文件生成的拆分流文件的数量 |
segment.original.filename | 父流文件的文件名 |
状态管理:
该组件不保存状态。
限制:
该组件没有限制
输入流要求:
组件必须提供输入流。
系统资源考量:
资源 | 描述 |
---|---|
MEMORY | 除了表示分割XML的所有生成的流文件外,还将流文件的全部内容(作为文档对象)读入内存。文档对象占用的内存大约是XML大小的10倍。例如,一个1mb的XML文档可能会使用10mb的内存。如果由于XML的大小而生成了许多分割,则可能需要两阶段方法来避免过度使用内存。 |