GetFile
描述:
从目录中的读取文件并创建相应的文件内容数据流输出。 如果文件没有读取权限,将被忽略。
标签:
local, files, filesystem, ingest, ingress, get, source, input, 文件, 读取
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
读取目录 | 指定读取文件的目录 支持表达式语言 (仅支持变量) | ||
文件过滤器 | \..* | 仅选取名称与给定正则表达式匹配的文件 | |
路径过滤器 | 当<迭代子目录>参数选是时,只扫描路径与给定正则表达式匹配的子目录 | ||
分批数量 | 10 | 每次迭代处理中要读取的最大文件数 | |
保留源文件 | 保留 | - 保留 - 不保留 | 如果为保留,则在将文件复制到内容仓库后不会删除该文件;该参数可以保证文件被保留,且对于测试时很有用。如果不保留,则需要文件的写入权限,否则忽略该文件。 |
迭代子目录 | 是 | - 是 - 否 | 选择是否迭代处理子目录,并从中读取文件。 |
轮询间隔 | 0 sec | 表示在处理目录迭代之前的等待时间 | |
忽略隐藏文件 | 忽略 | - 忽略 - 不忽略 | 选择是否忽略隐藏文件 |
最早文件修改时间 | 0 sec | 文件被读取的最早修改时间限定,任何小于此时间量的文件(根据最后修改日期)将被忽略 | |
最晚文件修改时间 | 文件被读取的最晚修改时间限定,任何超过此时间量的文件(根据上次修改日期)都将被忽略 | ||
最小文件大小限定 | 0 B | 能被读取的最小文件大小 | |
最大文件大小限定 | 能被读取的最大文件大小 |
连线:
名字 | 描述 |
---|---|
success | 成功读取文件后的文件内容数据流输出 |
读取属性:
未提供。
写入属性:
名字 | 描述 |
---|---|
filename | 读取的文件名字 |
path | 基于读取目录的文件相对路径。例如,如果<读取目录>参数设置为/tmp,则从/tmp中读取的文件的path属性将设置为./。如果<迭代子目录>参数设置为true并且从/tmp/abc/1/2/3中读取文件,则path属性将设置为abc/1/2/3 |
file.creationTime | 文件的创建时间。可能无法在所有文件系统上运行 |
file.lastModifiedTime | 文件的最后修改时间。可能无法在所有文件系统上运行 |
file.lastAccessTime | 文件的最后访问时间。可能无法在所有文件系统上运行 |
file.owner | 文件的所有者。可能无法在所有文件系统上运行 |
file.group | 文件的组所有者。可能无法在所有文件系统上运行 |
file.permissions | 文件的读/写/执行权限。可能无法在所有文件系统上运行 |
absolute.path | 文件的绝对路径 |
状态管理:
该组件不保存状态。
限制:
要求权限 | 说明 |
---|---|
读文件系统 | 基于当前平台可访问的权限,提供相应的读取文件操作权限。 |
写文件系统 | 基于当前平台可访问的权限,提供相应的写入文件操作权限。 |
输入流要求:
组件禁止提供输入流。
系统资源考量:
未提供。