MoveHDFS
描述:
针对HDFS中的文件或目录下的文件进行重命名操作
标签:
hadoop, HDFS, put, move, filesystem, moveHDFS, 移动, 重命名
参数:
如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.
名字 | 默认值 | 允许值列表 | 描述 |
---|---|---|---|
Hadoop配置 | 指定由逗号分隔符分隔的多个Hadoop配置文件。如果不设置,则Hadoop将搜索类路径(classpath)查找'core-site.xml' 和 'hdfs-site.xml'文件,或还原为默认配置。 为了使用 swebhdfs, 可查看 '高级设置' 的 PutHDFS 文档 支持表达式语言 (仅支持变量) | ||
Kerberos证书服务 | 控制器服务API: KerberosCredentialsService 实现: KeytabCredentialsService | 指定用于Kerberos授权的证书服务配置 | |
Kerberos Principal | 指定用于认证的Kerberos principal。 需要设置在 orchsym.properties 配置文件中设置 orchsym.kerberos.krb5.file 支持表达式语言 (仅支持变量) | ||
Kerberos Keytab | 指定用于关联Principal认证的Kerberos keytab。 需要设置在 orchsym.properties 配置文件中设置 orchsym.kerberos.krb5.file 支持表达式语言 (仅支持变量) | ||
Kerberos重新登录时长 | 4 hours | 尝试Kerberos重新登录的时长。注:该参数以被弃用,并组件执行没有影响。现在重新登录将自动发生 支持表达式语言 (仅支持变量) | |
额外类路径 | 指定将添加到类路径的并以逗号分隔的多个文件或目录。 当指定目录时,所有目录下的文件将被添加到类路径中,但并不迭代包含子目录中的文件 | ||
冲突解决策略 | 失败 | - 替换 - 忽略 - 失败 | 决定在目标目录下已经存在相同文件时该如何处理 |
源文件或目录 | ${path} | 指定将要处理的HDFS目录或单个文件 支持表达式语言 (支持流属性和变量) | |
目标目录 | 文件将被移动的目标目录 支持表达式语言 (仅支持变量) | ||
HDFS操作 | 移动 | - 移动 - 拷贝 | 将在源文件上执行的操作 |
文件过滤正则 | 指定文件的Java正则表达式过滤设置。如果设置,仅匹配的文件将被读取,否则读取所有文件 | ||
忽略.文件 | 忽略 | - 忽略 - 不 | 如果忽略,则以点(“.”)开头的文件将被忽略 |
远程拥有者 | 在写入文件后,改变HDFS文件的拥有者。仅当该平台以拥有修改拥有者权限的HDFS超级用户权限的用户身份运行时,此操作才有效。 | ||
远程组 | 在写入文件后,改变HDFS文件的组。仅当该平台以拥有修改组权限的HDFS超级用户权限的用户身份运行时,此操作才有效。 |
连线:
名字 | 描述 |
---|---|
success | 成功执行重命名输出到此连线 |
failure | 由于不能重命名而导致失败输出到此连线 |
读取属性:
名字 | 描述 |
---|---|
filename | 用于移动的输入数据流上的文件名属性 |
写入属性:
名字 | 描述 |
---|---|
filename | 文件名 |
absolute.hdfs.path | 文件的绝对路径 |
状态管理:
该组件不保存状态。
限制:
要求权限 | 说明 |
---|---|
读文件系统 | 基于当前平台可访问的权限,提供相应的读取文件操作权限。 |
写文件系统 | 基于当前平台可访问的权限,提供相应的写入文件操作权限。 |
输入流要求:
组件允许提供输入流。
系统资源考量:
未提供。