Skip to main content

DeleteHDFS

描述:

从HDFS中删除一个或多个文件或目录。删除路径可由输入数据流的属性指定,或直接设置静态的字面路径值。如果组件有输入数据流连线,则组件将通过输入数据流来触发运行。注意:也可使用通配符方式来匹配多个文件或目录。如果没有输入数据流连线,则将没有数据流输出。如果有输入数据流,如果没有删除错误,则将路由到成功连线,否则失败连线,如果要删除批量的文件,则可先使用ListHDFS生成要删除的特定文件列表

标签:

hadoop, HDFS, delete, remove, filesystem, 删除, 移除

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 并且 参数还支持 表达式语言.

名字默认值允许值列表描述
Hadoop配置指定由逗号分隔符分隔的多个Hadoop配置文件。如果不设置,则Hadoop将搜索类路径(classpath)查找'core-site.xml' 和 'hdfs-site.xml'文件,或还原为默认配置。 为了使用 swebhdfs, 可查看 '高级设置' 的 PutHDFS 文档

支持表达式语言 (仅支持变量)
Kerberos证书服务控制器服务API:
KerberosCredentialsService
实现:
KeytabCredentialsService
指定用于Kerberos授权的证书服务配置
Kerberos Principal指定用于认证的Kerberos principal。 需要设置在 orchsym.properties 配置文件中设置 orchsym.kerberos.krb5.file

支持表达式语言 (仅支持变量)
Kerberos Keytab指定用于关联Principal认证的Kerberos keytab。 需要设置在 orchsym.properties 配置文件中设置 orchsym.kerberos.krb5.file

支持表达式语言 (仅支持变量)
Kerberos重新登录时长4 hours尝试Kerberos重新登录的时长。注:该参数以被弃用,并组件执行没有影响。现在重新登录将自动发生

支持表达式语言 (仅支持变量)
额外类路径指定将添加到类路径的并以逗号分隔的多个文件或目录。 当指定目录时,所有目录下的文件将被添加到类路径中,但并不迭代包含子目录中的文件
路径指定删除的文件或目录路径,通配符表达式仅支持删除文件

支持表达式语言 (支持流属性和变量)
递归处理
- 是
- 否
递归删除非空目录的内容

连线:

名字描述
success当有输入数据流并没有删除错误将输出到此成功连线
failure当有输入数据流并发送删除错误将输出到此失败连线

读取属性:

未提供。

写入属性:

名字描述
hdfs.filename删除的HDFS文件,如果删除了多个文件,该属性仅表示最后一个文件
hdfs.path删除请求的HDFS路径,如果删除多个路径,该属性仅表示最后一个路径
hdfs.error.message与到hdfs.error.code相关的错误信息

状态管理:

该组件不保存状态。

限制:

要求权限说明
写文件系统基于当前平台可访问的权限,提供相应的写入文件操作权限。

输入流要求:

组件允许提供输入流。

系统资源考量:

未提供。

参考:

ListHDFS, PutHDFS