Skip to main content

ConsumeAzureEventHub

描述:

从微软的Azure事件中心接收消息,并将接收到的Azure消息内容输出到数据流中

标签:

azure, microsoft, cloud, eventhub, events, streaming, streams, 微软, 事件, 流式, 云

参数:

如下列表中,必填参数则标识为加粗. 其他未加粗参数,则表示为可选参数。表中同时提到参数默认值设置, 参数还支持 表达式语言, 并且 如果将一个参数认定为"敏感", 表示是加密状态. 在输入一个敏感参数时, 确保 orchsym.properties 文件中存在属性设置 orchsym.sensitive.props.key.

名字默认值允许值列表描述
事件中心命名空间指定Azure事件中心分配的命名空间,通常类似 <Event Hub 名字>-ns

支持表达式语言 (仅支持变量)
事件中心名字指定拉取消息的Azure事件中心名字

支持表达式语言 (仅支持变量)
共享访问策略名指定事件中心共享访问策略的名字,该策略必须具有监听的权限

支持表达式语言 (仅支持变量)
共享访问策略主秘钥指定事件中心共享访问策略的主秘钥

敏感状态
支持表达式语言 (仅支持变量)
事件中心消费组$Default指定事件中心使用的消费组名

支持表达式语言 (仅支持变量)
事件中心消费主机指定事件中心消费实例的主机名。如果不指定,将自动生成一个格式为nifi-<UUID>的名字

支持表达式语言 (仅支持变量)
记录读取服务控制器服务API:
RecordReaderFactory
实现:
ParquetReader
GrokReader
SyslogReader
Syslog5424Reader
CSVReader
AvroReader
JsonPathReader
JsonTreeReader
ScriptedReader
XMLReader
用于解析读取接收到的消息,可通过事件中心名字的变量引用'${eventhub.name}'来访问schema
记录输出服务控制器服务API:
RecordSetWriterFactory
实现:
CSVRecordSetWriter
FreeFormTextRecordSetWriter
AvroRecordSetWriter
JsonRecordSetWriter
XMLRecordSetWriter
ParquetRecordSetWriter
ScriptedRecordSetWriter
用于序列化记录到输出数据流的输出服务。可通过事件中心名字的变量引用'${eventhub.name}'来访问schema。如果不指定,每个消息将单独输出
初始位置新开始流
- 现有流从流中保留的最旧消息中读取。
- 新开始流忽略旧的保留消息(即使存在),从现在开始读取新准备好的消息。
指定开始接收消息的位置,当Azure中没有存储指定的开始位置
预取数300指定将要获取消息的预期数

支持表达式语言 (仅支持变量)
分批数量10一次会话处理的消息数,该参数可能影响吞吐量和一致性。平台在处理此数量的消息后将提交数据流会话和事件中心检查点。如果平台会话已提交,但未能创建事件中心检查点,则可能再次检索相同的消息。数字越大,吞吐量越高,但可能导致一致性问题。

支持表达式语言 (仅支持变量)
接收消息超时1 min在返回前等待接收预期数的消息的时间

支持表达式语言 (仅支持变量)
存储账号名指定存储事件中心消费组状态的云存储账号名

支持表达式语言 (仅支持变量)
存储账号秘钥指定存储事件中心消费组状态的云存储账号秘钥

敏感状态
支持表达式语言 (仅支持变量)
存储容器名指定存储事件中心消费组状态的存储容器,如果不指定,将使用事件中心名字

支持表达式语言 (仅支持变量)

连线:

名字描述
success成功从事件中心获取消息输出到此连线
parse.failure如果事件中心的消息无法用读取服务解析或者通过输出服务失败,消息的内容将作为单独的数据流输出到此连线

读取属性:

未提供。

写入属性:

名字描述
eventhub.enqueued.timestamp消息在Azure事件中心排队的毫秒数时间戳
eventhub.offset存储消息的分区的偏移量
eventhub.sequence分配给消息的Azure序列号
eventhub.name拉取消息的事件中心的名字
eventhub.partition拉取消息的事件中心的分区名字

状态管理:

该组件不保存状态。

限制:

该组件没有限制

输入流要求:

组件禁止提供输入流。

系统资源考量:

未提供。