如何组织一个复杂的Apache Flink应用程序？ [英] How to organize a complex Apache Flink application?

查看：13 发布时间：2022/3/15 10:46:47 apache-flink flink-streaming flink-sql

本文介绍了如何组织一个复杂的Apache Flink应用程序？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我们使用Flink从一些物联网传感器生成事件。每个传感器都可用于生成不同类型的事件(如温度、湿度等)。一对多比率(传感器启用的事件)。
传感器与存储在关系数据库中的启用事件之间的映射

为了丰富传感器数据，我们将连接传感器数据流和表API。正在添加具有已启用事件列表的元数据。

那么，如果某些特定的sensor-123只启用了TEMP和PRESSURE两个事件，如何才能只向这两个定义的流程函数发送传感器数据呢？

脑海中浮现出如下内容：

val enriched: DataStream[EnrichedSensorData] = ...

val temp = enriched.filter(x => isTempEnabled(x)).process(....)
val humd = enriched.filter(x => isHumdEnabled(x)).process(....)
val press = enriched.filter(x => isPressEnabled(x)).process(....)

效果如何？就Flink最佳实践而言，如何做得最好？据我所知，在我的例子中，我将数据流乘以几倍，尽管我随后用过滤将结果发过滤
在我的案例中，执行数据丰富过程的最佳方式是什么？将传感器数据流与表流连接(通过Flink-CDC-Connector)+在丰富进程函数中使用状态缓存映射传感器ID->；list(EnabledEvents)？

如何组织一个复杂的Apache Flink应用程序？ [英] How to organize a complex Apache Flink application?

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

如何组织一个复杂的Apache Flink应用程序？ [英] How to organize a complex Apache Flink application?

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭