在理解Flink运行时架构之前,我们先用一个生活化的比喻来建立直观认识:
想象你是一家大型工厂的总经理,需要生产一批复杂的产品。你会怎么做?
- 制定生产计划:首先画出生产流程图,明确每个环节的工作内容
- 分解任务:将复杂的生产过程分解为多个可并行的工序
- 分配工人:为每个工序安排合适数量的工人并行作业
- 协调执行:确保各个工序之间的协调配合
Flink的运行时架构正是这样一个"智能工厂"的管理系统。
ExecutionGraph:生产总指挥图
什么是ExecutionGraph?
ExecutionGraph就像是工厂的总生产指挥图,它是Flink程序在运行时的完整执行计划。
// 用户编写的Flink程序(简化示例)
DataStream<String> source = env.addSource(new FlinkKafkaConsumer<>(...));
DataStream<WordCount> counts = source.flatMap(new Tokenizer()) // 分词算子.keyBy(value -> value.word) // 按key分组.window(TumblingEventTimeWindows.of(Time.seconds(10))) // 窗口.sum("count"); // 聚合算子
counts.addSink(new FlinkKafkaProducer<>(...));
这段用户代码经过Flink内部转换,最终形成ExecutionGraph:
JobGraph (逻辑计划)↓
ExecutionGraph (物理执行计划)↓
实际运行的Task和SubTask
ExecutionGraph的关键特征
- 包含并行度信息:每个算子应该启动多少个并行实例
- 包含资源分配:每个并行实例需要多少资源
- 包含数据流向:数据如何在各个并行实例之间流转
- 包含容错信息:如何进行checkpoint和故障恢复
Task:工厂中的生产线
Task的概念
Task可以理解为工厂中的一条完整生产线。由于算子链(Operator Chain)的优化,多个相邻的算子会被合并到同一个Task中执行。
// 原始算子链
Source -> FlatMap -> Map -> KeyBy -> Window -> Sum -> Sink// 经过算子链优化后,可能形成这样的Task:
Task1: Source -> FlatMap -> Map (算子链合并)
Task2: KeyBy -> Window -> Sum (算子链合并)
Task3: Sink
为什么要有算子链?
就像工厂为了提高效率,会把相关的工序安排在同一条生产线上,避免半成品在不同车间之间频繁搬运。
算子链的好处:
- 减少数据序列化/反序列化开销
- 减少网络传输
- 减少线程切换
- 提高整体处理效率
Task的实际示例
public class ChainedMapTask extends StreamTask<String, StreamMap<String, String>> {@Overrideprotected void init() {// 初始化算子链中的所有算子SourceFunction sourceOperator = ...;MapFunction mapOperator = ...;// 构建算子链}@Overrideprotected void processInput() {// 处理输入数据,在算子链中依次执行while (isRunning()) {Record record = sourceOperator.next();Record mapped = mapOperator.map(record);output.collect(mapped);}}
}
SubTask:生产线上的具体工位
SubTask的概念
如果Task是一条生产线,那么SubTask就是这条生产线上的具体工位。当我们设置并行度为4时,一个Task会被分解为4个SubTask,就像一条生产线复制了4份,同时工作。
// 设置并行度
source.flatMap(new Tokenizer()).setParallelism(4); // 创建4个SubTask// 在TaskManager中的实际执行
SubTask-0: 处理数据分区0
SubTask-1: 处理数据分区1
SubTask-2: 处理数据分区2
SubTask-3: 处理数据分区3
SubTask的生命周期
public class SubTask {// 1. 初始化阶段public void initialize() {setupOperators();initializeState();registerMetrics();}// 2. 运行阶段 public void run() {while (isRunning()) {processNextRecord();if (shouldCheckpoint()) {performCheckpoint();}}}// 3. 清理阶段public void cleanup() {closeOperators();releaseResources();}
}
SubTask之间的数据交换
SubTask之间通过数据分区和网络传输进行协作:
// KeyBy操作会触发数据重分布
stream.keyBy(record -> record.getUserId()) // 按用户ID分区.map(new UserProcessor());// 数据流转示意:
SubTask-0: 用户1,5,9... → 重分区 → SubTask-0: 所有用户1的数据
SubTask-1: 用户2,6,10... → 重分区 → SubTask-1: 所有用户2的数据
SubTask-2: 用户3,7,11... → 重分区 → SubTask-2: 所有用户3的数据
SubTask-3: 用户4,8,12... → 重分区 → SubTask-3: 所有用户4的数据
三者关系总结
让我们用一个完整的示例来理解三者关系:
// 1. 用户程序
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();DataStream<String> lines = env.socketTextStream("localhost", 9999);
DataStream<Tuple2<String, Integer>> counts = lines.flatMap(new Tokenizer()) // 并行度4.keyBy(value -> value.f0).timeWindow(Time.seconds(5)).sum(1); // 并行度4counts.print(); // 并行度1
转换过程:
1. ExecutionGraph层面:
ExecutionVertex-1: Source+FlatMap (并行度4)
ExecutionVertex-2: KeyBy+Window+Sum (并行度4)
ExecutionVertex-3: Print (并行度1)
2. Task层面:
Task-1: [Source -> FlatMap] 算子链
Task-2: [KeyBy -> Window -> Sum] 算子链
Task-3: [Print]
3. SubTask层面:
Task-1的SubTask实例:- SubTask-1-0 (处理数据分片0)- SubTask-1-1 (处理数据分片1) - SubTask-1-2 (处理数据分片2)- SubTask-1-3 (处理数据分片3)Task-2的SubTask实例:- SubTask-2-0 (处理特定key的数据)- SubTask-2-1 (处理特定key的数据)- SubTask-2-2 (处理特定key的数据) - SubTask-2-3 (处理特定key的数据)Task-3的SubTask实例:- SubTask-3-0 (汇总所有结果)
性能调优要点
理解了这三者关系后,我们就能更好地进行性能调优:
1. 合理设置并行度
// 根据数据量和CPU核数设置
env.setParallelism(Runtime.getRuntime().availableProcessors());// 为不同算子设置不同并行度
source.setParallelism(2); // IO密集型,并行度可以适当小些
transform.setParallelism(8); // 计算密集型,并行度可以大些
sink.setParallelism(1); // 输出汇总,通常并行度为1
2. 优化算子链
// 禁用算子链(在需要时)
someStream.map(new MyMapper()).disableChaining() // 禁用与下游算子的链接.keyBy(...).startNewChain() // 从这里开始新的算子链.sum(1);
3. 监控SubTask运行状况
// 通过Flink Web UI观察:
// - 各个SubTask的吞吐量是否均衡
// - 是否存在数据倾斜
// - 网络传输是否成为瓶颈
// - SubTask的CPU和内存使用情况
小结
- ExecutionGraph:整个作业的执行蓝图,包含所有执行细节
- Task:经过算子链优化的执行单元,是逻辑上的"工作组"
- SubTask:Task的并行实例,是实际执行计算的"工人"
三者关系就像建筑施工:ExecutionGraph是施工总图纸,Task是各个专业工种组(如水电组、瓦工组),SubTask是每个工种组里的具体工人。理解这个关系有助于我们更好地设计和优化Flink应用程序。