flink和spark对比
更新时间: 2025-09-25 18:15:54
1、技术理念不同:Spark的技术理念是使用微批来模拟流的计算,基于Micro-batch,数据流以时间为单位被切分为一个个批次,通过分布式数据集RDD进行批量处理,是一种伪实时。而Flink是基于事件驱动,它是一个面向流的处理框架, Flink基于每个事件一行一行地流式处理,是真正的流式计算。 另外他也可以基于流来模拟批进行计算实现批处理,在技术上具有更好的扩展性。
2、时间机制:SparkStreaming只支持处理时间, 折中地使用processing time来近似地实现event time相关的业务。使用processing time模拟event time必然会产生一些误差, 特别是在产生数据堆积的时候,误差则更明显,甚至导致计算结果不可用,Structured streaming 支持处理时间和事件时间,同时支持 watermark 机制处理滞后数据Flink 支持三种时间机制:事件时间、注入时间、处理时间、同时支持 watermark 机制处理迟到的数据,说明Flink在处理乱序大实时数据的时候,优势比较大。
flink和spark对比 相关文章
- 福建省三明市清流县气象台发布雷电黄色...
- 云南省文山壮族苗族自治州文山市气象台...
- 福建省龙岩市上杭县气象台发布雷电黄色...
- 江苏省苏州市吴江区气象台发布强对流黄...
- 贵州省毕节市织金县气象台发布大风蓝色...
- 广西壮族自治区钦州市浦北县气象台发布...
- 广东省云浮市郁南县气象台发布暴雨橙色...
- 云南省文山壮族苗族自治州文山市气象台...
- 贵州省毕节市纳雍县气象台发布大雾黄色...
- 广西壮族自治区气象台发布暴雨蓝色预警
- 青海省海东市气象台发布地质灾害橙色预...
- 江西省抚州市东乡区气象台发布雷电黄色...
- 江西省吉安市井冈山市气象台发布雷电黄...
- 江西省南昌市进贤县气象台发布雷电黄色...
- 福建省龙岩市新罗区气象台发布雷电黄色...
- 江苏省无锡市气象台发布强对流黄色预警...
- 广东省湛江市遂溪县气象台发布雷雨大风...
- 广西壮族自治区桂林市兴安县气象台发布...
- 广东省肇庆市封开县气象台发布暴雨黄色...
- 贵州省黔南布依族苗族自治州罗甸县气象...