spark streaming基本原理为将输入数据流以时间片为单位进行拆分,然后以批处理的方式处理每个时间片的数据。
Spark Streaming使用DSTream来表示一个连续的数据流。
DSTream被表示为一系列连续的RDDs,其中每个RDD包含来自一定时间间隔的数据。
Name | Name | Last commit date | ||
---|---|---|---|---|
parent directory.. | ||||
spark streaming基本原理为将输入数据流以时间片为单位进行拆分,然后以批处理的方式处理每个时间片的数据。
Spark Streaming使用DSTream来表示一个连续的数据流。
DSTream被表示为一系列连续的RDDs,其中每个RDD包含来自一定时间间隔的数据。