本次学习还是为了实现之前搁置了很久的项目:网站日志流量分析系统,之前使用Docker搭建了基础环境:使用Docker搭建Spark集群(用于实现网站流量实时分析模块),这次再补补Spark的理论基础,再编写Scala代码实现网站流量实时分析
1、Spark架构
①Driver Program:用户编写的Spark程序称为Driver Program,每个Driver程序包含了
本次学习还是为了实现之前搁置了很久的项目:网站日志流量分析系统,之前使用Docker搭建了基础环境:使用Docker搭建Spark集群(用于实现网站流量实时分析模块),这次再补补Spark的理论基础,再编写Scala代码实现网站流量实时分析
①Driver Program:用户编写的Spark程序称为Driver Program,每个Driver程序包含了