切换导航
首页
编程语言
前端开发
移动开发
开发工具
程序设计
行业应用
CMS系统
服务器
数据库
面试题
菜鸟教程
首页
Spark
Spark
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 Spark 是一种与 Hadoop 相似的开源
· 实时统计每天pv,uv的sparkStreamin...
01-07
· Spark RDD详解 | RDD特性、lineage...
12-11
· 聊聊Spark的分区、并行度 —— 前奏...
12-11
· 重要 | Spark分区并行度决定机制
12-11
· Spark SQL | 目前Spark社区最活跃的...
12-11
· Spark集群和任务执行
12-11
· Spark闭包 | driver & executo...
12-11
· Spark为什么只有在调用action时才会...
12-11
· 必须掌握的Spark调优技术点
12-11
· 对Spark硬件配置的建议
12-11
· Spark核心组件通识概览
12-11
· Spark流式状态管理(updateStateBy...
12-11
· 解析SparkStreaming和Kafka集成的两...
12-11
分类导航
区块链
大数据
图像处理
DevOps
Kafka
Spark
Dubbo
编程之家官方公众号
微信公众号搜索 “ 程序精选 ”
精选程序员所需精品干货内容!
标签云
更多