Weld 使用 Rust 语言编写,可以使用 LLVM 编译器框架,为整个数据分析工作流生成高效的并行运行的代码。CSAIL
Delta Lake 是一个存储层,为 Apache Spark 和大数据 workloads 提供 ACID
事务能力,其通过写和快照隔离之间的乐观并发控制(optimistic concurrency control),在写入数据期间提供一致性的读取,从而为构建在
Apache Fluo 是 Google
Percolator(搜索索引)的开源实现,允许用户对存储在Apache Accumulo
Jupyter Notebook 是一个基于 Web 的交互式计算笔记本环境。
Jupyter Notebook
允许用户创建和共享各种内容,包括实时代码、方程式、可视化和叙述文本的文档。它的用途包括:数据清理和转换、数值模拟、统计建模、
Metacat
Metacat 是一个联合的元数据 API 服务,可以访问 Hive、RDS、Teradata、Redshift、S3 和 Cassandra。
睿思BI-OLAP系统支持对数据表的OLAP查询,无需编写任何的代码,用户只需要通过语义层的定义就可以轻松搭建自己的多维数据模型并进行数据多维查询及可视化。
OpenMining是由Python编写的商务智能应用服务器,为商务智能中大数据的处理提供了便捷的操作,以此来提高用户挖掘商业情报的效率。
HPAT 是一个基于编译器的大数据框架,使用 Python 编写。
高性能分析工具包(HPAT)是一个基于编译器的框架,用于群集/云环境中的大数据分析和机器学习,既易于使用又非常快速;它比 Apache Spark
Moonbox是一个DVtaaS(Data Virtualization as a Service)平台解决方案。
Moonbox基于数据虚拟化设计思想,致力于提供批量计算服务解决方案。Moonbox负责屏蔽底层数据源的物理和使用细节,为用户带来虚拟数据库般