飞艇超集

问题描述

我已经使用 zeppelin 几年了,现在 superset 因更好的可视化功能等而受到越来越多的关注。所以我试图了解确切的差异,并在有人希望选择 BI 工具时提供帮助。

我根据对超集的初步阅读列出了一些独特的功能,如果有人能对列表做出更多贡献,我们将不胜感激。

  • 大多数大数据集群集成支持(Spark、flink 等)
  • 使用段落内联代码执行
  • 多语言支持

由于我不是 superset 的适当用户,我想了解 Zeppelin 的更多独特功能,而这些功能在 Superset 中是不可能或很难做到的。

我还从 apache wiki 中获得了以下详细信息,但除了利用笔记本风格外,我认为这些不是唯一的因素

Apache Zeppelin 是间接竞争对手,但它解决了不同的用例。

Apache Zeppelin 是一个基于 Web 的笔记本,支持交互式数据分析。它支持使用 sql、Scala 等创建漂亮的数据驱动、交互式和协作文档。尽管用户可以使用该项目创建数据可视化,但它利用笔记本风格的用户界面,并且面向 Scala 和 sql 共存的 Spark 社区

解决方法

从根本上说,Zeppelin 和 Superset 对数据工作流持截然不同的观点。

Zeppelin 以 [计算笔记本界面][1] 为中心,它使您能够编写代码片段、运行它们并内部化输出,以及迭代和扩展。 Zeppelin 笔记本然后专注于使用 20 多种编程[语言和解释器][2]。 Zeppelin 还可以使用 JDBC 连接器查询流行的数据库。

Superset 以 BI 用例为中心,附带 SQL IDE 和无代码图表构建器。这里的重要区别是 Superset 只能从 SQL 语言数据库中查询数据。 Superset 与 Zeppelin 不同,它不能让您运行来自各种编程语言的任意代码。

这两种工具的用例、工作流程和设计选择都非常不同。 Superset 希望最终用户和分析师以及 SQL 忍者能够创建仪表板(组织中的其他人可能会使用)。 Zeppelin 希望提升数据科学家和程序员的水平来分析数据,而不是专注于构建仪表板供组织的其他成员使用。

[1]: https://en.wikipedia.org/wiki/Notebook_interface#:~:text=A%20notebook%20interface%20(也%20call,and%20text%20into%20separate%20sections. [2]:https://zeppelin.apache.org/supported_interpreters.html