背景
大数据数据需要查询分析可视化工具,AI数据挖掘和探索也需要相关可视化编辑工具,开源产品主要有两个一个是Zeppelin notebook 一个是jupyter notebook,其中juypter主要用于数据科学家、算法分析人员使用python进行数据分析、算法建模,相关企业如aws、百度、腾讯都有基于jupyter notebook去进行定制化开发,zeppelin notebook比较偏重于大数据数据查询分析可视化,支持多种大数据计算引、存储引擎擎如:Spark、Flink、Hive、Kylin等,现在对这两个产品进行介绍

Apache Zeppelin简介
Zeppelin是一个Web笔记形式的交互式数据查询分析工具,可以在线用scala和SQL对数据进行查询分析并生成报表,notebook可以包括多个paragraph(段)。paragraph是进行数据分析的最小单位,即在 paragraph中可以完成数据分析代码的编写以及结果的可视化查看。因此,一个paragraph 可看做是一个基本的任务单元。Zeppelin的后台数据引擎可以是Spark、flink、Python等,开发者可以通过实现更多的解释器来为Zeppelin添加数据引擎。
-
多解释器支持

-
丰富的数据可视化

本文介绍了Apache Zeppelin和Jupyter Notebook,两者都是数据查询和分析的工具。Zeppelin专注于大数据查询,支持多种计算引擎,适合企业级应用;Jupyter Notebook则更适合数据科学家,支持多种编程语言,资源利用率高。两者各有侧重,企业通常选择Zeppelin,而个人和AI建模人员更倾向于Jupyter Notebook。
1204

被折叠的 条评论
为什么被折叠?



