
大数据
努力的凹凸曼
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Cloudera HUE大数据可视化分析
1.Hue 概述及版本下载1)概述Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job等等。2)...原创 2019-04-15 17:25:51 · 1459 阅读 · 0 评论 -
Spark SQL快速离线数据分析
1.Spark SQL概述1)Spark SQL是Spark核心功能的一部分,是在2014年4月份Spark1.0版本时发布的。2)Spark SQL可以直接运行SQL或者HiveQL语句3)BI工具通过JDBC连接SparkSQL查询数据4)Spark SQL支持Python、Scala、Java和R语言5)Spark SQL不仅仅是SQL6)S...原创 2019-04-28 17:01:12 · 2531 阅读 · 0 评论 -
Spark-Streaming实时数据分析
1.Spark Streaming功能介绍1)定义Spark Streaming is an extension of the core Spark API that enables scalable, high-throughput, fault-tolerant stream processing of live data streams2.NC服务安装并运行Spark ...原创 2019-04-30 15:26:27 · 2624 阅读 · 1 评论