
平台
无名虫
express to the day before and consider the day after
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ERROR 22 - The requested URL returned error: 404 Not Found
filelists.sqlite.bz2 from epel: [Errno 256] No more mirrors to try.今天遇到这个问题 根据提示试了好长时间 也没弄好。最后终于在官方网上找到类似的问题。以下是解决方法yum clean allyum makecache最后要记得重新下载:需要用到的yum工具包...原创 2020-06-06 15:29:15 · 1240 阅读 · 0 评论 -
spark-2.4.0 源码编译
环境: hadoop2.6.0-cdh5.7.0 jdk 8 + maven 3.5.4 + scala 2.11这里提醒下,spark2.4.0之前的版本maven使用 3.3.9+ 就可以了; spark2.2.0之前的版本支持jdk 7。源码下载安装[hadoop@hdp001 softwore]$ wget https://archi...原创 2019-01-06 14:32:00 · 1539 阅读 · 0 评论 -
Kafka 0.10.1.0 Cluster的搭建和Topic简单操作
1. 环境准备: Linux 服务器 3个节点2. 需要提前安装的软件 Zookeeper 3.4.6 JDK 1.7 + Scala 2.11+# 1. zookeeper 3.4.6[hadoop@hdp001 zookeeper-3.4.6]$ bin/zkServer.sh statusUsing config: /home/hadoo...原创 2019-01-09 10:10:27 · 833 阅读 · 1 评论 -
数仓平台设计思路01
大数据行业中,数仓的作用不言而喻,承载着整个公司全业务线的核心,现在就企业内部数据的分析,尤其是各种各样的统计分析报表和用户画像分析,进行阐述。下图为数仓整体的技术架构:一个优秀可靠的数仓,一定要结构、分层清晰,能够快速找到数据的位置。主题域的划分,完全可按照公司内部的业务线和结构去划分。上图中:BDL层,作为缓冲数据层,其实就是贴源数据层,和源数据使用相同的表。直接用源库(传统关系型业...转载 2019-02-16 11:19:23 · 838 阅读 · 0 评论