# 大数据相关框架学习
本仓库主要存放了一些学习大数据的实战项目代码,项目来源主要来自慕课网
## 1. 集群搭建
- 这里面的项目都可以通过搭建单机standalone模式完成整个流程
- 这学期云计算课程需要使用集群环境,刚好学校有云资源,记录下集群搭建过程
- **[集群搭建](https://github.com/Thpffcj/BigData-Getting-Started/blob/master/集群搭建.md)**
## 2. 目录结构
### hadoop-train
- Hadoop基础与电商行为日志分析 新手入门大数据
- 本课程从Hadoop核心技术入手,以电商项目为依托,带领你从0基础开始上手,逐步掌握大数据核心技术(如:HDFS、YARN、MapReduce以及Hive),并使用这些技术进行实战,最终完成电商行为日志分析项目,让你轻松入门大数据!
**项目博客**
- [大数据概述](http://www.thpffcj.com/2017/12/12/Big-Data-Getting-Started-2/)
- [分布式文件系统HDFS](http://www.thpffcj.com/2018/01/04/Big-Data-Getting-Started-3/)
- [分布式资源调度YARN](http://www.thpffcj.com/2018/01/05/Big-Data-Getting-Started-4/)
- [分布式计算框架MapReduce](http://www.thpffcj.com/2018/01/06/Big-Data-Getting-Started-5/)
- [Hadoop项目实战](http://www.thpffcj.com/2018/01/07/Big-Data-Getting-Started-6/)
- [Hadoop集成Spring的使用](http://www.thpffcj.com/2018/01/08/Big-Data-Getting-Started-7/)
- [大数据相关技术拓展](http://www.thpffcj.com/2018/01/09/Big-Data-Getting-Started-8/)
### spark-train, spark-data-visualization
- Spark Streaming实时流处理项目实战
- 本课程从实时数据产生和流向的各个环节出发,通过集成主流的分布式日志收集框架Flume、分布式消息队列Kafka、分布式列式数据库HBase、及当前最火爆的Spark Streaming打造实时流处理项目实战,让你掌握实时处理的整套处理流程,达到大数据中级研发工程师的水平!
**项目博客**
- [初识实时流处理](http://www.thpffcj.com/2018/01/10/Big-Data-Real-time-Streaming-Data-Processing-1/)
- [分布式日志收集框架Flume](http://www.thpffcj.com/2018/01/11/Big-Data-Real-time-Streaming-Data-Processing-2/)
- [分布式发布订阅消息系统Kafka](http://www.thpffcj.com/2018/01/12/Big-Data-Real-time-Streaming-Data-Processing-3/)
- [Spark Streaming入门](http://www.thpffcj.com/2018/01/13/Big-Data-Real-time-Streaming-Data-Processing-4/)
- [Spark Streaming整合Flume](http://www.thpffcj.com/2018/01/14/Big-Data-Real-time-Streaming-Data-Processing-5/)
- [Spark Streaming整合Kafka](http://www.thpffcj.com/2018/01/15/Big-Data-Real-time-Streaming-Data-Processing-6/)
- [Spark Streaming整合Flume&Kafka打造通用流处理基础](http://www.thpffcj.com/2018/01/16/Big-Data-Real-time-Streaming-Data-Processing-7/)
- [Spark Streaming项目实战](http://www.thpffcj.com/2018/01/17/Big-Data-Real-time-Streaming-Data-Processing-8/)
- [可视化实战](http://www.thpffcj.com/2018/01/18/Big-Data-Real-time-Streaming-Data-Processing-9/)
### spark-sql-train, spark-sql-visualization
- 以慕课网日志分析为例 进入大数据Spark SQL的世界
- 本课程以“慕课网日志分析”这一大数据应用案例为主线,使用慕课网真实日志,以目前主流的、最新的Spark稳定版2.1.x为基础,依次介绍相关的大数据技术:Hadoop、Hive、Spark SQL,涉及数据清洗、统计存储、处理入库以及数据可视化(Echarts、Zeppelin),最终会形成一个完整的大数据项目。
**项目博客**
- [初探大数据](http://www.thpffcj.com/2018/04/14/Big-Data-SparkSQL-1/)
- [Spark及其生态圈](http://www.thpffcj.com/2018/04/15/Big-Data-SparkSQL-2/)
- [Spark SQL概述](http://www.thpffcj.com/2018/04/27/Big-Data-SparkSQL-3/)
- [DateFrame & Dataset](http://www.thpffcj.com/2018/05/03/Big-Data-SparkSQL-4/)
- [SparkSQL实战](http://www.thpffcj.com/2018/05/06/Big-Data-SparkSQL-5/)
### storm-train, storm-data-visualization
- 基于Storm构建实时热力分布项目实战
- Storm是实时流处理领域的一柄利器,本课程采用最新的Storm版本1.1.0,从0开始由浅入深系统讲解,深入Storm内部机制,掌握Storm整合周边大数据框架的使用,从容应对大数据实时流处理!
**项目博客**
- [初识实时流处理Storm](http://www.thpffcj.com/2018/03/05/Big-Data-Storm-Real-time-Streaming-Data-Processing-1/)
- [Storm编程](http://www.thpffcj.com/2018/03/18/Big-Data-Storm-Real-time-Streaming-Data-Processing-2/)
- [Storm周边框架使用](http://www.thpffcj.com/2018/03/21/Big-Data-Storm-Real-time-Streaming-Data-Processing-3/)
- [Storm架构及部署](http://www.thpffcj.com/2018/03/29/Big-Data-Storm-Real-time-Streaming-Data-Processing-4/)
- [并行度](http://www.thpffcj.com/2018/03/31/Big-Data-Storm-Real-time-Streaming-Data-Processing-5/)
- [分组策略与可靠性](http://www.thpffcj.com/2018/04/02/Big-Data-Storm-Real-time-Streaming-Data-Processing-6/)
- [DRPC](http://www.thpffcj.com/2018/04/06/Big-Data-Storm-Real-time-Streaming-Data-Processing-7/)
- [Storm整合其他大数据框架的使用](http://www.thpffcj.com/2018/04/07/Big-Data-Storm-Real-time-Streaming-Data-Processing-8/)
- [Storm综合项目实战](http://www.thpffcj.com/2018/04/09/Big-Data-Storm-Real-time-Streaming-Data-Processing-9/)
### flink-train
- 新一代大数据计算引擎 Flink从入门到实战
- 随着云计算和大数据的快速发展,在企业中需要处理和分析的数据量越来越大,随着Flink社区的快速发展,很多公司采用以Flink为核心技术栈来打造统一的大数据处理平台 ,Flink正变得越来越火,此时学习,正当其时。课程中从核心知识的多语言(Java-Scala)讲解到部署实战,循序渐进,助力系统入门Flink企业级应用
**项目博客**
- [初识Flink](http://www.thpffcj.com/2019/06/28/Big-Data-Flink-Getting-Started-1/)
- [DataSet & DataStream API 编程](http://www.thpffcj.com/2019/06/29/Big-Data-Flink-Getting-Started-2)
- [Flink Table API 和 Time 操作](http://www.thpffcj.com/2019/07/04/Big-Data-Flink-Getting-Started-3)
- [Filnk Connectors 和部署](http://www.thpffcj.com/2019/07/07/Big-Data-Flink-Getting-Started-4)
- [Flink项目实战](http://www.thpffcj.com/2019/07/10/Big-Data-Flink-Getting-Started-5)
### hbase-train
- HBase+Spring Boot实战分布式文件存储
- HBase是一个分布式可扩展的列式数据库,基于Hadoop实现大数据存储,提供数据的随机读写访问。 本课程讲解HBase集群部署、基础原理、高级特性、优化策略、容灾监控、开发实战,以及HBase相关的其他开源项目(如Phoenix,Sqoop等),感兴趣的小伙伴千万不要错过!
没有合适的资源?快使用搜索试试~ 我知道了~
大数据技术学习与实践项目集合_包含Hadoop电商日志分析_Spark实时流处理_集群搭建教程_数据可视化案例_大数据入门到实战...

共224个文件
java:98个
scala:69个
xml:15个

1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 82 浏览量
2025-07-28
20:37:55
上传
评论
收藏 5.23MB ZIP 举报
温馨提示
大数据技术学习与实践项目集合_包含Hadoop电商日志分析_Spark实时流处理_集群搭建教程_数据可视化案例_大数据入门到实战完整学习路径_适合新手学习大数据技术_涵盖HDFS_.zip
资源推荐
资源详情
资源评论




























收起资源包目录





































































































共 224 条
- 1
- 2
- 3
资源评论


2501_91769822
- 粉丝: 970
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 高职《化工单元操作》教学资源库的网络建设研究.docx
- 智能家居远程监控系统的研究与设计.docx
- 上海嘉定-应用物联网的十大工程等.docx
- 高中信息应用技术photoshop基础专题训练.doc
- 语音识别与合成-第1篇-洞察研究.pptx
- 大数据时代对人事档案创新管理的影响及优化.docx
- 计算机应用基础复习题及答案.ppt
- 第1章JSP简介.ppt
- 网络数据库课程设计——学籍管理系统.doc
- 以冬奥申报成功为契机-基于互联网探索冰雪运动英语的传播路径.docx
- 计算机技术应用的发展与展望.docx
- 中级软件设计方案师2018上半年上午试题及答案解析.docx
- 软件技术应用和发展.doc
- 中文版)铁路应用通信信号和过程控制系统信号安全相关电子.doc
- 电气工程及自动化控制在化工企业的应用分析.docx
- (源码)基于C++和RISCV指令集架构的在线Web解释器.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
