
CM6.3.1+CDH6.3.2单机部署Streamsets3.22.3:快速指南
下载需积分: 12 | 1021KB |
更新于2024-08-05
| 51 浏览量 | 举报
收藏
本文档详细介绍了如何在基于Centos 7.6的操作系统上使用CM (Cloudera Manager) 6.3.1和CDH (Cloudera Distribution Hadoop) 6.3.2环境进行大数据技术中的Streamsets 3.22.3单机部署。首先,我们从以下几个关键步骤来理解这个过程:
1. **准备Parcel包**:
- 从官方下载地址获取Streamsets 3.22.3版本的对应Parcel包,包括Manifest(元数据文件)、STREAMSETS_DATACOLLECTOR-3.22.3-el7.parcel(实际安装包)、STREAMSETS_DATACOLLECTOR-3.22.3-el7.parcel.sha(校验和文件)以及STREAMSETS-3.22.3.jar(定制服务描述符文件)。
- 将这些文件分别上传到Cloudera管理服务器的相应目录:Manifest和Parcel上传至/opt/cloudera/parcel-repo,而STREAMSETS-3.22.3.jar则上传至/opt/cloudera/csd。
2. **CDH集成**:
- 登录CDH UI(用户界面),开始集成Parcel包:
- 首先,访问主机页面并选择Parcel选项。
- 分配Parcel包,由于包体较大,可能需要较长时间等待。
- 完成分配后,激活新安装的Streamsets,并确认操作。
- 返回ClouderaManager主界面。
- 添加Streamsets服务:从CDH UI中,通过倒三角菜单找到并添加Streamsets服务。
- 选择目标主机,可以选择多个节点进行部署。
- 根据需求配置数据存储目录和资源存储目录,若磁盘资源充足,可以保持默认设置。
- 最后,点击完成,完成整个服务的安装和配置。
整个过程涉及了从下载、上传到集成和配置的完整流程,确保了在CDH环境中成功部署和运行Streamsets 3.22.3,这对于处理大数据流应用的开发、监控和管理至关重要。Streamsets是一个强大的数据集成工具,它允许用户轻松构建、管理和维护复杂的数据管道,适用于实时或批处理数据处理场景。通过与CDH集成,可以更有效地利用Hadoop生态系统的资源,提高大数据处理的效率和灵活性。
相关推荐






Don_kin
- 粉丝: 0
最新资源
- 绿色小巧的全网站截图软件:一触即发
- VC++初学者浏览器设计实例教程
- 唐飞课程设计选题系统论文解析与实现
- VC++6.0编程语言详细参考指南
- 掌握Visual Studio 2005集成环境的视频教程
- 极品时刻表20090701版:最便捷的火车时刻查询工具
- ASP程序实现在线人数统计功能
- C++实现FCFS、SJF、HRN算法案例解析
- ASP.Net影院售票系统:多态、接口及数据处理实践
- 三款美丽的可拖动纯JavaScript日历插件
- C++初学者适用:简易资源管理器制作教程
- 软件项目管理:编写指南与文档集经典
- 掌握Excel+VBA编程:实例教程800精选
- 北洋标签条码排版软件V3.28版功能详解
- 小哨兵一键GHOST:傻瓜化一键还原解决方案
- 电子蚊香第三代:电脑软件驱蚊新体验
- OPNET培训实验模板快速入门指南
- C++程序设计教程:谭浩强经典之作
- Visual Assist X 10.4:提高开发效率与代码质量
- Struts1.2、Hibernate3.2及Spring2.5框架整合教程
- 信号与系统中文课件全集:翻译老师精制PPT
- 深入解析C++编程实例技巧与应用
- Everything:本地文件搜索的高速利器
- Struts1.2+Ajax+SQLServer2000构建网络在线考试系统详解