存储概念解析
- 分布式存储
- 概念
- 是一种独特的系统架构
- 由一组能够通过网络连接 为了完成共同任务而协调任务的计算机节点组成
- 分布式是为了使用廉价的普通的计算机完成复杂的计算和存储任务
- 目的就是利用更多的机器处理更多的数据或任务
- 特性
- 可扩展:分布式存储系统可以扩展到几百甚至几千台的集群规模而且随着集群规模的增长 系统整体性能表现为线性增长
- 低成本:分布式存储系统的自动容错 自动负载均衡机制使其可以构建在普通的PC机上 另外 线性扩展能力也使得增加 尖山机器非常方便 可以实现自动运维
- 高性能: 无论是针对整个集群还是单台服务器 都要求分布式存储系统具备高性能
- 易用: 分布式存储系统需要能够提供易用的对外接口 也要求具备完善的监控 运维工具 并与其它系统集成
- 分布式算法
- 哈希分布
- 顺序分布
- 常用分布式存储方案
- Lustre
- Hadoop
- FastDFS
- GlusterFS
- Ceph
Ceph概述
- 什么是Ceph
- ceph是一个分布式存储系统 具有高扩展 高可用 高性能等优点
- ceph可以提供块存储 文件存储 对象存储
- ceph可以支持EB级别的存储空间
- 作为软件定义存储的优秀解决方案在行业中已得到广泛应用
- Ceph架构图
MON:集群监控
OSD:数据存储
MGR:管理器
MDS:存放文件系统的元数据
RGW:对象存储
- ceph工作图
Ceph数据存储
- 名词解释
- Object:对象
- Ceph最底层的存储单元
- 每个Object包含元数据和数据
- Pool:存储池
- 石村出对想得逻辑区分
- 规定了数据冗余的类型和对应的副本分布策略
- 支持两种类型:副本和纠删码 目前基本上使用的都是3副本类型
- PG:数据放置组
- 是一个逻辑概念
- 引入这一层是为了更好的分配和定位数据
- CRUSH:算法
- 是ceph使用的数据分布算法
- 确保数据分配到预期的地方
- 是容灾级别的控制策略
- 支持ceph存储集群动态扩展 重新平衡和恢复
- Ceph数据存储
Ceph搭建 实验举例:
- 虚拟机准备 所有主机至少2G内存 关闭防火墙和SeLinux
- ceph1 192.168.88.11 额外3块硬盘
- ceph2 192.168.88.12 额外3块硬盘
- ceph3 192.168.88.13 额外3块硬盘
- client 192.168.88.10
- 基础准备工作
- 更新自定义yum源 加入ceph相关软件
- 配置所有节点主机名解析
- 配置所有节点yum源
- 配置时间同步服务