目录
第一章 整体预览
第二章 企业理念
1、坚持自主创新研发
2、携手合作伙伴共同发展
3、严格保障用户数据安全
第三章 经典论文
1、什么是云计算
2006年,谷歌提出【云计算】概念,特指一种新兴的IT交付方式,【应用/数据/IT资源】通过网络作为标准服务,在灵活的价格基础上快速服务最终用户。
2、Google File System 论文
分布式文件管理系统
3、Google Bigtable 论文
根据数据建立数据模型,对外提供读写数据的接口
4、Google MapReduce 论文
针对大规模群组中的海量数据(大于1TB)处理分析的分布式编程模型
5、设计目的
高容错 易扩展 易编程
第四章 分布式基础知识
1、CAP 三要素
- 一致性(Consistency):所有服务节点应返回相同的数据。
- 可用性(Availability):所有服务节点应保持稳定的对外服务。
- 分区容错性(Partition Tolerance):系统允许部分节点暂时失效。
根据 CAP 定理,系统最多只能同时满足其中两项(CP 或 AP)。
2、BASE 理论
是对CAP理论中一致性与可用性权衡的折中方案:
- 基本可用(Basically Available):系统在部分故障时仍能提供核心服务能力
- 软状态(Soft-state):允许数据存在暂时的中间状态
- 最终一致性(Eventual consistency):系统将在一定时间后达成数据一致性
这一设计理念在保持系统高可用的同时,通过放松强一致性要求来提升整体性能。
第五章 云计算环境
云计算环境由 云端-计算机网络-终端组成
第六章 虚拟化技术
1、定义
将原本独立的服务器汇集起来,形成一个超大的资源池。云操作系统统一管理,根据实际需求再通过网络提供可动态扩缩的灵活的服务。
2、实现方式
目前有三种技术方案实现x86架构CPU敏感指令和特权指令的虚拟化
① 使用二进制翻译的全虚拟化
可以直接翻译成机器代码,虚拟化操作和底层硬件完全解耦。
② 操作系统辅助半虚拟化
③ 硬件辅助的硬件虚拟化
硬件厂商直接提供虚拟化的特性支持。
3、虚拟化的架构
① CPU虚拟化
可以将单个CPU模拟多个CPU并行,反之也可以,称之为 vCPU,允许一个平台同时运行多个操作系统,这些操作系统与非虚拟化的操作系统完全是一样的没有区别。同时保证多个操作系统之间互不影响,有独立的空间。
② 内存虚拟化
物理机或者服务器内存被操作系统完全独占造成资源浪费,对物理内存虚拟化之后,每个虚拟机分配适合的虚拟内存,可以提高物理资源的利用率。
③ 网络虚拟化
构建虚拟以太网适配器和虚拟交换机,达到在一个共享的物理网络资源基础上创建多个虚拟网络的目的。
④ 存储虚拟化
利用本地磁盘,通过专业设备将磁盘虚拟化,挂载到虚拟机的本地虚拟磁盘,提高本地磁盘的利用率和便携性。
⑤ GPU虚拟化
将GPU的计算能力虚拟化,称之为 vGPU,可以让多台虚拟机共享显卡算力。
4、虚拟机的四大特性
① 封装
虚拟机保存在文件中,复制文件到新的物理机或者服务器就可以复制虚拟机直接使用了。
② 硬件独立
不用任何修改就可以运行复制来的虚拟机文件创建新的虚拟机。
③ 隔离
多个虚拟机互相隔离,一个物理机可以部署多个操作系统环境,所以互不影响。
④ 分区
物理机的资源动态分配给各虚拟机。
第七章 云计算类型
1、服务类型分类
① IaaS
基础设施即服务,包含服务器,存储,网络服务等直接由Iaas服务商提供。其中阿里的ECS是属于基础设施服务的。
② PasS
平台即服务,提供开发和分发的解决方案,比如虚拟中间件服务器,运行环境,操作系统等。
③ SaaS
软件即服务,基于多租户技术,直接提供软件应用程序,比如云安全中心。
④ DaaS
数据即服务,是一种云战略。数据当成 API 进行发布,让上游系统、应用或外部合作方都能像调用服务一样去“拉取”或“订阅”数据。
┌──────────────────────────────┐
│ 上层调用方/前端 │
│ • 内部业务系统 │
│ • 外部合作方/第三方 │
│ • BI/报表系统 │
└─────────────┬────────────────┘
│ HTTP/HTTPS/GraphQL
┌──────────▼────────────┐
│ API 网关 / 统一入口 │
│ • 认证 + 鉴权 │
│ • 请求路由 │
│ • 限流 + 熔断 │
└──────────┬────────────┘
│
┌──────────▼────────────────────────────────┐
│ DaaS 平台 │
│ ┌────────────┐ ┌─────────────────────┐ │
│ │ 元数据中心 │ │ 数据服务微服务 │ │
│ │ (Data Catalog)│ │ (UserService, OrderService…) │ │
│ └────────────┘ └─────────────────────┘ │
│ • 接口定义 • 数据聚合/拆分 │
│ • 数据血缘 • 数据质量校验 │
│ • 文档规范 • 缓存服务(Redis)│
│ • 授权策略 • 日志监控(OpenTelemetry)│
└──────────┬────────────────────────────────┘
│
┌──────────▼──────────┐
│ 底层数据源层 │
│ • 关系型数据库(MySQL/Oracle) │
│ • NoSQL(MongoDB/Elasticsearch)│
│ • 数据仓库/大数据平台 (Hive/Hadoop)│
│ • 第三方 API/消息总线(Kafka/RabbitMQ)│
└─────────────────────┘
2、部署方式分类
① 公有云
面向互联网用户,开放网络提供云计算能力。
② 私有云
面向企业内部提供云计算服务。
③ 混合云
兼顾公有和私有两者的能力。
第八章 云计算的特点和优点
1、特点
大规模
虚拟化
高可用
通用性:网络提供可用功能,可通过各种统一的标准机制从多样化的客户端获取到,比如说WEB界面,移动APP等。
按需服务:消费者可以单方面按照实际需求获取云资源,比如说服务器时间,网络存储,避免和各服务提供商的沟通成本。
高可伸缩性:灵活的提供资源来扩展应用,也可以快速的释放资源来实现收缩,可以在任意时间购买任意数量的资源。
廉价性
多租户隔离:多租户模式将不同用户的不同需求,对不同的物理资源进行动态分配或者重新分配。
2、对比本地IDC优势
节省建立基础设置的成本
快速搭建应用服务
简化管理和维护工作
不需要完全管理底层基础设施
更大的灵活性和扩展性