第六章 数据库技术基础(比较重要,下午题会出E-R题)
基础知识上午题
6.1 数据库(DB)数据库系统(DBS system)、数据库管理系统(DBMS)
DB:长期存储在计算机内,有组织,可共享的数据集合
DBMS:一种系统软件、对数据库进行管理
DBS:由数据库、硬件、数据库管理系统、软件和管理员(DBA)、用户等组成
6.2 数据库技术的发展
人工管理阶段
文件管理阶段
数据库系统阶段(有较高的数据独立性)
6.3 数据操作语言和权限操作语言
(1)数据操作语言:
DDL(CREATE/ALTER/DROP/完整性约束) 对表操作
DML(SELECT/INSERT/DELETE/UPDATE) 对数据操作
(2)权限的操作语言:DCL
6.4 数据模型
数据模型是对现实世界的模拟
(1)数据模型分类:
关系模型:表
半结构化模型:层次、网状、数据结构:json 超文本标记语言(只保留了对象,不会有操作代码)、xml可扩展标记语言
概念数据模型(E-R模型):按照用户的观点对数据和信息建模,是现实世界到信息世界的第一层抽象
基本数据模型(层次、网状、关系模型、面向对象数据模型),按照计算机系统的观点对数据建模
目前提出的对象模型
(2)数据模型的三要素
数据结构:对象类型的集合
数据操作:操作的集合
数据的约束条件:是一组完整性规则的集合
6.5 E-R模型
大题是补充E-R图
(1)实体(长方形)
在现实世界中区别其他对象的“事物”和“物体”,例如学生、书本
(2)联系(菱形)
1)两个不同实体之间的联系
一对一、一对多、多对多
2)两个以上不同实体集之间的联系(下午题经常考)
1:1:1; 1:1:*; 1:*:*; *:*:*
3)同一实体集内的二元关系(两根横线)
一对一,一对多。其中的关系也是实体
(3)属性
1)简单属性和复合属性:不可分、可细分
2)单值属性和多值属性
3)NULL属性:表示无意义或不知道
4)派生属性:从其他属性得来。如身份证和年龄(派生)
(4)扩充的E-R模型
弱实体(要以来另一个实体而存在),两个方框表示
特殊化(实体之间存在的共性)
父实体和子实体之间用圆圈进行联系,用两根线
6.6 DBS的体系结构
(1)数据抽象(层)
视图层、逻辑层、物理层
(2)三层模式结构
外模式:用户模式或子模式,用户与数据库系统的接口
模式(逻辑、概念模式) student(sid,sname),一个系统只能有一个逻辑模式,逻辑结构
内模式(物理、存储模式)
(3)两级映像
外模式/模式映像
模式/内模式映像:逻辑结构和物理结构的关系
(4)数据的立性
外部程序与内部数据是互相独立的,相当于要修改只需在映像进行修改,可以使得多个应用程序不用改变,保证了下面两点
1)数据物理独立性,通过模式/内模式
2)数据逻辑独立性,通过外模式/模式
6.7 数据库类型和授权类型
(1)数据库类型
集中式数据库系统、并行数据库系统(多个CPU)、客户/服务器数据库体系结构、分布式数据库系统、web数据库
(2)授权类型
read:允许读取、不修改 insert:允许插入、不修改
update:允许修改、不删除 delete:允许修改
index:允许创建和删除索引 resource:允许创建新关系
alteration:允许添加和删除关系中的属性 drop:允许删除关系
十二章的内容
数据库的控制功能
事务管理:原子性、一致性、隔离性、持久性
故障恢复:事务故障、系统故障、介质故障、计算机病毒
并发控制:
封锁、排他锁(X锁)和共享锁(S锁)
共享 S(share)锁 :用于不更改或不更新数据的操作(只读操作),如 SELECT 语句。若事务T1对数据对象A加上S锁,则其它事务只能再对A加S锁,而不能加X锁,直到T1释放A上的S锁
排他锁(X锁):用于数据修改操作,例如INSERT、UPDATE 或 DELETE。确保不会同时同一资源进行多重更新。若事务T1对数据对象A加上X锁,则只允许T1读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T1释放A上的X锁
三级封锁协议(保证数据的一致性):
一级:解决丢失更新,加X锁、二级:解决读脏数据,加S锁、三级:解决不可重复读数据
事务的执行状态
活动状态:事物的初始状态。
部分提交状态:全部执行完。
失败状态:由于硬件或是逻辑上的错误,使事物不能在继续进行,处于失败状态的事物必须回滚。然后事物就进入了中止态。
中止状态:事物回滚并数据库恢复到开始执行前的状态。
提交状态:当事物成功完成后,事物处于提交状态,只有事物处于提交状态,才能说明事物已经提交。
事物的隔离级别(高到低)
可串行化(读幻影):SERIALIZABLE
可重复读:REPEATABLE READ
读提交数据:READ COMMITTED
可以读未提交数据:READ UNCOMMITTED
SQL语句定义:SET RANSACTION SOLATON LEVEL a)/b)/c)/d)
幻影现象:同一事物对数据对象的两次访问得到的数据记录不同,加了内容,不可重复读问题
6.8 数据仓库
DW的基本特性:面向主题的、数据是集成的、数据是先对稳定的、数据是反映历史变化的(时限一般5~10年)
数据模式——事实表,多维数据模式包括(星型模式、雪花模式、事实星状模式)
数据仓库体系结构:
通常采用:数据仓库服务器、OLAP(联机分析处理)、前端服务器
从结构的角度:企业仓库、数据集市、虚拟仓库
数据仓库的数据模型与操作行数据库的区别:1不包含纯操作型的数据;2扩充了码结构,增加了时间属性作为码的一部分;3增加了一些导出数据。
数据仓库的物理设计:主要提高I/O性能,通过粒度划分和数据分割来提高系统的性能。
第十三章内容:
数据挖掘技术
(1)各项技术
海量数据收集
强大的多处理计算机
数据挖掘算法:人工神经网络、决策树、遗传算法、近邻算法和规则推导
(2)数据挖掘的过程
确定对象
准备数据(60%工作量,包括数据选择,数据预处理清晰,数据转换)、建立模型、数据挖掘、结构分析、知识应用
数据转储
OLAP(联机分析处理)
通常对数据仓库进行数据挖掘
面向事务、面向具体业务、提供决策支持
第六章下午题E-R图
1.概念模型设计(补充图信息)
(1)两方联系 AB,BA
(2)三方联系 AB,BC
(3)弱实体(双边矩形和菱形) 一个实体的存在必须以另一个实体为前提(家长(弱实体)-学生)
(4)聚合(涉及三个实体,又先后顺序) 两个实体A,B产生联系,联系再跟另一个实体C产生联系,要将AB之间的联系,框起来
(5)子实体 (员工(代购员、配送员))
(6)同一实体集内的二元关系
2.逻辑模型设计(补充逻辑信息)
也可被叫做关系模式:例如 医院(医院名称、地址、电话)
3.23年例题及其答案
例题
答案