【操作系统复习】Unit2-1:进程与线程
1. 进程与线程
1.1 进程的概念和特征
并发:在某一时刻t,t都在a1和a2两个活动的起点和终点之间的某一处。(在时间上是重叠的)【不考虑a1和a2是否在同一个处理机上执行】
并行:考虑2个程序,他们在同一时间度量下同时运行在不同的处理机上
程序的顺序执行与特征:
- 顺序性、封闭性(独占全部资源)、可再现性
前趋图
- 有向无循环图,图中的每个结点可以表示一条语句、一个程序段或进程,结点间的有向边表示语句或程序段的执行次序
表示先A后B,也可写成 A → B A\rightarrow B A→B
程序并发执行时的特征
- 间断性∶并发程序具有"执行—暂停—执行"这种间断性的活动规律。
- 非封闭性∶多个程序共享系统中的资源,这些资源的状态将由多个程序来改变,致使程序之间相互影响。
- 不可再现性∶在初始条件相同的情况下,程序的执行结果依赖于执行的次序。
- 竞争∶ 多个进程在读写一个共享数据时结果依赖于它们执行的相对时间,这种情形叫做竞争。【对同一共享数据同时进行读写】
- 竞争条件(Race Condition)∶ 多个进程并发访问和操作同一数据且执行结果与访问的特定顺序有关,称为竞争(发生)条件。
临界资源:一次仅允许一个进程访问的资源
临界区:每个进程中访问临界资源的那段代码称为临界区
并行性的确定——Bernstein条件
- 判断 程序并发执行 是 结果是否可再现 的充分条件
进程的定义
- 进程是程序的一次执行;
- 进程是一个程序及其数据,在处理机上顺序执行时所发生的活动;
- 进程是程序在一个数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位
- 进程是可以和别的计算并发执行的计算;
- 进程可定义为一个数据结构,及能在其上进行操作的一个程序;
特征:
- 动态性:进程是程序的一次执行过程。而程序是静态实体。【进程最基本的特征】
- 并发性:多个进程实体同时存在于内存中,能在一段时间内同时运行。
- 独立性:在传统OS中,进程是独立运行的基本单位
- 异步性:也叫制约性,进程之间相互制约,进程以各自独立的不可预知的速度向前推进
进程的结构特征
- 结构特征:程序段,数据段,进程控制块PCB(这三者构成了进程实体/进程映像)【进程映像是静态的,进程是动态的】
- 一个进程应该包括:
- 程序的代码;程序的数据;
- PC中的值,用来指示下一条将运行的指令;
- 一组通用的寄存器的当前值,堆、栈;
- 一组系统资源(如打开的文件)
引入进程的利弊:
- 利:提高效率
- 弊:空间开销、时间开销
进程与程序的区别与联系
-
进程是动态的(进程是程序在处理机上一次执行的过程),程序是静态的
-
进程是暂时的,程序是永久的
-
进程与程序的组成不同:进程的组成包括程序、数据和进程控制块(即进程状态信息)。
-
进程与程序的对应关系:通过多次执行,一个程序可对应多个进程;通过调用关系,一个进程可包括多个程序。
-
进程是竞争计算机系统有限资源的基本单位。进程更能真实地描述并发,而程序不能。
-
进程具有创建其他进程的功能;而程序没有
1.2 进程状态与控制
进程控制的主要任务是创建和撤销进程、实现进程的状态转换(由内核实现)
Unix中的进程层次结构
-
原语
- 由若干条指令所组成的指令序列来实现某个特定的操作功能
- 指令序列执行是连续的、不可分割的
- 是操作系统核心组成部分
- 必须在管态(内核态)下执行,且常驻内存
- 由若干条指令所组成的指令序列来实现某个特定的操作功能
-
OS创建一个新进程(创建原语)
- 分配唯一的进程标识号,申请一个空白PCB → \rightarrow → 为进程分配其运行所需的资源 → \rightarrow → 初始化PCB → \rightarrow → 将新进程插入就绪队列
- fork创建进程。
-
撤销原语
- kill:(终止运行、放弃CPU)、释放资源回父进程/OS、撤销子孙进程、将PCB从所在队列中删除
-
阻塞原语、唤醒原语(【王道P41】)
进程的三种基本状态:就绪、执行、阻塞
一共五种状态:以上三种+创建态、结束态
-
处于执行状态的进程数目<=CPU的核数,理论上可以为0,但实际上是CPU进入idle死循环
-
处于阻塞状态和就绪状态的进程数目,可以为[0,n]
进程控制块PCB
-
作用:进程创建、撤销;进程唯一标志;限制系统进程数目
-
每一个进程均有一个PCB,在创建进程时,建立PCB,伴随进程运行的全过程,直到进程撤消而撤消
进程控制块的内容
-
-
PCB组织方式:线性表、链接方式、索引方式
1.3 进程的通信
进程间通信
- 低级通信:只能传递状态和整数值(控制信息),包括进程互斥和同步所采用的信号量和管程机制。缺点:
- 传送信息量小:效率低,每次通信传递的信息量固定,若传递较多信息则需要进行多次通信
- 编程复杂:用户直接实现通信的细节,编程复杂,容易出错
- 高级通信:以较高的效率传输大量数据的通信方式,主要包括三类:共享内存、消息传递系统、管道。
共享内存/共享存储
- 共享内存是最有用的进程间通信方式,也是最快的IPC形式(因为它避免了其它形式的IPC必须执行的开销巨大的缓冲复制)。
- 两个不同进程A、B共享内存的意义是,同一块物理内存被映射到进程A、B各自的进程地址空间。(共享存储区)
- 对共享存储区进行读写操作时需要使用同步互斥工具(eg:PV操作)
- 共享内存通信的效率高(因为进程可以直接读写内存)。
- 进程之间在共享内存时,保持共享区域直到通信完毕。
信息传递系统(message passing)
-
进程间的数据交换以格式化的消息(message)为单位
-
进程通过系统提供的发送消息和接收消息两个原语进行数据交换。
-
两种通信方式:直接通信方式(消息直接给接收进程)、间接通信方式(有个信箱)
-
调用方式分为阻塞调用、非阻塞调用
-
主要问题
- 解决信息丢失、延迟问题(TCP协议)
- 编址问题:mailbox
-
管道通信(Pipe)
- 管道是半双工的,数据只能向一个方向流动;需要双方通信时,需要建立起两个管道;
- “管道”是一个共享文件(单独的一种文件系统),又名pipe文件。管道是一个固定大小的缓冲区
- 数据的读出和写入:FIFO方式
1.3 线程概念的引入
进程与线程
- 进程包含了两个概念:资源拥有者和可执行单元
- 现代操作系统将资源拥有者称为进程,可执行单元称为线程
线程:将资源与计算分离,提高并发效率
- 线程是进程中的一个实体
- 线程是一个CPU调度和分派的单位(进程变为了资源分配的单元)
- 线程基本不拥有资源,只有必不可少的少量资源;它可以与其他同进程的线程共享进程拥有的所有资源
引入进程的好处:
- 多个程序可以并发执行,改善资源使用率、提高系统效率
引入线程好处
-
减少并发程序执行时所付出的时空开销,使得并发粒度更细、并发性更好、共享进程资源
-
线程比进程轻量:容易创建、撤销
进程 vs 线程
- 可从调度、并发性、拥有资源、独立性等方面说
1.4 线程的实现方式
【王道P44】
分为用户级线程、内核级线程、混合的线程实现方式
线程模型
线程安全
可重入不一定线程安全, 线程安全不一定可重入