进程
定义
程序:是静态的,就是个存放在磁盘里的可执行文件,就是一系列的指令集合。
进程(Process):是动态的,是程序的一次执行过程
进程是进程实体的运行过程,是系统进行资源分配的一个基本单位
组成
- PCB 是给操作系统用的。
- 程序段、数据段是给进程自己用的。
PCB
程序段、数据段、PCB三部分组成了进程实体
当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的“身份证号”—— PID(Process ID,进程ID)
组织
- 在一个系统中,通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来。
- 进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题
链接方式
索引方式
特征
小结
进程状态及转换
三种基本状态
- 进程是程序的一次执行。在这个执行过程中,有时进程正在被CPU处理,有时又需要等待CPU服务,可见,进程的状态是会有各种变化。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。
注意:单核处理机环境下,每时刻最多只有一个进程处于运行态。(双核环境下可以同时有两个进程处于运行态)
进程已经拥有了除处理机之外所有需要的资源,一旦获得处理机,即可立即进入运行态开始运行。即:万事俱备,只欠CPU
如:等待操作系统分配打印机、等待读磁盘操作的结果。CPU是计算机中最昂贵的部件,为了提高CPU的利用率,需要先将其他进程需要的资源分配到位,才能得到CPU的服务
另外两种状态
操作系统需要完成创建进程。操作系统为该进程分配所需的内存空间等系统资源,并为其创建、初始化PCB (如:为进程分配PID)
进程运行结束(或者由于bug导致进程无法继续执行下去,比如数组越界错误),需要撤销进程。
操作系统需要完成撤销进程相关的工作。完成将分配给进程的资源回收,撤销进程PCB等工作
进程状态的转换
小结
进程控制
什么是进程控制
- 进程控制就是要实现进程状态的转换
如何实现进程控制
- 原语是一种特殊的程序,它的执行具有原子性。也就是说,这段程序的运行必须一气呵成,不可中断。
- 为何进程控制(状态转换)的过程要“一气呵成”?
- 如果不能“一气呵成”,就有可能导致操作系统中的某些关键数据结构信息不统一的情况, 这会影响操作系统进行别的管理工作。比如:将一个进程从阻塞 队列添加到就绪队列时,修改阻塞队列中此进程的状态为就绪态之后,应当将其从阻塞队列移 至就绪队列,如果不是一气呵成,可能出现状态为就绪态,但仍处于阻塞队列的情况。
如何实现原语的“原子性”
- 用“关中断指令”和“开中断指令”这两个特权指令实现原子性
- 正常情况:CPU每执行完一条指令都会例行检查是否有中断信号需要处理,如果有, 则暂停运行当前这段程序,转而执行相应的中断处理程序。
- CPU执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后才会恢复检查。 这样,关中断、开中断 之间的这些指令序 列就是不可被中断的,这就实现了“原子性“
进程控制相关的原语
无论哪种原语实现进程控制,所要做的事情有三类:
更新PCB中的信息
- 所有的进程控制原语一定都会修改进程状态标志
- 剥夺当前运行进程的CPU使用权必然需要保存其运行环境
- 某进程开始运行前必然要恢复其之前的运行环境
将PCB插入到合适的队列
分配/回收资源
进程的创建
进程的终止
进程的阻塞和唤醒
进程的切换
程序是如何运行的
问题:执行完指令2后,另一个进程开始上CPU运行。 之后还怎么切换回之前的进程????
注意:另一个进程在运行过程中也会使用各个寄存器
解决办法:在进程切换时先在PCB中保存这个进程的运行环境(保存一些必要的寄存器信息),如:PSW:xxxxx,PC:指令4的地址,通用寄存器:2。当原来的进程再次投入运行时,可以通过PCB恢复它的运行环境
小结
进程通信
什么是进程通信
- 进程通信就是指进程之间的信息交换。
- 进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。
- 为了保证安全,一个进程不能直接访问另一个进程的地址空间。 但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。
进程通信的方法
共享存储
- 两个进程对共享空间的访问必须是互斥的(互斥访问通过操 作系统提供的工具实现)。
- 操作系统只负责提供共享空间和同步互斥工具(如P、V操作)
- 基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式
- 基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制, 而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。
管道通信
管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
各进程要互斥地访问管道。
数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read()系统调用将被阻塞。
如果没写满,就不允许读。如果没读空,就不允许写。
数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。
消息传递
- 进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
小结
线程、多线程
什么是线程
线程的特性和优点
- 进程间并发,开销很大;线程间并发,开销更小
- 引入线程机制后,并发带来的系统开销降低,系统并发性提升
- 当切换进程时,需要保存/恢复进程运行 环境,还需要切换内 存地址空间(更新快表、更新缓存)
- 同一进程内的各个线程间并发,不需要切换进程运行环 境和内存地址空间,省时省力
- 注意:从属于不同进程的线程间切换,也会导致进程的切换!开销也大!
- 从属同一进程的各个线程共享进程拥有的资源。
- 引入线程前,进程既是资源分配的基本单位,也是调度的基本单位。
- 引入线程后,进程是资源分配的基本单位,线程是调度的基本单位。
- 线程也有运行态、就绪态、阻塞态
- 在多CPU环境下,各个线程也可以分派到不同的CPU上并行地执行。
- 引入线程后,进程是资源分配的基本单位。而线程几乎不拥有资源,只拥有极少量的资源(线程控制块TCB、寄存器信息、堆栈等)
- 传统的进程是程序 执行流的最小单位;引入线程后,线程成为了程序执行流的最小单位
为什么要引入线程
- 可以把线程理解为“轻量级进程”。
- 线程是一个基本的CPU执行单元,也是程序执行流的最小单位。
- 引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件)
- 引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。
- 线程则作为处理机的分配单元。
线程的实现方式
用户级线程(User-Level Thread, ULT)
- 用户级线程由应用程序通过线程库实现。
- 所有的线程管理工作都由应用程序负责(包括线程切换)
- 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
- 在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。(用户级线程对用户不透明,对操作系统透明)
- 可以这样理解,“用户级线程”就是“从用户视角看能看到的线程”
内核级线程(Kernel-Level Thread, KLT)
- 又称“内核支持的线程”
- 内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此,内核级线程的切换必然需要在核心态下才能完成。
- 可以这样理解,“内核级线程”就是“从操作系统内核视角看能看到的线程”
组合方式
- 在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n个用户级线程映射到m个内核级线程上( n >= m)
重点重点重点
: 操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。- 例如:上边这个模型中,该进程由两个内核级线程,三个用户级 线程,在用户看来,这个进程中有三个线程。但即使该进程在一 个4核处理机的计算机上运行,也最多只能被分配到两个核,最多只能有两个用户线程并行执行。
多线程模型
在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”问题。
多对一
- 多对一模型:多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
- 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
- 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行
一对一
- 一对一模型:一个用户及线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
- 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
- 缺点:一个用户进程会占用多个内核级线程, 线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
多对多
- 多对多模型:n 用户及线程映射到 m 个内核级线程(n >= m)。每个用户进程对应 m 个内核级线程。
- 克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。