操作系统-Part5——I/O 管理

[TOC]

I/O 管理概述

I/O 设备的基本概念和分类

image-20211115162634513

  • UNIX 系统将外部设备抽象为一种特殊的文件,用户可以使用与文件操作相同的方式对外部设备进行操作。
    • Write 操作:向外部设备写出数据
    • Read 操作:从外部设备读入数据
  • I/O 设备的分类
    • 按使用特性
      • 人机交互类外设
      • 存储设备
      • 网络通信设备
    • 按传输速率分类
      • 低速设备(鼠标、键盘)
      • 中速设备(激光打印机)
      • 高速设备(磁盘)
    • 按信息交换的单位分类
      • 块设备(磁盘)
        • 传输速率较高,可寻址
      • 字符设备(鼠标、键盘)
        • 传输速率较慢,不可寻址
        • 常采用中断驱动方式

I/O 控制器

image-20211115171623799

  • I/O 设备的组成
    • 机械部件
      • 主要用来执行具体 I/O 操作。
    • 电子部件
      • 通常是一块插入主板扩充槽的印刷电路板。
      • 包括 I/O 控制器(设备控制器)
  • I/O 控制器的功能:
    • 接受和识别 CPU 的命令
      • CPU发来的 read/write 命令,I/O 控制器中会有相应的控制寄存器来存放命令和参数。
    • 想 CPU 报告设备的状态
      • I/O 控制器中会有相应的状态寄存器,用于记录 I/O 设备的当前状态。
    • 数据交换
      • I/O 控制器中设置相应的数据寄存器。用于暂存输入输出时的数据。
    • 地址识别
      • 为了区分设备控制器中的各个寄存器,也需要给各个寄存器设置特定的地址
  • I/O 控制器的组成
    • image-20211115171448414
    • 一个 I/O 控制器可能会对应多个设备;
    • 数据寄存器、控制寄存器、状态寄存器可能有多个(每个控制/状态寄存器对应一个具体的设备),且这些寄存器都要有相应的地址,才能方便CPU操作。
      • 有的计算机会让这些寄存器占用内存地址的一部分,称为内存映像 I/O;另一些计算机则采用 I/O 专用地址,即寄存器独立编址
  • 内存映像 I/O v.s. 寄存器独立编址
    • image-20211115171837978

I/O 控制方式

image-20211115201702719

  • 程序直接控制方式
    • 完成一次读/写操作的流程
      • image-20211115194455982
    • CPU 干预的频率
      • 很频繁,I/O 操作开始之前完成之后需要 CPU 介入,并且在等待 I/O 完成的过程中 CPU 需要不断地轮询检查。
    • 数据传送的单位
      • 每次读/写一个字
    • 数据的流向
      • 读操作(数据输入):I/O 设备 -> CPU -> 内存
      • 写操作(数据输出):内存 -> CPU -> I/O 设备
      • 每个字的读/写都需要 CPU 的帮助
    • 主要缺点和主要优点
      • 优点:实现简单。
      • 缺点:CPU 和 I/O 设备只能串行工作,CPU 需要一直轮询检查,长期处于忙等状态 ,CPU 利用率低
  • 中断驱动方式
    • 完成一次读/写操作的流程
      • image-20211115195236013
      • 引入中断机制。将等待 I/O 的进程阻塞在每个指令周期的末尾检查中断
    • CPU 干预的频率
      • 每次 I/O 操作开始之前完成之后需要 CPU 介入。
      • 而等待 I/O 完成的过程中 CPU 可以切换到别的进程执行。
    • 数据传送的单位
      • 每次读/写一个字
    • 数据的流向
      • 读操作(数据输入):I/O 设备 -> CPU -> 内存
      • 写操作(数据输出):内存 -> CPU -> I/O 设备
    • 主要缺点和主要优点
      • 优点:通过 I/O 控制器主动发出中断信号报告 I/O 已完成,CPU 不再需要不停地轮询。CPU 和 I/O 设备并行工作,CPU 利用率明显提升。
      • 缺点:每个字在 I/O 设备与内存之间的传输,都需要经过 CPU。而频繁的中断处理会消耗较多的 CPU 时间
  • DMA( Direct Memory Access,直接存储器存取)方式
    • DMA 控制器
      • image-20211115200414017
      • DR(Data Register,数据寄存器):暂存从设备到内存,或从内存到设备的数据。
      • MAR(Memory Address Register,内存地址寄存器):在输入时,MAR 表示数据应放到内存中的什么位置;输出时 MAR 表示要输出的数据放在内存中的什么位置。
      • DC(Data Counter,数据计数器):表示剩余要读/写的字节数。
      • CR(Command Register,命令/状态寄存器):用于存放 CPU 发来的 I/O 命令,或设备的状态信息。
    • 完成一次读/写操作的流程
      • image-20211115195617190
      • DMA 读写完之后,向 CPU 发出中断信号
    • CPU 干预的频率
      • 仅在传送一个或多个数据块的开始结束时,才需要 CPU 干预。
    • 数据传送的单位
      • 每次读/写一个或多个块
      • 注意:每次读写的只能是连续的多个块,且这些块读入内存后在内存中也必须是连续的
    • 数据的流向(不再需要经过CPU)
      • 读操作(数据输入):I/O 设备 -> 内存
      • 写操作(数据输出):内存 -> I/O 设备
    • 主要缺点和主要优点
      • 优点:
        • 数据传输单位为“块”,而不是“字”。
        • 数据在 I/O 与内存之间的传输不需要经过 CPU,CPU 介入频率降低数据传输效率增加
        • CPU 和 I/O 设备的并行性得到提升
      • 缺点:
        • CPU 每发出一条 I/O 指令,只能读/写一个或多个连续(而不能离散)的数据块
        • 如果要读/写多个离散存储的数据块,或者要将数据分别写到不同的内存区域时,CPU 要分别发出多条 I/O 指令,进行多次中断处理才能完成。
  • 通道控制方式
    • 通道(弱化 CPU)可以识别并执行一系列通道指令
      • image-20211115201531964
      • CPU 向通道发出 I/O 指令。指明通道程序在内存中的位置,并指明要操作的是哪个 I/O 设备
      • 通道执行内存中的通道程序(其中指明了要读入/写出多少数据,读/写的数据应放在内存的位置等信息,相当于任务清单
      • 通道执行完规定的任务后,向 CPU 发出中断信号
    • 完成一次读/写操作的流程
      • image-20211115200740547
    • CPU 干预的频率
      • 极低,通道会根据 CPU 的指示执行相应的通道程序,只有完成一组数据块的读/写后才需要发出中断信号,请求 CPU 干预。
    • 数据传送的单位
      • 每次读/写一组数据块
    • 数据的流向(在通道的控制下进行)
      • 读操作(数据输入):I/O 设备 -> 内存
      • 写操作(数据输出):内存 -> I/O 设备
    • 主要缺点和主要优点
      • 缺点:实现复杂,需要专门的通道硬件支持
      • 优点:CPU、通道、I/O 设备可并行工作,资源利用率很高

I/O 软件层次结构

image-20211115202052358
  • 用户层软件

    • 用户层软件实现了与用户交互的接口,用户可直接使用该层提供的、与 I/O 操作相关的库函数对设备进行操作
    • 用户层软件将用户请求翻译成格式化的 I/O 请求,并通过系统调用请求操作系统内核的服务
  • 设备独立性软件

    • 设备独立性软件,又称设备无关性软件。与设备的硬件特性无关的功能几乎都在这一层实现。
    • 主要实现的功能:
      • 向上层提供统一的调用接口(如 read/write 系统调用)
      • 设备的保护(访问权限)
      • 差错处理
      • 设备的分配与回收(临界资源)
      • 数据缓冲区管理(屏蔽设备之间数据交换单位大小和传输速度的差异)
      • 建立逻辑设备表(LUT,Logical UnitTable),包含逻辑设备名到物理设备名的映射关系、根据设备类型选择调用相应的驱动程序
        • image-20211115203148579
        • 操作系统系统可以采用两种方式管理逻辑设备表(LUT):
          1. 整个系统设置一张 LUT,意味着所有用户不能使用相同的逻辑设备名,因此只适用于单用户操作系统。
          2. 每个用户设置一张 LUT,各个用户使用的逻辑设备名可以重复,适用于多用户操作系统。系统在用户登录时为其建立一个用户管理进程,而 LUT 就存放在用户管理进程的 PCB 中。
  • 设备驱动程序

    • 负责对硬件设备的具体控制,将上层发出的一系列命令转化成特定(不同厂家)设备的命令。
    • 包括设置设备寄存器检查设备状态
    • 驱动程序一般会以一个独立进程的方式存在。
  • 中断处理程序

    • image-20211115205824849
    • 当 I/O 任务完成时,I/O 控制器会发送一个中断信号,系统会根据中断信号类型找到相应的中断处理程序并执行。
  • 最常考的是设备独立性软件、设备驱动程序这两层。

    • 直接涉及到硬件具体细节、且与中断无关的操作肯定是在设备驱动程序层完成的
    • 没有涉及硬件的、对各种设备都需要进行的管理工作都是在设备独立性软件层完成的
    • image-20211115210124001

I/O 核心子系统

I/O 子系统概述

  • image-20211115210745581
  • 考研中,需要重点理解和掌握的功能是:
    • I/O 调度
      • 类比磁盘调度
      • 先来先服务算法、优先级算法、短作业优先等
    • 设备保护
      • 类比文件保护功能
      • 设备被看做是一种特殊的文件,每个设备也会有对应的 FCB。
      • 当用户请求访问某个设备时,系统根据 FCB 中记录的信息来判断该用户是否有相应的访问权限,以此实现“设备保护”的功能。
    • 假脱机技术(SPOOLing技术)
    • 设备分配与回收
    • 缓冲区管理(即缓冲与高速缓存)

假脱机技术

image-20211115210955966

  • 脱机技术 —— 脱离主机的控制进行的输入/输出操作。
    • image-20211115214348914
    • 缓解 CPU 与慢速 I/O 设备的速度矛盾。
    • 实现 I/O 设备与 CPU 的并行。
  • 假脱机技术(SPOOLing 技术)
    • image-20211115213754105
    • 输入井:模拟脱机输入时的磁带,用于收容 I/O 设备输入的数据
    • 输出井:模拟脱机输出时的磁带,用于收容用户进程输出的数据
    • 磁盘上开辟出两个存储区域 —— 输入井和输出井。
    • 输入进程:模拟脱机输入时的外围控制机
    • 输出进程:模拟脱机输出时的外围控制机
    • 要实现 SPOOLing 技术,必须要有多道程序技术的支持。系统会建立输入进程和输出进程。
    • 输入缓冲区:用于暂存从输入设备输入的数据,之后再转存到输入井中
    • 输出缓冲区:用于暂存从输出井送来的数据,之后再传送到输出设备上
    • 输入缓冲区和输出缓冲区是在内存中的缓冲区
  • 共享打印机
    • SPOOLing 技术可以把一台物理设备虚拟成逻辑上的多台设备,可以将独占式设备改造成共享设备
      1. 在磁盘输出井中为进程申请一个空闲缓冲区(这个缓冲区是在磁盘上的),并将要打印的数据送入其中;
      2. 为用户进程申请一张空白的打印请求表,并将用户的打印请求填入表中(用来说明用户的打印数据存放位置等信息),再将该表挂到假脱机文件队列上。
      3. 当打印机空闲时,输出进程会从文件队列的队头取出一张打印请求表,并根据表中的要求将要打印的数据从输出井传送到输出缓冲区,再输出到打印机进行打印。
    • image-20211116140746931

设备的分配与回收

image-20211116141015539

  • 设备分配时应考虑的因素

    • 设备的固有属性
      • 独占设备:一个时段只能分配给一个进程,只允许各个进程串行使用(如打印机)
      • 共享设备:可同时分配给多个进程使用(如磁盘),各进程往往是宏观上同时共享使用设备,而微观上交替使用。
      • 虚拟设备:采用 SPOOLing 技术将独占设备改造成虚拟的共享设备,可同时分配给多个进程使用(如采用 SPOOLing 技术实现的共享打印机)
    • 设备分配算法
      • 先来先服务
      • 优先级高者优先
      • 短任务优先
      • ……
    • 设备分配中的安全性
      • 安全分配方式:为进程分配一个 I/O 设备后就将进程阻塞,本次 I/O 完成后才将进程唤醒。
        • 一个时段内每个进程只能使用一个设备
        • 优点:破坏了“请求和保持”条件,不会死锁
        • 缺点:对于一个进程来说,CPU 和 I/O 设备只能串行工作
      • 不安全分配方式:进程发出 I/O 请求后,系统为其分配 I/O 设备,并且进程可继续执行,之后还可以发出新的 I/O 请求。只有某个 I/O 请求得不到满足时才将进程阻塞。
        • 一个进程可以同时使用多个设备
        • 优点:进程的计算任务和 I/O 任务可以并行处理
        • 缺点:有可能发生死锁(死锁避免、死锁的检测和解除)
  • 静态分配与动态分配

    • 静态分配:进程运行前为其分配全部所需资源,运行结束后归还资源
      • 破坏了“请求和保持”条件,不会发生死锁
    • 动态分配:进程运行过程中动态申请设备资源
  • 设备分配管理中的数据结构

    • 设备、控制器、通道之间的关系:
      • 一个通道控制多个控制器,一个控制器控制多个设备
      • image-20211116142938193
    • 设备控制表(DCT):系统为每个设备配置一张 DCT,用于记录设备情况
      • 系统会根据阻塞原因不同,将进程 PCB 挂到不同的阻塞队列中
      • image-20211116143032613
    • 控制器控制表(COCT):每个设备控制器都会对应一张 COCT。操作系统根据 COCT 的信息对控制器进行操作和管理。
      • image-20211116143127155
    • 通道控制表(CHCT):每个通道都会对应一张 CHCT。操作系统根据 CHCT 的信息对通道进行操作和管理。
      • image-20211116143209860
    • 系统设备表(SDT):记录了系统中全部设备的情况,每个设备对应一个表目。
      • image-20211116143256935
  • 设备分配的步骤

    • 步骤:

      1. 根据进程请求的物理设备名查找 SDT(注:物理设备名是进程请求分配设备时提供的参数)
      2. 根据 SDT 找到 DCT,若设备忙碌则将进程 PCB 挂到设备等待队列中,不忙碌则将设备分配给进程。
      3. 根据 DCT 找到 COCT,若控制器忙碌则将进程 PCB 挂到控制器等待队列中,不忙碌则将控制器分配给进程。
      4. 根据 COCT 找到 CHCT,若通道忙碌则将进程 PCB 挂到通道等待队列中,不忙碌则将通道分配给进程。
    • 注意:只有设备、控制器、通道三者都分配成功时,这次设备分配才算成功,之后便可启动 I/O 设备进行数据传送

    • 缺点:

      • 用户编程时必须使用物理设备名,底层细节对用户不透明,不方便编程
      • 若换了一个物理设备,则程序无法运行
      • 若进程请求的物理设备正在忙碌,则即使系统中还有同类型的设备,进程也必须阻塞等待
  • 设备分配步骤的改进方法

    • 改进方法:建立逻辑设备名与物理设备名的映射机制,用户编程时只需提供逻辑设备名
      • image-20211116144907464
    • 分配步骤
      1. 根据进程请求的逻辑设备名查找 SDT(注:用户编程时提供的逻辑设备名其实就是“设备类型”)
      2. 查找 SDT,找到用户进程指定类型的且空闲的设备,将其及其 DCT 分配给该进程。
        • 操作系统在逻辑设备表(LUT)中新增一个表项记录该次调用的逻辑设备名和物理设备名的映射关系
        • 在这一步,操作系统动态分配物理设备,并返回相应 DCT。
        • 之后用户进程再次通过相同的逻辑设备名,操作系统通过 LUT 表的记录也可以找到对应的物理设备。
      3. 根据 DCT 找到 COCT,若控制器忙碌则将进程 PCB 挂到控制器等待队列中,不忙碌则将控制器分配给进程。
      4. 根据 COCT 找到 CHCT,若通道忙碌则将进程 PCB 挂到通道等待队列中,不忙碌则将通道分配给进程。
    • 逻辑设备表的设置问题:
      • 整个系统只有一张 LUT:各用户所用的逻辑设备名不允许重复,适用于单用户操作系统
      • 每个用户一张 LUT:不同用户的逻辑设备名可重复,适用于多用户操作系统

缓冲区管理

image-20211116150127920

  • 缓冲区的定义
    • 缓冲区是一个存储区域,可以由专门的硬件寄存器组成,也可利用内存作为缓冲区。
      • 使用硬件作为缓冲区的成本较高,容量也较小,一般仅用在对速度要求非常高的场合(如,存储器管理中所用的联想寄存器,快表)
      • 一般情况下,更多的是利用内存作为缓冲区,“设备独立性软件”的缓冲区管理就是要组织管理好内存中的缓冲区
  • 缓冲区的作用
    • 缓和 CPU 与 I/O 设备之间速度不匹配的矛盾
    • 减少对 CPU 的中断频率,放宽对 CPU 中断响应时间的限制
      • 字符型设备,每输出完一个字符就要向 CPU 发送一次中断信号
    • 解决数据粒度不匹配的问题
      • 输出进程每次可以生成一块数据,但 I/O 设备每次只能输出一个字符
    • 提高 CPU 和 I/O 设备之间的并行性
  • 单缓冲
    • 单缓冲策略,操作系统会在主存中为其分配一个缓冲区
    • 注意:
      • 当缓冲区数据非空时,不能往缓冲区冲入数据,只能从缓冲区把数据传出
      • 当缓冲区为空时,可以往缓冲区冲入数据,但必须把缓冲区充满以后,才能从缓冲区把数据传出
      • 一般来说,一个缓冲区的大小就是一个块,用户进程的工作区大小与缓冲区相同
    • image-20211116154946154
    • image-20211116154847194
    • 技巧:假定一个初始状态,分析下次到达相同状态需要多少时间,这就是处理一块数据平均所需时间
      • 采用单缓冲策略,处理一块数据平均耗时 Max(C, T)+M
  • 双缓冲
    • 双缓冲策略,操作系统会在主存中为其分配两个缓冲区
    • image-20211116155441445
    • image-20211116155706436
    • 当 M+C>T,则很难有回到初始状态,但是通过图中观察可发现,周期为 M+C。
      • **采用双缓冲策略,处理一个数据块的平均耗时为 Max (T, C+M)**。
  • 使用单/双缓冲在通信时的区别
    • 两台机器之间通信时,可以配置缓冲区用于数据的发送和接受。
      • 若两个相互通信的机器只设置单缓冲区,在任一时刻只能实现数据的单向传输
      • 若两个相互通信的机器设置双缓冲区,则同一时刻可以实现双向的数据传输
      • 管道通信中的“管道”其实就是缓冲区。要实现数据的双向传输,必须设置两个管道
      • ==这里与part2说法冲突todo==
  • 循环缓冲
    • 将多个大小相等的缓冲区链接成一个循环队列。
    • image-20211116162507957
  • 缓冲池
    • 缓冲池由系统中共用的缓冲区组成。这些缓冲区按使用状况可以分为:空缓冲队列、装满输入数据的缓冲队列(输入队列)、装满输出数据的缓冲队列(输出队列)。
    • 另外,根据一个缓冲区在实际运算中扮演的功能不同,又设置了四种工作缓冲区:用于收容输入数据的工作缓冲区(hin)、用于提取输入数据的工作缓冲区(sin)、用于收容输出数据的工作缓冲区(hout)、用于提取输出数据的工作缓冲区(sout)
    • image-20211116163116910