文档库 最新最全的文档下载
当前位置:文档库 › 系统结构_复习

系统结构_复习

系统结构_复习
系统结构_复习

第一章计算机系统结构的基本概念

1986年到2002年,体系结构进步主要依赖于什么技术?

出现RISC技术、依靠指令级并行和Cache

2002年以后,计算机性能提高速度降低的原因是什么?

2002年以后,由于功耗,指令级并行和存储延迟进展缓慢,性能提高降到20%。这一时期线程级并行和数据级并行成为主要的改进方向

现代计算机为什么不再采用微型机、小型机和大型机的分类方法?现在如何分类?

小型计算机已经被基于微处理器的服务器取代,多处理器系统已经取代了大型机,甚至巨型机也可以由多个高性能微处理器(集群)构成;

目前一般把计算机分为3类:

? 1 桌面计算机:追求性价比为主

? 2 服务器:可靠性和可扩展性是关键

? 3 嵌入式计算机:以最低价格满足实际性能要求,实时性、最小的存储器和最小的功耗是其关键特性

不同角度所看到的计算机系统的属性是不同的,对不对?

对,从不同角度所看到的计算机系统的属性是不同的,它是一个”虚拟计算机”。

主要观察角度包括:应用程序员,系统程序员,硬件设计人员。

对计算机系统的认识通常只需要在某一个层次上。

透明性的判断(判断题)

定义:本来存在的事物或属性,从某种角度看似乎不存在

例如:CPU类型、型号、主存储器容量等

对应用程序员透明

对系统程序员、硬件设计人员等不透明

例如:浮点数表示、乘法指令

对高级语言程序员、应用程序员透明

对汇编语言程序员、机器语言程序员不透明

例如:数据总线宽度、微程序

对汇编语言程序员、机器语言程序员透明

对硬件设计人员、计算机维修人员不透明。

理解系统结构的概念

计算机系统结构定义一:

程序员所看到的计算机系统的属性, 即概念性结构和功能特性

程序员:系统程序员(包括:汇编语言、机器语言、编译程序、操作系统)

看到的:编写出能在机器上正确运行的程序所必须了解到的。

计算机系统结构定义二:

计算机系统由软件、硬件和固件组成,它们在功能上是同等的

同一种功能可以用硬件实现,也可以用软件或固件实现

计算机系统结构研究的是软硬件功能分配和对软硬件界面的确定。

计算机系统结构、组成和实现

计算机组成是指计算机系统结构的逻辑实现(确定功能部件的并行度;设计缓冲和排队策略等);计算机实现是指计算机组成的物理实现(处理机、主存储器等部件的物理结构等);

三者关系:三者各自包含不同的内容,但又有着紧密的联系。一种系统结构可

以有多种组成,同样,一种组成可以有多种物理实现。系统结构设计不应该对组成、实现技术的采用与发展有过多或不合理的限制;计算机组成与实现是可以折衷权衡的;系统结构的设计与硬件的设计不可混淆;三者的内容不同时期会有所变化。

关系:外特性 ——— 内特性 ——— 物理实现

1:n 1:n

当前体系结构的研究已远超了指令集体系结构,对不对?

对,过去体系结构通常指指令系统的设计,实际上是指令集体系结构,由于计算机应用领域的扩展,计算机体系结构的研究已经扩展到许多组成和实现的内容。

学会系统结构的3种分类方法

1 弗林(Flynn)分类法

通过指令流(Instruction stream,IS) 和数据流(Data stream ,DS)进行分类

SISD(Single IS Single DS),SIMD(Single IS Multiple DS)

MISD(Multiple IS Single DS),MIMD(Multiple IS Multiple DS)

2 冯氏分类法

冯氏分类法按最大并行度分类

最大并行度(Pm)指单位时间内能处理的最大二进制位数,可分为:

字串位串WSBS(Word serial and bit serial);字并位串WPBS(Word parallel and bit serial);字串位并WSBP(Word serial and bit parallel );字并位并WPBP(Word parallel and bit parallel)

3汉德勒(H?ndler)分类法

根据并行度和流水线提出的一种分类法。

t(系统型号)=(k,d,w):程序控制部件(PCU)的个数k ;算术逻辑部件(ALU)或处理部件(PE)的个数d ;每个算术逻辑部件包含基本罗辑线路(ELC)的套数w ,如加法器位数。 t(系统型号)=(k ×k …,d ×d ?,w ×w …) :有流水线::k'表示宏流水线中程控部件的个数; d'表示指令流水线中算术逻辑部件的个数;w …表示操作流水线中基本逻辑线路的套数。 Cray1有1个CPU ,12个相当于ALU 或PE 的处理部件,最多8级流水线,字长为64位,可以实现1~14位流水线。表示为:t(Cray1)=(1,12×8,64(1~14))。

学会计算加速比 Amdahl 定律

Amdahl 定律认为:系统中改进某一部件对整个系统性能的提高与这种部件的使用频率或占总执行时间的比例有关。

例题一: 性能没有采用改进措施前的采用改进措施后的性能加速比=任务的时间采用改进措施后执行某行某任务的时间没有采用改进措施前执=n

T T 0=时间改进前整个任务的执行可改进部分占用的时间=e F 时间

改进后改进部分的执行时间改进前改进部分的执行=e S )1(*Se Fe Fe T T o n +-=Se Fe Fe T To S n n +-==)1(1

假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?

解:由题意可知:Fe=0.4, Se=10,根据Amdahl 定律

例题二:

假设FPSQR 操作占整个测试程序执行时间的20%。一种方法是采用FPSQR 硬件,使FPSQR 操作的速度加快到10倍。另一种实现方法是使所有浮点数据指令的速度加快,使FP 指令的速度加快到1.6倍,FP 指令占整个执行时间的50%。

请比较这两种设计方案。采用哪种实现技术来求浮点数平方根FPSQR 的操作对系统的性能影响较大。

解:分别计算出这两种设计方案所能得到的加速比

学会使用cpu 性能公式

CPU 的执行时间取决于三个要素:①时钟频率f(或时钟周期t);②每条指令所花的时钟周期数CPI ;③指令条数IC

课件P6.。。。例题1.3 1.4 1.5

同一种指令的CPI 是一定的吗?

同一种指令的CPI 由于流水线、Cache 等原因并不固定

访问的局部性分为哪2种,具体指的是什么

局部性分时间上的局部性和空间上的局部性。

时间上的局部性是指最近访问过的代码是不久将被访问的代码。

空间上的局部性是指那些地址上相邻近的代码可能会被一起访问。

存储系统的构成就是以访问的局部性原理为基础的。

列举几种计算机系统中的并行

采用并行性是改善计算机性能的重要方法

系统级并行,例如多处理器和多磁盘技术,可以实现更大的吞吐量,而处理器和磁盘都可增加数目(可扩展性),对服务器来说具有重要价值。===单一处理器层面,一般采用指令级并行来提高性能,指令级并行的代表技术是流水线。===在数字电路设计层面可以发掘并行性,比如,组相联的Cache 可以同时使用多个存储块,先行进位链能够加速求和的过程。

计算机中的软硬件的发展趋势是怎样的?

软硬件发展趋势:硬件实现的比例越来越高;硬件所占的成本越来越低;软硬件的界面在上升.

系统结构的设计者不需要关注实现技术,对吗?

不对,系统结构的设计者还应关注实现技术和计算机应用方面的重要发展趋势。因为这些发展趋势不仅影响机器未来的成本,也影响到所设计的系统结构的发展周期。 现代的计算机系统通常是由下往上、由上往下、还是由中间开始设计的?这个中间

56.164.0110

4.06.01≈=+=n S 22.182.0110

2.0)2.01(1==+-=FPSQR S 2

3.18125.016

.15.0)5.01(1==+-=FP S

是指什么?

由中间层开始设计其实就是由体系结构开始设计,是目前计算机的主要设计方法。

评价一个计算机系统结构好坏的标准主要是哪两个指标?

评价一个计算机系统结构好坏的标准主要是性能和成本这两个指标。

衡量机器性能的唯一固定而且可靠的标准就是真正执行程序的时间。这个时间有哪2种?

时间分为响应时间和CPU时间,要根据需要选择:

响应时间指完成任务的全部时间,包括磁盘、存储器、I/O设备访问和操作系统开销等;CPU时间指任务在CPU上消耗的时间,不包括I/O等待和执行其它优先级更高任务的时间。

学会MIPS的计算,举例说明为什么MIPS值可能和性能相反

MIPS 表示每秒百万指令条数。对于一个给定的程序,MIPS 定义为:课件P8

主要优点:直观、方便。目前还经常使用

主要缺点:(1) 指令集不同时不准确,依赖于指令集合;(2) 指令使用频度差别很大,依赖于程序;(3) 可能和性能相反,如用软硬件分别实现浮点运算

MFLOPS不能体现机器的整体性能,对吗,举例说明

MFLOPS即每秒百万次浮点操作次数。对。

MFLOPS 仅仅只能用来衡量机器浮点操作的性能,而不能体现机器的整体性能。例如编译程序,不管机器的性能有多好,它的MFLOPS不会太高。

求平均性能时,什么时候用算术平均、调和平均和几何平均?(课件P9)

平均执行时间是各执行时间的算术平均值。

如果性能是用速度(例如MIPS和MFLOPS)表示,那么平均时间是调和平均SPECRatio是一个比率,没有单位,算术平均没有意义,必须用几何平均计算。

使用参考机器比较机器性能时,和参考机器的性能有关吗?无关(课件公式)

一个平均数是否能表示一个基准测试程序测量出的性能,用什么作指标?

一个平均数是否能表示一个基准测试程序测量出的性能,可以标准偏差的大小作为指标。(算术标准偏差能帮助我们评价其数据接近标准正态分布的程度,从而达到评价测试性能值的准确度的目的。数值越小,准确度越高。)

系列机和兼容机有相同的体系结构,对不对?的区别是什么

对。==系列机是同一个厂家生产的具有相同系统结构,不同的组成和实现技术的一系列不同型号的机器。不同的组成和实现只是性能和价格不同,他们的系统结构是相同的。==兼容机是不同厂家生产的具有相同系统结构,不同的组成和实现技术的性价比不同的机器。

几种兼容的概念

向上(下)兼容是指按某档机器编制的程序,不加修改就能运行于比它高(低)档的机器

向前(后)兼容是指按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之前(后)投入市场的机器

模拟和仿真哪个速度更快,哪个需要硬件支持?

模拟是用软件方法在一台现有机器上实现另一台机器的指令系统。==仿真是用微程序直接解释另一台机器的指令系统的方法。==模拟方法速度低,仿真方法速度高,但仿真需要硬件支持,系统结构差别大的机器难于完全用仿真方法来实现。==通常把2种方法混合起来,尽可能用仿真的方法,无法仿真的指令再用模拟方法实现。

计算机性能的发展,带宽和时延哪个进步更快?

性能发展趋势:带宽优于时延。(带宽或吞吐量:在给定时间内所完成的工作总量

时延或响应时间:从事件开始到完成所需要的时间。)

集成电路的加工工艺是用什么来表示的?

集成电路的加工工艺是用特征尺寸来表示的,特征尺寸即CPU表面电路的特征线宽。

晶体管密度和特征尺寸大小的平方成反比。

学会集成电路动态和静态功率的计算。

集成电路最主要的功耗来自开关晶体管,称为动态功率:

功率动态= 1/2×电容负载×电压2×开关频率

晶体管停止工作时,仍然会有泄漏电流,这时芯片消耗的是静态功率。

功率静态= 电流静态×电压

了解晶片的成品数的计算方法。

晶片的成本增长速度大体与晶片面积增长速度的平方成正比,对吗?

对。晶片的成本增长速度大体与晶片面积增长速度的平方成正比。

第二章指令系统

指令系统的概念是什么?

指令系统是计算机所有机器指令的集合,是软硬件的之间的主要分界面。

目前指令系统与软件之间的语义差距越来越大,对不对?

指令系统与软件之间存在语义差距,目前差距越来越大。

数据表示和数据结构的区别

数据表示:指计算机硬件能够直接识别,可以被指令系统直接调用的那些数据类型,是由硬件实现的数据类型。

数据结构:指面向计算机系统软件、面向应用领域所需处理的数据类型,是由软件实现的数据类型。

会计算浮点数的表数范围、表数精度和表数效率

(见课件P13 浮点数的表数范围,精度,效率)

如果不采用隐藏位,基数为2时,表数效率最低,对吗?

采用隐藏位,基数为几时,则3个参数都达到最好?

多数机器的尾数采用原码、小数表示,阶码一般机器都采用整数、移码表示,对吗?是

了解5种舍入法。哪种最简单,哪种最复杂最精确,哪种一般用于软件等。P15 恒舍法、恒置法、下舍上入法、R*舍入法、查表法; P16 比较:恒舍法最简单

R*舍入法最复杂最精确;下舍上入法一般用于软件实现

警戒位什么时候使用?不设置警戒位,可能出现很大的误差或造成完全错误的运算结果,对吗1)P17警戒位在舍入和左规时使用 2)是

警戒位需要多少位?代价很大吗?P17

计算机中的操作数类型通常是由硬件解释的,对吗?

是,数据类型通过指令中的操作码来解释

带标志符的数据表示法和数据描述符表示法都属于自定义数据表示方法,对吗?是 P18

自定义数据表示方法:

1)数据上有一个由硬件解释的表示数据类型的符号

2)包括带标志符的数据表示方法(针对一个数据,如R-2计算机)和数据描述符表示法(针对一组数据,如B-6700计算机)

测试表明程序中访问的数据大多是字节类型,对吗不对

寻址技术主要内容是什么?

寻找操作数及其他信息地址的技术称为寻址技术,主要包括:编址方式、寻址方式和定位方式。

计算机一般按字节编址,按字访问,对吗P18是

X86处理器有几个零地址空间?都是什么? P19

零地址空间个数:

三个零地址空间:通用寄存器、主存储器和输入输出设备均独立编址

两个零地址空间:主存储器与输入输出设备统一编址

一个零地址空间:所有存储设备统一编址,最低端是通用寄存器,最高端是输入输出设

备,中间为主存储器

隐含编址方式(堆栈计算机),实际上没有零地址空间:堆栈

高位交叉和低位交叉编址的主要目的分别是什么?P19

高位交叉编址:主要目的是用来扩大存储器容量。

低位交叉编址:主要目的是提高存储器速度。

立即寻址的使用频率很低,对吗?

各种存储器寻址方式的使用频率

存储器寻址方式数据对齐的原因是什么?

存储器寻址方式通常是数据对齐的,不对齐会导致硬件的复杂性,即使是支持不对齐的机器,对齐的指令也会运行的更快

间接寻址方式与变址寻址方式差别及优缺点

对于程序员,两种寻址方式的主要差别是:

间址寻址方式:间接地址在主存中,无偏移量

变址寻址方式:基地址在变址寄存器中,有偏移量

主要优缺点比较:

采用变址寻址方式编写的程序简单、易读。

实现的难易程度:间址寻址方式容易

指令的执行速度:间址寻址方式慢

对数组运算的支持:变址寻址方式比较好

自动变址:在访问间接地址过程中,地址自动增减

寄存器寻址和堆栈寻址的优缺点 P20

寄存器寻址方式

主要优点:指令字长短、指令执行速度快、支持向量和矩阵运算并能提高其速度

主要缺点:现场切换困难、硬件复杂,如果寄存器不对称,不利于优化编译

堆栈的寻址方式

主要优点:指令字长短、指令执行速度快、支持向量和矩阵运算并能提高其速度

主要缺点:现场切换困难、硬件复杂,如果寄存器不对称,不利于优化编译

理解程序的3种定位方式P20

三种定位方式:

直接定位:在程序装入主存储器之前,程序中的指令和数据的主存物理就已经确定了的称为直接定位方式。

静态定位:在程序装入主存储器的过程中随即进行地址变换,确定指令和数据的主存物理地址的称为静态定位方式。

动态定位:在程序执行过程中,当访问到相应的指令或数据时才进行地址变换,确定指令和数据的主存物理地址的称为动态定位方式。

固定操作码长度计算P 21

就是所有指令使用相同的代码位数,其最小码长等于:

式中 是平均码长, 是第i 种指令的码长,n 是指令总数。

优点:规整,译码简单

缺点:浪费信息量(操作码的总长位数增加)

例:已知 n = 15,求定长编码的最小平均码长。

解:如:

IBM 公司的大中型机:最左边8位为操作码

Intel 公司的安腾(Intanium)处理机:14位定长操作码

许多RISC 处理机采用定长操作码

最优huffman 编码法如何计算机?能实际应用吗?

不能,操作码必须是正整数。 操作码最短平均长度: 学会计算信息冗余量 P22 固定长操作码相对于Huffman 操作码的信息冗余量为 学会使用最小概率合并法 p21

举例说明什么是扩展编码法 p22

4-8-12的形式表示扩展编码,能代表一种具体编码方法吗 不能 P22

扩展编码法分别用保留1个码点和保留1位的方法进行扩展,支持指令种类一样多吗 (期待答案)

学会分析不同地址码个数指令的应用情况(见例子) P23~P24

地址码个数不同的几种指令都适用什么情况? 不同地址个数指令的特点及适用场合 地址数目

程序

的长度 程序 存储量 程序执 行速度 适用场合 三地址

最短 最大 一般 向量,矩阵运算为主 二地址

较短 很大 很低 一般不宜采用 一地址

较长 较大 较快 连续运算,硬件结构简单 零地址

最长 最小 最低 嵌套,递归,变量较多 二地址

寄存器型

一般 最小 最快 多累加器,数据传送较多

指令系统的完整性、规整性(对称性、均匀性) 的含义 P24

完整性:是指应该具备的基本指令种类,通用计算机必须有5类基本指令

规整性包括对称性和均匀性

对称性:所有通用寄存器同等对待,操作码的设置等都要对称,如:A-B 与B-A

均匀性:不同的数据类型(如定点数、逻辑数、浮点点数、十进制数、字符串)、字长(如8位、16位、32为、64位)、存储设备(如寄存器、主存储器、堆栈)、操作种类(加减乘除等)要设置相同的指令

计算机的5类基本指令是什么

指令的种类:

i n

i i p p H ∑=?-

=12log ??n p p R n i i

i 21

2log log 1∑=?--=

1 数据传送类指令

2 运算类指令

3 程序控制指令

4 输入输出指令

5 处理机控制和调试指令

转移指令有哪3类?

转移指令一般可分为3类:无条件转移,条件转移指令(包括循环控制指令),调用与返回指令

一般条件转移、复合条件转移、隐含条件转移指令含义P25

一般条件转移:转移条件:零(Z)、正负(N)、进位(C)、溢出(V)及其组合

复合条件转移:代替2条指令,首先进行运算,并根据运算的结果决定是否转移,不需要条件码,与高级语言一致。

保存现场有哪2种方式?保存现场的指令通常如何得到

保存现场分为调用者保存和被调用者保存2种方式,有时必须采用调用者保存方式(如涉及公用变量的情况),大多数实际使用的编译器都会结合这2种方式。

这类指令涉及到现场的保存问题,至少要保存返回地址,现在的体系结构一般都由编译器生成指令来保存和恢复现场。

处理器可以不设置输入输出指令吗?为什么? P26

可以

输入输出操作主要有:启动、停止、测试、控制设备,数据输入、输出操作等,一般采用单一的直接寻址方式

在多用户或多任务环境下,输入输出指令属于特权指令

也可以不设置输入输出指令,输入输出设备与主存储器共用同一个零地址空间

可以不设处理机控制和调试指令吗?为什么?P26

不可以

处理机状态切换指令

一般处理机有两状态:管态和用户态

虚拟存储器管理指令

硬件和软件的调试指令

硬件调试指令,如:

JTEG支持指令

寄存器及主存单元的显示等

软件调试指令:

断点的设置及跟踪指令等

这类指令虽然使用频率不高,但对操作系统的实现很关键,不可或缺

指令系统的优化设计的两个方向是什么?P26

早期计算机主要使用前2种,目前还在使用的则是后2种,分别代表指令系统的优化设计有两个截然相反的方向:

1. 复杂指令系统计算机CISC

(Complex Instruction Set Computer)

增强指令功能,设置功能复杂的指令

面向高级语言和操作系统

用一条指令代替一串指令

2. 精简指令系统计算机RISC

(Reduced Instruction Set Computer)

只保留功能简单的指令

功能较复杂的指令用子程序来实现

本节内容针对的是CISC。

数据传送指令的使用频度和执行时间约占多少百分比 P27

Intel 8088处理机

MOV、PUSH和POP等3种数据传送指令的使用频度在程序中占40%左右,执行时间占30%以上。

IBM大中型计算机的统计结果

数据传送指令所占的比例还要高

高级语言程序中,循环体中只有一条语句的约占多少?有1至3条语句的约占多少?P27

在一般高级语言中,循环体中只有一条语句的约占40%

有1至3条语句的约占70%左右。

用高级语言编写的程序,与用汇编或机器语言编写的程序,时间开销和空间开销一样大,对吗?不对

高级语言与一般计算机的机器语言的语义差距非常大,用高级语言编写的程序经编译程序编译后生成的目标程序,与直接用机器语言或汇编语言编写的程序相比,时间开销和空间开销都要大一个数量级。

说明什么是高级语言计算机并举例 20%-%80规律指的是什么P28 CISC中,大约20%的指令占据了80%的处理机时间。

其余80%指令:使用频度低,只占20%的处理机运行时间。

哪几类指令的使用频度最高

指令类型7种应用程序平均

F1F2F3F4F5F6F7

数据传送

算术运算

逻辑运算/位操作字符串处理

转移指令

处理器控制34.25

24.97

3.40

2.42

34.84

0.13

35.85

22.34

4.34

4.22

32.99

0.26

28.84

45.32

7.63

2.72

15.34

0.15

20.12

43.65

7.49

2.01

17.63

0.10

25.04

45.72

6.38

2.10

20.52

0.24

24.33

45.42

3.97

2.35

25.72

0.19

34.31

28.28

4.89

2.10

30.29

0.14

30.25

36.24

5.44

2.86

25.33

0.19

了解RISC的主要特点P29

早期卡内基梅隆大学论述的RISC的特点:

1、大多数指令在单周期内完成

2、LOAD/STORE结构

3、硬布线控制逻辑

4、减少指令和寻址方式的种类

5、固定的指令格式

6、注重编译优化技术

RISC体系结构还应具有如下特点:

(1) 面向寄存器结构。

(2) 十分重视提高流水线的执行效率。

要提高RISC处理机的速度,必须采用流水线,而且,要尽量减少断流,提高流水线的效率。

(3) 重视优化编译技术。

优化编译技术在提高系统性能中发挥很重要的作用,改变了过去认为提高计算机速度仅仅依靠硬件的传统观点。

高效率的流水线和优化编译技术是现代RISC系统必须十分注重的两点。这比卡内基梅隆大学的定义更加全面了。

-------------------------------------------------------------------------- 90年代初,IEEE的Michael Slater对RISC定义的描述:

1、RISC为使流水线高效率执行,应具有:

(1) 简单而统一格式的指令译码

(2) 大部分指令可以单周期执行完成

(3) 仅Load和Store指令可以访问存储器

(4) 简单的寻址方式

(5) 采用延迟转移技术

(6) 采用LOAD延迟技术

2、RISC为使编译器便于生成优化代码,应具有:

(1) 三地址指令格式

(2) 较多的寄存器

(3) 对称的指令格式

利用程序执行时间的计算公式:P = I· CPI · T,比较一下RISC和CISC P29 程序执行时间的计算公式:

P = I· CPI · T

其中:

P是执行这个程序所使用的总的时间;

I是这个程序所需执行的总的指令条数;

CPI (Cycles Per Instruction)是每条指令执行的平均周期数

T是一个周期的时间长度。

-------------------------------------------------------------------------- 对于T而言:

RISC一般采用硬布线逻辑实现,指令要实现功能都比较简单

RISC的T通常要比CISC的T小。

RISC处理机的工作主频一般要比CISC处理机高。

对于CPI而言:

RISC的大多数指令都是单周期执行的,他们的CPI应该是1

由于RISC中还有LOAD和STORE指令,也还有少数复杂指令,所以,CPI要略大于1。

对于 I 而言:

由于CISC中复杂指令使用的频度很低,程序中使用的绝大多数指令都是与RISC一样的简单指令

因此实际上RISC的I长度只比CISC的长30%~40%

类型指令条数I 指令平均周期数

CPI

周期时间T

CISC 1 2~15 33ns~5ns

RISC 1.3~1.4 1.1~1.4 10ns~2ns RISC的速度要比CISC快3倍左右,关键是RISC的CPI减小了

同类问题的程序长度,RISC比CISC长30%~40%

-------------------------------------------------------------------------- 减小CPI是软硬件共同作用的结果

硬件方面:

采用硬布线控制逻辑,

减少指令和寻址方式的种类,

使用固定的指令格式,

采用LOAD/STORE结构,

指令执行过程中设置多级流水线等。

软件方面:十分强调优化编译技术的作用

采用延迟转移技术的两个限制条件是什么,成功率如何P30 延迟转移技术的定义:

为了使指令流水线不断流,在转移指令之后插入一条没有数据相关和控制相关的有效指令,而转移指令被延迟执行,这种技术称为延迟转移技术。

采用指令延迟转移技术时,指令序列的调整由编译器自动进行,用户不必干预。

采用延迟转移的程序,必须十分小心。

----------------------------------------------------------------------

两个限制:

1 被移动指令在移动过程中与所经过的指令之间没有数据相关

2 被移动指令不破坏条件码,至少不影响后面的指令使用条件码

采用延时转移技术的计算机,如果找不到符合上述条件的指令,必须在条件转移指令后面插入空操作

如果指令的执行过程分为多个流水段,则要插入多条指令,插入1条指令成功的概率比较大,插入2条或2条以上指令成功的概率明显下降

适用于循环程序指令取消技术如何调整指令? P30

向后转移(适用于循环程序)

实现方法:

循环体的第一条指令安放在两个位置,分别在循环体的前面和后面。

如果转移成功,则执行循环体后面的指令,然后返回到循环体开始;

否则取消循环体后面的指令

重叠寄存器窗口与windows窗口类似,对吗? P30 貌似不是

提出重叠寄存器窗口技术的原因是什么,如何实现?P30

原因:在RISC中,子程序比CISC中多,CALL和RETURN操作传送参数访问存储器的信息量很大。为使CALL和RETURN操作尽量少访问存储器,美国加洲大学伯克利分校的

F.Baskett提出重叠寄存器窗口技术(Overlapping Register Window)

实现方法:

设置一个数量比较大的寄存器堆,并把它划分成很多个窗口。这里的窗口不是windows

窗口,是1组寄存器,一块寄存器组成的存储缓冲区。

每个过程使用其中相邻的3个窗口和1个公共窗口

有一个窗口存放本过程私有的局部数据;有一个窗口与前一个过程共用;存放前一过程传送给本过程的参数;存放本过程传送给前一过程的计算结果。

有一个窗口与下一个过程共用;存放本过程传送给下一过程的参数;存放下一过程传送给本过程的计算结果

指令流调整技术有哪2种调整方法?延迟转移和指令取消技术也调整指令次序,和它的调整指令次序有何不同?P31有个指令流调整的例子至于有何不同PPT上没有介绍复习时整理吧

固件指什么技术?RISC的实现完全不需要固件,对吗?P31 没具体定义应该不是

固件(微程序技术)的主要缺点是:执行速度低,不可能1个周期完成1个指令。

目前,ROM的速度低于SRAM

一条机器指令通常要多条微指令解释执行

固件的主要优点是:便于实现复杂指令,便于修改指令系统,增加了机器的灵活性和适应性

RISC以硬联逻辑为主来实现指令系统,但对于少数复杂指令,用微程序技术实现,即硬件为主固件为辅的方法。

简述现代编译器的结构(没有)

现代编译器的结构

第1个层次的独立,使编译器对一种新的语言,更换一个新的前端就可以了。

在编译器的后3个层次中,都包含着优化,这些优化被设计成可选的,其中:

高层优化一般在源码上进行

局部优化局限在代码片断之内

全局优化将局部优化扩展为跨越分支,并引入一组针对优化循环的转换

寄存器分配将寄存器和操作数联系起来

处理器相关的优化则针对特定的体系结构

在代码生成器一层要包含一个汇编器,完成最后的到目标代码的转换。

当今编译器的寄存器分配算法都基于什么技术?(没有)

寄存器分配是重要的优化方案之一。

当今的寄存器分配算法都基于图论中的图着色技术,采用启发式算法来进行分配。

这种算法要求拥有一定寄存器的数量,如一般至少要为整数变量保留16个通用寄存器。 优化编译能加快代码执行,但不能减小代码体积,对吗?(没有)不对优化编译不仅能加快代码的执行,也能减小代码体积

(新版PPT上有个图但看不懂貌似也没毛用)

多媒体指令和向量计算机中的向量指令一样快,对不对?为什么?

(课件上没有比较)

多媒体指令的定义:多媒体指令实际上是一种SIMD 指令,对于非向量体系结构的计算机,这是一种针对小向量的指令,其共同特点是寄存器较大,元素项较小且相互邻近。 Intel 的MMX 的

第三章 存储系统

什么是存储系统,组成存储系统的目的是什么?

存储系统的定义:把两个或两个以上速度、容量和价格各不相同的存储器用硬件、软件、或软件与硬件相结合的方法连接起来,称为一个存储系统。

存储系统的目的是组织好速度、容量和价格均不相同的存储器:使这个存储器的速度接近速度最快的那个存储器;存储容量与容量最大的那个存储器相等;单位容量的价格接近最便宜的那个存储器。

计算机的存储系统对应用程序员透明的,对吗

对。这个系统对应用程序员透明,从应用程序员的角度看,它是一个存储器。 计算机中有哪2种存储系统?了解其组成、目的和特点

存储系统

Cache 存储系统 虚拟存储系统 组成

由Cache 和主存储器构成 由主存储器和磁盘存储器构成 主要目的 提高存储器速度

扩大存储器容量 特点

从系统程序员的角度看,速度接近

Cache 的速度存储容量是主存的容

量,每位价格接近主存储器 从应用程序员的角度看,速度接近主存储器的速度,存储容量是虚拟地址空间每位价格接近磁盘存储器

Cache 存储系统的存储容量是多少?虚拟存储系统呢?

Cache 存储容量是主存的容量;

虚拟存储系统存储容量是虚拟地址空间。

Cache 存储系统只对M2存储器进行编址,M1存储器只在内部编址,存储系统的容量等于M2存储器的容量。==虚拟存储系统另外设计一个容量很大的逻辑地址空间,M1和M2的地址映射到这个抽象的地址空间。

(课件P24 补充图片。)

如何计算存储系统的单位容量的平均价格?

S2>>S1时, C ≈C2, 注意: S2与S1不能相差太大,否则很难调度

存储器的存取时间和存取周期相同吗,存储系统呢?

不同。访问周期指的是存储系统的访问周期(组成原理中所说的存取时间、存取周期是指针对存储器的),对存储系统来说,存储周期、存取周期、存取时间,和访问周期都是一个概念 会计算命中率、访问周期和访问效率 命中率定义:在M1存储器中访问到的概率:N1: M1的访问次数。N2: M2的访问次数。 访问周期与命中率的关系:T=HT1+(1-H)T2,当命中率H →1时,T →T1

存储系统的访问效率: 2

12

211S S S C S C C +?+?=2

11N N N H +=),()1(1)1(1

2211112T T H f H H T H T H T T T e T T =?-+=?-+?==

Ps. 存储系统的访问效率主要与命中率和两级存储器的速度之比有关

假设T2=5T1 ,在命中率H 为0.9和0.99两种情况下,分别计算存储系统的访问效率。 解:

当H=0.9时, e1=1/(0.9+5(1-0.9))=0.72 ; 当H=0.99时, e2=1/(0.99+5(1-0.99))=0.96 学会采用预取技术的命中率计算**** 注意看例题***

方法:不命中时,把M2存储器中相邻几个单元组成的一个数据块都取出来送入M1存储器中。(H ’是采用预取技术后的命中率; H 是原来的命中率; n 为数据块大小与数据重复使用次数的乘积) 采用预取技术之后,缺失率(不命中率)降低n 倍 存储器停顿周期数相关计算**** 注意看例题***

通常将处理器暂停工作,等待一次存储器访问的周期数称为存储器停顿周期数

存储器停顿周期数由缺失次数和每次缺失代价决定:

存储器停顿周期数=缺失次数×缺失代价=存储器访问次数×缺失率×缺失代价

=指令数×(存储器访问次数÷指令数)×缺失率×缺失代价

=指令数×每条指令访存次数×缺失率×缺失代价

=指令数×每条指令读次数×读缺失率×读缺失代价+指令数×每条指令写次数×写缺失率×写缺失代价

存储器性能和处理器性能哪个增长的更快?===处理器

理解计算机的频带平衡

现代计算机系统都以存储器为中心,存储器的访问速度影响整个计算机系统的性能。计算机中各级存储器频带应该达到平衡,解决存储器频带平衡主要有以下方法:

1)多个存储器并行工作:并行访问、交叉访问;

2)设置各种缓冲存储器:预取指令缓冲栈、操作数先行缓冲栈、运算结果后行缓冲栈、通用寄存器 3)采用存储系统:多级Cache 存储系统

并行访问存储器能增加字长,对吗?

对的,并行访问增大了存储器的字长,一个存储周期内能访问更多的机器字

并行访问存储器访问冲突的主要原因是什么?

从存储器本身看,主要是因为地址寄存器和控制逻辑只有一套。如有n 个独立的地址寄存器和n 套读写控制逻辑,上述第3和第4种冲突就自然解决了,第1和第2种冲突也会有所缓解。

A.取指令冲突:转移发生时,其后同时取出的指令无用;

B.读操作数冲突:同时取出的多个操作数,不一定都有用;

C.写数据冲突:n 个机器字(nw 位)作为一个存储字同时写回存储器,写单字要先读;

D.读写冲突:要读出的机器字和要写入的机器字同在一个存储字时,无法在一个存储周期内完成

低位和高位交叉存储器的目的和理由

高位:主要目的:扩大存储器容量(用地址码的高位区分存储体号)

低位:主要目的:提高存储器访问速度(用地址码的低位区分存储体号)

理由,看课件理解。

低位交叉存储器的启动间隔应为多少,存储体个数增加是否意味速度的增加,为什么

每存储体的启动间隔t 为:

n 为存储体个数 n

n H H 1-+='??

????=n T t m

Tm 为每个存储体的访问周期

低位交叉访问存储器利用了程序的空间局部性,能大幅度提高存储器的速度。但低位交叉访问存储器的访问冲突也比较大,增加存储体的数目并不能得到速度的线性增长 无冲突访问存储器通常针对一维和二维数组,具体指什么

问题答案不清楚,需要再仔细看看:一维(存储体的个数取质数,且n ≥向量长度。) 二维(顺序存储:按行、对角线访问没有冲突,但按列访问每次冲突;

错位存储:按行、按列访问无冲突,但按对角线访问有冲突;

n*n 二维数组:并行存储体的个数m ≥n ,并且取质数,同时还要在行、列方向上错开一定的距离存储数组元素。)

虚拟存储器中有几种地址,都是什么?

虚拟存储器中有3种地址空间,对应3种地址:

虚拟地址空间:又称虚存空间或虚拟存储器空间,它是应用程序员用来编写程序的地址空间,这个地址空间非常大。虚存空间上的地址,又称虚存地址或虚地址

主存储器地址空间:也称主存地址空间、主存物理空间或实存地址空间,其地址又称主存实地址、主存物理地址、主存储器地址

辅存地址空间:也就是磁盘存储器的地址空间,其地址又称为磁盘地址、辅存地址 理解三种地址映像和变换及其特点(查看课件中有关映像和变换的图)

因地址映象和变换方法不同,有三种虚拟存储器:页式、段式、段页式虚拟存储器。 外部地址变换和内部地址变换的区别

需要总结 ,问问(课件3.2.2.4)

会计算需要的页表级数

虚拟存储空间大小Nv=4GB ,页的大小Np=1KB ,每个页表存储字占用4个字节。计算得页表的级数:

第1级页表为1页,存储容量1KB ,可以有256个存储字,在这里只需要用其中的64个页表存储字。===用第一级页表的64个存储字指向第二级页表的64个页面,每个页面各有256个页表存储字,二级页表共有16K 个页表存储字。====同样,第三级页表共有16K 个页面,即4M 个页表存储字。这4M 个页表存储字正好用来存放虚拟存储空间的4M 个页面信息。====因此,第1级页表为1个页面,第2级页表有64个页面,第3级页表则有16K 个页面。

理解目录表和快慢表的含义和区别(需要完善)

目录表:基本思想:用一个小容量高速存储器存放页表。

快慢表:两级存储系统。

相联访问和按地址访问的区别,快表、慢表、目录表、散列都是什么访问

相联访问:目录表,快表

按地址访问:慢表,散列

虚拟存储器中的散列函数是由软件还是硬件实现?有什么用?为什么会出现散列冲突?

1. 散列函数的种类很多。快表中的散列函数必须用硬件来实现,采用一些简单的函数关系。

2. 要在一个按地址访问的存储器中查找一个信息,可以有顺序查找法、对分查找法和散列查找法等。散列(Hashing)查找方法的速度最快。===对快表来说,就是要把多用户虚页号Pv 变换成快表的地址Ah ,函数关系是:Ah=H(Pv)。

3. 把一个大的多用户虚页号Pv 散列变换成了一个小的快表地址Ah ,因此,必然会321010324log 1log 1log 4log 2222=??????--=??????--=K K G g

有很多个多用户虚页号Pv都散列变换到相同的快表地址Ah中,这种现象称为散列冲突 页面、cache块、快表和目录表存储字的替换,都是由硬件实现的,对不对?

不对。虚拟存储器中主存页面的替换,一般用软件实现Cache块替换,一般用硬件实现。其余的,一般用硬件。

理解书中的几种页面替换算法,了解其命中率和实现难易(P43)

1.随机算法

2.先进先出算法

3.近期最少使用算法

4.最久没有使用算法

5.最优替换算法

OPT算法不是一种实际能使用的算法,对不对?对的,可作为标准理想化的算法。

堆栈性替换算法有什么特点,哪些是哪些不是?

堆栈型算法的基本特点:随着分配给程序的主存页面数增加,主存的命中率也提高,至少不下降。LFU算法,OPT算法和LRU算法都是堆栈型算法。FIFO算法不是堆栈型算法。

动态页面调度算法在多道程序中是如何工作的?它要求采用什么样的页面替换算法?

由于堆栈型替换算法的命中率随分配个该程序的主存页面增加而单调上升,因此,在多道程序系统中,可以采用一种被称为页面失效频率法(PFF:Page Fault Freguency)的动态页面调度方法。过程:根据各道程序在运行过程中页面失效率的情况,由操作系统动态调整分配给每道程序的主存页面数。当一道程序的命中率低于某个限定值时就增加分配给该道程序的主存页面数,以提高它的命中率。而当命中率高于某个限定值时就减少分配给该道程序的主存页面数。这样可以使整个系统的总的命中率和主存利用率都得到提高。

了解影响主存命中率的主要因素

影响主存命中率的主要因素:

程序执行过程中页地址流分布情况;所采用的页面替换算法;

页面大小;主存容量;页面调度方式。

页面大小、主存容量与命中率的关系是怎么样的?(参看课件P48图)

页面大小为某个值时,命中率达到最大。

主存命中率H随着分配给该程序的主存容量S的增加而单调上升。在S比较小的时候,H提高得非常快。随着S的逐渐增加,H提高的速度逐渐降低。当S增加到某一个值之后,H几乎不再提高。

页面调度方式有哪几种,有什么不同?

分页式:整个程序调入主存再开始运行

请求页式:在发生页面失效时,才将页面调入主存

预取式:

(1)用在程序被挂起之后又重新开始运行之前;(2)把上次停止运行前一段时间内用到的页面先调入到主存储器,然后才开始运行程序。(3)可以避免在程序开始运行时,频繁发生页面失效的情况。(4)如果调入的页面用不上,浪费了调入的时间,占用了主存资源。

直接相联、组相联、全相联映像的命中率和硬件实现复杂度都如何?(课件补充P49)直接相联:硬件实现很简单, 不需要相联访问存储器;命中率比较低。

组相联:实现难度和造价要比直接映象方式高;块的冲突概率比较低,块的利用率大幅度提高,块失效率明显降低。

全相联:用硬件实现起来会非常复杂;命中率比较高,Cache存储空间利用率高。

在虚拟存储器中,采用什么映像方式,用软件还是硬件实现?

在虚拟存储器中,一般都采用全相联映像,全部用软件实现

直接相联映像实际上不做地址变换,对不对,为什么?

对的,因为主存中一块只能映象到Cache的一个特定的块中。地址映象方式简单,

数据访问时,只需检查区号是否相等即可。

什么叫组相联度,n路组相联指的什么?

主存和Cache按同样大小划分成块,还按同样的块数划分成组,一个区的组数为Cache的总组数。组内块数被称为组相联度,如果组相联度为n,则这种组相联称为n路组相联 位选择组相联映象中主存是否分组,Cache呢?

主存不分组,cache分组。除了分块之外,Cache分组,主存按照Cache的组数取相应块数分区。

段相联映像中失效的代价非常高,对不对?

对。因为段相联方式的主要缺点:当发生段失效时,要把本段内已经建立起来的映象关系全部撤消。

Cache替换算法是软件还是硬件实现的?虚拟存储器呢?

Cache替换算法的主要特点:全部用硬件实现。

在虚拟存储器中,一般都采用全相联映像,全部用软件实现

Cache替换算法中计数器位数如何确定?(参看课件P52)

方法一.每块一个计数器:在块表内增加一个替换计数器字段,计数器的长度与Cache 地址中的组内块号字段的长度相同。====方法二.每组一个计数器:本组有替换时,计数器加“1”,计数器的值就是要被替换出去的块号

比较对法和堆栈法都是LFU算法,只是硬件实现不同,对不对?学会计算二者使用的触发器数量。(对的,参看课件例题P53.)

会计算Cache系统的加速比(参看课件P54)

Cache命中率与容量、块大小、组数的关系

==Cache的命中率随它的容量的增加而提高;==在组相联映象方式中,块的大小对H的影响非常大:块很小时,命中率很低。随着块大小的增加,由于程序的局部性,H增加。当块非常大时,进入Cache中的数据可能用不上。当块大小等于Cache容量时,命中率将趋近于零。==随着组数的增加,Cache的命中率要降低 什么情况Cache与主存不一致?

(a) CPU写Cache(b) I/O写主存

Cache有哪2种更新算法,如何工作的?学会计算机2者与主存的通信量。写直达法(写通过法,用于一级cache), 写回法(抵触修改法,用于二级cache)。(参见P55) 什么是不按写分配法与按写分配法?都与何种更新相配?

不按写分配法:在写Cache不命中时,只把所要写的字写入主存

按写分配法:在写Cache不命中时,还把一个块从主存读入Cache

目前,在写回法中采用按写分配法,在写直达法中采用不按写分配法。

理解几种预取算法,各算法的命中率如何?

预取算法有如下几种:按需取:不命中时,把一个块取到Cache中来;==恒预取:无论是否命中,把下一块取到Cache中;==不命中预取:当不命中,把本块和下一块取到Cache 中。(恒预取能使Cache的不命中率降低75~85%;不命中预取能使Cache的不命中率降低30~40%)

评价Cache存储系统性能可以用缺失率、平均存储器访问时间和CPU性能公式,哪个更好?都能保证正确吗

评价一个Cache存储系统最准确的方法仍然是通过CPU性能公式。平均存储器访问时间是比缺失率更好的一种存储系统评价方法。缺失率、平均存储器访问时间不能保证正确。

会计算机平均存储器访问时间(需要看电脑上的课件例题了第三章193。。。)

平均存储器访问时间=命中时间+缺失率×缺失代价

乱序执行由于指令的重叠执行,降低了缺失代价,通常有更高的性能,对不对?

对吧?(有待更正。。。)

解释一下缺失的4种类型含义

强制缺失(compulsory):对一个块的第一次访问一定会发生缺失,也叫冷启动或首次访问缺失。

容量缺失(capacity):由于Cache容量不够引起的不能容纳程序所有块引起的缺失,可以理解为全相联映像也无法避免的缺失。

冲突缺失(conflict):对于直接映像和组相联映像,在全相联映像下命中,却由于替换策略的问题引起冲突而产生缺失,也叫碰撞或干涉缺失。

一致缺失(coherency):由于Cache刷新而保持多处理器中多Cache一致性引起的缺失。 冲突缺失怎样根据组相联度进一步划分?每类含义是什么

组相联度的下降会引起冲突缺失,下面将冲突缺失划分为4类,直接映像被看作1路组相联:8路:从全相联(没有冲突)到8路相联而引起的冲突缺失。

4路:从8路相联到4路相联而引起的冲突缺失。

2路:从4路相联到2路相联而引起的冲突缺失。

1路:从2路相联到1路相联(直接映射)而引起的冲突缺失。

总缺失=强制缺失+容量缺失+冲突缺失+一致缺失

冲突缺失=8路缺失+4路缺失+2路缺失+1路缺失

时延和带宽都很高,适合大块还是小块?都很低呢?

在高时延和高带宽的存储器中,较大的块更有效,因为缺失时可以获得更多字节,而缺失代价只有少量的增加;

而在低时延和低带宽的存储器中,则希望块小一些,因为此时大块并不能节省多少时间。 理解组相联缺失率的2个经验规律

对于组相联的缺失率,存在2个经验规律:

(1)相同容量的8路组相联和全相联在降低缺失率方面同样有效。

(2)2:1Cache经验规律:容量为N(N<128k)的直接映像和容量为N/2的2路组相联缺失率几乎相同,因此Cache容量一般少于128k。

会计算多级Cache的平均存储器访问时间和每条指令的平均存储器停顿周期(参看课件3.216)设L1和L2为一级和二级Cache,则公式为:

平均存储器访问时间=命中时间L1+缺失率L1×缺失代价L1

=命中时间L1+缺失率L1×(命中时间L2+缺失率L2×缺失代价L2) 每条指令的平均存储器停顿周期

=每条指令缺失次数L1×命中时间L2+每条指令缺失次数L2×缺失代价L2 一级和二级Cache的速度有什么样的影响

一级Cache的速度会影响处理器的时钟频率,

而二级Cache的速度只影响一级Cache的缺失代价。

理解多级包含和多级独占的含义,各适合什么情况?

通常一级Cache的数据都包含在二级Cache中,这种属性成为多级包含。多级包含的一级Cache的块可以和二级Cache的块一样大或更小。

如果二级Cache和一级Cache的容量差异不很大,这时可以采用多级独占方式,即一级Cache的数据不在二级Cache中出现。

理解读缺失优先于写缺失的含义

在读缺失发生时查看写缓存的内容,如果要写的内容和要读内容重合,那么先从写缓冲区读后写,如果不重合,再进行正常的读缺失处理。这就是所谓的读缺失优先于写缺失。

计算机系统结构模拟试题(5)

计算机组成原理模拟试题(2) 一、填空题:04分,每题02分 1、X=-0.1001 [X]原=_____________ [X]补=_____________[-X]补=_____________ Y=0.0101 [Y]原=_____________ [Y]补=_____________ [-Y]补=_____________ [X+Y]补=_____________ 2、对西文输出的字符设备,在计算机的内存储器中存储的是字符数据的每个字符的_____________码,输出(包括显示或打印)的则是每个字符的_____________,设备中的字符发生器的主要功能是解决从字符的_____________码和字符的_____________间的对应关系。 二、单选题:20分,每题02分 3、32 x 32点阵汉字的机内编码需要。 A: 16个字节 B: 32个字节 C: 32×2个字节 D: 32×4个字节 4、某机字长32位,采用原码定点整数表示,符号位为1位,数值位为31位,则可表示的最大正整数为,最小负整数为。 A: B: C: D: 5、在定点二进制运算器中,减法运算一般通过来实现。 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 6、在浮点数运算中产生溢出的原因是。 A: 运算过程中最高位产生了进位或借位 B: 参加运算的操作数超出了机器的表示范围 C: 运算的结果的阶码超出了机器的表示范围 D: 寄存器的位数太少,不得不舍弃最低有效位 7、无论如何划分计算机的功能部件,控制器部件中至少含有。 A: PC、IP B: PC、IR C: IR、IP D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 B: 地址线为32根,数据线为16根

《计算机系统结构》复习题

计算机系统结构复习 填空(15*1分),选择(15*1分),简答题(5/6 30分),综合题(4*10分) 1、从使用语言角度,可将系统按功能划分为多层次机器级结构,层次结构分别是:应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序机器级。 2、各机器级的实现主要靠翻译和解释或两者结合进行。翻译是先用转换程序将高一级机器级上的程序整个地变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技术。解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功能,是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。 3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。 4、计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定,为机器语言、汇编语言程序设计或编译程序生成系统提供使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。 5、计算机系统结构的属性包括: 1.数据表示、2.寻址方式、3.寄存器组织、4.指令系统、5.存储系统组织、6.中断机构、7.系统机器级的管态和用户态的定义和切换、8.机器级的I/O 结构、9.系统各部分的信息保护方式和保护机构等。 6、机器透明性:指相对于每一机器级设计人员,都客观存在的功能或属性看不到的现象,称相对于此级设计人员来说,这些功能或属性是具有透明性,即透明的。 7、计算机组成指的是计算机系统结构的逻辑实现,包括机器级内部的数据流和控制流的组成以及逻辑设计等。它着眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。 8、计算机组成设计要解决的问题是在所希望达到的性能和价格下,怎样更好、更合理地把各种设备各部件组织成计算机,来实现所确定的系统结构。 9、当前,计算机组成设计主要是围绕提高速度,着重从提高操作的并行度、重叠度,以及功能的分散和设置专用功能部件来进行的。 10、计算机组成设计要确定的方面一般应包括: 1.数据通路宽路、2.专用部件的设置、3.各种操作对部件的共享程度、4.功能部件的并行度、5.控制机构的组成方式、6.缓冲和排队技术、7.预估预判技术、8.可靠性技术等。 11、计算机实现指计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术,其中,器件技术在实现技术中起着主导作用。 13、软、硬件取舍的三个基本原则是: (1).考虑在现有硬件、器件(主要是逻辑器件和存储器)条件下,系统要有高的性能价格比,主要从实现费用、速度和其他性能要求来综合考虑。 (2).考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。 (3).从“软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持。 14、程序在系统上运行的时间应该是衡量机器时间(速度)性能最可靠的标准。 15、计算机性能通常用峰值性能及持续性能来评价。峰值性能是指在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能。

计算机系统结构有详细答案

(仅供参考,不作为考试标准), 选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员 。意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速 。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同 栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法 象联组,相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高 是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路 令指条下析分后推C) 令指条下行执后推D) 流的用采,时关据数到,中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

计算机系统结构模拟试题5

计算机组成原理模拟试题(2)一、填空题:04分,每题02分 =_____________ [X]补=_____________补-X][1、 X=-0.1001 [X]原 =_____________ =_____________ =_____________ [-Y]补Y]原=_____________ []补 Y=0.0101 [Y ]补=_____________ [X+Y对西文输出的字符设备,在计算机的内存储器中存储的是 字符数据的每个字符的、 2,设备中的字符_____________(包括显示或打印)的则是每个字 符的码,输出_____________间的对应关_____________发生器的主要功能是解决从字符的 _____________码和字符的系。分二、单选题:20分,每题02 。3、 32 x 32点阵汉 字的机内编码需要 A: 16个字节 B: 32个字节 2个字节 C: 32×个字节 D: 32×4位,则可表示位,数值位为314、某机字长32位,采 用原码定点整数表示,符号位为1 。,最小负整数为的最大正整数为 A: B: C: D: 来实现。 5、在定点二进制运算器中,减法运算一般通过 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 。 6、在浮点数运算中产生溢出的原因是运算过程中最高位产生了进位或借位 A: 参加运算的操作数超出了机器的表示范围B: C: 运算的结果的阶码超出了机器的表示范围寄存器的位数太少,不得不舍弃最低有效位 D: 。 7、无论如何划分计算机的功能部件,控制器部件中至少含有 IP A: PC、 IR B: PC、、IP C: IR D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 根16根,数据线为32地址线为B: C: 地址线为15根,数据线为16根 D: 地址线为15根,数据线为32根 9、在统一编址方式下,存储单元和I/O设备是靠指令中的来区分的。

(完整版)计算机系统结构复习题(附答案)范文

计算机系统结构复习题和重点(附答案) 一、单项选择题 1.实现汇编语言源程序变换成机器语言目标程序是由() A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 2.系列机软件必须保证() A.向前兼容,并向上兼容B.向前兼容,并向下兼容 C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容 3.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是()A.56个B.63个 C.64个D.84个 4.在IBM370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是()A.“执行”指令B.“程序调用”指令 C.“比较与交换”指令D.“测试与置定”指令 5.关于非专用总线三种控制方式中,下列叙述错误 ..的是() A.集中式定时查询,所有部件共用同一条“总线忙”线 B.集中式定时查询,所有部件都用同一条“总线请求”线 C.集中式独立请求,所有部件都用同一条“总线请求”线 D.集中式串行链接,所有部件都用同一条“总线请求”线 6.磁盘外部设备适合于连接到() A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 7.在Cache存储器中常用的地址映象方式是() A.全相联映象B.页表法映象 C.组相联映象D.段页表映象 8.在指令级高度并行的超级处理机中,下列叙述正确的是() A.超标量处理机利用资源重复,要求高速时钟机制 B.超流水线处理机利用资源重复,要求高速时钟机制 C.超标量处理着重开发时间并行性,要求高速时钟机制 D.超流水线处理机着重开发时间并行性,要求高速时钟机制 9.间接二进制n方体网络是一种() A.多级立方体网络B.多级全排列网络

(完整版)计算机系统结构试题及答案

计算机系统结构复习题 单选及填空: 计算机系统设计的主要方法 1、由上往下的设计(top-down) 2、由下往上的设计(bottom-up) 3、从中间开始(middle-out) Flynn分类法把计算机系统的结构分为以下四类: (1)单指令流单数据流 (2)单指令流多数据流 (3)多指令流单数据流 (4) 多指令流多数据流 堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。 名词解释: 虚拟机:用软件实现的机器叫做虚拟机,但虚拟机不一定完全由软件实现,有些操作可以由硬件或固件(固件是指具有软件功能的固件)实现。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 兼容机:它是指由不同公司厂家生产的具有相同系统结构的计算机。 流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。 单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。 多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。 吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。 指令的动态调度:

是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。 指令的静态调度: 是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。 超标量: 一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。 超流水:在一个时钟周期内分时流出多条指令。 多级存储层次: 采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的内容都是其下一层(离CPU更远的一层)存储器中内容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。 写直达法: 在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。写回法: 只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。 集中式共享多处理机: 也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成,各处理器共享一个集中式的物理存储器,这个主存相对于各处理器的关系是对称的, 分布式共享多处理机: 它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址,在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。 多Cache一致性: 多处理机中,当共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储器块的副本,要保证多个副本数据是一致的。 写作废协议: 在处理器对某个数据项进行写入之前,它拥有对该数据项的唯一的访问权 。 写更新协议: 当一个处理器对某数据项进行写入时,它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。 机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机系统结构专业简历

计算机系统结构专业简历 写简历时:使用语言力求平实、客观、精炼,篇幅视工作所限为1-2页,工作年限5年以下,通常以1页为宜;工作年限在5年以上,通常为2页。以下是小编为大家搜集整理提供到的计算机系统结构专业简历内容,希望对您有所帮助。欢迎阅读参考学习! 计算机系统结构专业简历俞xx 一年以上工作经验|男|25岁(1991年7月17日) 居住地:南京 电话:138*******(手机) E-mail:XXX 最近工作[7个月] 公司:XX有限公司 行业:网络游戏 职位:游戏策划师 最高学历 学历:本科 专业:计算机系统结构 学校:南京理工大学 自我评价 本人品行端正,谦虚谨慎,吃苦耐劳,综合素质好。交际、沟通能力较强,拥有创新思维,有团队精神并能承受较大的工作

压力。性格直爽、乐观、自信的我,为人坦城、做事认真、接受与理解力强,爱好唱歌、爬山等。对于自己要做的事情一定会尽心尽力尽职尽责将其做到最好,不管在任何环境下都能用最短的时间去适应。 求职意向 到岗时间:可随时到岗 工作性质:全职 希望行业:网络游戏 目标地点:南京 期望月薪:面议/月 目标职能:游戏策划师 工作经验 2015/2 – 2015/9:XX有限公司[7个月] 所属行业:网络游戏 策划部游戏策划师 1.参与项目的战斗设计,完成第二版角色动作、技能、战斗打击效果设计及跟进。 2.参与部分关卡设计,包括场景排布和怪物场景内刷新规则,怪物AI和技能的设计。 3.针对项目第二版新手引导流程设计与优化,对项目各个系统功能的BUG测试修复以及体验优化。 2014/6 – 2015/1:XX有限公司[7个月] 所属行业:网络游戏

计算机系统结构模拟题

《计算机系统结构》模拟题 一.判断是非题,对的打√,错的打× 1.系列机是指由一个厂家生产的具有相同组成,但具有不同系统结构和实现的一系列不同型号的机器。 ( × ) 2.Cray 1向量处理机中,由于每个向量寄存器的长度为64,当实际需要处理的向量长度大于64时,它就不能够处理了。 ( × ) 3.按照Flynn 分类法,Illiac IV 阵列处理机是MIMD 计算机。 ( × ) 4.多级混洗交换网络是阻塞网络。 ( √ ) 二.填空题 1.多机系统的互连网络的通信模式可分为4种,其中,一对一的通信模式称为____单播_____模式,一对全体的通信模式为_____广播____模式,多对多的通信模式为____会议_____模式。 2.SIMD 计算机和流水线向量处理机都可以执行向量指令,前者采用___资源重复______并行性,后者采用___时间重叠______并行性。 3.系列机软件兼容必须做到___向后_____兼容,力争做到___向上_____兼容。 4.流水线消除瓶颈段的方法有____细分_____和____重复设置瓶颈段(可交换次序)_____2种方法。 5.设通道数据传送过程中,选择一次设备的时间为 s T ,传送一个字节的时间为D T ,则字 节多路通道最大流量等于____ D s T T 1 _____。 6.Illiac IV 8×8阵列中,网络直径为____7_____。 7.对堆栈型替换算法,增大分配给程序的___主存页面______,对第一级存储器的命中率就会单调____上升_____。 8.从网络的任何结点看,若网络拓扑结构都是相同的,则称这样的网络是___对称______网络。 三.单项选择题 1.在计算机系统层次结构中,从下层到上层,各层相对顺序正确的是( B )。 A.汇编语言机器级-操作系统机器级-高级语言机器级 B.微程序机器级-传统机器语言机器级-汇编语言机器级 C.传统机器语言机器级-高级语言机器级-汇编语言机器级 D.汇编语言机器级-应用语言机器级-高级语言机器级 2.Illiac IV 阵列处理机中,PE 之间所用的互连函数是( A )。

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

计算机系统结构总复习题

一、单项选择题 1、直接执行微指令的是( ) A.汇编程序B.编译程序 C.硬件D.微指令程序 2、对系统程序员不透明的应当是( )。 A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器 3、对机器语言程序员透明的是( )。 A.中断字B.主存地址寄存器 C.通用寄存器D.条件码 4、计算机系统结构不包括( )。 A.主存速度B.机器工作状态 C.信息保护D.数据 5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。A.计算机软件所要完成的功能B.计算机硬件的全部组成 C.编程要用到的硬件组织D.计算机各部件的硬件实现 6、计算机组成设计不考虑( )。 A.专用部件设置B.功能部件的集成度 C.控制机构的组成D.缓冲技术 7、以下说法中,不正确的是( )。 软硬件功能是等效的,提高硬件功能的比例会: A.提高解题速度B.提高硬件利用率 C.提高硬件成本D.减少所需要的存贮器用量 8、在系统结构设计中,提高软件功能实现的比例会( )。 A.提高解题速度B.减少需要的存贮容量 C.提高系统的灵活性D.提高系统的性能价格比 9、下列说法中不正确的是( )。 A.软件设计费用比软件重复生产费用高 B.硬件功能只需实现一次,而软件功能可能要多次重复实现 C.硬件的生产费用比软件的生产费用高 D.硬件的设计费用比软件的设计费用低 10、在计算机系统设计中,比较好的方法是( )。 A.从上向下设计B.从下向上设计 C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( )。 A.传统机器语言级与操作系统机器级之间 B.传统机器语言级与微程序机器级之间 C.微程序机器级与汇编语言机器级之间 D.操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( )。 A.向前兼容,并向上兼容 B.向后兼容,力争向上兼容

计算机系统结构(复习题)

《计算机系统结构》复习题(一) 一、单项选择题 1.同号相减或异号相加,阶差为1,只需要设置位警戒位。【】A.0 B. 1 C. 2 D. 3 2.计算机系统多级层次结构中,操作系统机器级的直接上层是【】A.传统机器级B.高级语言机器级 C.应用语言机器级D.汇编语言机器级 3.以下不.是设计RISC的原则的是【】A.指令多用硬联控制实现 B.指令条数多,通常超过100条 C.指令寻址方式一般不超过两种 D.所有指令都在一个机器周期内完成 4. 下列操作码的编码方法中,操作码平均长度最短的是:【】 A、固定长编码 B、Huffman编码 C、不等长扩展编码 D、等长扩展编码 5.在采用延迟转移技术时,在以下几种调度方法中,效果最好的是哪一种方法【】 A.将转移指令前的那条指令调度到延迟槽中 B.将转移目标处的那条指令调度到延迟槽中 C.将转移不发生时该执行的那条指令调度到延迟槽中 D.在延迟槽中填入NOP空操作指令 6.在以下输入输出控制器的管理方式中,外设的工作速度对计算机性能影响最小的是 【】 A. 程序控制轮询方式 B. 程序控制中断方式 C. 直接存储器访问方式 D. I/O处理机方式 7. 计算机系统多级层次结构中,操作系统机器级的直接上层是【】 A.传统机器级B.高级语言机器级 C.应用语言机器级D.汇编语言机器级 8.多处理机的互连方式采用总线形式的优点是【】 A.硬件成本低且简单 B.适用于处理机机数较多的场合 C.有很高的潜在通信速率 D.不便于改变系统硬件设置 9.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是【】A.56个B.63个 C.64个D.84个

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

-计算机系统结构(有详细答案)

(仅供参考,不作为考试标准), 选择题(30分,每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员 在计算机系统设计时,为了提高系统性能,应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度 重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度 为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法 与全相联映象相比,组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令 流水操作中,遇到数据相关时,采用的解决办法有________。 A)用优化编译器检测,通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络 虫蚀寻径以流水方式在各寻径器是顺序传送的是________。 授课:XXX

计算机系统结构模拟题

《计算机系统结构》模拟题(补)一.单项选择题 1. SIMD是指()。 A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2. 磁盘外部设备适合于连接到()。 A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 3. 下列()存储设备不需要编址。 A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 4.多处理机的各自独立型操作系统( )。 A.要求管理程序不必是可再入的 B.适合于紧耦合多处理机 C.工作负荷较平衡 D.有较高的可靠性 5.输入输出系统硬件的功能对( )是透明的。 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 6. 实现汇编语言源程序变换成机器语言目标程序是由()。 A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 7.全相联地址映象是指( )。 A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间是固定的,而组任何虚页可以装入任何实页位置 D.组间可任意装入,组是固定装入 8.( )属于MIMD系统结构。 A.各处理单元同时受同一个控制单元的管理 B.各处理单元同时接受同一个控制单元送来的指令 C.松耦合多处理机和多计算机 D.阵列处理机

9.设16个处理器编号分别为0,1,2,…,15用Cube3互联函数时,第10号处理机与第( ) 号处理机相联。 A.11 B.8 C.14 D.2 10.若输入流水线的指令既无局部性相关,也不存在全局性相关,则( )。 A.可获得高的吞吐率和效率 B.流水线的效率和吞吐率恶化 C.出现瓶颈 D.可靠性提高 11.流水线的技术指标不包括( )。 A.响应比 B.吞吐率 C.加速比 D.效率 12.指令优化编码方法,就编码的效率来讲,方法最好是()。 A. 固定长度编码 B. 扩展编码法 C. Huffman编码法 D. 以上编码都不是 13.RISC 计算机的指令系统集类型是 ( ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器 - 存储器型 14.相联存储器的访问方式是( )。 A.先进先出顺序访问B.按地址访问 C.无地址访问D.按容访问 15.存储器读写速率越高,每位的成本也越高,存储容量也小。解决这一问题的主要方法是采用( )。 A.多级存储体系结构B.并行存储器 C. Cache D.缓冲技术 16.计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是()。 A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 17.对系统程序员不透明的是()。 A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 18.在计算机系统设计中,比较好的方法是()。

《计算机体系结构》期末复习题标准答案

《计算机体系结构》期末复习题答案

————————————————————————————————作者:————————————————————————————————日期:

《计算机体系结构》期末复习题答案 系别_________ 班级_________ 姓名__________ 学号__________ 一、填空题(每空1分) 1.按照弗林(Flynn)分类法,计算机系统可以分为4类:SISD计算机、(SIMD计算机)、(MISD计算机)和(MIMD计算机)。 2. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心,总线结构,分散控制。 3. 当前计算机系统中的存储系统是一个层次结构,其各层分别为:(通用寄存器,高速缓存,主存,辅存,脱机大容量存储器)。 4.高速缓冲存储器的地址映象方式有三种,它们分别是:(全向量方式,直接相联方式,组相联方式)。 5.虚拟存储器的三种管理方式是(段式管理,页式管理和段页式管理)。 6.目前计算机中常用数据有(用户定义数据,系统数据和指令数据)三种类型。 7.通常可能出现的流水线的相关性有(资源相关,数据相关和控制相关)。 8.解决中断引起的流水线断流的方法有(不精确断点法和精确断点法)。 9.目前向量处理机的系统结构有两种:(存储器-存储器型和寄存器-寄存器型)。 10.通用计算机基本指令分为5类,它们分别是:(数据传送类,运算类,程序控制类,输入输出类,处理机控制和调试类)。 11.执行指令x1=x2+x3;x4=x1-x5会引起(RAW)类型的数据相关,执行指令x5=x4*x3;x4=x0+x6会引起(W AR)类型的数据相关,执行指令x6=x1+x2;x6=x4*x5会引起(WA W)类型的数据相关。 12.多计算机网络中,通常出现的4种通信模式是(单播模式,选播模式,广播模式和会议模式)。 13.传统的冯?诺依曼计算机是以控制驱动方式工作,以数据驱动方式工作的典型计算机是(数据流计算机),以需求驱动方式工作的典型计算机是(归约机),以模式匹配驱动方式工作的典型计算机是(人工智能计算机)。 二、名词解释(每题2分) 1.计算机体系结构: 计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性,是硬件子系统的概念结构及其功能特性。 2.系列机: 所谓系列机是指同一厂家生产的具有相同的系统结构,但采取了不同的组成和实现的技术方案,形成了不同型号的多种机型。 3.模拟: 模拟是指用软件的方法在一台计算机上,实现另一台计算机的指令系统,被模拟的机器是不存在的,称为虚拟机,执行模拟程序的机器称宿主机。 4.程序的局部性原理: 程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律,即程序往往重

计算机系统结构期末考试试题及其答案

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页 共 24 页 计算机科学系《计算机系统结构》期末考试试卷(A 卷) 2、此试卷适用于计算机科学与技术本科专业。 一 单选题:(10分,每题1分) 1、 ."启动I/O"指令是主要的输入输出指 令,是属于( B ) A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对(B )是透 明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定,组内任何虚页可装入任何实页位

置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写 后读的数据相关,则(B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是(B) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是 (C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

上海大学 计算机系统结构复习题汇总

计算机系统结构复习题 一、单项选择题 1、直接执行微指令的是( C ) A.汇编程序B.编译程序 C.硬件D.微指令程序 2、对系统程序员不透明的应当是( D )。 A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器 3、对机器语言程序员透明的是( B )。 A.中断字B.主存地址寄存器 C.通用寄存器D.条件码 4、计算机系统结构不包括( A )。 A.主存速度B.机器工作状态 C.信息保护D.数据 5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( C )。 A.计算机软件所要完成的功能B.计算机硬件的全部组成 C.编程要用到的硬件组织D.计算机各部件的硬件实现 6、计算机组成设计不考虑( B )。 A.专用部件设置B.功能部件的集成度 C.控制机构的组成D.缓冲技术 7、以下说法中,不正确的是( B )。 软硬件功能是等效的,提高硬件功能的比例会: A.提高解题速度B.提高硬件利用率 C.提高硬件成本D.减少所需要的存贮器用量 8、在系统结构设计中,提高软件功能实现的比例会( C )。 A.提高解题速度B.减少需要的存贮容量 C.提高系统的灵活性D.提高系统的性能价格比 9、下列说法中不正确的是( D )。 A.软件设计费用比软件重复生产费用高 B.硬件功能只需实现一次,而软件功能可能要多次重复实现 C.硬件的生产费用比软件的生产费用高 D.硬件的设计费用比软件的设计费用低 10、在计算机系统设计中,比较好的方法是( D )。 A.从上向下设计B.从下向上设计 C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( A )。 A.传统机器语言级与操作系统机器级之间 B.传统机器语言级与微程序机器级之间 C.微程序机器级与汇编语言机器级之间 D.操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( B )。 A.向前兼容,并向上兼容 B.向后兼容,力争向上兼容

计算机系统结构考试计算题

有一指令流水线如下所示 入 1 2 3 4 出 50ns 50ns 100ns 200ns (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段请采取两种不同的措施消除此“瓶颈”。对 于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少 解:(1) 2200(ns) 2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1T n TP 1pipeline -== 45.45%11 5 4400TP m t TP E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 变成八级流水线(细分) 850(ns) 509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n TP 1pipeline -== 58.82%17 10 8400TP m ti TP E m 1 i ≈=? =?? =∑= 重复设置部件 1 2 3_1 3_2 4_1 4_4 入 出

)(ns 851T n TP 1pipeline -== 58.82%17 10 8 85010400E ≈=??= 有一 4段组成,其3段时,总次,然后流到第4段。如果 需要的时间都是t ?,问: (1) 当在流水线的输入端连续地每t ?时间输入任务时,该流水线会发生 什么情况 (2) 此流水线的最大吞吐率为多少如果每t ?2输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少 (3) 当每段时间不变时,如何提高该流水线的吞吐率仍连续处理10个任 务时,其吞吐率提高多少 (2)

计算机系统结构复习题分析

计算机系统结构复习

1从使用语言角度,可将系统按功能划分为多层次机器级结构,层次结构分别是:应用语 _________ 言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微 程序序机器级。 2、各机器级的实现主要靠翻译和解释或两者结合进行。翻译是先用转_________ 级上的程序整个地变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技__________ 术。解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功—能,是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。 3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。 4、计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定,提供机器语言、汇编语言程序设计或编译程序生成系统为使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。 5、计算机系统结构的属性包括:数据_________ 组织、中断机构、系统机器级的管态和用户态的定义和切换、机器级的I/O结构、系统各部 分的信息保护方式和保护机构等属性。 6、机器透明性:指相对于每一机器级设计人员,都客观存在的功能或属性看不到的现象,称相对于此级设计人员来说,这此功能或属性是具有透明性,即透明的。 7、计算机组成指的是计算机系统结构的逻辑实现,包括机器级内部的数据流和控制流的组 成以及逻辑设计等。它着眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各 部件间的联系。 8计算机组成设计要解决的问题是在所______________________________________________________ 各种设备各部件组织成计算机,来实现所确定的系统结构。 9、当前,计算机组成设计主要是围绕_________ 功能的分散和设置专用功能部件来进行的。 10、计算机组成设计要确定的方面一般应包括:数据通路宽路、专用部件的设置、各种操作对部件的共享程度、功能部件的并行度、控制机构的组成方式、缓冲和排队技术、预估预判技术、可靠性技术等。 11、计算机实现指计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术,其中,器件技术在实现技术中起着主导作用。 12、计算机系统结构设计的任务是进行软、硬件的功能分配,确定传统机器级的软、硬件界面。 13、软、硬件取舍的三个基本原则是: 第一个基本原则是应考虑在现有硬、器件(主要是逻辑器件和存储器)条件,系统要有高 的性能价格比,主要从实现费用、速度和其他性能要求来综合考虑。 第二个基本原则是要考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不 合理地限制各种组成、实现技术的采用。 第三个基本原则是从"软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持放在首位。 14、程序运行的时间应该是衡量机器时间(速度)性能最可靠的标准。 15、计算机性能诵常用峰值性能及持续性能来评价。峰值性能是指在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能。 16、持续性能的表示有算术性能平均值、调和性能平均值和几何性能平均值三种。 17、算术性能平均是通常对系统执行时间评价;调和性能平均值反映运行全部程序所需的时

相关文档
相关文档 最新文档