当前位置：文档库 › 高等计算机系统结构习题

高等计算机系统结构习题

★★

1、解释下列术语

计算机系统结构

计算机组成

计算机实现

【答案】计算机系统结构、计算机组成和计算机实现是三个不同的概念。系统结构定义为由程序设计者所看到的一个计算机系统的属性，即概念性结构和功能特性，这里的程序设计者是指为机器语言或编译程序设计者所看到的计算机属性，是硬件子系统的概念结构及其功能特性，它是计算机系统的软、硬件的界面。计算机组成是计算机系统结构的逻辑实现，包括机器内部的数据流和控制流的组成以及逻辑设计等。计算机实现是指计算机组成的物理实现。

★★

2、解释下列术语

系列机

兼容机

模拟

仿真

【答案】所谓系列机是指在一个厂家内生产的具有相同的系统结构，但具有不同组成和实现的一系列不同型号的机器。不同公司厂家生产的具有相同系统结构的计算机成为兼容机。

系列机方法能够在具有相同系统结构的各种机器之间实现软件移植，为了实现软件在不同系统结构的机器之间的相互移植，可以采用模拟和仿真。模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。仿真是指用微程序直接解释另一种机器指令系统的方法。

★

3、SIMD是指（）

A、单指令流单数据流

B、单指令流多数据流

C、多指令流单数据流

D、多指令流多数据流

【答案】B

★★

4、从执行程序的角度看，并行性等级可分为哪些？

【答案】指令内部并行、指令级并行、任务级或过程级并行、作业或程序级并行。

★★★

5、名词解释

Amdahl定律、CPI

【答案】Amdahl定律：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

Fe=（改进前可改进部分占用的时间）/（改进前整个任务的执行时间）

Se=（改进前可改进部分的执行时间）/（改进后改进部分的执行时间）

则，改进后整个系统加速比为e

e e n S F F s /)1(1

+-=。

每条指令平均时钟周期数

CPI=CPU 时钟周期数/IC （指令的条数）=∑=n

i i

i IC

I CPI 1

( 其中i I =指令i 在程序中执行的次数 ★★

6、名词解释

MIPS 、MFLOPS 【答案】MIPS=

?执行时间指令条数=610?CPI f MFLOPS=

?执行时间程序中的浮点操作次数 ★

7、按照计算机系统层次结构，算术运算、逻辑运算和移位等指令应属于（）级机器语言。

A 、传统机器语言机器

B 、操作系统机器

C 、汇编语言机器

D 、高级语言机器【答案】B ★

8、按照Flynn 分类法，多处理机属于（）。 A 、SISD B 、SIMD C 、MISD D 、MIMD 【答案】D ★★

9、按照Amdahl 定律，假设将某系统的某一部件的处理速度加快到原来的5倍，但该部件的原处理时间仅为整个运行时间的20%，则采用加快措施后能使整个系统的性能提高到原来的（）倍。 A 、1/0.36 B 、1/0.24 C 、1/0.45 D 、1/0.84 【答案】D ★

10、对计算机系统结构，下列（）是透明的。 A 、浮点数据表示 B 、程序性中断

C 、访问方式保护

D 、阵列运算部件【答案】D ★

11、对汇编语言程序员，下列（）不是透明的。 A 、中断字寄存器 B 、乘法器

C 、移位器

D 、指令缓冲器【答案】A ★★

12、下列（）兼容方式对系列机来说是必须做到的。 A 、向前兼容 B 、向后兼容 C 、向上兼容 D 、向下兼容【答案】B ★★

13、如果某一个计算任务用向量方式求解比用标量方式求解要快10倍，称可用向量方式求解部分所花费时间占总时间的百分比为可向量化百分比。请画出加速比与可向量化比例两者关系的曲线，并回答加速比为2和5时，可向量化百分比分别为多少。

【答案】解：设可向量化百分比为x ，加速比为y ，根据Amdahl 定律，有

x y 9.011

1011-=

+-=

。图略

则，9.0)

11(y x -=。y=2时，x=

%6.559

y=5时，x=%9.889

★★

14、用一台433MHz 的处理器执行标准测试程序，它包含的各类指令和相应的时钟周期数如下表，求有效CPI 、MIPS 速率和程序的执行时间。指令类型指令数时钟周期数整数运算 50 000 1 数据传送 35 000 2 浮点运算 12 000 2 控制传送 7 000 2 【答案】

解：∑==n

i IC

Ii CPIi CPI 1)*

( =(50000*1+35000*2+12000*2+7000*2)/(50000+35000+12000+7000) =1.52周期/指令

)

4336

.1/(

/(6

CPI

285

MIPS==MIPS

)

执行时间t=(50000*1+35000*2+12000*2+7000*2)/(433*6

10)=3.649*s3

10-

★

15、假设对A机器指令系统的每条指令的解释执行可直接由B机器的一段微程序解释执行，则A称为（）。

A、仿真机

B、宿主机

C、虚拟机

D、目标机

【答案】D

★

16、假设用软件方法在A计算机上实现B计算机的指令系统，则B称为（）。

A、仿真机

B、宿主机

C、虚拟机

D、目标机

【答案】C

★

17、在计算机系统层次结构图中，下列四个级别机器由下到上应按（）排列：（1）、汇编语言机器（2）、微程序控制机器

（3）、传统机器语言机器（4）、操作系统机器

A、（2）（3）（4）（1）

B、（2）（4）（3）（1）

C、（3）（2）（1）（4）

D、（1）（2）（3）（4）

【答案】A

★★

18、在计算机系统设计的方法中，“由中间开始”设计方法通常把“中间”取在（）。

A、传统机器级和操作系统机器级之间

B、操作系统机器级和汇编语言机器级之间

C、传统机器级和汇编语言机器级之间

D、微程序控制机器级和传统机器级之间

【答案】A

★

19、在系列机的软件兼容中，按某档机器编制的程序，不加修改就能运行于比它高档的机器，叫做（）。

A、向下兼容

B、向上兼容

C、向前兼容

D、向后兼容

【答案】B

★★

20、什么是访问的局部性原理，有哪两种，分别是什么？

【答案】局部性原理是指根据程序的最近情况，可以较精确地预测出最近地将来将要用到哪些指令和数据。局部性分为时间上的局部性和空间上的局部性。时间上的局部性是指最近访问过的代码是不久将被访问的代码。空间上的局部性是指那些地址上相邻近的代码可能会被一起访问。

★

21、用于科学计算的计算机中，标志系统性能的主要参数是（）。

A、提高CPU主频

B、扩大主存容量

C、采用非冯.诺依曼结构

D、采用并行处理技术

【答案】A

★

22、下列体系结构中，最适合多个任务并行执行的体系结构是（）。

A、流水线向量机结构

B、堆栈处理机结构

C、共享存储多处理机结构

D、分布存储多计算机结构

【答案】C

★★

23、对计算机系统结构按照Handler法分类，PEPE表示为t(ILLIAC Ⅳ)= (1，64，64)，则在Flynn分类法中，它属于（）。

A、SISD

B、SIMD

C、MISD

D、MIMD

【答案】B

★

24、在冯〃诺依曼计算机特征中，机器以（）为中心。

A、存储器

B、输入输出设备

C、运算器

D、控制器

【答案】C

★

25、如果有一个经解释实现地计算机，可以按功能划分为3级。每一级为了执行一条指令需要下一级的M条指令解释。若执行第一级的一条指令需要Kns的时间，那么执行第三级的一条指令需要用（）ns时间。

A、KM

B、K2M

C、KM3

D、KM2

【答案】D

★

26、从用户的观点看，评价计算机系统性能的综合参数是（）。

A、指令系统

B、吞吐率

C、主存容量

D、主频率

【答案】B

★

27、主频为400MHz的微处理机，平均每条指令的执行时间为两个机器周期，每个机器周期由两个时钟脉冲组成，则当存储器为“零等待”时，机器运行速度为（）MIPS。

A、100

B、200

C、300

D、400

【答案】A

★★

28、为使虚存系统有效地发挥其预期的作用，所运行的程序应具有的特性是（）。

A、该程序不应含有过多的I/O操作

B、该程序的大小不应该超过实际的内存容量

C、该程序应具有较好的局部性

D、该程序的指令相关不应过多

【答案】C

★★

29、下列哪个方法不能提高并行性？

A、时间重叠

B、资源重复

C、资源共享

D、分布存储

【答案】D

★

30、在采用基准测试程序来测试评价机器的性能时，下列方法按照评价准确性递增的顺序排列是（）。

（1）、实际的应用程序方法

（2）、核心程序方法

（3）、玩具基准测试程序（小测试程序）

（4）、综合基准测试程序

A、（1）（2）（3）（4）

B、（2）（3）（4）（1）

C、（3）（4）（1）（2）

D、（4）（3）（2）（1）

【答案】D

★

31、每秒百万指令条数为（）。

A、IC

B、CPI

C、MIPS

D、MFLOPS

【答案】C

★

32、软件和硬件在（）意义上是等效的。

A、系统结构

B、功能

C、性能

D、价格

【答案】B

★★

33、机器工作状态的定义和切换对（）来说是透明的。

A、操作系统操作员

B、机器语言程序员

C、逻辑设计员

D、硬件维护员设计员

【答案】A

★★★

34、某台计算机只有Load/Store 指令能对存储器进行读/写操作，其它指令只对寄存器进行操作。根据程序跟踪实验结果，已知每种指令所占的比例及CPI 数如下：

指令类型指令所占比例 CPI

算逻指令43％ 1

Load指令21％ 2

Store指令12％ 2

转移指令24％ 2

(1)求上述情况下的平均CPI。

(2)假设程序由M条指令组成。算逻运算中25%的指令的两个操作数中的一个已在寄存器中，另一个必须在算逻指令执行前用Load指令从存储器取到寄存器。因此有人建议增加另一种算逻指令，其特点是一个操作数取自寄存器，另一个操作数取自存储器，即寄存器?存储器类型，假设这种指令的CPI等于2。同时，转移指令的CPI变为3。求新指令系统的平均CPI。

【答案】

（1）CPI旧＝(0.43×1＋0.21×2＋0.12×2+0.24×2)=1.57

（2）原算逻指令中的25％变成了寄存器?存储器型指令，所以算逻指令(寄存器?寄存器型)少了(0.25×0.43)M 条，Load指令少了(0.25×0.43)M 条，而(0.25×0.43)M 条的新指令为寄存器?存储器型指令。指令总数少了

(0.25×43%)M条。设执行算逻指令(寄存器?寄存器型)、Load指令、算

逻指令(寄存器?存储器型)、Store指令和转移指令的周期总数分别为C1，C2，C3，C4，C5，所以:

C1=(0.43-(0.25×0.43))M×1=0.3225M

C2=(0.21-(0.25×0.43))M×2=0.205M

C3=(0.25×0.43)M×2=0.215M

C4=0.12M×2=0.24M

C5=0.24×3M=0.72M

新指令总数N=（1-(0.25×0.43)）M=0.8925M

CPI新=（C1+C2+C3+C4+C5）/ N=1.7025M/0.8925M=1.908

★★★

35假设一台计算机可用两种运行方式，即常规方式与提高方式执行一个程序，其概率分布分别为{α，1-α}。

(a) 假如α在a与b之间变动，0≤a

子表达式。（2

))(1(2++-=

a b n n

S 平均, n 为性能提高的倍数）

试计算a →0和b →1时的加速比因子。【答案】

（a ）2

))(1(2++-=a b n n

S 平均

, n 为性能提高的倍数（b ）)

1(2S +=

n n

平均 ★★

36、假设在一台40MHZ 处理机上运行200,000条指令的目标代码，程序主要由四种指令组成。根据程序跟踪实验结果，已知指令混合比和每种指令所需的指令

根据所得的CPI,计算相应的MIPS 速率。【答案】

平均%10*8%12*4%18*2%60*1+++=CPI =2.24

86.1710

*24.24010*6

6===MHZ

CPI f MIPS ★★

37、假设高速缓存Cache 工作速度为主存的5倍，且Cache 被访问命中的概率为90%，则采用Cache 后，能使整个存储系统获得多高的加速比？【答案】

Speedup = 5

/9.01.01

+=3.57

★★★

38、假定一个计算机设计者，对高级语言结构的使用进行研究，结果表明过程调用是最常用的操作之一。该设计者已设想了一个优化的设计方案，它能减少过程调用和返回所需的取存指令次数。为了进行验证，对未加优化和已优化的方案进行实验测试，假定所使用的是相同的优化编译器。实验测得结果如下：（1）为优化方案的时钟周期比优化的快5％

（2）未优化方案中的取存指令数占总指令数的30％

（3）优化方案中的取存指令数比未优化的少1/3，对于其他指令，两种方案的动态执行数没有变化

（4）所有指令，包括取存，均只需1个时钟周期

要求定量的判断，哪一个设计方案使计算机工作的速度更快。【答案】

由（1）可知，未优化方案的时钟周期t=0.95t1，t1为优化后的时钟周期由（2）（3）可以得到优化方案的指令条数

IC IC IC IC 9.0*%70*%30*)3/11(1=+-=

由（4）可知，两种方案的CPI 都是1，又因为

06.11

*1*1**1===t CPI IC t CPI IC T T S p

所以，优化后的方案工作速度更快。

★★★

39、假定要将某一执行部件改进后速度提高10倍，改进后被改进部件执行时间占系统总运行时间的50％。问改进后，获得的加速比p S 是多少？【答案】

假设系统在改进前后的执行时间分别为1T 和2T ，则

Fe Fe T T S p /)1(1

21+-=

（1）

由（1）式，得 12*]/)1[(T Se Fe Fe T +-= （2）由题意 10

*%501

2T Fe T =

（3）（2）-（3），得 12*)1(%50T Fe T -= （4）

*2*10T T Fe =

（5）

由（4）（5）可得 5.52

T T S p ★★★

40、某工作站采用时钟频率f 为15MHz ，CPI 为1.5的处理机来执行一个已知混合程序。假定每次存储器存取为1个周期延迟，问：（1）此计算机的处理速率为多少MIPS ？

（2）假定将处理机的时钟频率f 提高到30MHz ，但存储器子系统的速率不变。

这样，每次存储器存取需要2个时钟周期，如果30％指令每条只需要一次存储存取，而另外5％每条需要2次存储存取，还假定已知混合程序的指令数不变，并与原工作站兼容，试求改进后的处理机性能。【答案】

（1） MIPS=f/(CPI*106)=15*106/(1.5*106)=10MIPS

（2）如题所述，30％的指令需要一次存储存取，则这些指令在处理器提高时

钟频率之后需要增加1个时钟周期；同样，另外5％的指令需要增加2个时钟周期。

new CPI =(改进前执行混合程序所需的时钟周期数+30％*1*指令数+5%*2*指令数)/指令数

=old CPI +30%*1+5%*2=1.5+0.3+0.1=1.9

处理速率MIPS=MIPS CPI f new new 79.15)10*9.1/(10*30)10*/(666== 假设混合程序的指令数为IC ，则有

58.1/*/*=new

new old

old f IC CPI f IC CPI

可见，改进后工作站性能提高了。

★★★

41、1台向量计算机1次只能以下述两种执行方式中的一种运行：一种是向量方式，执行速度v R 为10MFLOPS ；另一种是标量方式，执行速度s R 为1MFLOPS 。设α是该计算机的典型程序代码中可向量化部分的百分比。（a ）推导出该计算机平均执行速度R 的公式

（b ）要使R 达到7.5MFLOPS ，问向量化百分比α应多大？

（c ）假设s R =1MFLOPS ，α=0.7，要使R 达到2MFLOPS ，问v R 应为多大？【答案】（a ）α

αα91010

)1(10/1-=

-+=

R （b ）R=7.5，则5.791010

=-α

，α=0.963

（c ）Rs

Rv R /)1(/1

αα-+=

，

则5.3)

7.01(5.07

.0/)1(/1=--=

--=

R Rv αα

MFLOPS

★★★

42、假设我们有一个需要运行100秒的标准程序，其中有90秒是CPU 时间而剩下的是I/O

占用的时间。如果在以后的五年中，CPU 速度每年提高50%且I/O 时间保持不变，那么五年后我们的程序要耗费多少时间？

【答案】

耗费的时间 = CPU 时间 +I/O 时间 100 = 90 + I/O 时间 I/O 时间 = 10 秒

下表计算新的处理器时间和剩下的运行时间:

★★★

43、计算机系统有三个部件可以改进，这三个部件的加速比如下：部件1加速比S1=30；部件2加速比S2=20；部件3加速比S3=10；（1）如果部件1和部件2的可改进比例为30％，那么当部件3的可改进比例为多少时，系统的加速比才可以达到10？

（2）如果三个部件的可改进比例为30％、30％和20％，三个部件同时改进，那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少？【答案】

（1）多个部件可改进情况下Amdahl 定理的扩展

∑

∑+-=

Fi Fi S )1(1

其中，Fi 为可加速部件I 在未优化系统中所占的比例，

Si 是部件I 的加速比。

}332211)]321(1{[-+++

++-=S F S F S F F F F S 1

}10

3203.0303.0)]33.03.0(1{[10-+++++-=F F

∴F3=0.36=36% （2）%8282.07.1412

2.010

2.020

3.0303.0)]2.03.03.0(1[===+++++-=

T T T T T p

★★★

44、假设我们考虑条件分支指令的两种不同设计方法如下： CPU1：通过比较指令设置条件码，然后测试条件码进行分支。 CPU2：在分支指令中包括比较过程。

在两种CPU 中，条件分支指令都占用2个时钟周期而所有其他指令占用1个时钟周期，对于CPU1，执行的指令中分支指令占20％；由于每个分支指令之前都需要有比较指令，因此比较指令也占20％。由于CPU1在分支时不需要比较，因此假设它的时钟周期时间比CPU2快1.25倍。哪一个CPU 更快？如果CPU1

的时钟周期时间仅仅比CPU2快1.1倍，哪一个CPU更快？

【答案】

对于CPU1，占用2个时钟周期的分支指令占总指令的20％，剩下的指令占用1个时钟周期，所以CPI1=0.2*2+0.8*1=1.2

总CPU时间T1=IC*1.2*时钟周期1

根据假设，有：时钟周期2=1.5*时钟周期1

在CPU2中，没有独立的比较指令，所以CPU2的程序量为CPU1的80%，分支指令的比例为：20%/80%=25%

这些分支指令占用2个时钟周期，而剩下的75%的指令占用1个时钟周期，因此：CPI2=0.25*2+0.75*1=1.25

IC2=0.8*IC1

总CPU时间T2=IC2*CPI2*时钟周期2=0.8*IC1*1.25*1.25*时钟周期1

=1.25*IC1*时钟周期1

在这些假设之下，尽管CPU2执行指令条数较少，CPU1因为有着更短的时钟周期，所以比CPU2快。

如果CPU1的时钟周期仅仅比CPU2快1.1倍，则

时钟周期2=1.1*时钟周期1

T2=1.1*IC1*时钟周期1

因此，CPU2由于只能更少的指令，比CPU1运行更快。

★★

45、从机器（汇编）语言程序员看，以下哪些是透明的？

指令地址寄存器；指令缓冲器；时标发生器；条件码寄存器；乘法器；主存地址寄存器；磁盘外设；先行进位链；移位器；通用寄存器；中断字寄存器

【答案】

透明的有：指令缓冲器、时标发生器、乘法器、磁盘外设、先行进位链、移位器

★★

46、实现软件移植的主要途径有哪些？它们存在什么问题？适用于什么场合？【答案】

（1）采用系列机方法，只能在具有相同系统结构的各种机器之间实现软件移植，一般是一个厂家生产的机器。

（2）采用模拟与仿真的方法，可在不同系统结构的机器之间相互移植软件，对于使用频率较高的指令，尽可能用仿真方法以提高运算速度，而对于使用

频率低且难于用仿真实现的指令则用模拟方法来实现。

（3）采用统一的高级语言方法，可以解决结构相同或完全不同的各种机器上的软件移植，但是，要统一高级语言，语言的标准化很重要，但难以在短期

内解决。

★★

47、在SUN SPARC2工作站上，对SPEC Benchmark进行测试，获得了如下所示的速率值，求出其算术、几何及调和平均值（以MFLOPS表示）

程序名速率（MFLOPS）

GCC 10.7

Espress0 8.9 Spice2g6 8.3 DODUC 5.0 NASA7 8.7 Li 9.0 Eqntott 9.7 Matrix300 11.1 FPPPP 7.8 TOMCATV

5.6

【答案】算术平均值

48.8)6.58.71.117.90.97.80.53.89.87.10(10

=+++++++++ 几何平均值10)6.5*8.7*1.11*7.9*0.9*7.8*0.5*3.8*9.8*7.10(=8.25 调和平均值

.76.5/18.7/11.11/17.9/10.9/17.8/10.5/13.8/19.8/17.10/110

=+++++++++ ★★

48、某计算机系统采用浮点运算部件后，使浮点运算速度提高到原来的20倍，而系统运行一程序的整体性能提高到原来的5倍，试计算该程序中浮点操作所占的比例。

【答案】设该程序中浮点操作所占的比例是x

有：20

/)1(1

5x x +-=

∴x=0.8/0.95=84.2%

★★★

49、假定我们有一台计算机，如果所有的cache 访问都命中的话，它的CPI 是2.0。唯一的数据访问指令是store 和load ，它们占指令总数的40％，不命中损失是25个时钟周期，不命中率是2％。如果所有的指令访问cache 都命中的话，那么机器的速度是存在cache 不命中时的多少倍？【答案】

首先计算所有cache 访问都命中时计算机的性能：

CPU 执行时间＝（CPU 时钟周期＋内存停机周期）×时钟周期时长＝（IC ×CPI ＋0）×时钟周期时长＝ IC ×2.0×时钟周期时长

现在计算考虑cache 不命中在内的真实计算机性能，我们先计算内存停机周期：

内存停机周期=IC ×每条指令访问内存的次数×不命中率×不命中损失 =IC ×（1＋0.4）×0.02×25

=IC ×0.7

其中（1＋0.4）代表每条指令访问一次内存, 而占指令总数40%的store 和load 访问两次内存, 所以平均每条指令访问访问(1+0.4)次内存。这样总的性能是：

CPU执行时间=（IC×2.0＋IC×0.7）×时钟周期时长

= IC×2.7×时钟周期时长

性能提高的比是执行时间之比的倒数：

cache不命中考虑在内的CPU执行时间/cache访问全部命中的CPU执行时间=2.7×IC×时钟周期时长/2.0×IC×时钟周期时长

=1.35

cache访问全部命中时的速度是有cache不命中时机器速度的1.35倍。

★★★

50、下面由六条指令组成的代码段需运行64次才能计算向量算术表达式：

D(I) = A(I) + B(I) x C(I)，其中0≤I≤63。

Load R1,B(I) /R1←Memory(α+I)/

Load R2,C(I) /R2←Memory(β+I)/

Multiply R1,R2 /R1←(R1) x (R2)/

Load R3,A(I) /R3←Memory(γ+I)/

Add R3,R1 /R3←(R3)+(R1)/

Store D(I),R3 /Memory(θ+I)←(R3)/

这里R1、R2和R3为CPU的寄存器，(R1)是R1的内容，α、β、γ和θ分别是数组B(I)、C(I)、A(I)和D(I)的起始存储地址。假设在一台SIMD机中，不论单处理机还是单个PE，每次取数或存数需4个时钟周期，加法需2个周期，乘法需8个周期。

计算在一台SISD单处理机计算机上依次重复执行上述代码段64次所需的CPU周期数，忽略所有其它延迟时间。

假设用一台有64个PE的SIMD机，以6条同步向量指令对64组向量数据执行上述向量操作，所用的时钟速率与前面一样。计算SIMD机的总执行时间，忽略指令广播及其它延迟。

SIMD计算机与SISD计算机相比，其加速比为多少？

【答案】

该程序段中每条指令所需的周期数如下所示：

Load R1,B(I) 4

Load R2,C(I) 4

Multiply R1,R2 8

Load R3,A(I) 4

Add R3,R1 2

Store D(I),R3 4

运行一遍这六条指令，共需要（忽略其它延迟时间）4＋4＋8＋4＋2＋4＝26个周期。

在一台SISD单处理计算机上依次重复执行上述代码段64遍所需的CPU周期数为26×64 = 1664

在一台有64个PE的SIMD机，以6条同步向量指令直接对64组向量数据执行上述向量操作，那么只需要执行一遍，所需CPU周期数为26。SIMD计算机和SISD计算机相比，加速比为1664/26 = 64。

计算机系统结构题库

《计算机系统结构》题库一．单项选择题（在下列每小题的四个备选答案中，只有一个答案是正确的，请把你认为是正确的答案填入题后的（）内，每小题2分）第一章： 1.计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是： A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级机器语言机器级---汇编语言机器级 D.汇编语言机器级---应用语言机器级---高级语言机器级答案：B 分数：2 所属章节1—1 2.汇编语言源程序变成机器语言目标程序是经来实现的。 A. 编译程序解释 B. 汇编程序解释 C. 编译程序翻译 D. 汇编程序翻译答案：D 分数：2 所属章节1—1 3.直接执行微指令的是： A. 汇编程序 B. 编译程序 C. 硬件 D. 微指令程序答案：C 分数：2 所属章节1—1 4.对系统程序员不透明的是： A. Cache存储器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存储器答案：D 分数：2 所属章节1—2 5.对应用程序员不透明的是： A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器答案：D 分数：2 所属章节1—2 6.对机器语言程序员透明的是： A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码答案：B 分数：2 所属章节1—2 7.计算机系统结构不包括： A. 主存速度 B. 机器工作状态 C. 信息保护 D. 数据表示答案：A 分数：2 所属章节1—2 8.对计算机系统结构透明的是： A. 字符行运算指令 B. 是否使用通道行I/O处理机 C. 虚拟存储器 D. VLSI技术答案：D 分数：2 所属章节1—2 9.对汇编语言程序员透明的是： A.I/O方式中的DMA访问方式 B. 浮点数据表示 C. 访问方式保护 D 程序性中断. 答案：A 分数：2 所属章节1—2 10.属计算机系统结构考虑的应是：

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的通过使用WINDLX模拟器，对程序中的三种相关现象进行观察，并对使用专用通路，增加运算部件等技术对性能的影响进行考察，加深对流水线和RISC处理器的特点的理解。 ·实验原理：指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤一．使用WinDLX模拟器，对做如下分析：（1）观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。（2）考察增加浮点运算部件对性能的影响。（3）考察增加forward部件对性能的影响。（4）观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程一．使用WinDLX模拟器，对做如下分析： } 浮点加、乘、除部件都设置为1，浮点数运算部件的延时都设置为4，如图1：图1 初始设置将和加载至WinDLX中，如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关；指出程序中出现上述现象的指令组合。 1）数据相关点击F7，使程序单步执行，当出现R-Stall时停止，运行过程中出现下图3所示，输入整数6。图3 输入整数6 @ 打开Clock Diagram，可以清楚的看到指令执行的流水线如图4所示。图4 指令流水线双击第一次出现R-Stall的指令行，如图5所示。

图5 指令详细信息对以上出现的情况分析如下：程序发生了数据相关，R-Stall（R-暂停）表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据；而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。上述过程发生了WR冲突，即写读相关。为了避免此类冲突， seq r5,r4,0×a的intEX指令延迟了一个周期进行。由此，相关指令为： 2）控制相关由图6可以看出，在第4时钟周期：第一条指令处于MEM段，第二条命令处于intEX段，第三条指令出于aborted状态，第四条命令处于IF段。图 6 指令流水线 }

计算机系统结构习题及答案

第1章计算机系统结构的基本概念 1、有一个计算机系统可按功能分成4级，每级的指令互不相同，每一级的指令都比其下一级的指令在效能上强M倍，即第i级的一条指令能完成第i-1级的M条指令的计算量。现若需第i级的N条指令解释第i+1级的一条指令，而有一段第1级的程序需要运行Ks，问在第 2、3和4级上一段等效程序各需要运行多长时间？答：第2级上等效程序需运行：(N/M)*Ks。第3级上等效程序需运行：(N/M)*(N/M)*Ks。第4级上等效程序需运行：(N/M)*(N/M)*(N/M)*Ks。 2、硬件和软件在什么意义上是等效的？在什么意义上又是不等效的？试举例说明。答：软件和硬件在逻辑功能上是等效的，原理上，软件的功能可用硬件或固件完成，硬件的功能也可用软件模拟完成。只是反映在速度、价格、实现的难易程度上这两者不同。 3、试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。答：计算机系统结构、计算机组成、计算机实现互不相同，但又相互影响。（1）计算机的系统结构相同，但可采用不同的组成。如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。从汇编语言、机器语言程序设计者看到的概念性结构相同，均是由中央处理机/主存，通道、设备控制器，外设4级构成。其中，中央处理机都有相同的机器指令和汇编指令系统，只是指令的分析、执行在低档机上采用顺序进行，在高档机上采用重叠、流水或其它并行处理方式。（2）相同的组成可有多种不同的实现。如主存器件可用双极型的，也可用MOS型的；可用VLSI单片，也可用多片小规模集成电路组搭。（3）计算机的系统结构不同，会使采用的组成技术不同，反之组成也会影响结构。如为实现A:=B+CD:=E*F,可采用面向寄存器的系统结构，也可采用面向主存的三地址寻址方式的系统结构。要提高运行速度，可让相加与相乘并行，为此这两种结构在组成上都要求设置独立的加法器和乘法器。但对面向寄存器的系统结构还要求寄存器能同时被访问，而对面向主存的三地址寻址方式的系统结构并无此要求，倒是要求能同时形成多个访存操作数地址和能同时访存。又如微程序控制是组成影响结构的典型。通过改变控制存储器中的微程序，就可改变系统的机器指令，改变结构。如果没有组成技术的进步，结构的进展是不可能的。综上所述，系统结构的设计必须结合应用考虑，为软件和算法的实现提供更多更好的支持，同时要考虑可能采用和准备采用的组成技术。应避免过多地或不合理地限制各种组成、实现技术的采用和发展，尽量做到既能方便地在低档机上用简单便宜的组成实现，又能在高档机上用复杂较贵的组成实现，这样，结构才有生命力；组成设计上面决定于结构，下面受限于实现技术。然而，它可与实现折衷权衡。例如，为达到速度要求，可用简单的组成但却是复杂的实现技术，也可用复杂的组成但却是一般速度的实现技术。前者要求高性能的器件，后者可能造成组成设计复杂化和更多地采用专用芯片。组成和实现的权衡取决于性能价格比等因素；结构、组成和实现所包含的具体内容随不同时期及不同的计算机系统会有差异。软件的硬化和硬件的软件都反映了这一事实。VLSI的发展更使结构组成和实现融为一体，难以分开。 4、什么是透明性概念？对计算机系统结构，下列哪些是透明的？哪些是不透明的？存储器的模m交叉存取；浮点数据表示；I/O系统是采用通道方式还是外围处理机方式；数据总线宽度；字符行运算指令；阵列运算部件；通道是采用结合型还是独立型；PDP-11系列的单总线结构；访问方式保护；程序性中断；串行、重叠还是流水控制方式；堆栈指令；存储器最小编址单位；Cache存储器。答：透明指的是客观存在的事物或属性从某个角度看不到。透明的有：存储器的模m交叉存取；数据总线宽度；阵列运算部件；通道是采用结合型还是独立型；PDP-11系列的单总线结构；串行、重叠还是流水控制方式；Cache存储器。不透明的有：浮点数据表示；I/O系统是采用通道方式还是外围处理机方式；字符行运算指令；访问方式保护；程序性中断；堆栈指令；存储器最小编址单位。P.S. 属于计算机系统结构的属性有：数据表示、寻址方式、寄存器组织、指令系统、存储组织、中断机构、I/O结构、保护机构等。属于组成的属性有：数据通路宽度、专用部件设置、功能部件并行度、控制机构的组成方式，可靠性技术等。它着眼于机器内各事件的排序方式，控制机构的功能及部件间的关系。属于实现的属性有：部件的物理结构、器件、模块的划分与连接、微组装技术、信号传输技术等，它着眼于器件技术和微组装技术。 5、从机器（汇编）语言程序员看，以下哪些是透明的？指令地址寄存器；指令缓冲器；时标发生器；条件寄存器；乘法器；主存地址寄存器；磁盘外设；先行进位链；移位器；通用寄存器；中断字寄存器。答：透明的有：指令缓冲器、时标发生器、乘法器、主存地址寄存器、先进先出链、移位器 6、下列哪些对系统程序员是透明的？哪些对应用程序员是透明的？系列机各档不同的数据通路宽度；虚拟存储器；Cache存储器；程序状态字；“启动I/O”指令；“执行”指令；指令缓冲寄存器。答:对系统程序员透明的有：虚拟存储器；Cache存储器；程序状态字；对应用程序员透明的有：系列机各档不同的数据通路宽度；“启动I/O”指令；“执行”指令；指令缓冲寄存器。该题答案纯属本人个人见解。对系统程序员透明是否意味着有计算机系统结构透明，而对应用程序员透明则对应着对计算机组成透明呢？----lanjing 以下摘自南京大学出版社出版，李学干主编的辅导书

2010年4月自考计算机系统结构试题及答案

全国2010年4月自学考试计算机系统结构试题课程代码：02325 一、单项选择题(本大题共10小题，每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1．在计算机系统结构设计中，提高软件功能实现的比例可( ) A．提高解题速度B．减少需要的存储器容量 C．提高系统的灵活性D．提高系统的性能价格比 2．浮点数表示的尾数的基r m=16，尾数长度p=8，可表示的规格化最大正尾数的值是( ) A．1／256 B．1／2 C．15／16 D．255／256 3．下列数据存储空间为隐含寻址方式的是( ) A．CPU中的通用寄存器B．主存储器 C．I／O接口中的寄存器D．堆栈 4．当计算机系统执行通道程序完成输入输出工作时，执行通道程序的是( ) A．CPU B．通道 C．CPU和通道D．指定的外设 5．下列有关中断的叙述正确的是( ) A．中断响应的次序是由硬件决定的B．中断处理的次序是由硬件决定的 C．中断处理的次序是不可改的D．中断响应的次序是可灵活改变的 6．与虚拟存储器的等效访问速度无关．．的是( ) A．访存页地址流B．页面替换算法 C．主存的容量D．辅存的容量 7．非线性流水线的特征是( ) A．一次运算中使用流水线中的多个功能段 B．一次运算中多次使用流水线中的某些功能段 C．流水线中某些功能段在各次运算中的作用不同 D．流水线的各功能段在不同的运算中可以有不同的连接 8．属于集中式共享存储器结构的SIMD计算机是( ) A．ILLIAC IV B．BSP C．CM-2 D．MP-1 1

计算机体系结构实验报告二

实验二结构相关一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。透明性：在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。 CPI：每条指令执行的平均时钟周期数。测试程序套件：由各种不同的真实应用程序构成的一组测试程序，用来测试计算机在各个方面的处理性能。存储程序计算机：冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中，机器一旦启动，就能按照程序指定的逻辑顺序执行这些程序，自动完成由程序所描述的处理工作。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。软件兼容：一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。向上（下）兼容：按某档计算机编制的程序，不加修改就能运行于比它高（低）档的计算机。向后（前）兼容：按某个时期投入市场的某种型号计算机编制的程序，不加修改地就能

计算机体系结构试题汇总

计算机系统结构姓名：学号：一、简答题（每小题10分，共20分） 1．简述使用物理地址进行DMA存在的问题，及其解决办法。 2．从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较（列表）。二、（60分）现有如下表达式： Y＝a ×X 其中：X和Y是两个有64个元素的32位的整数的向量，a为32位的整数。假设在存储器中，X和Y的起始地址分别为1000和5000，a的起始地址为6000。 1．请写出实现该表达式的MIPS代码。 2．假设指令的平均执行时钟周期数为5，计算机的主频为500 MHz，请计算上述MIPS 代码（非流水化实现）的执行时间。 3．将上述MIPS代码在MIPS流水线上（有正常的定向路径、分支指令在译码段被解析出来）执行，请以最快执行方式调度该MIPS指令序列。注意：可以改变操作数，但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图，计算调度前和调度后的MIPS代码序列执行所需的时钟周期数，以及调度前后的MIPS流水线执行的加速比。 4．根据3的结果说明流水线相关对CPU性能的影响。三、（20分）请分析I/O对于性能的影响有多大？假设： 1．I/O操作按照页面方式进行，每页大小为16 KB，Cache块大小为64 B；且对应新页的地址不在Cache中；而CPU不访问新调入页面中的任何数据。 2．Cache中95%被替换的块将再次被读取，并引起一次失效；Cache使用写回方法，平均50%的块被修改过；I/O系统缓冲能够存储一个完整的Cache块。 3．访问或失效在所有Cache块中均匀分布；在CPU和I/O之间，没有其他访问Cache 的干扰；无I/O时，每1百万个时钟周期中，有15,000次失效；失效开销是30个时钟周期。如果替换块被修改过，则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机系统结构基本习题和答案

计算机系统结构基本习题和答案填空题 1、从（使用语言的）角度可以将系统看成是按（功能）划分的多个机器级组成的层次结构。 2、计算机系统结构的层次结构由高到低分别为（应用语言机器级，高级语言机器级，汇编语言机器级，操作系统机器级，传统机器语言机器级，微程序机器级）。 3、应用程序语言经（应用程序包）的（翻译）成高级语言程序。 4、高级语言程序经（编译程序）的（翻译）成汇编语言程序。 5、汇编语言程序经（汇编程序）的（翻译）成机器语言程序。 6、在操作系统机器级，一般用机器语言程序（解释）作业控制语句。 7、传统机器语言机器级，是用（微指令程序）来（解释）机器指令。 8、微指令由（硬件）直接执行。 9、在计算机系统结构的层次结构中，机器被定义为（能存储和执行相应语言程序的算法和数据结构）的集合体。 10、目前M0由（硬件）实现，M1用（微程序（固件））实现，M2到M5大多用（软件）实现。以（软件）为主实现的机器成为虚拟机。（虚拟机）不一定全用软件实现，有些操作也可用（固件或硬件）实现。 11、透明指的是（客观存在的事物或属性从某个角度看不到），它带来的好处是（简化某级的设计），带来的不利是（无法控制）。 12、计算机系统结构也称（计算机体系结构），指的是（传统机器级的系统结构）。它是（软件和硬件/固件）的交界面，是机器语言汇编语言程序设计者或编译程序设计者看到的（机器物理系统）的抽象。 13、计算机组成指的是（计算机系统结构的逻辑实现），包括（机器级内的数据流和控制流）的组成及逻辑设计等。计算机实现指的是（计算机组成的物理实现），它着眼于（器件）技术和（微组装）技术。14、确定指令系统中是否要设乘法指令属于（计算机系统结构），乘法指令是用专门的高速乘法器实现还是用加法器实现属于（计算机组成），乘法器和加法-移位器的物理实现属于（计算机实现）。 15、主存容量与编址方式的确定属于（计算机系统结构），主存是否采用多体交叉属于（计算机组成），主存器件的选定属于（计算机实现）。 16、设计何种系列机属于（计算机系统结构），系列机内不同型号计算机的组织属于（计算机组成）。 17、是否采用通道方式输入输出的确定属于（计算机系统结构），通道采用结合型还是独立型属于（计算机组成）。 18、对PDP-11或V AX-11来说，单总线结构属于（计算机系统结构），其机器级的I/O连接和使用方式属于（计算机组成）。 19、由于计算机组成和计算机实现关系密切，有人称它们为（计算机实现），即计算机系统的（逻辑实现）和（物理实现）。 20、计算机系统结构可有（由上而下）、（由下而上）和（由中间开始）三种不同的设计思路。 21、“由中间开始”设计的“中间”是指（层次结构中的软硬交界面），目前多数是在（传统机器级）与（操作系统级）之间。 22、除了分布处理，MPP和机群系统外，并行处理计算机按其基本结构特征可分为（流水线计算机）、（阵列处理机）、（多处理机）、（数据流计算机）四种不同的结构。 23、费林按指令流和数据流的多倍性把计算机系统分类，这里的多倍性指（系统瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数）。 24、费林分类法能反映出大多数计算机的并行工作方式和结构特点，但只能对（控制流）机器分类，不能对（数据流）机器分类，而且对（流水线处理机）的分类不确切。 25、我们把（着眼于软、硬件功能分配和确定程序设计所看到的机器级界面的计算机系统结构）称为从程序设计者看的计算机系统结构，而把（着眼于如何更好、更合理地实现分配给硬件的功能的计算机组成）称为从计算机设计者看的计算机系统能够结构。

(完整版)计算机系统结构试题及答案

计算机系统结构复习题单选及填空：计算机系统设计的主要方法 1、由上往下的设计（top-down） 2、由下往上的设计（bottom-up） 3、从中间开始（middle-out） Flynn分类法把计算机系统的结构分为以下四类：（1）单指令流单数据流（2）单指令流多数据流（3）多指令流单数据流 (4) 多指令流多数据流堆栈型机器：CPU 中存储操作数的单元是堆栈的机器。累加器型机器：CPU 中存储操作数的单元是累加器的机器。通用寄存器型机器：CPU 中存储操作数的单元是通用寄存器的机器。名词解释：虚拟机：用软件实现的机器叫做虚拟机，但虚拟机不一定完全由软件实现，有些操作可以由硬件或固件（固件是指具有软件功能的固件）实现。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。兼容机：它是指由不同公司厂家生产的具有相同系统结构的计算机。流水线技术：将一个重复的时序过程，分解成为若干个子过程，而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。单功能流水线：指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。多功能流水线：指各段可以进行不同的连接，以实现不同的功能的流水线。顺序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。乱序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同，允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。吞吐率：在单位时间内流水线所完成的任务数量或输出结果的数量。指令的动态调度：

是指在保持数据流和异常行为的情况下，通过硬件对指令执行顺序进行重新安排，以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。指令的静态调度：是指依靠编译器对代码进行静态调度，以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。超标量：一种多指令流出技术。它在每个时钟周期流出的指令条数不固定，依代码的具体情况而定，但有个上限。超流水：在一个时钟周期内分时流出多条指令。多级存储层次：采用不同的技术实现的存储器，处在离CPU不同距离的层次上，各存储器之间一般满足包容关系，即任何一层存储器中的内容都是其下一层（离CPU更远的一层）存储器中内容的子集。目标是达到离CPU最近的存储器的速度，最远的存储器的容量。写直达法：在执行写操作时，不仅把信息写入Cache中相应的块，而且也写入下一级存储器中相应的块。写回法：只把信息写入Cache中相应块，该块只有被替换时，才被写回主存。集中式共享多处理机：也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成，各处理器共享一个集中式的物理存储器，这个主存相对于各处理器的关系是对称的，分布式共享多处理机：它的共享存储器分布在各台处理机中，每台处理机都带有自己的本地存储器，组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址，在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起，每台处理机除了能访问本地存储器外，还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。多Cache一致性：多处理机中，当共享数据进入Cache，就可能出现多个处理器的Cache中都有同一存储器块的副本，要保证多个副本数据是一致的。写作废协议：在处理器对某个数据项进行写入之前，它拥有对该数据项的唯一的访问权。写更新协议：当一个处理器对某数据项进行写入时，它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。机群：是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机系统结构考试题库及答案

计算机系统结构试题及答案一、选择题（50分，每题2分，正确答案可能不只一个，可单选或复选） 1.（CPU周期、机器周期）是内存读取一条指令字的最短时间。 2.（多线程、多核）技术体现了计算机并行处理中的空间并行。 3.（冯?诺伊曼、存储程序）体系结构的计算机把程序及其操作数据一同存储在存储器里。 4.（计算机体系结构）是机器语言程序员所看到的传统机器级所具有的属性，其实质是确定计算机系统中软硬件的界面。 5.（控制器）的基本任务是按照程序所排的指令序列，从存储器取出指令操作码到控制器中，对指令操作码译码分析，执行指令操作。 6.（流水线）技术体现了计算机并行处理中的时间并行。 7.（数据流）是执行周期中从内存流向运算器的信息流。 8.（指令周期）是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机，使用（晶体管）作为电子器件。 10.1960年代中期开始出现的第三代计算机，使用（小规模集成电路、中规模集成电路）作为电子器件。 11.1970年代开始出现的第四代计算机，使用（大规模集成电路、超大规模集成电路）作为电子器件。 12.Cache存储器在产生替换时，可以采用以下替换算法：（LFU算法、 LRU算法、随机替换）。

13.Cache的功能由（硬件）实现，因而对程序员是透明的。 14.Cache是介于CPU和（主存、内存）之间的小容量存储器，能高速地向CPU提供指令和数据，从而加快程序的执行速度。 15.Cache由高速的（SRAM）组成。 16.CPU的基本功能包括（程序控制、操作控制、时间控制、数据加工）。 17.CPU的控制方式通常分为：（同步控制方式、异步控制方式、联合控制方式）反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是：（在功能部件内部采用同步控制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下，尽可能多地采用异步控制方式）。 19.CPU的同步控制方式有时又称为（固定时序控制方式、无应答控制方式）。 20.CPU的异步控制方式有时又称为（可变时序控制方式、应答控制方式）。 21.EPROM是指（光擦可编程只读存储器）。 22.MOS半导体存储器中，（DRAM）可大幅度提高集成度，但由于（刷新）操作，外围电路复杂，速度慢。 23.MOS半导体存储器中，（SRAM）的外围电路简单，速度（快），但其使用的器件多，集成度不高。 24.RISC的几个要素是（一个有限的简单的指令集、CPU配备大量的通用寄存器、强调对指令流水线的优化）。

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学实验报告课程名称计算机系统结构计算机学院03班王陈(11)

目录实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。相关性分析结果........................................................................... 错误!未定义书签。增加浮点运算部件对性能的影响........................................... 错误!未定义书签。增加forward部件对性能的影响 ............................................ 错误!未定义书签。转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

计算机系统结构作业答案第三章(张晨曦)

3.1 -3.3为术语解释等解答题。 3.4 设一条指令的执行过程分为取指令，分析指令和执行指令3个阶段，每个阶段所需时间分别为ΔT, ΔT, 2ΔT，分别求出下列各种情况下，连续执行N条指令所需的时间。 (1) 顺序执行方式 (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”，“分析指令”与“执行指令”重叠解： (1) 4NΔT (2) (3N+1) ΔT (3) 2(N+1) ΔT 3.6 解决流水线瓶颈问题有哪两种常用方法？解： (1) 细分瓶颈段将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段重复设置瓶颈段，使之并行工作，以此错开处理任务 3.9 列举下面循环中的所有相关，包括输出相关，反相关，真数据相关。 for(i = 2; i < 100; i=i+1) { a[i] = b[i] + a[i]; -----(1) c[i+1] = a[i] + d[i]; -----(2) a[i-1] = 2*b[i]; -----(3) b[i+1] = 2*b[i]; -----(4) } 解：输出相关：第k次循环时(1)与第k+1轮时(3) 反相关：第k次循环时(1)和(2)与第k-1轮时(3) 真数据相关：每次循环(1)与(2)，第k次循环(4)与k+1次循环(1)，(3)，(4) 3.12 有一指令流水线如下所示 50ns 50ns 100ns 200ns (1)求连续如入10条指令的情况下，该流水线的实际吞吐率和效率 (2)该流水线的“瓶颈”在哪一段？请采用两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1）（m表示流水线级数，n 表示任务数）

计算机系统结构实验报告

计算机系统结构实验报告一．流水线中的相关实验目的： 1. 熟练掌握WinDLX模拟器的操作和使用，熟悉DLX指令集结构及其特点； 2. 加深对计算机流水线基本概念的理解； 3. 进一步了解DLX基本流水线各段的功能以及基本操作； 4. 加深对数据相关、结构相关的理解，了解这两类相关对CPU性能的影响； 5. 了解解决数据相关的方法，掌握如何使用定向技术来减少数据相关带来的暂停。实验平台： WinDLX模拟器实验内容和步骤： 1.用WinDLX模拟器执行下列三个程序：求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序，观察程序在流水线中的执行情况，观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s，通过模拟找出存在资源相关的指令对以及导致资源相关的部件；记录由资源相关引起的暂停时钟周期数，计算暂停时钟周期数占总执行周期数的百分比；论述资源相关对CPU性能的影响，讨论解决资源相关的方法。 3. 在不采用定向技术的情况下（去掉Configuration菜单中Enable Forwarding选项前的勾选符），用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数，计算暂停时钟周期数占总执行周期数的百分比。在采用定向技术的情况下（勾选Enable Forwarding），用WinDLX再次运行程序data_d.s。重复上述3中的工作，并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准输入读入一个整数，求其阶乘，然后将结果输出。该程序中调用了input.s中的输入子程序，这个子程序用于读入正整数。实验结果：在载入fact.s和input.s之后，不设置任何断点运行。 a.不采用重新定向技术，我们得到的结果

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页共 24 页计算机科学系《计算机系统结构》期末考试试卷（A 卷） 2、此试卷适用于计算机科学与技术本科专业。一单选题：(10分，每题1分) 1、 ."启动I/O"指令是主要的输入输出指令，是属于（ B ） A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对(B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定，组内任何虚页可装入任何实页位

置 D.组间可任意装入，组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

计算机体系结构实验报告二

实验二结构相关一、实验目的：通过本实验，加深对结构相关的理解，了解结构相关对CPU性能的影响。二、实验内容： 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟，找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数，计算暂停时钟周期数占总执行周期数的百分比。 4. 论述结构相关对CPU性能的影响，讨论解决结构相关的方法。三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ；浮点运算，两个周期，结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ；条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程打开软件，load structure_d.s文件，进行单步运行。经过分析，此程序一次循环中共有五次结构相关。（R-stall 数据相关Stall- 结构相关） 1)第一个结构相关：addd f2,,f0,f2 由于前面的数据相关，导致上一条指令addd f0,f0,f4暂停在ID阶段，所以下一条指令addd f2,,f0,f2发生结构相关，导致相关的部件：译码部件。 2)第二个结构相关：ADDI R2, R2, #8，与第一个结构相关类似。由于数据相关，上一条指令暂停在ID阶段，所以导致下一条指令发生结构相关。