文档库 最新最全的文档下载
当前位置:文档库 › 2013计算机组织与体系结构期中参考答案

2013计算机组织与体系结构期中参考答案

2013计算机组织与体系结构期中参考答案
2013计算机组织与体系结构期中参考答案

《计算机组织与体系结构》期中试卷参考答案

一、

(14分)已知X= - 0.1001,Y= 0.0101,求:

(1)用双符号表示符号位 [

4

1

X ]补 、[ 2 Y ]补 、、[x]原 、[x]移 (2) [X-Y] 补=?; X-Y=?;同时指出是否发生“溢出”?上溢出还是

下溢出? 溢出用什么电路来判断?

X= - 0.1001,Y= 0.0101

[X]补= 11.0111 [ x ]补 =11.110111 [ 2 Y]补 =00.1010 [X]移 =00.0111

[Y]补=00.0101 [-Y]补=11.1011

[X]补 = 1 1. 0 1 1 1 + [-Y]补 = 1 1. 1 0 1 1 [X-Y]补 = 1 1 1. 0 0 1 0

两个符号位11相同,运算结果不溢出;异或门判断溢出。

X-Y=-0.1110

二、 (14分)现有动态存储器芯片,设一个存储体容量为128K 字,字长32位,模块数

m=8,分别用顺序方式和交叉方式进行组织。存储周期T=200ns ,数据总线宽度为32位,总线传送周期τ=50ns 。(1)写出顺序存储器和交叉存储器的内存地址格式;(2)顺序存储器和交叉存储器连续读出20个字所需的时间是多少?

解:

(4分)顺序存储器内存地址格式:

(4分)交叉存储器内存地址格式:

(2)

(3分)顺序存储器连续读出20个字所需的时间是:

T1=mT=20×200ns=4000ns=4×10-6

s;

(3分)交叉存储器连续读出20个字所需的时间是:

T2=T+(m-1) τ=200ns+950ns=1150ns=1.15×10-6

s

三、 (20分)已知:X=+0.1011,Y=-0.1101,用补码一位乘法的Booth 算法计算P=X ·Y 。 解:[X]补=00.1011 [Y]补=11.0011 [-X]补=11.0101

因此:X

X·Y = -0.1000 1111

,根据IEEE754标准规定的32位单四、(15分)已知X的真值为(2.75)

10

精度浮点数的表示方法,写出X的32位单精度浮点数的二进制存储格式

(最后转换成十六进制数)。

解:

(2.75)10=(10.11)2=(-1)0(1+0.011)*2128-127

(128)10=(10000000)2

单精度浮点标准格式:

0 1000 0000 0110 0000 0000 0000 0000 000

(0100 0000 0011 00000 0000 0000 0000 000)2=(40300000)H

五、(16分)设有若干片128K×8位的SRAM芯片,构成1024K×32位的存储器。

(1).构成1024K×32位的存储器需要多少片128K×8位的SRAM芯片?

(2).128K×8位的SRAM芯片的片内字节地址多少条?

(3).存储器与CPU连接的结构示意图如下图所示,在该图上画出存储器与CPU连

接的结构图,设CPU的接口信号有地址信号、数据信号、控制信号MREQ#和R/W#。

(1)该存储器需要1024K*32/128K*8 = 32片SRAM芯片;

(2) 128K×8位的SRAM芯片的片内字节地址17位,因为217=128K;1024K×32位的存储器地址需要20条地址线,因为220=1024K,其中高3位用于芯片选择,低17位作为每个存储器芯片的地址输入。

(3) 该存储器与CPU连接的结构图如下:

六、(20分)一访主存的块地址流为:2、 3、 2、 1、 5、 2、 4 、5 、

3、2 、5 、2,假设Cache只有3块,采用全相连映像,填写下表并分别

计算两种替换策略的命中率。

FIFO的命中率=

LUR的命中率=

FIFO的命中率=3/12*100%=25% LUR的命中率=5/12*100%=41.67%

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示: (1 用两给出条指 (1) (24? 变八级流水线(细分) ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。

(2) (3)重复设置部件 吞吐率提高倍数= t t ??2310 75 =1.64 3.5 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 +B 4;再计算由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。 段23 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机组织与体系结构实验报告

《计算机组织与体系结构》 实验报告 学号: XXX 姓名:XXX 班级:XXX 指导教师:XXX 时间: 2013年01月 中国矿业大学计算机学院

目录 一基本运算器实验 (2) 1、实验目的 (2) 2、实验设备 (2) 3、实验原理 (2) 4、实验步骤 (3) 5、实验结果 (5) 5、实验体会 (5) 二微程序控制实验 (6) 1、实验目的 (6) 2、实验设备 (6) 3、实验原理 (6) 4、实验步骤 (12) 5、实验体会 (13) 三CPU与简单模型机设计实验 (13) 1、实验目的 (13) 2、实验设备 (13) 3、实验原理 (13) 4、实验步骤 (18) 5、实验流图 (21) 6、实验体会 (25)

实验一基本运算器实验 1. 实验目的 (1) 了解运算器的组成结构。 (2) 掌握运算器的工作原理。 2. 实验设备 PC机一台,TD-CMA实验系统一套。 3.实验原理 本实验的原理如下图所示: 运算器内部含有三个独立运算部件,分别为算术、逻辑和移位运算部件,要处理的数据存于暂存器A和暂存器B,三个部件同时接受来自A和B的数据(有些处理器体系结构把移位运算器放于算术和逻辑运算部件之前,如ARM),各部件对操作数进行何种运算由控制信号S3…S0和CN来决定,任何时候,多路选择开关只选择三部件中一个部件的结果作为ALU的输出。如果是影响进位的运算,还将置进位标志FC,在运算结果输出前,置ALU零标志。ALU中所有模块集成在一片FPGA中。 逻辑运算部件由逻辑门构成,较为简单,而后面又有专门的算术运算部件设计实验,在此对这两个部件不再赘述。移位运算采用的是桶形移位器,一般采用交叉开关矩阵来实现,交叉开关的原理如图1-1-2所示。图中显示的是一个4X4的矩阵(系统中是一个8X8的矩阵)。每一个输入都通过开关与一个输出相连,把沿对角线的开关导通,就可实现移位功能,即: (1) 对于逻辑左移或逻辑右移功能,将一条对角线的开关导通,这将所有的输入位与所使用的输出分别相连,而没有同任何输入相连的则输出连接0。 (2) 对于循环右移功能,右移对角线同互补的左移对角线一起激活。例如,在4位矩阵中使用‘右1’和‘左3’对角线来实现右循环1位。 (3) 对于未连接的输出位,移位时使用符号扩展或是0填充,具体由相应的指令控制。使用另外的逻辑进行移位总量译码和符号判别。

计算机组成与结构

第1章计算机组成与体系结构 根据考试大纲,本章内容要求考生掌握3个知识点。 (1)构成计算机的各类部件的功能及其相互关系; (2)各种体系结构的特点与应用(SMP、MPP); (3)计算机体系结构的发展。 1.1 计算机体系结构的发展 冯·诺依曼等人于1946年提出了一个完整的现代计算机雏形,它由运算器、控制器、存储器和输入/输出设备组成。现代的计算机系统结构与冯·诺依曼等人当时提出的计算机系统结构相比,已发生了重大变化,虽然就其结构原理来说,占有主流地位的仍是以存储程序原理为基础的冯·诺依曼型计算机,但是,计算机系统结构有了许多改进,主要包括以下几个方面。 (1)计算机系统结构从基于串行算法改变为适应并行算法,从而出现了向量计算机、并行计算机、多处理机等。 (2)高级语言与机器语言的语义距离缩小,从而出现了面向高级语言机器和执行高级语言机器。 (3)硬件子系统与操作系统和数据库管理系统软件相适应,从而出现了面向对象操作系统机器和数据库计算机等。 (4)计算机系统结构从传统的指令驱动型改变为数据驱动型和需求驱动型,从而出现了数据流计算机和归约机。 (5)为了适应特定应用环境而出现了各种专用计算机。 (6)为了获得高可靠性而研制容错计算机。 (7)计算机系统功能分散化、专业化,从而出现了各种功能分布计算机,这类计算机包括外围处理机、通信处理机等。 (8)出现了与大规模、超大规模集成电路相适应的计算机系统结构。 (9)出现了处理非数值化信息的智能计算机。例如自然语言、声音、图形和图像处理等。 1.2 构成计算机的各类部件的功能及其相互关系 计算机由控制器、运算器、存储器、输入设备和输出设备组成。

计算机系统结构网上作业

计算机系统结构作业参考答案 一、 1、试述现代计算机系统的多级层次结构。 计算机系统具有层次性,它由多级层次结构组成。从功能上计算机系统可分为五个层次级别:第一级是设计级。这是一个硬件级,它由机器硬件直接执行。 第二级是一般机器级,也称为机器语言级。它由微程序解释系统.这一级是硬件级。 第三级是操作系统级,它由操作系统程序实现。这些操作系统由机器指令和广义指令组成,这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。 第四级是汇编语言级。它给程序人员提供一种符号形式的语言,以减少程序编写的复杂性。这一级由汇编程序支持执行。 第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。 答:一般原则: (1)确定指令系统时,只选择使用频度很高的指令及少量有效支持操作系统,高级语言及其它功能 的指令,大大减少指令条数,一般使之不超过100条; (2)减少寻址方式种类,一般不超过两种; (3)让所有指令在一个机器周期内完成; (4)扩大通用寄存器个数,一般不少于32个,尽量减少访存次数; (5)大多数指令用硬联实现,少数用微程序实现; (6)优化编译程序,简单有效地支持高级语言实现。

基本技术: (1)按RISC一般原则设计,即确定指令系统时,选最常用基本指令,附以少数对操作系统等支持最有用的指令,使指令精简。编码规整,寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现,功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即:为了减少访存,减化寻址方式和指令格式,简有效地支持高级语言中的过程调用,在RISC机器中设有大量寄存嚣,井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令,即可让本条指令执行与下条指令预取在时间上重叠。另外,将转移指令与其前面的一条指令对换位置,让成功转移总是在紧跟的指令执行之后发生,使预取指令不作废,节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配,减少访存次数。不仅要利用常规手段优化编译,还可调整指令执行顺序,以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别 (1)全相连映像 主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分,Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同,Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关,Cache必须对每个块和块自身的地址加以存储。当请求数据时,Cache控制器要把请求地址同所有的地址加以比较,进行确认。 (2)直接映像 把主存分成若干区,每区与Cache大小相同。区内分块,主存每个区中块的大小和Cache 中块的大小相等,主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中,即相同块号的位置。主存地址分为三部分:区号、块号和块内地址,Cache地址分为:块号和块内地址。直接映像方式下,数据块只能映像到Cache中唯一指定的位置,故不存在替换算法的问题。它不同于全相连Cache,地址仅需比较一次。 (3)区别: 全相连映像比较灵活,块冲突率低,只有在Cache中的块全部装满后才会出现冲突,Cache 利用率高。但地址变换机构复杂,地址变换速度慢,成本高。 直接映像的地址变换简单、速度快,可直接由主存地址提取出Cache地址。但不灵活,块冲突率较高,Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成?

高级计算机体系结构作业汇总(非标准答案)

1.Explain the Concepts Computer Architecture 系统结构 由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。 Advanced CA 高级系统结构 新型计算机系统结构。基于串行计算机结构,研究多指令多数据计算机系统,具有并发、可扩展和可编程性。为非冯式系统结构。 Amdahl law Amdahl定律 系统中某部件由于采用某种方式时系统性能改进后,整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。 SCALAR PROCESSING 标量处理机 在同一时间内只处理一条数据。 LOOK-AHEAD 先行技术 通过缓冲技术和预处理技术,解决存储器冲突,使运算器能够专心与数据的运算,从而大幅提高程序的执行速度。 PVP 向量型并行计算处理机 以流水线结构为主的并行处理器。 SMP 对称多处理机系统 任意处理器可直接访问任意内存地址,使用共享存储器,访问延迟、带宽、机率都是等价的。MPP 大规模并行计算机系统 物理和逻辑上均是分布内存,能扩展至成百上千处理器,采用专门设计和定制的高通信带宽和低延迟的互联网络。 DSM 分布式共享存储系统 内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。 COW 机群系统 每个节点都是一个完整的计算机,各个节点通过高性能网络相互连接,网络接口和I/O总线松耦合连接,每个节点有完整的操作系统。 GCE 网格计算环境 利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。 CISC 复杂指令集计算机

通过设置一些复杂的指令,把一些原来由软件实现的常用功能改用硬件实现的指令系统实现,以此来提高计算机的执行速度。 RISC 精简指令集计算机 尽量简化计算机指令功能,只保留那些功能简单,能在一个节拍内执行完的指令,而把复杂指令用段子程序来实现。 VMM 虚拟机监视器 作为软硬件的中间层,在应用和操作系统所见的执行环境之间。 SUPERCOMPUTER 超级计算机 数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM 共享虚拟存储器 存储器虚拟化为一个共享的存储器,并提供单一的地址空间。 MAINFRAME 大型计算机 作为大型商业服务器,一般用于大型事务处理系统,特别是过去完成的且不值得重新编写的数据库应用系统方面。 COMPUTER SYSTEM ON CHIP 片上计算机系统 在单个芯片上集成的一个完整系统。 PARALLEL ARCHITECTURE INTO SINGLE CHIP 单片并行结构 在单个芯片上采用的并行体系结构 MOORE law Moore定律 当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。 UMA 一致存储访问 采用集中式存储的模式,提供均匀的存储访问。 NUMA 非一致存储访问 内存模块局部在各个结点内部,所有局部内存模块构成并行机的全局内存模块。 COMA 全高速缓存存储访问 采用分布式存储模式,通过高速缓存提供快速存储访问。 CC-NUMA 全高速缓存非一致性均匀访问 存在专用硬件设备保证在任意时刻,各结点Cache中数据与全局内存数据的一致性。NORMA 非远程存储访问

计算机组成与系统结构常见选择题

一、选择题(50分,每题2分,正确答案可能不只一个,可单选或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯诺伊曼、存储程序)体系结构的计算机把程序及其操作数据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 年开始出现的第二代计算机,使用(晶体管)作为电子器件。 年代中期开始出现的第三代计算机,使用(小规模集成电路、中规模集成电路)作为电子器件。 年代开始出现的第四代计算机,使用(大规模集成电路、超大规模集成电路)作为电子器件。 存储器在产生替换时,可以采用以下替换算法:(LFU算法、LRU算法、随机替换)。 的功能由(硬件)实现,因而对程序员是透明的。 是介于CPU和(主存、内存)之间的小容量存储器,能高速地向CPU提供指令和数据,从而加快程序的执行速度。 由高速的(SRAM)组成。 的基本功能包括(程序控制、操作控制、时间控制、数据加工)。的控制方式通常分为:(同步控制方式、异步控制方式、联合控制方式)反映了时序信号的定时方式。 的联合控制方式的设计思想是:(在功能部件内部采用同步控制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 的同步控制方式有时又称为(固定时序控制方式、无应答控制方式)。 的异步控制方式有时又称为(可变时序控制方式、应答控制方式)。

计算机体系结构_第一次作业

计算机体系结构 第一章 1.11 Availability is the most important consideration for designing servers, followed closely by scalability and throughput. a. We have a single processor with a failures in time(FIT) of 100. What is the mean time to failure (MTTF) for this system? b. If it takes 1 day to get the system running again, what is the availability of the system? c. Imagine that the government, to cut costs, is going to build a supercomputer out of inexpensive computers rather than expensive, reliable computers. What is the MTTF for a system with 1000 processors? Assume that if one fails, they all fail. 答: a. 平均故障时间(MTTF)是一个可靠性度量方法,MTTF的倒数是故 障率,一般以每10亿小时运行中的故障时间计算(FIT)。因此由该定义可知1/MTTF=FIT/10^9,所以MTTF=10^9/100=10^7。b. 系统可用性=MTTF/(MTTF+MTTR),其中MTTR为平均修复时间, 在该题目中表示为系统重启时间。计算10^7/(10^7+24)约等于1. c. 由于一个处理器发生故障,其他处理器也不能使用,所以故障率 为原来的1000倍,所以MTTF值为单个处理器MTTF的1/1000即10^7/1000=10^4。 1.14 In this exercise, assume that we are considering enhancing

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。 CPI:每条指令执行的平均时钟周期数。 测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。 存储程序计算机:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。 向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。 向后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能

计算机系统结构第1-8章部分作业答案复习课程

计算机系统结构第1-8章部分作业答案

第一章 1.6 某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下: 求该计算机的有效CPI 、MIPS 和程序执行时间。 解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (或 259 460 ) (2)MIPS 速率=f/ CPI =400/1.776 =225.225MIPS (或 259 5180 MIPS) (3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/ 400=575μs 1.9 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。具体数据如下表所示: (1)改进后,各类操作的加速比分别是多少? (2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 解:根据Amdahl 定律Se Fe Fe S n + -= )1(1可得

4类操作均改进后,整个程序的加速比: 2.16)1(1 ≈+-=∑∑i i i n S F F S 1.10 第二章 变长编码,哈夫曼编码 第三章 3.12 有一条指令流水线如下所示: (1)求连续输入10条指令的情况下,该流水线的实际吞吐率和效率。 (2)该流水线的瓶颈在哪一段?请采用两种不同的措施消除此瓶颈。对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解: (1)本题主要考察对各功能段用时不等的线性流水线的性能计算公式的掌握情况。 2200(ns) 2009200)10050(50t n t T max k i i =?++++=?-+?=∑=)1(1 流水 )(ns 220 1 T n TP 1-==流水

计算机组成与体系结构复习大纲2016

《计算机组成与系统结构》考试大纲 第1章计算机系统概论 本章的学习目的:初步了解计算机系统的组成和计算机的工作过程,掌握常用的概念、名词术语,为以后各章的学习打下基础。 本章要掌握的主要内容: 1.计算机系统是由硬件和软件两大部分组成的,硬件是物质基础,软件是解题的灵魂。弄清硬件和软件的概念。 2.计算机硬件系统所包含的主要部分,各部分的功能及其组成框图。 3.计算机的工作过程,主要是周而复始地取出指令、解释指令和执行指令的过程。而指令周期是指取出指令和执行指令所需的时间。它包括取出指令、解释指令和执行指令两个阶段。 4.冯·诺依曼计算机的设计思想是采用二进制表示各种信息以及存储程序和程序控制。存储程序的概念是将解题程序(连同必须的原始数据)预先存入存储器;程序控制是指控制器依据所存储的程序控制全机自动、协调地完成解题任务。存储程序和程序控制统称为存储程序控制。它是电子数字计算机与其他计算工具的最大区别,是电子计算机之所以能高速进行大量计算工作的基础。 5.控制器和运算器合称为中央处理器CPU,当前CPU芯片还集成有存储管理部件、Cache等;CPU和内存储器合称为计算机主机。 6.指令字和数据均以二进制代码的形式存入存储器,计算机是如何区分出指令和数据的。 7.计算机系统的主要性能指标:字长、存储容量、运算速度等。 8.计算机的运算速度是指它每秒钟执行指令的条数。单位是MIPS(百万条指令每秒) ∑=? = n i i i m t f V 1 1 式中,n—指令的种类 f i —第i种指令在程序中出现的频度(%) t i —第i种指令的指令周期 9.计算机系统按功能划分,通常为五级的层次结构:依次是微程序设计级、一般机器级、操作系统级、汇编语言级和高级语言级,每一级都可进行程序设计。 10.软件和硬件在逻辑功能的等效性及其例子。 11.本章主要的术语及概念:

《计算机体系结构》在线作业二

北交《计算机体系结构》在线作业二 一、单选题(共20 道试题,共60 分。) 1. 按照M ·弗林对处理机并行性定义的分类原则,阵列机ILLIAC —IV 是( )。 A. SISD B. SIMD C. MISD D. MIMD 正确答案: 2. 输入输出系统硬件的功能对( )是透明的。 A. 操作系统程序员 B. 应用程序员 C. 系统结构设计人员 D. 机器语言程序设计员 正确答案: 3. 浮点数尾数基值rm=8,尾数数值部分长6位,可表示规格化正尾数的个数是()。 A. 56个 B. 63个 C. 64个 D. 84个 正确答案: 4. 从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。 A. 计算机软件所要完成的功能 B. 计算机硬件的全部组成 C. 编程要用到的硬件组织 D. 计算机各部件的硬件实现 正确答案: 5. 对机器语言程序员透明的是( )。 A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码 正确答案: 6. 通道方式输入输出系统中,对优先级高的磁盘等高速设备,适合于连接( )。 A. 字节多路通道 B. 选择通道 C. 数组多路通道

D. 字节及数组多路通道 正确答案: 7. 设16 个处理器编号分别为0 ,1 ,2 ,…,15 ,用PM 2-0 互联函数时,第13 号处理机与第( ) 号处理机相联。 A. 12 B. 9 C. 11 D. 5 正确答案: 8. 对系统程序员不透明的应当是( )。 A. Cache存贮器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存贮器 正确答案: 9. 对应用程序员不透明的是( )。 A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器 正确答案: 10. 系列机软件应做到( )。 A. 向前兼容,并向上兼容 B. 向后兼容,力争向上兼容 C. 向前兼容,并向下兼容 D. 向后兼容,力争向下兼容 正确答案: 11. 动态数据流机最突出的特点是使( )。 A. 数据流令牌无标号 B. 需要程序记数器来实现 C. 令牌带上标号 D. 同步由门(Latch)寄存器来实现 正确答案: 12. 计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是( )。 A. 汇编语言机器级――操作系统机器级――高级语言机器级 B. 微程序机器级――传统机器语言机器级――汇编语言机器级 C. 传统机器语言机器级――高级语言机器级――汇编语言机器级 D. 汇编语言机器级――应用语言机器级――高级语言机器级 正确答案: 13. 用户高级语言源程序中出现的读写(I/O) 语句,到读写操作全部完成,需要通过( )共同完成。 A. 编译系统和操作系统 B. I/O 总线、设备控制器和设备 C. 操作系统和I/O 设备硬件

《_计算机组成与系统结构》考试试卷

学试卷 院(系、部) 专业 班级 姓名 学号 …… .… … … … … …… … … … … .密… … … … … … … … … …… … … … … 封 … … … … …… . . …… … … … ……. . 线… … … … … … … … … … … … … … . . 计算机组成与系统结构考试试卷 一. 填空题 (填空每空1分,共10分;选择填空每空2分,共20分) 1.计算机系统中的存贮器系统是指___D ___。 A RAM 存贮器 B ROM 存贮器 C 主存贮器 D cache 、主存贮器和外存贮器 2.某机字长32位,其中1位符号位,31位表示尾数。若用定点小数表示,则最大正小数为___B ___。 A +(1 – 2-32) B +(1 – 2-31) C 2-32 D 2-31 3.算术 / 逻辑运算单元74181ALU 可完成___C ___。 A 16种算术运算功能 B 16种逻辑运算功能 C 16种算术运算功能和16种逻辑运算功能 D 4位乘法运算和除法运算功能 4.存储单元是指___B ___。 A 存放一个二进制信息位的存贮元 B 存放一个机器字的所有存贮元集合 C 存放一个字节的所有存贮元集合 D 存放两个字节的所有存贮元集合; 5.相联存贮器是按___C ___进行寻址的存贮器。 A 地址方式 B 堆栈方式 C 内容指定方式 D 地址方式与堆栈方式 6.变址寻址方式中,操作数的有效地址等于___C ___。 A 基值寄存器内容加上形式地址(位移量) B 堆栈指示器内容加上形式地址(位移量) C 变址寄存器内容加上形式地址(位移量) D 程序记数器内容加上形式地址(位移量) 7.以下叙述中正确描述的句子是:___D ___。 A 同一个CPU 周期中,可以并行执行的微操作叫相容性微操作 B 同一个CPU 周期中,不可以并行执行的微操作叫相容性微操作 C 同一个CPU 周期中,可以并行执行的微操作叫相斥性微操作 D 同一个CPU 周期中,不可以并行执行的微操作叫相斥性微操作 8.计算机使用总线结构的主要优点是便于实现积木化,同时___C ___。 A 减少了信息传输量 B 提高了信息传输的速度 C 减少了信息传输线的条数

计算机体系结构第一次作业

问答题(共4道题) 1.什么是存储系统? 答:存储系统是指计算机中由存放程序和数据的各种存储设备、控制部件及管理信息调度的设备(硬件)和算法(软件)所组成的系统。计算机的主存储器不能同时满足存取速度快、存储容量大和成本低的要求,在计算机中必须有速度由慢到快、容量由大到小的多级层次存储器,以最优的控制调度算法和合理的成本,构成具有性能可接受的存储系统。 2.什么是高速缓冲存储器 答:指存取速度比一般随机存取记忆体(RAM)来得快的一种RAM。 一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成,容量比较小但速度比主存高得多,接近于CPU的速度。 在计算机存储系统的层次结构中,是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 3.假设一台模型计算机共有10种不同的操作码,如果采用固定长操作码需要4 位。已知各种操作码在程序中出现的概率如下表所示,计算采用Huffman编码 法的操作码平均长度,并计算固定长操作码和Huffman操作码的信息冗余量 (假设最短平均长度H=3.1位)。 答:构造Huffman树如下:

Huffman 编码的平均码长为: ∑=10 1 i i i l p =0.17*2+(0.15+0.15+0.13+0.12)*3+(0.09+0.08+0.07)*4+(0.03+0.01)*5=3.15 冗余量=(3.15-3.10)/3.15=1.59% 固定码长=log210=4 冗余量=(4-3.10)/4=22.5% 4.若某机要求有:三地址指令4条,单地址指令192条,零地址指令16条。设指令字长为12位,每个地址码长3位。问能否以扩展操作码为其编码? 答:三种指令字格式如下:

计算机组成与系统结构课后答案全

第 1 章习题答案 5.若有两个基准测试程序P1和P2在机器M1和M2上运行,假定M1和M2的价格分别是5000元和8000元,下表给出了P1和P2在M1和M2上所花的时间和指令条数。 请回答下列问题: (1)对于P1,哪台机器的速度快?快多少?对于P2呢? (2)在M1上执行P1和P2的速度分别是多少MIPS?在M2上的执行速度又各是多少?从执行速度来看,对于P2,哪台机器的速度快?快多少? (3)假定M1和M2的时钟频率各是800MHz和,则在M1和M2上执行P1时的平均时钟周期数CPI各是多少? (4)如果某个用户需要大量使用程序P1,并且该用户主要关心系统的响应时间而不是吞吐率,那么,该用户需要大批购进机器时,应该选择M1还是M2?为什么?(提示:从性价比上考虑)(5)如果另一个用户也需要购进大批机器,但该用户使用P1和P2一样多,主要关心的也是响应时间,那么,应该选择M1还是M2?为什么? 参考答案: (1)对于P1,M2比M1快一倍;对于P2,M1比M2快一倍。 (2)对于M1,P1的速度为:200M/10=20MIPS;P2为300k/=100MIPS。 对于M2,P1的速度为:150M/5=30MIPS;P2为420k/=70MIPS。 从执行速度来看,对于P2,因为100/70=倍,所以M1比M2快倍。 (3)在M1上执行P1时的平均时钟周期数CPI为:10×800M/(200×106)=40。 在M2上执行P1时的平均时钟周期数CPI为:5×(150×106)=40。 (4)考虑运行P1时M1和M2的性价比,因为该用户主要关心系统的响应时间,所以性价比中的性能应考虑执行时间,其性能为执行时间的倒数。故性价比R为: R=1/(执行时间×价格) R越大说明性价比越高,也即,“执行时间×价格”的值越小,则性价比越高。 因为10×5000 > 5×8000,所以,M2的性价比高。应选择M2。 (5)P1和P2需要同等考虑,性能有多种方式:执行时间总和、算术平均、几何平均。 若用算术平均方式,则:因为(10+/2×5000 > (5+/2×8000,所以M2的性价比高,应选择M2。 若用几何平均方式,则:因为sqrt(10× ×5000 < sqrt(5××8000,所以M1的性价比高,应选择M1。 6.若机器M1和M2具有相同的指令集,其时钟频率分别为1GHz和。在指令集中有五种不同类型的指令 请回答下列问题: (1)M1和M2的峰值MIPS各是多少? (2)假定某程序P的指令序列中,五类指令具有完全相同的指令条数,则程序P在M1和M2上运行时,哪台机器更快?快多少?在M1和M2上执行程序P时的平均时钟周期数CPI各是多少?

计算机体系结构作业一

计算机体系结构第一次报告 -----------计算机科学与技术S151000853 洪文杰 1. Brief of your research field 2. Name of the benchmarks in your research field 3. List of program of the benchmark and brief for each program 一、研究方向 我的研究方向是高性能计算(High Performance Compute),一般分为以下几个大方面: 1)并行计算(Parallel Computing) 2)高端计算(High-end Parallel Computing) 3)高性能计算(High Performance Computing) 4)超级计算(Super Computing)。 高性能计算(HPC) 指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计图1.HPC 总线网络拓扑算资源操作)的计算系统和环境。有许多类型的HPC 系统,其范围从标准计算机的大型集群,到高度专用的硬件。 大多数基于集群的HPC系统使用高性能网络互连,比如那些来自InfiniBand 或Myrinet 的网络互连。基本的网络拓扑和组织可以使用一个简单的总线拓扑,在性能很高的环境中,网状网络系统在主机之间提供较短的潜伏期,所以可改善总体网络性能和传输速率。

图(1)高性能计算结构模型 二、高性能计算的benchmarks 1)Linpack 高斯消元法求解线性代数方程组。 2)NPB(NAS Parallel Benchmark) 美国NAS项目开发,包含8个空气动力学计算类应用,测试范围从整数排序到复杂的数值计算。 3)LAPACK ScalLAPACK 稠密、带状矩阵之上的各类操作。 4)Perfect、SPLASH 、ParkBench 三、List of program of the benchmark and brief for each program 1)Linpack用于测试高性能计算机系统浮点性能的benchmark。通过利用高性能计算机,用高斯消元法求解N元一次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。 Linpack测试包括三类: 1、Linpack100求解规模为100阶的稠密线性代数方程组,它只允许采用编译优化选项进行优化,不得更改代码,甚至代码中的注释也不得修改。 2、Linpack1000要求求解规模为1000阶的线性代数方程组,达到指定的精度要求,可以在不改变计算量的前提下做算法和代码上做优化。 3、HPL即High Performance Linpack,也叫高度并行计算基准测试,它对数组大小N没有限制,求解问题的规模可以改变,除基本算法(计算量)不可改变外,可以采用其它任何优化方法。HPL是针对现代并行计算机提出的测试

计算机组织与体系结构课后习题答案

体系结构课后习题答案 第二章 1,设A,B,C 的内存地址分别是A[i],B[i],C[i],i 从1到1000 LOAD M (A[i]) ADD M (B[i]) STOR M(C[i]) 2, a LOAD M (2) 00000001|000000000010 b 一次 3,在IAS 机上读取一个值的过程如下: IR 中操作码→控制总线,存储器地址X →MAR,MAR 中值→地址总线 X 中数据→数据总线,数总线地址→MBR 写入一个值: IR 中操作码→控制总线,存储器地址X →MAR,MAR 值→地址总线 MBR 值→数据总线,数据总线值→X 4,程序代码:LOAD M(0FA) ADD M(0FB) LOAD M(0FA) JUMP +M(08D,0:19) LOAD –M(0FA) ADD M(0FB) 程序代码意图:首先装入0FA 值,然后与0FB 相加,再装入0FA 值,若AC 中值非负,取0FA 左指令再装入-(0FA )将0FB 的值相加后装入AC 中 5,如图所示 AC MQ 算术-逻辑电路 40 40 MBR I/O 设备 IBR IR 控制电路 PC MAR 主存储器M 40 20 8 40 12 12 8 40 12

6,便于同时存取两个连续地址序号的存储单元,提高访问速度 7,(1)存储器数据传输率快了32倍 (2)数据通道最大数目增大了一倍 (3)单通道最大数据传输速率提升了5倍。各种技术的使用,提升了整机的性能。 8,回答正确,但是不适合用户理解。MAC机的时钟速率是1.2ghz,P4为2.4ghz,而时钟速率在一定程度上反映了计算机的执行速度,所以P4的机器可能是目前最符合用户要求的机型。 9,在这种表示方法中,10个管表示了十个数字,而使用二进制可以表示错误!未找到引用源。个数字 10,(画图)略 11,MIPS=错误!未找到引用源。*错误!未找到引用源。 12,∵MIPS=错误!未找到引用源。*错误!未找到引用源。 ∴CPI(VAX)=5,CPI(IBM)=1.39 IC≈错误!未找到引用源。 13,CPI=(1+2+2+2)/错误!未找到引用源。=7*错误!未找到引用源。 MIPS=错误!未找到引用源。*错误!未找到引用源。=错误!未找到引用源。*错误!未找到引用源。=5.71*错误!未找到引用源。 T=7*错误!未找到引用源。*错误!未找到引用源。=1.75*错误!未找到引用源。14,a:算术平均法适用于较多程序,抖动较大 调和平均发适用于较少程序,抖动较小 b:计算机A Ra=1/4×(100+0.1+0.2+1)≈25 MIPS Rb=4/(1/100+10+5+1)=0.25 MIPS 计算机B Ra=1/4×(10+0.1++1+1/8)=3.06 Rb=4/(0.1+1+10+8)=0.21 计算机C Ra=1/4×(5+5+2+1)=3.25 Rb=4/(0.2+0.2+0.5+1)=2.1 故C>A>B 第三章 1 步骤一 存储器CPU寄存器 1 0011 1 pc 2 5940 ac 3 26 0011 ir 5 0003 6 步骤二 存储器CPU寄存器 1 0011 2 pc 2 5940 000 3 ac 3 26 0011 ir

计算机体系结构作业整理

1. 简述计算机系统设计的主要方法。 答:基于计算机系统层次结构的基础上,其设计方法可以有以下的三种:方法1:由上向下(Top-Down)①设计过程:面向应用的数学模型→面向应用的高级语言→面向这种应用的操作系统→面向操作系统和高级语言的机器语言→面向机器语言的微指令系统和硬件实现。②应用场合:专用计算机的设计(早期计算机的设计)。③特点:对于所面向的应用领域,性能(性能价格比)很高。方法2:由下向上(Bottom-Up)(通用计算机系统的一种设计方法)①设计过程:根据当时的器件水平,设计微程序机器级和传统机器级。根据不同的应用领域设计多种操作系统、汇编语言、高级语言编译器等。最后设计面向应用的虚拟机器级。②应用场合:在计算机早期设计中(60~70年代)广为采用。③特点:容易使软件和硬件脱节,整个计算机系统的效率降低。方法3:中间开始(Middle-Out)①设计过程:首先定义软硬件的分界面,然后各个层次分别进行设计。②应用场合:用于系列机的设计。③特点:软硬件的分界面在上升,硬件比例在增加。硬件价格下降,软件价格上升。软硬件人员结合共同设计。 2. 一般来讲,计算机组成设计要确定的内容应包括那些方面? 答:计算机组成设计要确定的内容应包括:①数据通路的宽度,指数据总线上一次能并行传送的信息位数;②专用部件的设置,包括设置那些专用部件,如乘除法专用部件,浮点运算部件,字符处理部件,地址运算部件等,每种专用部件的个数等等,这些都取决于所需答到的机器速度,专用部件的使用频度及允许的价格等;③各种操作对部件的共享程度,若共享程度太高,则会由于共享部件的分时使用而降低操作的速度;若对同一功能部件设置多个以降低共享度,则系统的价格会随之升高;④功能部件的并行度,如功能部件的控制和处理方式是采用顺序串行方式,还是采用重叠,流水,分布处理方式。⑤控制机构的组成方式,如控制机构是采用硬联线控制还是微程序控制,是采用单机处理还是多机处理或功能分布处理;⑥缓冲和排队技术,包括如何在部件间设置多大容量的缓冲器来弥补它们的速度差异,对于等待要求处理的事件如何排队,如随机,先进先出,先进后出,优先级,循环等不同方式;⑦预估,预判技术,如采用何种原则来预测未来的行为,以优化性能和优化处理;⑧可靠性技术,如采用什么样的冗余技术和容错技术来提高可靠性。 3. 简述计算机系统结构用软件实现和用硬件实现各自的优缺点。 答:计算机系统结构用硬件实现:速度快、成本高;灵活性差、占用内存少。 用软件实现:速度低、复制费用低;灵活性好、占用内存多。 4.简述冯.诺依曼计算机的特征。 答:冯·诺依曼(Van Nenmann)机主要特点是程序存储,指令驱动,集中控制。一般认为其主要特征有以下几点:(1) 机器以运算器为中心。除了完成运算以外,机器内部的数据传输都经过运算器。各部件的操作以及它们之间的协调由控制器集中控制。(2) 存储器按一维线性编址,顺序访问存储器地址单元,每

相关文档
相关文档 最新文档