文档库 最新最全的文档下载
当前位置:文档库 › 计算机体系结构课后习题原版答案PDF版 张晨曦

计算机体系结构课后习题原版答案PDF版 张晨曦

计算机体系结构课后习题原版答案PDF版 张晨曦
计算机体系结构课后习题原版答案PDF版 张晨曦

计算机系统结构考试计算题

3.12 有一指令流水线如下所示 (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。 对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1) 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 ? 变成八级流水线(细分) 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件 出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成,3段时,一次,然4段。如果 需要的时间都是,问: (1) 当在流水线的输入端连续地每时间输入任务时,该流水线会发生 什么情况? (2) 此流水线的最大吞吐率为多少?如果每输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少? (3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个 任务时,其吞吐率提高多少? (2) t ?t ?2

计算机系统结构重点题解自考复习资料

第 1 章计算机系统结构的基本概念 1.1 解释下列术语 层次结构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每 一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级, 汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 然后再在这低翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序, 一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效 程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复, 直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透 明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻 辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl 定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高, 受限于该部件的执行时间占总执行时间的百分比。 而是相对地簇聚。包程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的, 括时间局部性和空间局部性。 CPI:每条指令执行的平均时钟周期数。 测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的 处理性能。

计算机系统结构计算题

计算题 用一条4段浮点加法器流水线求8个浮点数的和:Z =A +B +C +D +E +F +G +H 解: Z =[(A +B)+(C +D)]+[(E +F)+(G +H)] 例 设在下图所示的静态流水线上计算: 流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中,试计算其吞吐率、加 周期 1 2 3 规格化 尾数加 对阶 求阶差 时间A C E G A+B E+F A+B+C+D 7个浮点加法共用了15个时钟周期。 流水线的吞吐率为:TP n T t t k ==?=?7150471?? 流水线的加速比为:S T T t t k ==???=?04715187?? 流水线的效率为:E T k T t t k =?=????=?047415047?? 乘法 加减法 时间 段 输 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A ×B C ×D 1 2 3 4

(3)计算性能 在18个△t 时间中,给出了7个结果。吞吐率为: 不用流水线,由于一次求和需6△t ,一次求积需 则产生上述7个结果共需(4×6+3×4)△t = 36△t 加速比为 流水线的效率 例 有一条动态多功能流水线由5段组成,加法用1、3、4、5 段,乘法用1、2、5段,第2段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算: 试计算其吞吐率、加速比和效率。 (1) 选择适合于流水线工作的算法 应先计算A 1×B 1、A 2×B 2、A 3×B 3和A 4×B 4; 再计算(A 1×B 1)+(A 2×B 2) (A 3×B 3)+(A 4×B 4); 然后求总的累加结果。 (2) 画出时空图 (3) 计算性能 非线性流水线 例5.3:一条4功能段的非线性流水线,每个功能段的延迟时间都相等,它的预约表如下: (1)写出流水线的禁止向量和初始冲突向量。 乘法 加法 t TP ?=18756.11828≈??=t t S 31.018 54344≈??+?=E

(完整word版)计算机系统结构复习资料

1. 多级层次结构 从计算机语言的角度,把计算机系统按功能划分成多级层次结构。 2. 透明性: 在计算机技术中,对本来存在的事物或属性,但从某种角度看又好象不存在的概念称为透明性。 3. 对于通用寄存器型机器,这些属性主要是指:(选择题) (1) 数据表示 (硬件能直接辩认和处理的数据类型) (2) 寻址规则 (包括最小寻址单元、寻址方式及其表示) (3) 寄存器定义 (包括各种寄存器的定义、数量和使用方式) (4) 指令集 (包括机器指令的操作类型和格式、指令间的排序和控制机构等) (5) 中断系统 (中断的类型和中断响应硬件的功能等) (6) 机器工作状态的定义和切换 (如管态和目态等) (7) 存储系统 (主存容量、程序员可用的最大存储容量等) (8) 信息保护 (包括信息保护方式和硬件对信息保护的支持) (9) I/O 结构(包括I/O 连接方式、处理机/存储器与I/O 设备间数据传送的方式和格式以及I/O 操作的状态等) 4. 计算机组成 计算机系统的逻辑实现。 5. 计算机实现 计算机系统的物理实现。 (两者的区别 第5页) 6. 系列机 在一个厂家内生产的具有相同的体系结构,但具有不同组成和实现的一系列 不同型号的机器。 7. 冯氏分类法 用系统的最大并行度对计算机进行分类。 最大并行度:计算机系统在单位时间内能够处理 8. Flynn 分类法 按照指令流和数据流的多倍性进行分类。 9. 4个定量原理:(有理解,有简答) 第6级 第5级 第4级 第3级 第2级 第1级

以经常性事件为重点=大概率事件优先规则 10.CPU性能公式: CPU时间= 执行程序所需的时钟周期数×时钟周期时间= IC ×CPI ×时钟周期时间 其中,时钟周期时间是系统时钟频率的倒数。 每条指令执行的平均时钟周期数CPI CPI = 执行程序所需的时钟周期数/IC IC:所执行的指令条数 11.程序的局部性原理(构成存储层次的理论依据) 包括程序的时间局部性,程序的空间局部性 12.冯·诺依曼结构的主要特点 以运算器为中心。 在存储器中,指令和数据同等对待。 存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。 指令的执行是顺序的。 指令由操作码和地址码组成。 指令和数据均以二进制编码表示,采用二进制运算。 13.实现可移植性的常用方法 采用系列机,模拟与仿真,统一高级语言。 14.软件兼容方式: 向前(后)兼容,向上(下)兼容四种。 向后兼容一定要保证,他是系列机的根本特征(填空) 15.模拟:用软件的方法在一台现有的机器(称为宿主机)上实现另一台机器(称为虚拟机) 的指令集。 16.仿真:用一台现有机器(宿主机)上的微程序去解释实现另一台机器(目标机)的指令 集。 17.并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。 同时性和并发性(填空) 18.从执行程序的角度来看,并行性等级从低到高可分为: 指令内部并行 指令级并行 线程级并行 任务级或过程级并行 作业或程序级并行 19.提高并行性的技术途径: 时间重叠,资源重复,资源共享 20.耦合度分为:(了解区别) 紧密耦合系统(直接耦合系统):在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。 松散耦合系统(间接耦合系统):一般是通过通道或通信线路实现计算机之间的互连,可以共享外存设备(磁盘、磁带等)。机器之间的相互作用是在文件或数据集一级上进行的。 21.CISC指令集结构存在的问题: 各种指令的使用频度相差悬殊 指令集庞大,指令条数很多,许多指令的功能又很复杂, 许多指令由于操作繁杂,其CPI值比较大,执行速度慢。

计算机体系结构复习计算题

1. 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少 根据Amdahl 定律可知: 系统加速比 = = = 由题可知: 可改进比例 = 40% = 部件加速比 = 10 系统加速比 = 采用此增强功能方法后,能使整个系统的性能提高倍。 2. 假设一台计算机的I/O 处理占10%,当其CPU 性能改进到原来的10倍时,而I/O 性能仅改进为原来的两倍时,系统总体性能会有什么改进 加速比=1/(10%/2+90%/10)= 本题反映了Amdahl 定律,要改进一个系统的性能要对各方面性能都进行改进,不然系统中最慢的地方就成为新系统的瓶颈。 3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为Δt, Δt, 2Δt, Δt ,“加”由1→2→4组成,“乘”由1 →3→4组成,输出可直接返回输入或锁存。现执行 ∑=*+4 1 ])[(i i i i c b a (1) 画出流水时空图,标出流水线输入端数据变化情况。 (2) 求运算全部完成所需的时间和流水线效率。 (3) 找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。 (1) (2)由上图可知,全部运算完的时间是23Δt 。 92 37 23437=???= t t η (3) 部件 ① ② ③ ④ ⑤ ⑥ 结果 输入 a 1 a 2 a 3 a 4 a 1+b 1 a 2+b 2 a 3+b 3 a 4+b 4 ① ③ ⑤ b 1 b 2 b 3 b 4 c 1 c 2 c 3 c 4 ② ④ ⑥ Δt 4 3 2 1

计算机体系结构复习

1. 计算机系统的多级层次结构: 第6级 第5级 第4级 第3级 第2级 第1级 2. 系统结构的概念: 计算机系统结构指的是计算机系统的软、 硬件的界面, 即机器语言程 序员或编译程序设计者所能看到的传统机器级所具有的属性。 3. 在计算机技术中, 对本来存在的事物或属性, 但从某种角度看又好象不存在的概念称为 透明性。 4. 对于通用寄存器型机器,这些属性主要是指: (选择题) 1) 指令系统(包括机器指令的操作类型和格式、指令间的排序和控制机构等) 2) 数据表示 (硬件能直接辩认和处理的数据类型) 3) 寻址规则 (包括最小寻址单元、寻址方式及其表示) 4) 寄存器定义 (包括各种寄存器的定义、数量和使用方式) 5) 中断系统 (中断的类型和中断响应硬件的功能等) 6) 机器工作状态的定义和切换 (如管态和目态等) 7) 存储系统 (主存容量、程序员可用的最大存储容量等) 8) 信息保护 (包括信息保护方式和硬件对信息保护的支持) 9) I/O 结构(包括 I/O 连接方式、处理机 /存储器与 I/O 设备间数据传送的方式和 格式 以及 I/O 操作的状态等) 5. 计算机组成指的是计算机系统结构的逻辑实现, 包含物理机器级中的数据流和控制流的 组成以及逻辑设计。 6. 计算机实现指的是计算机组成的物理实现。 7. 数据表示是指计算机硬件能够直接识别、指令集可以直接调用的数据类型。 8. 数据类型、数据结构、数据表示之间的关系 名词解释 填空 选择 简答 计算 L1:微程序机器

9.系列机指由同一厂商生产的具有相同体系结构、但具有不同组成和实现的一系列不同型 号的机器。 10.常见的计算机系统结构分类法有两种:Flynn 分类法和冯氏分类法。冯氏分类法是用系 统的最大并行度对计算机进行分类;Flynn 分类法是指按照指令流和数据流的多倍性进行分类。 11.定量分析技术(简答题): 1)以经常性事件为重点:在计算机系统设计中,经常需要在多种不同的方法之间进行折中,这时应按照对经常发生的情况采用优化方法的原则进行选择。 2)Amdahl 定律:加速某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比。 3)CPU性能公式:执行一个程序所需的CPU 时间=执行程序所需的时钟周期数*时钟周期时间 4)程序的局部性原理:指程序执行时所访问的存储器地址分布不是随机的,而是相对簇聚的。分为时间局部性和空间局部性。 12.冯诺依曼结构的特点:以运算器为中心;在存储器中,指令和数据同等对待;存储器是 按地址访问、按顺序线性编址的一维结构,每个存储单元的位数是固定的;指令是按顺序执行的;指令由操作码和地址码组成;指令和数据均以二进制编码表示,采用二进制运算。 13.实现可移植性的常用方法有三种:采用系列机、模拟与仿真、统一高级语言。 14.系列机在兼容方面,向后兼容一定要保证,尽量保证向上兼容 15.模拟是指用软件的方法在一台现有的计算机上实现另一台计算机的指令集。(软件方法) 16.仿真是指用一台现有计算机上的微程序去解释实现另一台计算机的指令集。(硬件方法) 17.并行性包括同时性和并发性。 18.从执行程序的角度来看,并行性等级从低到高可分为:(简答) 1)指令内部并行:单条指令中各微操作之间的并行 2)指令级并行:并行执行两条或两条以上的指令 3)线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位。 4)任务级或过程级并行:并行执行两个或两个以上的过程或任务,以子程序或进程为调度单位。 5)作业或程序级并行:并行执行两个或两个以上的作业或程序。 19.提高并行性的技术路径(12 字):时间重叠、资源重复、资源共享 20.能够对紧密耦合系统和松散耦合系统进行区分:紧密耦合系统共享主存,松散耦合系统共 享外设 21.CISC 指令集结构存在的问题: 1)各种指令的使用频度相差悬殊

计算机体系结构参考1

第一题选择题 1.SIMD是指(B) A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2.下列那种存储设备不需要编址?D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3.按照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4.早期的计算机系统只有定点数据表示,因此硬件结构可以很简单。但是这样的系统有明显的缺点,下面哪一个不是它的缺点:B A.数据表示范围小 B.单个需要的计算时钟周期多 C.编程困难 D.存储单元的利用率很低 7.下面哪个页面替换算法实际上是不能够实现的?D A)随机页面替换算法 B)先进先出替换算法 C)最久没有使用算法 D)最优替换算法

9.指令优化编码方法,就编码的效率来讲,那种方法最好?C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10.在早期冯·诺依曼计算机特征中,机器以(C)为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A.先进先出顺序访问 B.按地址访问 C.无地址访问 D.按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每—段分别只有—个部件可供使用,并且执行时间分别为Δt、2Δt和3Δt,连续执行n条指令所需要花费的最短时间约为( C )。 (假设“取指令”、“分析”和“执行”可重叠,并假设n足够大) A.6 nΔt B.2 nΔt C.3 nΔt D.nΔt 6、下列计算机不属于RISC计算机的是(C )。 A.SUN:Ultra SPARC

计算机体系结构试题及答案版本

计算机体系结构试题及答案 1、计算机高性能发展受益于:(1) 电路技术的发展;(2) 计算机体系结构技术的发展。 2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。第六级:应用语言虚拟机-> 第五级:高级语言虚拟机-> 第四级:汇编语言虚拟机-> 第三级:操作系统虚拟机->第二级:机器语言(传统机器级) -> 第一级:微程序机器级。 3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。 4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。 5、Amdahl 提出的体系结构是指机器语言级程序员所看见的计算机属性。 6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。 7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。

8、计算机体系结构、计算机组织、计算机实现的区别和联系? 答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。 9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。 10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的 各机器,而且它们所获得的结果一样,差别只在于运行时间的不同。 11、兼容机:不同厂家生产的、具有相同体系结构的计算机。 12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。 13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算三大领域。 14、摩尔定律:集成电路密度大约每两年翻一番。 15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。(b)流量:单位时间内所完成的工作量。(c )假定两台计算机x 、y;x 比y 快意思为:对于给定任务,x 的响应时间比y少。x的性能是y的几倍是指:响应时间x / 响应时间y = n ,响应时间与性能成反比。

计算机体系结构试题汇总

计算机系统结构 姓名:学号: 一、简答题(每小题10分,共20分) 1.简述使用物理地址进行DMA存在的问题,及其解决办法。 2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。 二、(60分)现有如下表达式: Y=a ×X 其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。 1.请写出实现该表达式的MIPS代码。 2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。 3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。 4.根据3的结果说明流水线相关对CPU性能的影响。 三、(20分)请分析I/O对于性能的影响有多大?假设: 1.I/O操作按照页面方式进行,每页大小为16 KB,Cache块大小为64 B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。 2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。 3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

(完整版)计算机系统结构复习题(附答案)范文

计算机系统结构复习题和重点(附答案) 一、单项选择题 1.实现汇编语言源程序变换成机器语言目标程序是由() A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 2.系列机软件必须保证() A.向前兼容,并向上兼容B.向前兼容,并向下兼容 C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容 3.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是()A.56个B.63个 C.64个D.84个 4.在IBM370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是()A.“执行”指令B.“程序调用”指令 C.“比较与交换”指令D.“测试与置定”指令 5.关于非专用总线三种控制方式中,下列叙述错误 ..的是() A.集中式定时查询,所有部件共用同一条“总线忙”线 B.集中式定时查询,所有部件都用同一条“总线请求”线 C.集中式独立请求,所有部件都用同一条“总线请求”线 D.集中式串行链接,所有部件都用同一条“总线请求”线 6.磁盘外部设备适合于连接到() A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 7.在Cache存储器中常用的地址映象方式是() A.全相联映象B.页表法映象 C.组相联映象D.段页表映象 8.在指令级高度并行的超级处理机中,下列叙述正确的是() A.超标量处理机利用资源重复,要求高速时钟机制 B.超流水线处理机利用资源重复,要求高速时钟机制 C.超标量处理着重开发时间并行性,要求高速时钟机制 D.超流水线处理机着重开发时间并行性,要求高速时钟机制 9.间接二进制n方体网络是一种() A.多级立方体网络B.多级全排列网络

计算机系统结构课程的重点和难点范文

.. . … . word. … 第一章 计算机系统结构的基本概念 【学习指南】 一.本章是全书的基础,所以要透切理解本章所介绍的基本概念,例如计算机系统层次结构,系统结构定义,计算机组成定义,计算机实现定义,系统结构、组成与实现的三者关系,透明性,Amdahl 定律,CPU 性能公式,局部性原理,MIPS 定义,MFLOPS 定义等等。 1. 计算机系统由硬件和软件组成,按功能划分为多级层次结构。 2. 计算机系统结构作为一门学科,主要是研究软件,硬件功能分配和对软件、硬件界面的确定,即哪些功能由软件完成,哪些功能由硬件完成。计算机系统结构,计算机组成和计算机实现是三个不同的概念。计算机系统结构是计算机系统的软硬件的界面;计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。 3. 计算机系统结构的分类 (1) 通常把计算机系统按照其性能和价格的综合指标分为巨型、大型、中型、小型、 微型等。 (2) 按用途可分为科学计算、事务处理、实时控制、家用等。 (3) 按处理机个数和种类,可分为单处理机、多处理机、并行处理机、关联处理机、 超标量处理机、超流水线处理机、SMP (对称多处理机)、MPP (大规模并行处理 机)、机群系统等。 (4) Flynn 分类法。按照指令流和数据流的不同组织方式,将计算机系统结构分为以下 四类: ? 单指令流单数据流SISD (Single Instruction stream Single Datastream ) ? 单指令流多数据流SIMD (Single Instruction stream Multiple Datastream ) ? 多指令流单数据流MISD (Multiple Instruction stream Single Datastream ) ? 多指令流多数据流MIMD (Multiple Instruction stream Multiple Datastream ) (5)式分类法。提出用最大并行度对计算机系统结构进行分类。分为: ? 字串位串WSBS (Word Serial and Bit Serial ) ? 字并位串WPBS (Word Parallel and Bit Serial ) ? 字串位并WSBP (Word Serial and Bit Parallel ) ? 字并位并WPBP (Word Parallel and Bit Parallel ) 4.计算机系统设计的定量原理 (1) 加快经常性事件的速度(Make the common case fast)。 (2) Amdahl 定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 Fe 表示(改进前可改进部分占用的时间)/(改进前整个任务的执行时间),Se 表示(改进前改进部分的执行时间)/(改进后改进部分的执行时间),则: ? 改进后的整个任务的执行时间为: )1(0Se Fe Fe T T n +-=, 其中0T 为改进前的整个任务的执行时间。 ? 改进后的整个系统加速比为:

计算机体系结构课后答案

计算机体系结构课后答案

计算机体系结构课后答案 【篇一:计算机体系结构习题(含答案)】 1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。 (1)最大尾数(8)最小正数 (2)最小正尾数(9)最大负数 (3)最小尾数(10)最小负数 (4)最大负尾数(11)浮点零 (5)最大阶码(12)表数精度 (6)最小阶码(13)表数效率 (7)最大正数(14)能表示的规格化浮点数个数 2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。尾数用原码、纯小数表示,阶码用移码、整数表示。 (1) 设计这种浮点数的格式 (2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。 3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。 (1) 选择合适的舍入方法。

(2) 确定警戒位位数。 (3) 计算在正数区的误差范围。 4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发? 5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。 (1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。 6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字 段的长度均为6位。 (1) 如果双地址指令有15条,单地址指令和零地址指令的条数基本相同,问单地址指令和零地址指令各有多少条?并且为这3类指令分配操作码。 (2) 如果要求3类指令的比例大致为1:9:9,问双地址指令、单地址指令和零地址指令各有多少条?并且为这3类指令分配操作码。 7.别用变址寻址方式和间接寻址方式编写一个程序,求c=a+b,其中,a与b都是由n个元素组成的一维数组。比较两个程序,并回答下列问题: (1) 从程序的复杂程度看,哪一种寻址方式更好?

计算机体系结构知识点

目录 第一章计算机系统结构基本概念 (2) (一) 概念 (2) (二) 定量分析技术 (3) (三) 计算机系统结构发展 (4) (四) 计算机的并行性 (5) 第二章计算机指令集结构 (7) 一. 指令集结构的分类 (7) 二. 寻址方式 (7) 三. 指令集结构的功能设计 (8) 四. 指令格式的设计 (10) 五. MIPS指令集结构 (10) 第三章流水线技术 (14) 一. 流水线的基本概念 (14) 二. 流水线的性能指标 (14) 三. 流水线的相关与冲突 (16) 四. 流水线的实现 (18) 第四章指令集并行 (18) 付志强

第一章计算机系统结构基本概念 (一)概念 什么是计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性. 透明性:在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念成为透明性. 常见计算机系统结构分类法 冯氏分类法(冯泽云):按最大并行度对计算机进行分类. Flynn分类法:按指令流和数据流多倍性进行分类 ①单指令流单数据流 ②单指令流多数据流 ③多指令流单数据流(不存在) ④多指令流多数据流 付志强

(二)定量分析技术 Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比. 加速比=系统性能 改进后 系统性能 改进前 = 总执行时间 改进前 总执行时间 改进后 加速比依赖于以下两个因素 ①可改进比例 ②部件加速比 CPU性能公式 CPU时间 CPU时间=执行程序所需时间的时钟周期数x时钟周期时间(系统频率倒数) CPI(Cycles Per Instruction) CPI =执行程序所需时钟周期数/所执行指令条数 ∴CPU时间= IC x CPI x 时钟周期时间 可知CPU性能取决于一下三个方面 ①时钟周期时间:取决于硬件实现技术和计算机组成 付志强

计算机系统结构考试计算题

有一指令流水线如下所示 入 1 2 3 4 出 50ns 50ns 100ns 200ns (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段请采取两种不同的措施消除此“瓶颈”。对 于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少 解:(1) 2200(ns) 2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1T n TP 1pipeline -== 45.45%11 5 4400TP m t TP E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 变成八级流水线(细分) 850(ns) 509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n TP 1pipeline -== 58.82%17 10 8400TP m ti TP E m 1 i ≈=? =?? =∑= 重复设置部件 1 2 3_1 3_2 4_1 4_4 入 出

)(ns 851T n TP 1pipeline -== 58.82%17 10 8 85010400E ≈=??= 有一 4段组成,其3段时,总次,然后流到第4段。如果 需要的时间都是t ?,问: (1) 当在流水线的输入端连续地每t ?时间输入任务时,该流水线会发生 什么情况 (2) 此流水线的最大吞吐率为多少如果每t ?2输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少 (3) 当每段时间不变时,如何提高该流水线的吞吐率仍连续处理10个任 务时,其吞吐率提高多少 (2)

计算机体系结构知识点汇总

第一章计算机体系结构的基本概念 1.计算机系统结构的经典定义 程序员所看到的计算机属性,即概念性结构与功能特性。 2.透明性 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 3.系列机 由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 4.常见的计算机系统结构分类法有两种:Flynn分类法、冯氏分类法Flynn分类法把计算机系统的结构分为4类: 单指令流单数据流(SISD) 单指令流多数据流(SIMD) 多指令流单数据流(MISD) 多指令流多数据流(MIMD) 5. 改进后程序的总执行时间

系统加速比为改进前与改进后总执行时间之比 6.CPI(Cycles Per Instruction):每条指令执行的平均时钟周期数 CPI = 执行程序所需的时钟周期数/IC 7.存储程序原理的基本点:指令驱动 8.冯·诺依曼结构的主要特点 1.以运算器为中心。 2.在存储器中,指令和数据同等对待。 指令和数据一样可以进行运算,即由指令组成的程序是可以修改的。 3.存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。 4.指令的执行是顺序的 5.指令由操作码和地址码组成。 6.指令和数据均以二进制编码表示,采用二进制运算。 9.软件的可移植性 一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。差别只是执行时间的不同。我们称这两台计算机是软件兼容的。 实现可移植性的常用方法:采用系列机、模拟与仿真、统一高级语言。 软件兼容: 向上(下)兼容:按某档机器编制的程序,不加修改就能运行于比它高(低)档的机器。 向前(后)兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改地就能运行于在它之前(后)投入市场的机器。 向后兼容是系列机的根本特征。 兼容机:由不同公司厂家生产的具有相同系统结构的计算机。

计算机体系结构 习题与答案

第二章习题(P69-70) 一、复习题 1.简述冯?诺依曼原理,冯?诺依曼结构计算机包含哪几部分部件,其结构以何部件为中心? 答:冯?诺依曼理论的要点包括:指令像数据那样存放在存储器中,并可以像数据那样进行处理;指令格式使用二进制机器码表示;用程序存储控制方式工作。这3条合称冯?诺依曼原理 冯?诺依曼计算机由五大部分组成:运算器、控制器、存储器、输入设备、输出设备,整个结构一般以运算器为中心,也可以以控制器为中心。 (P51-P54) 2.简述计算机体系结构与组成、实现之间的关系。 答:计算机体系结构通常是指程序设计人员所见到的计算机系统的属性,是硬件子系统的结构概念及其功能特性。计算机组成(computer organization)是依据计算机体系结构确定并且分配了硬件系统的概念结构和功能特性的基础上,设计计算机各部件的具体组成,它们之间的连接关系,实现机器指令级的各种功能和特性。同时,为实现指令的控制功能,还需要设计相应的软件系统来构成一个完整的运算系统。计算机实现,是计算机组成的物理实现, 就是把完成逻辑设计的计算机组成方案转换为真实的计算机。计算机体系结构、计算机组成和计算机实现是三个不同的概念,各自有不同的含义,但是又有着密切的联系,而且随着时间和技术的进步,这些含意也会有所改变。在某些情况下,有时也无须特意地去区分计算机体系结构和计算机组成的不同含义。 (P47-P48) 3.根据指令系统结构划分,现代计算机包含哪两种主要的体系结构? 答:根据指令系统结构划分,现代计算机主要包含:CISC和RISC两种结构。 (P55) 4.简述RISC技术的特点? 答:从指令系统结构上看,RISC 体系结构一般具有如下特点: (1) 精简指令系统。可以通过对过去大量的机器语言程序进行指令使用频度的统计,来选取其中常用的基本指令,并根据对操作系统、高级语言和应用环境等的支持增设一些最常用的指令; (2) 减少指令系统可采用的寻址方式种类,一般限制在2或3种; (3) 在指令的功能、格式和编码设计上尽可能地简化和规整,让所有指令尽可能等长; (4) 单机器周期指令,即大多数的指令都可以在一个机器周期内完成,并且允许处理器在同一时间内执行一系列的指令。 (P57-58) 5.有人认为,RISC技术将全面替代CISC,这种观点是否正确,说明理由? 答:不正确。与CISC 架构相比较,RISC计算机具备结构简单、易于设计和程序执行效率高的特点,但并不能认为RISC 架构就可以取代CISC 架构。事实上,RISC 和CISC 各有优势,CISC计算机功能丰富,指令执行更加灵活,这些时RISC计算机无法比拟的,当今时代,两者正在逐步融合,成为CPU设计的新趋势。 (P55-59) 6.什么是流水线技术? 答:流水线技术,指的是允许一个机器周期内的计算机各处理步骤重叠进行。特别是,当执行一条指令时,可以读取下一条指令,也就意味着,在任何一个时刻可以有不止一条指令在“流水线”上,每条指令处在不同的执行阶段。这样,即便读取和执行每条指令的时间保持不变,而计算机的总的吞吐量提高了。 (P60-62) 7.多处理器结构包含哪几种主要的体系结构,分别有什么特点? 答:多处理器系统:主要通过资源共享,让共享输入/输出子系统、数据库资源及共享或不共享存储的一组处理机在统一的操作系统全盘控制下,实现软件和硬件各级上相互作用,达到时间和空间上的异步并行。 SIMD计算机有多个处理单元,由单一的指令部件控制,按照同一指令流的要求为他们

计算机体系结构期末考试知识点与答案

体系结构复习重点.doc 1.冯.诺依蔓计算机的特点 答:冯·若依曼计算机的主要特点如下: 存储程序方式。指令和数据都是以字的方式存放在同一个存储器中,没有区别,由机器状态来确定从存储器读出的字是指令或数据。 指令串行执行,并由控制器集中加以控制、 单元定长的一维线性空间的存储器 使用低级机器语言,数据以二进制形式表示。 单处理机结构,以运算器作为中心。 其实,他最大的特点就是简单易操作。 2. T(C)=所描述的三个层次(8页) 答:3个层次为控制器、算术逻辑部件、基本逻辑部件 3. 计算机系统结构的分类(5页) 4. 计算机系统中的数据表示(38页) 5. 指令系统设计的原则 答:指令系统的设计原则是,应特别注意如何支持编译系统能高效、简易地将源程序翻译成目标代码。 首先是正交性:又称分离原则或互不相干原则。即指令中各个有不同含义的字段之间,在编码时应互相独立、互不相关。 规整性:对相似的操作数做出相同的规定。 可扩充性:要保留一定余量的操作码空间,为以后的扩展所用。 对称性:为了使编译能更加方便,通常希望操作具有对称性。 6. 流水操作中的相关 答:流水操作过程中会出现一下的3个相关:资源或结构相关、数据相关、和控制相关。 资源相关是指当有多条指令进入流水线后在同一机器周期内争用同一功能部件所发生的冲突。 数据相关:这是由于流水线中的各条指令的重叠操作使得原来对操作数的访问顺序发生了变化,从而导致了数据相关的冲突。 控制相关主要是转移指令引起的,比起数据相关来,他会使流水线丧失更多的性能。 7. 向量机中对向量的各种运算可以采用的加工方式(149页) 答:向量机中对向量的各种运算可以采用不同的加工方式,但比较有效的加工方式

计算机系统结构考试计算题

或者你才在上一个洞吞了柏忌,下一个洞你就为抓了老鹰而兴奋不已。 只有凭借毅力,坚持到底,才有可能成为最后的赢家。这些磨练与考验使成长中的青少年受 益匪浅。在种种历练之后,他们可以学会如何独立处理问题;如何调节情绪与心境,直面挫折,抵御压力;如何保持积极进取的心态去应对每一次挑战。往往有着超越年龄的成熟与自3.12 有一指令流水线如下所示 (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。 对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1) 2200(ns) 2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n TP 1pipeline -== 45.45%11 5 4400TP m t TP E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 ? 变成八级流水线(细分) 850(ns) 509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n TP 1pipeline -== 58.82%17 10 8400TP m ti TP E m 1 i ≈=? =?? =∑= ? 重复设置部件 出 50ns 50ns 100ns 200ns

或者你才在上一个洞吞了柏忌,下一个洞你就为抓了老鹰而兴奋不已。 只有凭借毅力,坚持到底,才有可能成为最后的赢家。这些磨练与考验使成长中的青少年受益匪浅。在种种历练之后,他们可以学会如何独立处理问题;如何调节情绪与心境,直面挫折,抵御压力;如何保持积极进取的心态去应对每一次挑战。往往有着超越年龄的成熟与自 )(ns 851T n TP 1pipeline -== 58.82%17 10 8 85010 400E ≈=??= 3.13 4段组成,3段时,一次,然后才能流到第4段。如果每段经过一次所需要的时间都是,问: (1) 当在流水线的输入端连续地每时间输入任务时,该流水线会发生 什么情况? (2) 此流水线的最大吞吐率为多少?如果每输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少? (3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个 任务时,其吞吐率提高多少? t t ?t ?2

计算机体系结构重点总结

1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。 F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间 整个任务在老计算机上运行得时间 同时将S定义为先进高速部件与老部件得性能,则 S= 老部件完成该功能得时间 先进高速部件完成该功能得时间 而采用了高速部件后整机性能提高比,即 Speedup = T old = 1 T new (1-F)+F/S 某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。根据Amdahl定律计算: ⑴采用增强技术后计算机性能加速比就是多少? ⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。 2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。 (2)时间局部性:如果某一参数被引用,那它不久将再次被引用。这里指出了程序执行时在时间上得局部性 (3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。指出程序执行时地址空间上得局部性。 3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。完成同样任务所需得时间越短,计算机得性能越好。(考判断) 4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。 5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。(考判断) 6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。 提高计算机性能就就是提高CPU性能与减少等待时间。 cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction), CPI=CPU花费得时钟数/CPU执行得总指令数 CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ 8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空) CPU性能 =1/CPU time= f / ( I×CPI ) 计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。 MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 ) MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×106 10、工作负载基准程序(workload benchmark): (1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空) 11、基准程序得一般设计原则: (1)具有代表性,反映用户得实际应用。 (2)不能对基准程序进行优化。 (3)复现性。能重复测试,其环境相同,结果能重复出现。(4)可移植性。系统相关性要小。 (5)紧凑性。基准程序不宜太庞大。 (6)成本-效率要高。 12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序 13、指令设计时主要以下几个方面来考虑: (考填空) ⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。

相关文档