欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    清华第2版《计算机系统结构》 部分答案.docx

    • 资源ID:8792652       资源大小:159.67KB        全文页数:26页
    • 资源格式: DOCX        下载积分:12金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要12金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    清华第2版《计算机系统结构》 部分答案.docx

    1、清华第2版计算机系统结构 部分答案计算机系统结构习题解答目录第一章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)第二章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)第三章(P202)3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法-实存状况图)第四章(P250)4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)第五章(P343)5.9(流水线性能/时空图),5.1

    2、5(2种调度算法)第六章(P391)6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)第八章(P498)8.12(SISD/SIMD算法)第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。有下划线者为推荐的主要知识点。)第一章(P33)1.7(1)从指定角度来看,不必要了解的知识称为透明性概念。(2)见下表,“”为透明性概念,“P”表示相关课文

    3、页数。模m交叉,浮点数据,P4通道与I/O处理机,P4总线宽度,阵列运算部件,结合型与独立型通道,单总线,访问保护,中断,指令控制方式,堆栈指令,最小编址单位,Cache存储器,1.8见下表,“”为透明性概念,“P”表示相关课文页数。指令地址寄存器,指令缓冲器,时标发生器,条件码寄存器,乘法器,主存地址寄存器,磁盘,先行进位链,移位器,通用寄存器 ,中断字寄存器,1.9见下表,“”表示都透明,“应”表示仅对应用程序员透明,“”表示都不透明。数据通路宽度,虚拟存储器,应,Cache存储器,程序状态字,“启动I/O”指令,应,“执行”指令,指令缓冲寄存器,Sn20 1 0 1 Fe1.12 已知S

    4、e=20 , 求作Fe-Sn关系曲线。 将Se代入Amdahl定律得 1.13 上式中令Sn=2,解出Fe=10/190.5261.14 上式中令Sn=10,解出Fe=18/190.9471.15 已知两种方法可使性能得到相同的提高,问哪一种方法更好。(1)用硬件组方法,已知Se=40,Fe=0.7,解出Sn=40/12.73.1496(两种方法得到的相同性能)(2)用软件组方法,已知Se=20,Sn=40/12.7,解出Fe=27.3/380.7184(第二种方法的百分比)(3)结论:软件组方法更好。因为硬件组需要将Se再提高100%(2040),而软件组只需将Fe再提高1.84%(0.70

    5、.7184)。1.17 1.18 记f 时钟频率,T=1/f 时钟周期,B 带宽(Byte/s)。 方案一: 方案二:1.19 由各种指令条数可以得到总条数,以及各百分比,然后代公式计算。(1)(2)(3)1.21(1)(2)1.24 记Tc 新方案时钟周期,已知CPI = CPIi = 1原时间 = CPI IC 0.95Tc = 0.95ICTc新时间 = (0.32/3+0.7) IC Tc = 0.9ICTc二者比较,新时间较短。第二章(P124)2.3(忽略P124倒1行 P125第8行文字,以简化题意)已知2种浮点数,求性能指标。 此题关键是分析阶码、尾数各自的最大值、最小值。 原

    6、图为数据在内存中的格式,阶码的小数点在其右端,尾数的小数点在其左端,遵守规格化要求。 由于尾数均为原码,原码的绝对值与符号位无关,所以最大正数与最小负数的绝对值相同,可用“最大绝对值”回答;最小正数与最大负数的绝对值相同,可用“最小绝对值”回答。 第1小问中,阶码全部位数为8,作无符号数看待真值为0255,作移-127码看待真值为-127+128;尾数(不计符号位)有23位小数,另加1位整数隐藏位,所以尾数绝对值为1.02.0 2-23,有效位数p=24; 第2小问中,阶码全部位数为11,作无符号数看待真值为02047,作移-1023码看待真值为-1023+1024;尾数(不计符号位)有52位

    7、小数,另加1位整数隐藏位,所以尾数绝对值为1.02.0 2-52,有效位数p=53。 最大绝对值为最大阶码与最大尾数绝对值的组合,最小绝对值为最小阶码与最小尾数绝对值的组合。代入相关公式后得最终结果如下表。32位64位最大绝对值(1-2-24)2129(1-2-53)21025最小绝对值2-1272-1023表数精度2-242-53表数效率100%100%2.5(1) rm = 2,re = 2,p = 24(隐藏最高位),q = 7。(2) Nmax = 1.71038,-|N|min = -1.4710-39 5.9610-8 10-7.22, = 100%2.61位7位6位0011111

    8、1333333(1) 0.2 = 0.333333H160 设阶码为移-63码(即-26+1,原题未指明) 0.2 = 0.110011001100110011001101B2-2 1位8位23位00111110110011001100110011001101 (其中最高有效位需隐藏) 阶码为移-127码(即-27+1)(2) 符号位不变,(阶码 63)4 + 127;尾数左规,除去最高位;(3) 符号位不变,(阶码 127)/ 4 + 63;尾数补最高位,按除法余数右移若干位,左补0。2.13 已知10条指令使用频度,求3种编码方法的平均码长与信息冗余量。(1)此问中的“最优Huffman编

    9、码法”实际是指码长下限,即信源的平均信息量熵,代公式得H=2.9566。(2)Huffman编码性能如下表;(3)2/8扩展编码是8/64/512法的变种,第一组2条指令,码长为2(1位扩展标志,1位编码),第二组8条指令,码长为4(1位扩展标志,与第一组区别,加3位编码),编码性能如下表;(4)3/7扩展编码是15/15/15法的变种,第一组3条指令,码长为2(共有4种组合,其中3种组合分别代表3条指令,留1种组合作为扩展前缀标志),第二组7条指令,码长为5(2位固定的前缀扩展标志,与第一组区别,加3位编码,只用其中7种组合),编码性能如下表。Huffman编码2/8扩展编码3/7扩展编码平

    10、均码长L2.993.13.2信息冗余量R1.10%4.61%7.59%2.15(1) 15条/63条/64条(2) 14条/126条/128条第三章(P202)3.3 直接代公式计算存储层次性能指标。(1)74ns,38ns,23.6ns(2)0.258,0.315,0.424(3)T256K T128K c128K c64K(4)19.092,11.97,10.0064。答案是256K方案最优。3.5 已知,其中g=0.1依题意有整理得0.9n0.2,解出,向下取整,得15;按另一种题意理解是向上取整,得16,也对。3.15 欲知可能的最高命中率及所需的最少主存页数,较好的办法是通过“堆栈模

    11、拟法”,求得命中次数随主存页数变化的函数关系。下图就是“堆栈模拟图”,其中“”表示命中。P=453251323513命中次数4532513235134532513235145325112354432551224444444n=10n=21n=33n=47n=57(1)Hmax=7/1258.3%(2)n=4(3)当1次页面访问代表连续1024次该页内存储单元访问时,后1023次单元访问肯定是命中的,而第1次单元访问的命中情况与这1次页面访问的命中情况相同。根据上图中最高命中情况,共有7次页命中(折算为71024次单元命中),5次页不命中(折算为51023次单元命中,也可写为51024-5),单

    12、元访问总次数为121024,故有:Hcell=(121024-5)/(121024)=12283/1228899.96%3.15加1题 一个二级存储层次,采用全相联映象和最久没有使用算法,实存共5页,为2道程序分享,页地址流分别如下P1 = 1 2 3 4 1 3 2 1P2 = 1 2 3 4 2 2 3 3试作2个实存分配方案,分别使2道程序满足(1)命中率相同;(2)命中次数之和最大。P1 =12341321命中次数N(1)12341321123413212341312244n1= 10n1= 20n1= 32n1= 44解:分别为2道程序作“堆栈模拟图”,其中“”表示命中。P2 =12

    13、342233命中次数N(2)12342233123442212334411111n2= 12n2= 22n2= 34n2= 4465 N(1)+N(2)432 N(1) N(2)1 1+4 2+3 3+2 4+1将两图结果综合,得到4个分配方案的命中率情况表如下n11234N(1)0024n24321N(2)4422N(1)+N(2)4446结论如下(1)命中率相同的方案是n1= 3而n2= 2;(2)命中次数之和最大的方案是n1= 4而n2= 1。3.19中(3)(4)(6)(8)问 虚存 实页 0 1 2 3虚组0 0 0 1 实存 1 虚组1 2 0 实组0 2 3 1 虚 3 虚组2

    14、4 2 实组1 页 4 5 3 5 虚组3 6 6 7 7 (a) 虚页集合与实页集合的对应关系 (b) 对应关系表(为有关系)(3)(4)通过作“实存状况图”模拟各虚块的调度情况,可获得Cache的块地址流序列。P=624146304573C044*4444*44*4*4*C111*1*1*00*555C266*6*6*6*66*6*6*6*77*C322222*33333*3入入入入中中替替中替替中C=230102310123此问最容易出错的地方是忽略“组相联”地址约束,将虚页装错实组。另外没有及时标注“*”号也容易导致淘汰对象错误。(6)H=4/1233%(8)做法同3.15题(3)问,

    15、Hcell=(1216-8)/(1216)95.8%第四章(P250)时间 中断请求 主程序 1级 2级 3级 4级 D1,D2 D3,D44.5 已知中断服务次序为3-2-4-1,。(1)中断屏蔽字表如下图;D1D2D3D4D10111D20010D30000D40110(2)中断过程示意图如右图。4.8(1)f=2105字节/秒,T=5us(2)Ts+Td=5us,通道时间图如下。作图时注意:至少要画到最慢设备的第二次请求出现,才能确定是否丢失数据(因为响应优先级低的设备较易丢失数据)。设 优备 先号 级D1 1D2 4D3 2D4 3时间(us) 0 10 20 30 40 50 60

    16、70 80 90 100 110 120 130 140 150 160 170(3)5,160,20,40;(4)D2丢失第一次请求的数据;(5)参见P245。第五章(P343)5.9 为了缩短运算时间,首先应考虑“最少切换算法”,即先执行完所有乘法(任务编号1-6)再执行加法(任务编号7-11),其次在加法中采用“最少相关算法”(即二叉树算法)。 记c1=A1B1,c6=A6B6,下图(a)是加法的计算顺序二叉树,注意任务10应该用前一级最早完成的任务7和8的结果,如果用任务9的结果则要推迟1拍启动,使总时间增加1拍。F=c1+c2+c3+c4+c5+c6 6 1 2 3 4 5 6 7

    17、8 9 10 11 5 1 2 3 4 5 6 7 8 9 4 1 2 3 4 5 6 3 7 8 9 10 11 10 2 7 8 9 10 11 1 1 2 3 4 5 6 7 8 9 10 11 11 0 1 2 3 4 5 6 7 8 9 12 14 15 18 22 (a) (b)根据时空图(b)得 TP = 11/(22t) = 1/(2t) S = (64t + 54t)/(22t) = 2 E = (64t + 54t)/(622t) = 1/35.15 t=10ns=10-8秒(1)F=1,2,5,C=(10011)(2)状态转移图如下图(a)所示。(3)最小启动循环=(3)

    18、,最小平均启动距离=3t。(4)插入2个延迟,最小启动循环=(2),最小平均启动距离=2t。(5)新预约表如下图(b)所示。 1 2 3 4 5 6 7 8 初态 4,6,8 S1 1 2 初态 3,4,6 S2 1 1 0 0 0 1 0 1 S3 4,6,8 4,6,8 1 0 0 1 1 S4 1 2 5 D1 1 0 1 0 1 0 1 1 0 0 0 1 1 1 D2 2 5 (a) (b) (c)(6)F=1,3,7,C=(1000101),状态转移图如下图(c)所示。(7)插入前TPmax = 1/3t = 1/30ns,插入后TPmax = 1/2t = 1/20ns。(8)插

    19、入前TP = 10/33t = 1/33ns,插入后TP = 10/26t = 1/26ns,如下图所示。 S4 1 1 2 2 3 10 10 S3 1 2 3 10 S2 1 1 2 2 3 10 10 S1 1 2 1 3 2 10 10 3 t(a) 插入前 93 6 D2 1 2 3 11 D1 1 2 3 4 10 S4 1 1 2 2 3 3 10 10 S3 1 2 3 4 10 S2 1 2 1 3 2 4 3 5 10 10 S1 1 2 3 4 1 5 2 10 10 2 t(b) 插入后 92 8第六章(P391)6.6(注意阅读P372倒数第9行倒数第6行)(4) V

    20、0 存储器 链接 V1 1 / V0 链接 V3 V1 + V2 链接 V5 V3 * V4访存倒数 加乘 8 16 8 9 31总拍数=72(各条依次链接)(3) V0 存储器 并行 V3 V1 + V2 链接 V4 V0 * V3 V6 V4 + V5 串行访存加乘 8 9 31 8 31总拍数=87(第4条功能部件冲突)已知n=32,k加=6,k乘=7,k访存=6,k倒数=14,启动、输出延迟各1。求各小题总拍数。(1) V0 存储器 V1 V2 + V3 并行 V4 V5 * V6访存加乘 9 31总拍数=40(并行执行,以最长指令为准)(2) V2 V0 * V1 并行 V3 存储器

    21、 V4 V2 + V3 串行(P372)乘访存 加 9 31 8 31总拍数=79(第3条错过时机,不能链接)(5) V0 存储器 V1 V2 + V3 并行 V4 V5 * V6 s0 s1 + s2 串行访存加乘 9 31 8总拍数=48(标量看成1个分量的向量)(6) V3 存储器 并行 V2 V0 + V1 串行 s0 s2 + s3 并行 V3 V1 * V4访存加乘 8 31 9 31总拍数=79(标量看成1个分量的向量)(7) V3 存储器 并行 V2 V0 + V1 链接 V4 V2 * V3 存储器 V4 串行访存加乘 8 9 31 8 31总拍数=87(第4条功能部件冲突)

    22、(8) V0 存储器 链接 V2 V0 + V1 V3 V2 * V1 串行 V5 V3 * V4 串行访存加乘 8 8 31 9 31 9 31总拍数=127(Vi冲突,功能部件冲突)6.10 已知向量速率Rv = 10MFLOPS,标量速率Rs = 1MFLOPS,并记为可向量化百分比。(1) 推导法1:使用Amdahl定律,在这里可将标量速率Rs作为原速率,局部加速后的速率为向量速率Rv,于是局部加速比Se=10,全局加速比为 再根据加速比的定义,所以有。(若将向量速率Rv作为原速率,局部减速后的速率为标量速率Rs,则局部加速比Se=0.1,推出的全局加速比Sn同上式。)推导法2:为了推

    23、导,定义T为总时间,N为总任务数。于是有平均速率Ra = 吞吐率TP = N/T。记N = Nv + Ns,且,则,于是有Nv = N和Ns = (1-)N 显然:总时间 所以: 或者:Ra (MFLOPS)10 1 0 1 (2) 已知Rv = 10MFLOPS,Rs = 1MFLOPS, Ra与的关系图如右图所示。(3) 已知Ra = 7.5MFLOPS,解出 (4) 已知Ra = 2MFLOPS, = 0.7,解出 第七章(P446)7.3 已知输入端编号13 = 1101B。(1)Cube3(1101B) = 0101B = 5(2)PM2+3(13) = (13 + 23)mod 1

    24、6 = 21 mod 16 = 5(3)PM2+0(13) = (13 - 20)mod 16 = 12(4)Shuffle(1101B) = 1011B = 11(5)Shuffle(Shuffle(1101B) = Shuffle(1011B) = 0111B = 77.4 用多级混洗交换网络,n = 4,拓扑结构同教材P410图7.21(e),控制信号=1010B,自左向右各级交换开关状态依次为交换直连交换直连。7.5 输入结点编号j = 9,f(j) = j控制信号 = 1001B1100B = 0101B = 5,答为5号处理机。7.6 直连状态时:编号在第i位不同的结点之间不能通信; 交换状态时:编号在第i位相同的结点之间不能通信。7.7 用单级混洗交换网可实现,总共混洗3步。证:设矩阵A = (aij)88按行展开依次存放在64个单元中,则任意元素aij的地址为8i + j,而aji的地址为8


    注意事项

    本文(清华第2版《计算机系统结构》 部分答案.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开