文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

【计算机架构】响应时间和吞吐量 | 相对性能 | 计算 CPU 时间 | 指令技术与 CPI | T=CC/CR, CC=IC*CPI

2023-09-02 09:36

关注

    

 目录

0x00 响应时间和吞吐量(Response Time and Throughput)

0x01 相对性能(Relative Performance)

0x02 执行时间测量(Measuring Execution Time)

0x03 CPU 时钟(Clocking)

0x04 CPU时间

0x05 指令计数和 CPI

0x06 性能摘要(Performance Summary)


0x00 响应时间和吞吐量(Response Time and Throughput)

响应时间 (Response time):完成任务所需的时间

吞吐量 (Throughput):每个单位时间内完成的总工作量 (比如: tasks/transactions... per hours)

存在多种因素可以对响应时间和吞吐量造成影响,包括但不限于:

换更快的处理器?添加更多的处理器?本章我们更关注的是 响应时间 (Response time) 。

0x01 相对性能(Relative Performance)

📚 定义:性能 =  1 / 执行时间

 \textrm{ Performance }= 1\, /\, \textrm{Execution Time}

X 比 Y 快 n 倍:

\frac{\textrm{Performance}_X}{\textrm{Performance}, _Y}=\frac{\textrm{Execution time}_Y}{ {\textrm{Execution time}}_X}=n

💭 举个例子:运行程序所需时间,在 A 机器上为 10s,在 B 机器上为 15s 

E_B/E_A=15s/10s=1.5

因此,A 比 B 快 1.5 倍。

0x02 执行时间测量(Measuring Execution Time)

执行时间测量 (Measuring Execution Time) 指的是在计算机程序中测量代码执行所需的时间。这通常是通过在代码开始和结束时记录时间戳来实现的,然后计算时间戳之间的差异来计算程序执行所需的时间。

执行时间测量通常是性能优化和调试代码的重要工具。通过测量程序中不同部分的执行时间,开发人员可以确定哪些部分需要进行优化,以使程序更加高效。

在实际应用中,执行时间测量可以使用多种不同的技术和工具来实现,例如内置的计时器函数、性能分析工具、代码覆盖率工具等等。不同的方法适用于不同的场景和需求。

总的反应时间 (Elapsed time):

CPU 时间 (CPU time):

0x03 CPU 时钟(Clocking)

CPU Clocking(CPU 时钟)指的是计算机 CPU 内部的时钟系统。这个时钟系统会以固定的速率来发出脉冲信号,这些信号会让 CPU 的不同部件在每个时钟周期内执行相应的操作。

数字硬件的操作受到固定速率时钟的控制:

时钟周期 (Clock period):时钟信号一个完整的循环所需要的时间。

时钟频率 (Clock Rate):每秒钟时钟信号产生的周期数。

0x04 计算CPU时间(T=CC/CR)

性能可以通过减少时钟周期数、增加时钟速度来改善。

硬件设计人员通常需要在时钟速度和时钟周期数量之间进行权衡。

🔺 CPU Time 计算公式如下:

CPU 时间 = CPU 时钟周期数 × 时钟周期
                 = CPU 时钟周期数 ÷ 时钟频率

📜 简化记忆:

💭 举个例子:

计算机 A 有 2GHz 的时钟, 10s 的CPU 时间,请设计计算机 B,目标达到 10s 的 CPU 时间。可以使用更快的时钟,但会导致 1.2 × 时钟周期,问计算机 B 的时钟应该多快?

💡 解答:已知 \textrm{Clock Rate}_A=2\textrm{GHz},\, \, \textrm{CPU Time}_A=10s计算 \textrm{Clock Rate}_B

* 根据上述公式 T=\frac{CC}{CR }那么 CR=\frac{CC}{T}

根据题意,使用更快时钟导致 1.2 倍 CC,并且目标 CPU 时间 T 为 6s,可列出公式:

\textrm{Clock Rate}_B=\frac{\textrm{Clock Cycles}_B}{\textrm{CPU Time}_B}=\frac{1.2\times\textrm{ Clock Cycles}_A}{6s}

此时我们需要计算 A 的时钟周期,根据公式 T=\frac{CC}{CR },那么时钟周期 CC=T\times CR

\textrm{Clock Cycles}_A=\textrm{CPU Time}_A\times \textrm{Clock Rate}_A=10s\times 2\textrm{GHz}={\color{Blue} 20\times 10^9}

此时我们已经得到了 CC_A,带入即可计算出 \textrm{ClockRate}_B

\textrm{CR}_B=\frac{1.2\times \textrm{CC}_{B(A)}}{\textrm{T}_B}= \frac{1.2\times {\color{Blue} 20\times 10^9}}{6s}=\frac{​{\color{Blue} 24\times10^9}}{6s}={\color{Red} 4}\textrm{\, GHz}

0x05 指令计数 IC 和 每条指令所需的时钟周期数 CPI

\textrm{IC} (Instruction Count),指的是 指令计数

\textrm{CPI} (Cycle Per Instrution),指的是 每条指令所需的时钟周期数。即 平均执行周期数

是指在一个程序中,每个时钟周期所执行的平均指令数。这两个概念都是计算机性能评估中的关键指标。通过减少指令计数或降低 CPI,可以提高计算机系统的性能。

 📃 简化记忆:

Execution time = (Instruction count * CPI) / Clock rate

程序的指令计数是由程序本身、指令集架构 (ISA) 和编译器所决定的。每个指令的平均时钟周期数取决于CPU硬件。如果不同的指令具有不同的CPI,则平均 CPI 受指令组合的影响。

💭 CPI 计算例子:

计算机 A 的周期时间 = 250ps,CPI = 2.0,计算机 B 的周期时间 为 500ps,CPI = 1.2

ISA 相同,哪台计算机更快?快多少?

💡 题解:根据题意得知:CT_A=250ps,CPI_A=2.0CT_B=500ps,CPI_B=1.2

既然要比谁更快,那么我们分别计算出 A, B 的 CPU Time:

\textrm{CPU Time}_A=IC\times CPI_A\times \textrm{CycleTime}_A=l\times 2.0\times 250ps=l\times 500ps

\textrm{CPU Time}_B=IC\times CPI_B\times \textrm{CycleTime}_B=l\times 1.2\times 500ps=l\times 600ps

\textrm{CPU Time}_A < \textrm{CPU Time}_B,因此 A 速度更快。

下面计算快多少:

\frac{\textrm{CPU Time}_B}{\textrm{CPU Time}_A}=\frac{l\times 600ps}{l\times 500ps}=1.2

0x06 关于CPI 的更多细节

如果不同的指令类别需要不同的时钟周期数:

 \textrm{ClockCycle}=\sum_{i=1}^{n}(IC_i\times CPI_i)

 加权平均 CPI (Avg):

CPI=\frac{\textrm{Clock\, Cycles}}{\textrm{IC}}=\sum_{i=1}^{n}(\textrm{CPI}_i\times \frac{IC_i}{IC})

💭 例子:Alternative compiled code sequences using instructions in classes A, B, C:

💡 解读:Sequence 1 中  IC=2+1+2=5

根据公式:\textrm{ClockCycle}=\sum_{i=1}^{n}(IC_i\times CPI_i)

再根据图表给出的 IC, CPI 即可计算出 Clock Cycles:

\textrm{Clock Cycles}=IC\times CPI=(2\times 1)+(1\times 2)+(2\times 3)={\color{Blue} 10}

然后通过公式计算平均:CPI=\frac{\textrm{Clock\, Cycles}}{\textrm{IC}}=\sum_{i=1}^{n}(\textrm{CPI}_i\times \frac{IC_i}{IC})

 \textrm{Avg. CPI}=\frac{\textrm{CC}}{IC}=\frac{​{\color{Blue} 10}}{5}={\color{Red} 2.0}

0x07 性能摘要(Performance Summary)

\textrm{CPU Time}=\frac{\textrm{Instructions}}{\textrm{Program}}\times \frac{\textrm{Clock Cycles}}{\textrm{Instruction}}\times \frac{\textrm{Seconds}}{\textrm{Clock Cycle}}

性能摘要 (Performance Summary) 是指对计算机系统、软件或应用程序性能进行评估、分析和总结的过程。在性能摘要中,可以考虑多种性能指标,如执行时间、吞吐量、响应时间、负载等。通常,性能摘要的目的是发现瓶颈、评估系统的优化潜力、指导系统设计和优化、以及进行比较评估等。在实践中,性能摘要是计算机系统开发和维护中非常重要的一环,可以帮助提高系统的性能、可靠性和稳定性。

性能取决于 算法 (影响 IC,可能影响 CPI)、编程语言 (影响 IC,CPI)、编译器(影响 IC,CPI)、指令集架构(影响 IC,CPI,Tc)。

🔺 计算公式总结: 

📌 [ 笔者 ]   王亦优📃 [ 更新 ]   2022.3.❌ [ 勘误 ]   📜 [ 声明 ]   由于作者水平有限,本文有错误和不准确之处在所难免,              本人也很想知道这些错误,恳望读者批评指正!

📜 参考资料 

C++reference[EB/OL]. []. http://www.cplusplus.com/reference/.

Microsoft. MSDN(Microsoft Developer Network)[EB/OL]. []. .

百度百科[EB/OL]. []. https://baike.baidu.com/.

来源地址:https://blog.csdn.net/weixin_50502862/article/details/129617958

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-服务器
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯