首页 > 网络技术迭代 > 内容

当心！ Unixbench浮点计算性能压力测试有陷阱！

发布于：2024-10-24 编辑：匿名来源：网络

背??景在测试某台服务器（非虚拟机）的基准性能时，我们发现Unixbench的某性能指标比基准值低很多，大约在20%左右。油石压力测试成绩低的正常结果最初归功于这个子。

经过检查Whetstone压力测试基准值，我们最终发现：（1）睿频会提高CPU浮点等纯计算的性能，但幅度不大，大约10%~20%，可能与此有关与负载。 ; （2）上述问题的本质是油石压测程序存在缺陷造成的。

虽然已经取得了一些初步成果，但CPU层面的分析和压测都是硬核知识。这里我们还没有触及表面，所以我在这里简单介绍一下。

初步测试分析：由于这些指标涉及CPU浮点计算性能，通过perf和火焰图分析，性能瓶颈不在内核态，用户态也没有异常热点。通过使用turbostat和i7z工具排查，发现服务器存在动态turbo频率，幅度较大。

C0C1C6 Turbostat 检查其启动参数，未添加参数“intel_idle.max_cstate=1 intel_pstate=disable”。添加这两个启动参数后，重新启动服务器，CPU频率和状态就会稳定。

C0C1涡轮增压器再次进行测试，结果符合预期。这里我们添加本次测试的服务器CPU型号，如下图。

为了进一步测试CPU模型，当前变量落在开关的两个参数上。从i7z的监控图可以发现差异。

当不添加参数时，CPU默认支持C0/C1/C6的Cstate状态。 C0一般是CPU核执行指令，也就是工作状态。

当没有指令执行时，CPU就会进行切换。到C1甚至C6状态。

Cstate的具体说明可以参见Intel官方手册。当CPU进入C6状态时，会关闭更多Oncore组件，清除Uncore缓存，并关闭时钟。

这样做的好处是省电，但也会带来较长的恢复时延（默认情况下，服务器会避免出现CState>C1的情况，以减少服务时延抖动等问题）。是否是因为CPU更多地进入比C1更大的模式，CPU响应延迟增加，最终导致性能下降？实际运行测试程序时，使用turbostat和i7z工具来跟踪Whetstone运行时CPU的状态。

奇怪的是，这两种情况下，CPU都运行在C0状态，也就是说CPU的大部分状态都是执行状态。全速运行，几乎没有CPU状态切换带来的延迟。

另一个现象是，对于C6 Cstate开启的服务器（以下C0C1C6代表支持深度睿频设置的服务器，C0C1代表固定睿频设置的服务器），运行压力测试程序的CPU频率较高（MHz > MHz）。 C0C1C6 i7z C0C1 i7z 这里有一个问题。

从逻辑上讲，参与计算的CPU频率越高，性能越好。那么为什么在 C0C1C6 上测量的油石得分较低呢？带着疑问，我们使用perf stat命令来捕获Whetstone程序的执行信息。

统计发现，差异较大的是用户态指令的数量：u。指令数量增加了一倍以上，执行时间也增加了。

50%。 C0C1C6 perf Instrumentation:uC0C1 perf Instrumentation:u 打开和关闭上述内核启动参数会导致同一执行程序的指令总数存在差异。

看起来CPU是故意惹麻烦，塞进很多指令？这确实有些令人费解。但Edwin Jin先生表示，perf统计的指令数据是指CPU退役的指令数。

情况确实如此。指令数量仍然主要由具体程序控制。

CPU不会因为频率变化而产生程序外的指令（除非是异常，那就另当别论了）。那么问题应该出在油石程序上。

通过分析其实现源码，我们找到了差异的原因。初步结果显示，油石在进行浮点计算压力测试之前，有一个固定的步骤，预估待测CPU的主频，然后预估一个工作负载（保存在xtra变量中）交给压力测试函数，然后执行压力测试函数，最后将xtra的耗时与压力测试函数的耗时相结合，得到一个比值，即为CPU的浮点计算性能值。

xtra 的值的特征是随着估计频率的增加而增加。目的是在足够宽的时间段内衡量一个相对稳定可靠的浮点计算性能值。

下图是作者的笔记（其实是Pentium系列的测试例子，有点老了）。 Whetstone 作者指出，这个单一估计用于拟合 CPU 的执行频率，并且可能对早期的固定频率 CPU 有效。

但今天，情况发生了变化。目前，涡轮增压技术已得到广泛应用。

早在2000年，英特尔就在其酷睿i7处理器中引入了睿频加速技术。 Intel的睿频技术就是在短期内提高CPU的核心频率，在处理器功耗设计允许的范围内提高计算性能。

不过持续时间并不是很长，因此超频获得的算力至少是不可持续的。第二层也是如此（目前较新的Intel CPU支持部分CPU核心稳定的睿频频率，这是一个深刻的话题，有待后续研究）。

现在问题就很明显了。 Whetstone只是估算CPU频率，拟合一个估算的、固定的CPU频率值，并将其转换为压力测试的计算量。

这种方法显然没有考虑到可变频率。这种情况下，计算出来的结果自然不一致，也不可靠。

这并不奇怪，因为 Unixbench 已经存在了 20 多年，而 GitHub 上 Whetstone 源代码的最后一次提交日期是十年前。没有考虑到Turbo Boost带来的CPU架构变化和频率变化等问题，这很正常。

Github上的Unixbench/master验证接下来我们修改了Whetstone的源码，主动控制了Whetstone的xtra变量。经过多次运行、采样、统计，得到以下两张图（横坐标为计算量xtra，纵坐标为油石，压力测试过程耗时为秒）。

首先，Whetstone的内部实现包含8种类型的测试。每次测试都会输出一个时间结果并绘制在上图中，用N1~N8表示（其中N4为整数计算，结果被忽略）。

从上图中相同计算量下的时间消耗对比来看，支持Turbo Boost频率越高的CPU花费的时间越少，计算性能越好。其次，当计算量较小时，当图中横坐标如下时，所有测试的结果（耗时）都是线性的。

当横坐标超过时，情况发生变化，N8(sqrt/exp/log)压测时间明显增加，影响了整体压测时间的线性关系。这个问题需要进一步分析。

目前估计与数值范围的计算导致处理代码进入另一个分支以及代码量的变化有关。具体来说，我们需要测试并查看 glibc/math 库的实现。

在本文描述的案例中，C0C1C6的实际计算性能更好（单核情况）。但由于Whetstone在启动阶段估计的xtra变量比C0C1大，导致运行的计算指令较多；另一方面，油石最终对C0C1C6的xtra为约，而C0C1的xtra为约，这就陷入了上图中的非线性区域，而C0C1C6得到的压力测量结果实际上偏低。

站长声明

标签：

上一篇：当平台过时、微服务回归单体时，DDD 的意义何在？

下一篇：GPU 机器运行业务，如果无法远程运行，尝试换成VNC，特别是自建的vnc只显示2，尝试

Reno5 Pro+艺术家限量版图片欣赏：首款电致变色量产手机，到底有多酷？

对于SNEAKER来说，这双被涂鸦成二维的Air Jordan 1应该很熟悉。 ▲ 图片来自：lowprofilestore 作者、Joshua、Vides的涂鸦也因其鲜明而强烈的作品风格，成为著名的视觉艺术家。球鞋、包包，甚至汽车、房屋等，都可以成为他的画板，仅用黑白线条勾勒出一个颇为俏皮的二维世界

06-21
只二完成数千万美元C轮融资，明裕创投领投

5月10日消息，二手奢侈品交易服务商只二近期完成数千万美元A轮融资C轮融资，由明裕创投领投，天富基金跟投，元璟资本、红点中国、赫斯特资本等老股东也进行了追加投资。太合资本专门为财务顾问服务。只二成立于2019年1月，作为二手奢侈品交易服务商，只二通过提供端到端的重

06-18
华为推出异形设计耳机，199欧元；中央经济工作会议：加快人工智能发展； 2023网络热词：显眼包包、特种兵旅游入选

中央经济工作会议：加快人工智能发展中央经济工作会议12月11日至12日在北京召开。会议强调，明年要围绕推动高质量发展，突出重点、抓住重点，扎实做好经济工作。要以科技创新特别是颠覆性技术、前沿技术推动产业创新，催生新产业、新模式、新动能，培育新的优质生产力。完

06-18
马斯克卖发香香水，真的很火

如果你无聊，就来Boring Company吧。如果你不无聊，就来Boring Company吧。无论你做出哪个选择，你都会对此感到满意——而刚才，在马斯克的“无聊公司”推出一款香水后，我意识到了更多。它的名字叫烧焦的头发。你没看错，顾名思义，它闻起来像烧焦的头发。烧焦的头发…

06-21
爱居智能获数千万元天使轮融资，目前仍在筹备Pre-A轮融资

据投资界（ID：pedaily）12月9日消息，据36氪报道，智能音频眼镜开发商“爱聚智能”已完成1000万元天使轮融资，由千资财富领投。本轮资金将主要用于团队建设和自有生产线，以及第一代产品落地和垂直领域爱居智能成立于2017年，专注于智能音频眼镜产品，拥有完整的设计、研发

06-17
3999起！小米14疯狂，超越iPhone 15 Pro，ThePaper OS惊艳亮相

这就是小米的“跨越时刻”。比小米手机历史更悠久的MIUI告别，ThePaper OS登场。 iPhone 基准测试会议如期举行。面对跨越式的iPhone 15 Pro，小米更有信心了。回顾8月份的年度讲话，雷军表示，小米这三年的高端探索是这十年来最痛苦也是最有收获的。手握小米14的雷军在发

06-21
最高罚款、停业整顿，施惠团再次被国家市场监管总局行政处罚

创头条获悉，5月27日，国家市场监管总局再次处以最高1万元罚款社区团购平台“十会团”被责令江苏“十会团”平台停业整顿3天。据悉，3月3日，国家市场监管总局已依法对橙心优选、多多买菜、美团优选、食灰团等社区团购平台不公平定价行为进行行政处罚，并督促企业积极主动整

06-17
【创业24小时】2023年2月28日

投融资昨天，国内市场共发生16起投资披露事件，其中先进制造7起（联盛光伏、安酷智芯、玉柴芯蓝、蓝星光宇、小牌科技）、灵图科技、科沃克科技）、企业服务5个（蚂蚁盛世、微物光子、亿盛云图、筑见智能、未来时速）、医疗健康案例2个（仁景生物、嘉晨西海）、本地生活1个（

06-18
4月：医疗企业强势领先，融资总额增速放缓

4月份头条融资报告中境内投融资事件合计（不含IPO），环比增长0.73%，同比增长0.73%。下降19%；累计披露融资金额7000万元，环比下降36.7%，较去年同期减少约1亿元。从投融资案例数量来看，本月发布的消息中，医疗健康领域企业遥遥领先，其次是企业服务领域企业和人工智能相

06-18
苹果宣布新一代iPad将于7月20日在中国大陆正式上市

北京时间7月10日晚间消息，苹果宣布新一代iPad（The New iPad）将于中国大陆正式上市7月20日。　　全新WiFi版iPad将推出两种颜色。 16GB型号建议零售价为人民币，32GB型号为人民币，64GB型号为人民币。 WiFiG版新款iPad建议零售价为16GB机型16000元、32GB机型1000元、64GB机

06-17
快递平台“一米滴答”获3亿元B轮融资，鼎晖投资领投

据投资界7月16日消息，物流网络平台“一米滴答”宣布完成3亿元融资在B轮融资中。本轮融资由鼎晖投资领投，普洛斯、源码资本、险峰长青、耀明投资、GVC跟投；同时，汉能投资集团担任财务顾问本轮融资。　　据悉，伊米滴答此前已获得两轮融资。今年9月，获得普洛斯、源码资

06-18
跨境电商SaaS公司“BI船长”完成近亿元A轮融资

近日，“BI船长”完成近亿元A轮融资。钟鼎资本领投，老股东同创伟业继续投资，纵腾集团跟投，山景资本担任独家财务顾问。 Captain BI是一家跨境电商SaaS公司，为亚马逊平台上销售的中国卖家提供运营、财务、CPC广告、CRM管理、FBA库存等智能数据分析服务。听，中小企业反馈

06-18