C++性能榨汁机之CPU亲和性

前言CPU领域中最广为人知的一条定律——摩尔定律:预计18个月会将芯片的性能提高一倍。过去几十年,各大公司致力于提高CPU晶体管密度和提高CPU工作频率,使得CPU的性能提升基本符合摩尔定律。但随着工艺不断发展,晶体管密度提升已经接近物理极限,CPU工作频率也由于功耗和发热的制约而无法继续提升。在基础物理领域没有大的突破的前提下,单核CPU的性能提升日益困难,于是,各大公司将目光投向了通过增加CP
Continue reading

C++性能榨汁机之虚函数的开销

虚函数的实现虽然C++标准并没有规定编译器实现虚函数的方式,但是大部分编译器均是采用了虚函数表来实现虚函数,即对于每一个包含虚成员函数的类生成一个虚函数表,一个指向虚函数表的指针被放在对象的首地址(不考虑多继承等复杂情况),虚函数表中存储该类所有的虚函数地址。当使用引用或者指针调用虚函数时,首先通过虚函数表指针找到虚函数表,然后通过偏移量找到虚函数地址并调用。关于虚函数表的更多细节,建议阅读《深度
Continue reading

C++性能榨汁机之指针与引用

前言C语言的指针让我们有了直接操控内存的强大能力,同时指针也是使用C语言时最容易出问题的地方。C++在继承了C语言的指针的同时又给我们提供了另外一个武器:引用。今天我们来探讨一下指针与引用的异同以及两者之间的性能差异。 指针与引用的区别引用与指针的区别也算是C++中老生常谈的话题了,无论是在期末考试的试卷上还是找工作时的笔试面试上,这个问题都是“常客”。对于这个问题更加详细的解答请参考《More
Continue reading

C++性能榨汁机之switch语句的背后

前言几乎每本面向初学者的C语言或C++书籍在前面两章都会提到分支控制语句if……else和switch……case,在某些情况下这两种分支控制语句可以互相替换,但却很少有人去深究在if……else和switch……case语句的背后到底有什么异同?应该选择哪一个语句才能使得效率最高?要回答这些问题,只能走到switch语句的背后,看看这些语句到底是怎么实现的。 if语句与switch语句相信学过C
Continue reading

C++性能榨汁机之无锁编程

前言私以为个人的技术水平应该是一个螺旋式上升的过程:先从书本去了解一个大概,然后在实践中加深对相关知识的理解,遇到问题后再次回到书本,然后继续实践……接触C++并发编程已经一年多,从慢慢啃《C++并发编程实战》这本书开始,不停在期货高频交易软件的开发实践中去理解、运用、优化多线程相关技术。多线程知识的学习也是先从最基本的线程建立、互斥锁、条件变量到更高级的线程安全数据结构、线程池等等技术,当然在项
Continue reading

C++性能榨汁机之惊群问题

一个小场景在开始正式讨论我们的问题之前,我们先想象这么一个小场景: 场景1:6只小鸟停在电线上休息,都在等待食物。 场景2:我们向鸟群投放一条小虫,作为它们的食物。 场景3:6只小鸟看到有食物到来,都停止休息,一起飞起来去抢夺食物。 场景4:最终只有一只小鸟(bird4)能够吃到食物,其他小鸟无奈而又伤心的回到电线上继续休息。 何谓惊群问题?上面我们的小场景实际就是一个现实中的惊群问题,明
Continue reading

C++性能榨汁机之局部性原理

前言《CSAPP》讲到了局部性原理:一个编写良好的计算机程序常常具有良好的局部性(loacality)。也就是说,它们倾向于引用邻近于其他最近引用过的数据项,或者最近引用过的数据项本身。这种倾向性,被称为局部性原理(principle of locality),是一个持久的概念,对硬件和软件系统的设计和性能都有着极大的影响。 局部性原理代码示例为了让大家更加直观的感受到局部性原理对我们程序性能的影
Continue reading

C++性能榨汁机之伪共享

前言  在多核并发编程中,如果将互斥锁的争用比作“性能杀手”的话,那么伪共享则相当于“性能刺客”。“杀手”与“刺客”的区别在于杀手是可见的,遇到杀手时我们可以选择战斗、逃跑、绕路、求饶等多种手段去应付,但“刺客”却不同,“刺客”永远隐藏在暗处,伺机给你致命一击,防不胜防。具体到我们的并发编程中,遇到锁争用影响并发性能情况时,我们可以采取多种措施(如缩短临界区,原子操作等等)去提高程序性能,但是伪共
Continue reading

C++性能榨汁机之循环展开

什么是循环展开?循环展开,英文中称(Loop unwinding或loop unrolling),是一种牺牲程序的尺寸来加快程序的执行速度的优化方法。可以由程序员完成,也可由编译器自动优化完成。循环展开最常用来降低循环开销,为具有多个功能单元的处理器提供指令级并行。也有利于指令流水线的调度。 循环展开对程序性能的影响我们直接以实际代码向大家展示循环展开的作用,首先看未经过循环展开优化的代码: 12
Continue reading

C++性能榨汁机之分支预测器(4)

前言在上篇文章中,我们通过分析一段典型程序的汇编级代码更加清楚的看到了分支预测对程序性能的影响,当数据对分支预测器预测不友好的时候,我们的程序性能下降巨大。那么,怎么才能避免分支预测频繁出错对我们程序运行的不利影响呢? 用条件传送替代条件控制转移分支预测对有规律的分支跳转可以实现非常高的预测正确率,比如在循环判断中,在循环终止之前,分支预测都可以基本保证完全的预测正确,预测错误只会出现在最后跳出循
Continue reading

Root lee

沉默是金


Programmer


HangZhou