C\C++代码优化的27个建议

您的位置：
门户
>> 文章精选
>> 软件开发专栏
>> .net
>> 查看资讯

发表于：2014-12-11 09:42

字体：大中小 | 上一篇 | 下一篇 | 我要投稿

作者：农村的我来源：51Testing软件测试网采编

DoNet

软件开发

　　1. 记住阿姆达尔定律：

　　Ahmdal's rule

　　funccost是函数func运行时间百分比，funcspeedup是你优化函数的运行的系数。

　　所以，如果你优化了函数TriangleIntersect执行40%的运行时间，使它运行快了近两倍，而你的程序会运行快25%。

　　这意味着不经常使用的代码不需要做较多优化考虑（或者完全不优化）。

　　这里有句俗语：让经常执行的路径运行更加高效，而运行稀少的路径正确运行。

　　2. 代码先保证正确，然后再考虑优化

　　这并不意味着用8周时间写一个全功能的射线追踪算法，然后用8周时间去优化它。

　　分多步来做性能优化。

　　先写正确的代码，当你意识到这个函数可能会被经常调用，进行明显的优化。

　　然后再寻找算法的瓶颈，并解决（通过优化或者改进算法）。通常，改进算法能显著地改进瓶颈——也许是采用一个你还没有预想到的方法。所有频繁调用的函数，都需要优化。

　　3. 我所了解的那些写出非常高效代码的人说，他们优化代码的时间，是写代码时间的两倍。

　　4.跳转和分支执行代价高，如果可能，尽量少用。

　　函数调用需要两次跳转，外加栈内存操作。

　　优先使用迭代而不是递归。

　　使用内联函数处理短小的函数来消除函数调用开销。

　　将循环内的函数调用移动到循环外(例如，将for(i=0;i<100;i++) DoSomething();改为DoSomething() { for(i=0;i<100;i++) { … }})。

　　if…else if…else if…else if…很长的分支链执行到最后的分支需要很多的跳转。如果可能，将其转换为一个switch声明语句，编译器有时候会将其转换为一个表查询单次跳转。如果switch声明不可行，将最常见的场景放在if分支链的最前面。

　　5. 仔细思考函数下标的顺序。

　　两阶或更高阶的数组在内存中还是以一维的方式在存储在内存中，这意味着（对于C/C++数组）array[i][j] 和 array[i][j+1]是相邻的，但是array[i][j] 和array[i+1][j]可能相距很远。

　　以适当的方式访问存储实际内存中的数据，可以显著地提升你代码的执行效率（有时候可以提升一个数量级甚至更多）。

　　现代处理器从主内存中加载数据到处理器cache，会加载比单个值更多的数据。该操作会获取请求数据和相邻数据（一个cache行大小）的整块数据。这意味着，一旦array[i][j]已经在处理器cache中，array[i][j+1]很大可能也已经在cache中了，而array[i+1][j]可能还在内存中。

　　6. 使用指令层的并行机制

　　尽管许多程序还是依赖单线程的执行，现代处理器在单核中也提供了不少的并行性。例如：单个CPU可以同时执行4个浮点数乘，等待4个内存请求并执行一个分支预判。

　　为了最大化利用这种并行性，代码块（在跳转之间的）需要足够的独立指令来允许处理器被充分利用。

　　考虑展开循环来改进这一点。

　　这也是使用内联函数的一个好理由。

　　7. 避免或减少使用本地变量。

　　本地变量通常都存储在栈上。不过如果数量比较少，它们可以存储在CPU寄存器中。在这种情况下，函数不但得到了更快访问存储在寄存器中的数据的好处，也避免了初始化一个栈帧的开销。

　　不要将大量数据转换为全局变量。

　　8. 减少函数参数的个数。

　　和减少使用本地变量的理由一样——它们也是存放在栈上。

　　9. 通过引用传递结构体而不是传值

　　我在射线追踪中还找不到一个场景需要将结构体使用传值方式（包括一些简单结构如：Vector，Point和Color）。

　　10. 如果你的函数不需要返回值，不要定义一个。

　　11. 尽量避免数据转换。

　　整数和浮点数指令通常操作不同的寄存器，所以转换需要进行一次拷贝操作。

　　短整型（char和short）仍然使用一整个寄存器，并且它们需要被填充为32/64位，然后在存储回内存时需要再次转换为小字节（不过，这个开销一定比一个更大的数据类型的内存开销要多一点）。

　　12. 定义C++对象时需要注意。

　　使用类初始化而不是使用赋值（Color c(black); 比Color c; c = black;更快）

　　13. 使类构造函数尽可能轻量。

　　尤其是常用的简单类型（比如，color，vector，point等等），这些类经常被复制。

　　这些默认构造函数通常都是在隐式执行的，这或许不是你所期望的。

　　使用类初始化列表(Use Color::Color() : r(0), g(0), b(0) {}，而不是初始化函数Color::Color() { r= g = b = 0; } .)

　　14. 如果可以的话，使用位移操作>>和<<来代替整数乘除法

　　15. 小心使用表查找函数

　　许多人都鼓励将复杂的函数（比如：三角函数）转化为使用预编译的查找表。对于射线追踪功能来说，这通常导致了不必要的内存查找，这很昂贵（并不断增长），并且这和计算一个三角函数并从内存中获取值一样快（尤其你考虑到三角查找打乱了cpu的cache存取）。

　　在其他情况下，查找表会很有用。对于GPU编程通常优先使用表查找而不是复杂函数。

　　16. 对大多数类，优先使用+= 、 -= 、 *= 和 /=，而不是使用+ 、 -、 * 、和?/

　　这些简单操作需要创建一个匿名临时中间变量。

　　例如：Vector v = Vector(1,0,0) + Vector(0,1,0) + Vector(0,0,1);?创建了五个匿名临时Vector: Vector(1,0,0), Vector(0,1,0), Vector(0,0,1), Vector(1,0,0) + Vector(0,1,0), 和 Vector(1,0,0) + Vector(0,1,0) + Vector(0,0,1).

　　对上述代码进行简单转换：Vector v(1,0,0); v+= Vector(0,1,0); v+= Vector(0,0,1);仅仅创建了两个临时Vector: Vector(0,1,0) 和 Vector(0,0,1)。这节约了6次函数调用（3次构造函数和3次析构函数）。

21/212 >

《2023软件测试行业现状调查报告》独家发布~

搜索风云榜

送祝福，领好礼

2023测试行业调查报告

挣点稿费

AI与软件测试

文章资料精选