内容简介:内存和资源管理是 C++ 最强的能力之一,也是 C++ 最复杂和最需要思考的地方。写 Java 的时候,我们只需要无脑地把所有对象都假设我们想写一个这段代码会返回一个
内存和资源管理是 C++ 最强的能力之一,也是 C++ 最复杂和最需要思考的地方。写 Java 的时候,我们只需要无脑地把所有对象都 new
出来。反正所有的对象只能放在堆区,又反正又垃圾回收器帮我们管理内存。然而,在 C++ 中,我们需要思考是把对象放在栈上,还是用 new
把对象放在堆上。默认情况下,对象会放在栈上,这样的好处是我们不会忘记释放对象的内存而造成内存泄漏。不过如果我们把一个大对象放在栈上,又将其作为参数或者返回值传递,就必须要考虑对象拷贝的开销了。C++ 由于和 C 兼容,默认情况下参数是按值传递 (call by value) 的,在传递参数和返回值的时候都会拷贝一遍对象。对于参数,我们尚可以将参数声明为引用类型 T&
来避免对象拷贝。而对于返回值的拷贝开销,则是不能声明为引用类型来解决的。
何时必须返回一个对象
假设我们想写一个 range
函数:
vector<int> range(int begin, int end, int step=1) { vector<int> res; for (int i = begin; i < end; i += step) { res.push_back(i); } return res; }
这段代码会返回一个 vector<int>
对象,也就是我们不希望看到的:放在栈上的大对象。调用这个函数会产生返回值的临时对象,从而需要拷贝列表中的所有元素。很显然,你不能直接把返回值类型改成 vector<int>&
来避免对象拷贝——编译器会产生一个警告: warning: reference to local variable ‘res’ returned
,你返回了一个临时变量的引用,这个引用指向了一个栈上的地址,而这个地址随时可能被回收。这也是 C++ 初学者容易犯的一个错误。既然不能返回一个引用,又想避免对象拷贝的开销,很多“老” C++ 程序员会进行一个人肉优化:把返回值作为引用参数传进去。按这种方法, range()
函数可以改写如下:
vector<int> range(vector<int>& out, int begin, int end, int step=1) { for (int i = begin; i < end; i += step) { out.push_back(i); } } // Caller vector<int> r; range(r, 0, 10);
C/C++ 程序员可能非常习惯这样写。然而,必须承认这是一个丑陋的写法。那么,直接返回一个 vector<int>
对象到底会怎么样呢?对象拷贝的开销能否避免?
临时对象与返回值优化
根据 《深度探索 C++ 对象模型》第 2.3 节 “程序转化语意学” (Program Transformation Semantics) 所述,函数的返回值会做如下转化:
-
添加一个临时变量
__result
-
当函数返回时,调用
__result
的 copy constructor,使用返回值x
作为参数 -
(如果有的话)对
__result
进行后续操作
注意,后续操作中还能包括更多的 constructor,例如我们调用 range
函数以初始化变量 r1
:
vector<int> r1; r1 = range(1, 10); // 调用 r1 的 copy assignment operator (即 operator=)
可以看到,虽然只是简单的一次函数调用,临时对象就进行了两次拷贝。而 range
产生的数越多,需要拷贝的内容就越多,对性能的影响就越大。
为了解决这个问题,很多 C++ 编译器都实现了 返回值优化 (Return Value Optimization),来消除返回值临时对象的多次拷贝。
一个例子
为了验证编译器进行返回值优化前后的不同,我们运行一个完整的例子。我们定义 Blob
类用于保存原始的二进制数据块。 Blob
需要自己分配空间以存储数据,因此它需要实现 destructor, copy constructor 和 copy assignment operator。所有的 constructor 和 destructor 都会调用 logging 函数,让我们能看出它们的调用顺序。
class Blob { public: Blob() : data_(nullptr), size_(0) { log("Blob's default constructor"); } explicit Blob(size_t size) : data_(new char[size]), size_(size) { log("Blob's parameter constructor"); } ~Blob() { log("Blob's destructor"); delete[] data_; } Blob(const Blob& other) { log("Blob's copy constructor"); data_ = new char[other.size_]; memcpy(data_, other.data_, other.size_); size_ = other.size_; } Blob& operator=(const Blob& other) { log("Blob's copy assignment operator"); if (this == &other) { return *this; } delete[] data_; data_ = new char[other.size_]; memcpy(data_, other.data_, other.size_); size_ = other.size_; return *this; } void set(size_t offset, size_t len, const void* src) { len = min(len, size_ - offset); memcpy(data_ + offset, src, len); } private: char* data_; size_t size_; void log(const char* msg) { cout << "[" << this << "] " << msg << endl; } };
我们定义 createBlob
函数,由字符串创建 blob,并调用这个函数:
Blob createBlob(const char* str) { size_t len = strlen(str); Blob blob(len); blob.set(0, len, str); return blob; } int main() { Blob blob; cout << "Start assigning value..." << endl; blob = createBlob("A very very very long string representing serialized data"); cout << "End assigning value" << endl; return 0; }
createBlob
函数返回了一个 Blob
对象,产生一个临时对象,这个临时对象会赋值给 blob
变量。那么我们应该能观察到很多的 constructor 和 destructor 调用。不过,现在编译器一般会默认进行返回值优化,消除掉很多不必要的 constructor 调用。为了观察最坏情况下的 constructor 调用情况,我们使用 -fno-elide-constructors
编译选项让编译器不进行返回值优化。
不进行返回值优化的结果:
[0x7ffd220ada20] Blob's default constructor Start assigning value... [0x7ffd220ad9e0] Blob's parameter constructor [0x7ffd220ada30] Blob's copy constructor [0x7ffd220ad9e0] Blob's destructor [0x7ffd220ada20] Blob's copy assignment operator [0x7ffd220ada30] Blob's destructor End assigning value [0x7ffd220ada20] Blob's destructor
可以看到,编译器生成了一个地址为 0x7ffd220ada30 的临时对象,临时对象需要调用一次 copy constructor 和 destructor。其中,copy constructor 需要复制 blob 中的数据,开销巨大。
进行返回值优化的结果:
[0x7ffdd52c7d50] Blob's default constructor Start assigning value... [0x7ffdd52c7d60] Blob's parameter constructor [0x7ffdd52c7d50] Blob's copy assignment operator [0x7ffdd52c7d60] Blob's destructor End assigning value [0x7ffdd52c7d50] Blob's destructor
编译器帮助我们优化掉了这个不需要的临时对象。然而,在实际的比较复杂的情况下(例如函数里 if
语句的两个分支分别返回不同的对象),编译器可能无法进行返回值优化。那么,我们需要更好的方法来消除临时对象的不利影响。C++11 中引入的 移动语义
(move semantics) 可以很好地解决这个问题。
移动语义与 move constructor
移动语义是 C++11 标准中引入的重要概念。移动语义类似 Rust 中的“所有权转移”。Move constructor 接收的是“右值引用”。在一般情况下,由于右值只是一个临时变量,我们可以“偷走”右值对象中的内容,而不会引起其他影响。在 C++11 中,移动语义才是真正重要的。Move constructor 如下定义:
Blob(Blob&& other) { log("Blob's move constructor"); swap(data_, other.data_); swap(size_, other.size_); } Blob& operator=(Blob&& other) { log("Blob's move assignment operator"); if (this == &other) { return *this; } swap(data_, other.data_); swap(size_, other.size_); }
我们再进行代码,观察 constructor 的调用情况。
不进行返回值优化的结果:
[0x7ffef7172f70] Blob's default constructor Start assigning value... [0x7ffef7172f30] Blob's parameter constructor [0x7ffef7172f80] Blob's move constructor [0x7ffef7172f30] Blob's destructor [0x7ffef7172f70] Blob's move assignment operator [0x7ffef7172f80] Blob's destructor End assigning value [0x7ffef7172f70] Blob's destructor
进行返回值优化的结果:
[0x7ffc18a6e2a0] Blob's default constructor Start assigning value... [0x7ffc18a6e2b0] Blob's parameter constructor [0x7ffc18a6e2a0] Blob's move assignment operator [0x7ffc18a6e2b0] Blob's destructor End assigning value [0x7ffc18a6e2a0] Blob's destructor
可以发现,这次的运行结果相当于将前一次运行中的所有 copy constructor / copy assignment operator 换成了 move constructor / move assignment operator。可以看到,移动语义带来的性能优化实际上和 RVO 是正交的:RVO 负责消除多余的临时变量和 constructor;移动语义则负责将开销较大的 copy constructor 换成 move constructor。
最后,现代的很多编译器已经可以自动添加 move constructor 了,编译器的 RVO 也做得越来越好。老的 C++ 程序员的写法似乎更像是一种“人肉编译器”的写法。我们必须要知道的一点是:编译器肯定是会越做越好的,而且编译器的能力常常远超过我们的想象。所以,我们更好的办法是将代码写得更优雅已读,如返回值拷贝开销这样的问题,更应该交给编译器去完成。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 对象.原型链,函数.原型对象
- 《JavaScript面向对象精要》之四:构造函数和原型对象
- 常对象与常成员函数
- 《JavaScript面向对象精要》之二:函数
- ndarray可迭代对象,函数,运算
- python面向对象-1方法、构造函数
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
精通Java并发编程(第2版)
[西] 哈维尔·费尔南德斯·冈萨雷斯 / 唐富年 / 人民邮电出版社 / 2018-10 / 89.00元
Java 提供了一套非常强大的并发API,可以轻松实现任何类型的并发应用程序。本书讲述Java 并发API 最重要的元素,包括执行器框架、Phaser 类、Fork/Join 框架、流API、并发数据结构、同步机制,并展示如何在实际开发中使用它们。此外,本书还介绍了设计并发应用程序的方法论、设计模式、实现良好并发应用程序的提示和技巧、测试并发应用程序的工具和方法,以及如何使用面向Java 虚拟机的......一起来看看 《精通Java并发编程(第2版)》 这本书的介绍吧!