0%

C++ new和delete探究

C++的new和delete是一种特殊的表达式。

new 和 delete 到底是什么?

我们都知道C++中sizeof不是函数,并且可以举出一堆的理由来证明sizeof不是函数。和sizeof类似,newdelete也不是函数,它们都是C++定义的关键字,通过特定的语法可以组成表达式。和sizeof不同的是,sizeof在编译时候就可以确定其返回值,newdelete背后的机制则比较复杂。

首先我们应该搞清楚,new应该要做些什么?也许你第一反应是,new不就和C语言中的malloc函数一样嘛,就用来动态申请空间的。你只答对了一半,看看下面语句:

1
string *ps = new string("hello world");

你就可以看出newmalloc还是有点不同的,malloc申请完空间之后不会对内存进行必要的初始化,而new可以。所以 new表达式背后要做的事情不是你想象的那么简单。在我用实例来解释new背后的机制之前,你需要先知道 operator newoperator delete

operator new 和 operator delete

不同与一般的operator***形式的操作符重载函数,operator newoperator delete这两个函数其实是 C++ 语言标准库的库函数,原型分别如下:

1
2
3
4
5
void *operator new(size_t);       //allocate an object
void *operator delete(void *); //free an object

void *operator new[](size_t); //allocate an array
void *operator delete[](void *); //free an array

后面两个你可以先不看,表示数组的newdelete,后面再介绍。前面两个均是C++标准库函数,你可能会觉得这是函数吗?请不要怀疑,这就是函数。因为newdelete是不允许重载的

两个函数和C语言中的mallocfree函数有点像了,都是用来申请和释放内存的,并且operator new申请内存之后不对内存进行初始化,直接返回申请内存的指针。

我们可以直接在我们的程序中使用这几个函数。

new 和 delete 背后机制

知道上面两个函数之后,我们用一个实例来解释newdelete背后的机制:

我们不用简单的C++内置类型来举例,使用复杂一点的类类型,定义一个类A:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
class A
{
public:
A(int v) : var(v)
{
fopen_s(&file, "test", "r");
}
~A()
{
fclose(file);
}

private:
int var;
FILE *file;
};

很简单,类A中有两个私有成员,有一个构造函数和一个析构函数,构造函数中初始化私有变量var以及打开一个文件,析构函数关闭打开的文件。

我们创建一个类的对象,返回其指针pA

1
class A *pA = new A(10);

如下图所示 new 背后完成的工作:

简单总结一下:

  • 首先需要调用上面提到的 operator new 标准库函数,传入的参数为class A的大小,这里为 8 个字节,也就是一个int类型成员变量和一个指针成员变量的大小,而且没有虚函数的那些东西。这样函数返回的是分配内存的起始地址,这里假设是0x007da290。

  • 上面分配的内存是未初始化的,也是未类型化的,第二步就在这一块原始的内存上对类对象进行初始化,调用的是相应的构造函数,这里是调用A:A(10); 这个函数,从图中也可以看到对这块申请的内存进行了初始化,var=10, file指向打开的文件。

  • 最后一步就是返回新分配并构造好的对象的指针,这里pA就指向0x007da290这块内存,pA的类型为类A对象的指针。

同理,那么 delete 都干了什么呢?还是接着上面的例子,如果这时想释放掉申请的类的对象怎么办?当然我们可以使用下面的语句来完成:

1
delete pA;

delete 所做的事情如下图所示:

delete就做了两件事情:

调用pA指向对象的析构函数,对打开的文件进行关闭。

通过上面提到的标准库函数operator delete来释放该对象的内存,传入函数的参数为pA的值,也就是0x007d290。

好了,解释完了newdelete背后所做的事情了,是不是觉得也很简单?不就多了一个构造函数和析构函数的调用嘛。

new 和 delete 与数组

如何申请和释放一个数组?我们经常要用到动态分配一个数组,也许是这样的:

1
2
string *psa = new string[10];      //array of 10 empty strings
int *pia = new int[10]; //array of 10 uninitialized ints

上面在申请一个数组时都用到了new []这个表达式来完成,按照我们上面讲到的newdelete知识,第一个数组是string类型,分配了保存对象的内存空间之后,将调用string类型的默认构造函数依次初始化数组中每个元素;第二个是申请具有内置类型的数组,分配了存储10个int对象的内存空间,但并没有初始化。

如果我们想释放空间了,可以用下面两条语句:

1
2
delete [] psa;
delete [] pia;

都用到delete [] 表达式,注意这地方的[]一般情况下不能漏掉!我们也可以想象这两个语句分别干了什么:第一个对 10 个string对象分别调用析构函数,然后再释放掉为对象分配的所有内存空间;第二个因为是内置类型不存在析构函数,直接释放为10个int型分配的所有内存空间。

这里对于第一种情况就有一个问题了:我们如何知道psa指向对象的数组的大小?怎么知道调用几次析构函数?

这个问题直接导致我们需要在 new [] 一个对象数组时,需要保存数组的维度,C++ 的做法是在分配数组空间时多分配了4个字节的大小,专门保存数组的大小(这4个字节一般位于数组首地址的前面,紧挨着数组),在 delete [] 时就可以取出这个保存的数,就知道了需要调用析构函数多少次了

还是用图来说明比较清楚,我们定义了一个类A,但不具体描述类的内容,这个类中有显示的构造函数、析构函数等。那么当我们调用

1
class A *pAa = new A[3];

时需要做的事情如下:

从这个图中我们可以看到申请时在数组对象的上面还多分配了4个字节用来保存数组的大小,但是最终返回的是对象数组的指针,而不是所有分配空间的起始地址。

这样的话,释放就很简单了:

1
delete []pAa;

这里要注意的两点是:

  • 调用析构函数的次数是从数组对象指针前面的 4 个字节中取出;
  • 传入 operator delete[] 函数的参数不是数组对象的指针 pAa,而是 pAa 的值减 4。

为什么 newdeletenew []delete [] 要配对使用?

从上面解释的你应该懂了 new / deletenew [] / delete []的工作原理了,因为它们之间有差别,所以需要配对使用。但偏偏问题不是这么简单,这也是我遇到的问题,如下这段代码:

1
2
int *pia = new int[10];
delete []pia;

这肯定是没问题的,但如果把 delete []pia换成 delete pia的话,会出问题吗?

这就涉及到上面一节没提到的问题了。上面我提到了在new []时多分配 4 个字节的缘由,因为析构时需要知道数组的大小,但如果不调用析构函数呢(如内置类型,这里的int数组)?我们在 new []时就没必要多分配那4个字节, delete []时直接到第二步释放为int数组分配的空间。如果这里使用 delete pia;那么将会调用 operator delete 函数,传入的参数是分配给数组的起始地址,所做的事情就是释放掉这块内存空间。不存在问题的。

这里说的使用 new []delete 来释放对象的提前是:对象的类型是内置类型或者是无自定义的析构函数的类类型!最好别这么做,因为如果没有正确地调用构造函数,类似有指针成员的类很容易造成内存泄露!

我们看看如果是带有自定义析构函数的类类型,用 new [] 来创建类对象数组,而用 delete 来释放会发生什么?用上面的例子来说明:

1
2
class A *pAa = new class A[3];
delete pAa;

那么delete pAa做了两件事:

  • 调用一次pAa指向的对象的析构函数;
  • 调用 operator delete(pAa)释放内存。

显然,这里只对数组的第一个类对象调用了析构函数,后面的两个对象均没调用析构函数,如果类对象中申请了大量的内存需要在析构函数中释放,而你却在销毁数组对象时少调用了析构函数,这会造成内存泄漏。

上面的问题你如果说没关系的话,那么第二点就是致命的了!直接释放pAa指向的内存空间,这个总是会造成严重的段错误,程序必然会奔溃!因为分配的空间的起始地址是pAa指向的地方减去 4 个字节的地方。你应该传入参数设为那个地址!

同理,你可以分析如果使用new来分配,用 delete []来释放会出现什么问题?是不是总会导致程序错误?

总的来说,记住一点即可:newdeletenew []delete [] 要配套使用总是没错的!

参考资料