前几天遇到这么一个题目:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
typedef struct
{
char flag[3];
short value;
} sampleStruct;

union
{
char flag[3];
short value;
} sampleUnion;

sizeof(sampleStruct)=?
sizeof(sampleUnion)=?

当时的想法是:对于stuct类型,对象大小是struct内部所有对象大小的和,当然要考虑字节对齐,char flag[3]对象占三字节,考虑到4字节对齐,后面剩一字节放不下short的2字节,所以short重新占用另外4字节,所以sizeof(sampleStruct)=8。Union类型是union对象里占用字节数最多的那个对象的字节数(在考虑字节对齐的情况下),所以sizeof(sampleUnion)=4。

当我在g++上编译运行程序时发现程序输出的结果并不是我想的那样:sizeof(sampleStruct)=8,sizeof(sampleUnion)=4,而是下图所示:
gcc
sizeof(sampleStruct)=6
sizeof(sampleUnion)=4

那是哪里出错了呢?
网上查阅资料发现,自己对C++中的字节对齐原理理解不够透彻,想当然的以为所有的结构体和联合体都是遵循4字节对齐这个规则,这种想法是错误的。
正确的字节对齐方式是:先取成员变量中的字节数最大值,这里struct中的short为2,然后与4字节比较,取两个中的最小值,这里为short的大小2字节,所以这个结构体的字节对齐方式为2字节对齐,根据2字节对齐方法算出来sizeof(sampleStruct)=6。

============================================
2016.11.3补充:

结构体字节对齐的方式,gcc与vs2010的处理细节还有一些小区别,看以下这个程序:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
#include <iostream>

using namespace std;

int main(){
typedef struct
{
double a;
short b;
int c;
char d;
}sampleStruct;
cout<<"sizeof(sampleStruct)="<<sizeof(sampleStruct)<<endl;
return 0;
}

此程序在gcc下编译运行后获得结果:
gcc
而同样一个程序在vs2010上运行结果却是:
vs

这里gcc与vs2010的一个区别是:vs2010在结构体对齐中不仅要求4字节对齐,而且还要求结构体最后的大小一定要是结构体中最大对象字节数的整数倍,所以在本程序中,按4字节对齐之后,算出结构体大小是20字节,但是结构体里最大元素是double,占用8字节,结构体大小应该是8的整数倍,所以还需要再补4字节,所以最后vs2010输出结构体大小是24字节。

在linux里的gcc中没有要求结构体大小是最大对象的整数倍,所以在gcc中输出结构体的大小是20字节。