与其他RISC架构一样,ARM处理器能够高效地访问对齐的数据,即字地址的末尾两位为零,半字地址的最后一位为零,也称这样的数据位于它的自然大小边界或者是自然对齐的。ARM编译器希望普通的“C”指针指向一个4字节对齐内存地址,这样它可以在代码中使用LDR/STR指令一次操作4个字节,否则只能使用LDRB/LDRH等字节/半字操作指令。相反如果指针指向一个非自然对齐的地址,例如如果一个整型指针指向地址0x8006,当然希望装载地址0xS006-0xS007-0x8008-0xS009处的数据,但是实际上ARM会对非自然对齐的地址进行转换而从装载地址0xS004-0xS005-0x8006-0xS007处的数据。在下面的示例中(测试环境为uVision3),首先定义了一个大小为16字节的整型数组,依次初始化为0,1,2,…,15。由于array是一个整型数组,编译器会确保它是4字节对齐的,即指针pc指向一个4字节对齐的地址。运行程序后,可以看到如果对pc指针不加__packed标记进行修饰,将得到一个奇怪的0x01000302;而在添加了__packed关键字之后,就得到了正确的结果。也就是说,如果要访问非自然对齐的数据,必须使用__packed关键字显式地标记出来。
ARM编译器总是保证程序中的变量、结构体或联合中的域分配到自然对齐的地址。这意味着编译器经常需要在各个域之间插入填充,以确保每个域的自然对齐。通常来说,程序员可以对这些填充视而不见,但是也有例外,例如为了节省结构体占用的空间,可以利用__packed去除填充。在了解了编译器的填充行为之后,可以通过调整域的顺序来减小结构体占用的空间。例如虽然结构体s1和s2的域相同,但是sizeof(s1)等于16,而sizeof(s2)等于12。