关于C#:#pragma pack效果

#pragma pack effect

我想知道是否有人能向我解释#pragma pack预处理器语句的作用,更重要的是,为什么要使用它。

我查看了提供一些见解的msdn页面,但我希望从有经验的人那里听到更多信息。我以前在代码中见过它,不过我好像找不到了。


#pragma pack指示编译器用特定的对齐方式打包结构成员。大多数编译器在声明结构时,都会在成员之间插入填充,以确保它们与内存中适当的地址对齐(通常是类型大小的倍数)。这避免了与访问未正确对齐的变量相关联的某些架构上的性能损失(或直接错误)。例如,给定4字节整数和以下结构:

1
2
3
4
5
6
struct Test
{
   char AA;
   int BB;
   char CC;
};

编译器可以选择在内存中这样布局结构:

1
2
3
4
5
|   1   |   2   |   3   |   4   |  

| AA(1) | pad.................. |
| BB(1) | BB(2) | BB(3) | BB(4) |
| CC(1) | pad.................. |

sizeof(Test)将是4倍;3=12,即使它只包含6字节的数据。据我所知,#pragma最常见的用例是在使用硬件设备时,需要确保编译器不会在数据中插入填充,并且每个成员都遵循前一个。使用#pragma pack(1),上述结构的布局如下:

1
2
3
4
5
6
7
8
|   1   |

| AA(1) |
| BB(1) |
| BB(2) |
| BB(3) |
| BB(4) |
| CC(1) |

sizeof(Test)为1倍;6=6。

使用#pragma pack(2)时,上述结构的布局如下:

1
2
3
4
5
6
|   1   |   2   |

| AA(1) | pad.. |
| BB(1) | BB(2) |
| BB(3) | BB(4) |
| CC(1) | pad.. |

sizeof(Test)为2倍;4=8。


#pragma用于向编译器发送非可移植(仅在本编译器中)消息。禁用某些警告和打包结构是常见原因。如果编译时启用了警告作为错误标志,则禁用特定警告尤其有用。

#pragma pack专门用于表示所包装的结构不应使其成员对齐。当您有一个内存映射接口到一个硬件上,并且需要能够精确地控制不同结构成员指向的位置时,这是非常有用的。这显然不是一个很好的速度优化,因为大多数机器处理对齐数据的速度要快得多。


它告诉编译器将结构中的对象与之对齐的边界。例如,如果我有这样的东西:

1
2
3
4
struct foo {
    char a;
    int b;
};

对于典型的32位机器,您通常"希望"在ab之间有3个字节的填充,这样b将以4个字节的边界着陆,以最大化其访问速度(这是默认情况下通常会发生的情况)。

但是,如果必须匹配外部定义的结构,则要确保编译器根据外部定义准确地布局结构。在这种情况下,您可以给编译器一个#pragma pack(1),告诉它不要在成员之间插入任何填充--如果结构的定义包括成员之间的填充,则显式地插入它(例如,通常使用名为unusedNignoreN的成员,或按该顺序插入的某些成员)。


数据元素(例如类和结构的成员)通常与当前生成处理器的字或双字边界对齐,以缩短访问时间。在不能被4整除的地址上检索一个双字需要32位处理器上至少一个额外的CPU周期。因此,如果您有三个char成员char a, b, c;,它们实际上会占用6或12字节的存储空间。

#pragma允许您重写它,以牺牲访问速度或不同编译器目标之间存储数据的一致性,从而实现更高效的空间使用。从16位代码到32位代码的转换让我很开心;我希望移植到64位代码会给某些代码带来同样的麻烦。


编译器可以在结构中对齐成员,以在特定平台上实现最大性能。#pragma pack指令允许您控制该对齐。通常,为了获得最佳性能,您应该将其保留为默认值。如果需要将结构传递给远程机器,通常会使用#pragma pack 1排除任何不需要的对齐。


由于特定体系结构的性能,编译器可以将结构成员放在特定的字节边界上。这可能会在成员之间留下未使用的填充。结构填料迫使构件相邻。

这可能很重要,例如,如果您需要一个符合特定文件或通信格式的结构,而您需要的数据在序列中的特定位置。然而,这样的用法并不处理endian ness问题,因此尽管使用了,它可能不可移植。

它还可以精确地覆盖一些I/O设备(例如UART或USB控制器)的内部寄存器结构,以便寄存器访问通过结构而不是直接地址。


我见过有人使用它来确保一个结构需要一整条缓存线来防止在多线程上下文中的错误共享。如果有大量的对象在默认情况下将被松散地打包,那么它可以节省内存并提高缓存性能以将它们打包得更紧密,尽管未对齐的内存访问通常会降低速度,因此可能会有不利的一面。


我以前在代码中使用过它,不过只是为了与遗留代码进行接口。这是一个Mac OS X Cocoa应用程序,需要从早期的Carbon版本加载首选项文件(它本身向后兼容原始的M68K System 6.5版本……你知道了)。原始版本中的首选项文件是配置结构的二进制转储文件,它使用#pragma pack(1)避免占用额外的空间并节省垃圾(即结构中可能存在的填充字节)。

代码的原始作者还使用#pragma pack(1)来存储在进程间通信中用作消息的结构。我认为这里的原因是为了避免出现未知或更改填充大小的可能性,因为代码有时会从一开始(ewww)开始对消息结构的特定部分进行计数,从而查看填充大小。


如果您对某些硬件(例如内存映射设备)进行编码,而这些硬件对寄存器排序和对齐有严格的要求,那么您可能只想使用这个。

然而,这看起来像是实现这一目标的一个非常钝的工具。一个更好的方法是在汇编程序中编写一个小型驱动程序的代码,并给它一个C调用接口,而不是用这个pragma瞎混。


请注意,pragma pack提供了其他实现数据一致性的方法(例如,有些人使用pragma pack(1)来处理应该通过网络发送的结构)。例如,请参见以下代码及其后续输出:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include <stdio.h>

struct a {
    char one;
    char two[2];
    char eight[8];
    char four[4];
};

struct b {
    char one;
    short two;
    long int eight;
    int four;
};

int main(int argc, char** argv) {
    struct a twoa[2] = {};
    struct b twob[2] = {};
    printf("sizeof(struct a): %i, sizeof(struct b): %i
"
, sizeof(struct a), sizeof(struct b));
    printf("sizeof(twoa): %i, sizeof(twob): %i
"
, sizeof(twoa), sizeof(twob));
}

输出如下:sizeof(结构A):15,sizeof(结构B):24尺寸(twoa):30,尺寸(twob):48

请注意,结构A的大小与字节计数的大小完全相同,但结构B添加了填充(有关填充的详细信息,请参阅此部分)。与pragma包相反,通过这样做,您可以控制将"线格式"转换为适当的类型。例如,"char two[2]"变为"short int"等。