Real-world use of X-Macros
我刚学过X宏。你看到了x宏的实际用途吗?他们什么时候才是合适的工作工具?
几年前,当我开始在代码中使用函数指针时,我发现了X宏。我是一个嵌入式程序员,经常使用状态机。我经常这样写代码:
1 2 3 4 5 | /* declare an enumeration of state codes */ enum{ STATE0, STATE1, STATE2, ... , STATEX, NUM_STATES}; /* declare a table of function pointers */ p_func_t jumptable[NUM_STATES] = {func0, func1, func2, ... , funcX}; |
问题是,我认为很容易出错,必须保持函数指针表的顺序,使其与状态枚举的顺序相匹配。
我的一个朋友向我介绍了X宏,它就像我脑袋里的灯泡熄灭了。说真的,我这辈子的X宏都在哪儿呢!
现在我定义下表:
1 2 3 4 5 6 | #define STATE_TABLE \ ENTRY(STATE0, func0) \ ENTRY(STATE1, func1) \ ENTRY(STATE2, func2) \ ... ENTRY(STATEX, funcX) \ |
号
我可以使用它如下:
1 2 3 4 5 6 7 | enum { #define ENTRY(a,b) a, STATE_TABLE #undef ENTRY NUM_STATES }; |
和
1 2 3 4 5 6 | p_func_t jumptable[NUM_STATES] = { #define ENTRY(a,b) b, STATE_TABLE #undef ENTRY }; |
。
另外,我还可以让预处理器构建我的函数原型,如下所示:
1 2 3 | #define ENTRY(a,b) static void b(void); STATE_TABLE #undef ENTRY |
另一种用法是声明和初始化寄存器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | #define IO_ADDRESS_OFFSET (0x8000) #define REGISTER_TABLE\ ENTRY(reg0, IO_ADDRESS_OFFSET + 0, 0x11)\ ENTRY(reg1, IO_ADDRESS_OFFSET + 1, 0x55)\ ENTRY(reg2, IO_ADDRESS_OFFSET + 2, 0x1b)\ ... ENTRY(regX, IO_ADDRESS_OFFSET + X, 0x33)\ /* declare the registers (where _at_ is a compiler specific directive) */ #define ENTRY(a, b, c) volatile uint8_t a _at_ b: REGISTER_TABLE #undef ENTRY /* initialize registers */ #define ENTRY(a, b, c) a = c; REGISTER_TABLE #undef ENTRY |
。
不过,我最喜欢的用法是当涉及到通信处理程序时
首先,我创建一个comms表,其中包含每个命令名和代码:
1 2 3 4 5 6 | #define COMMAND_TABLE \ ENTRY(RESERVED, reserved, 0x00) \ ENTRY(COMMAND1, command1, 0x01) \ ENTRY(COMMAND2, command2, 0x02) \ ... ENTRY(COMMANDX, commandX, 0x0X) \ |
。
我在表中有大小写名称,因为大小写将用于枚举,而小写将用于函数名。
然后,我还为每个命令定义结构,以定义每个命令的外观:
1 2 3 4 | typedef struct {...}command1_cmd_t; typedef struct {...}command2_cmd_t; etc. |
同样,我为每个命令响应定义结构:
1 2 3 4 | typedef struct {...}command1_resp_t; typedef struct {...}command2_resp_t; etc. |
。
然后我可以定义我的命令代码枚举:
1 2 3 4 5 6 | enum { #define ENTRY(a,b,c) a##_CMD = c, COMMAND_TABLE #undef ENTRY }; |
我可以定义我的命令长度枚举:
1 2 3 4 5 6 | enum { #define ENTRY(a,b,c) a##_CMD_LENGTH = sizeof(b##_cmd_t); COMMAND_TABLE #undef ENTRY }; |
。
我可以定义我的响应长度枚举:
1 2 3 4 5 6 | enum { #define ENTRY(a,b,c) a##_RESP_LENGTH = sizeof(b##_resp_t); COMMAND_TABLE #undef ENTRY }; |
号
我可以确定有多少命令,如下所示:
1 2 3 4 5 6 7 8 | typedef struct { #define ENTRY(a,b,c) uint8_t b; COMMAND_TABLE #undef ENTRY } offset_struct_t; #define NUMBER_OF_COMMANDS sizeof(offset_struct_t) |
号
注意:我从未实际实例化offset结构,我只是将它用作编译器为我生成我的命令定义数量的方法。
注意,然后我可以生成函数指针表,如下所示:
1 2 3 4 5 6 | p_func_t jump_table[NUMBER_OF_COMMANDS] = { #define ENTRY(a,b,c) process_##b, COMMAND_TABLE #undef ENTRY } |
号
我的函数原型:
1 2 3 | #define ENTRY(a,b,c) void process_##b(void); COMMAND_TABLE #undef ENTRY |
号
最后,为了有史以来最酷的使用,我可以让编译器计算出我的传输缓冲区应该有多大。
1 2 3 4 5 6 7 | /* reminder the sizeof a union is the size of its largest member */ typedef union { #define ENTRY(a,b,c) uint8_t b##_buf[sizeof(b##_cmd_t)]; COMMAND_TABLE #undef ENTRY }tx_buf_t |
号
同样,这个联合与我的offset结构类似,它没有被实例化,相反,我可以使用sizeof操作符来声明我的传输缓冲区大小。
1 | uint8_t tx_buf[sizeof(tx_buf_t)]; |
号
现在,我的传输缓冲区tx_buf是最佳大小,当我向这个comms处理程序添加命令时,我的缓冲区将始终是最佳大小。酷!
另一种用途是创建偏移表:因为内存通常是嵌入式系统的一个约束,所以当我的跳转表是稀疏数组时,我不想使用512字节(每个指针2个字节x 256个可能的命令)。相反,我将为每个可能的命令提供一个8位偏移的表。然后,这个偏移量被用来索引到我的实际跳转表中,这个表现在只需要是num_commands*sizeof(指针)。在我的例子中,定义了10个命令。我的跳转表是20字节长,我有一个256字节长的偏移表,总共是276字节,而不是512字节。然后我这样调用我的函数:
1 | jump_table[offset_table[command]](); |
号
而不是
1 | jump_table[command](); |
号
我可以创建这样的偏移表:
1 2 3 4 5 6 7 | /* initialize every offset to 0 */ static uint8_t offset_table[256] = {0}; /* for each valid command, initialize the corresponding offset */ #define ENTRY(a,b,c) offset_table[c] = offsetof(offset_struct_t, b); COMMAND_TABLE #undef ENTRY |
号
其中offsetof是"stddef.h"中定义的标准库宏
另一个好处是,有一种非常简单的方法可以确定命令代码是否受支持:
1 2 3 4 5 | bool command_is_valid(uint8_t command) { /* return false if not valid, or true (non 0) if valid */ return offset_table[command]; } |
这也是为什么在我的命令_表中我保留了命令字节0。我可以创建一个名为"process_reserved()"的函数,如果使用任何无效的命令字节索引到我的offset表,将调用该函数。
X宏本质上是参数化模板。因此,如果您需要以多种形式的几个类似的东西,那么它们是适合该工作的工具。它们允许您创建一个抽象形式,并根据不同的规则对其进行实例化。
我使用x宏将枚举值输出为字符串。由于遇到了它,我非常喜欢使用"用户"宏应用于每个元素的表单。多文件包含只是更痛苦的工作。
1 2 3 4 5 6 7 8 9 10 11 12 13 | /* x-macro constructors for error and type enums and string tables */ #define AS_BARE(a) a , #define AS_STR(a) #a , #define ERRORS(_) \ _(noerror) \ _(dictfull) _(dictstackoverflow) _(dictstackunderflow) \ _(execstackoverflow) _(execstackunderflow) _(limitcheck) \ _(VMerror) enum err { ERRORS(AS_BARE) }; char *errorname[] = { ERRORS(AS_STR) }; /* puts(errorname[(enum err)limitcheck]); */ |
我还使用它们根据对象类型进行函数调度。再次劫持我用来创建枚举值的同一个宏。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | #define TYPES(_) \ _(invalid) \ _(null) \ _(mark) \ _(integer) \ _(real) \ _(array) \ _(dict) \ _(save) \ _(name) \ _(string) \ /*enddef TYPES */ #define AS_TYPE(_) _ ## type , enum { TYPES(AS_TYPE) }; |
号
使用宏可以确保所有数组索引都与关联的枚举值匹配,因为它们使用宏定义(types宏)中的裸标记构造其各种形式。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 | typedef void evalfunc(context *ctx); void evalquit(context *ctx) { ++ctx->quit; } void evalpop(context *ctx) { (void)pop(ctx->lo, adrent(ctx->lo, OS)); } void evalpush(context *ctx) { push(ctx->lo, adrent(ctx->lo, OS), pop(ctx->lo, adrent(ctx->lo, ES))); } evalfunc *evalinvalid = evalquit; evalfunc *evalmark = evalpop; evalfunc *evalnull = evalpop; evalfunc *evalinteger = evalpush; evalfunc *evalreal = evalpush; evalfunc *evalsave = evalpush; evalfunc *evaldict = evalpush; evalfunc *evalstring = evalpush; evalfunc *evalname = evalpush; evalfunc *evaltype[stringtype/*last type in enum*/+1]; #define AS_EVALINIT(_) evaltype[_ ## type] = eval ## _ ; void initevaltype(void) { TYPES(AS_EVALINIT) } void eval(context *ctx) { unsigned ades = adrent(ctx->lo, ES); object t = top(ctx->lo, ades, 0); if ( isx(t) ) /* if executable */ evaltype[type(t)](ctx); /* <--- the payoff is this line here! */ else evalpush(ctx); } |
以这种方式使用X宏实际上有助于编译器提供有用的错误消息。我忽略了上面的evalarray函数,因为它会分散我的注意力。但是,如果您试图编译上述代码(注释掉其他函数调用,并为上下文提供一个伪typedef),编译器会抱怨缺少的函数。对于我添加的每个新类型,当我重新编译此模块时,会提醒我添加一个处理程序。因此,x宏有助于确保并行结构在项目增长时保持完整。
编辑:
这个答案使我的声誉提高了50%。这里还有一点。下面是一个否定的例子,回答了这个问题:什么时候不使用X宏?
这个例子显示了将任意代码片段打包到X-"记录"中。我最终放弃了这个项目的分支,并没有在以后的设计中使用这个策略(也不是因为缺乏尝试)。不知怎么地,它变得不受欢迎。实际上,宏的名称是X6,因为有一次有6个参数,但我厌倦了更改宏名称。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 | /* Object types */ /*"'X'" macros for Object type definitions, declarations and initializers */ // a b c d // enum, string, union member, printf d #define OBJECT_TYPES \ X6( nulltype, "null", int dummy , ("<null>")) \ X6( marktype, "mark", int dummy2 , ("<mark>")) \ X6( integertype, "integer", int i, ("%d",o.i)) \ X6( booleantype, "boolean", bool b, (o.b?"true":"false")) \ X6( realtype, "real", float f, ("%f",o.f)) \ X6( nametype, "name", int n, ("%s%s", \ (o.flags & Fxflag)?"":"/", names[o.n])) \ X6( stringtype, "string", char *s, ("%s",o.s)) \ X6( filetype, "file", FILE *file, ("<file %p>",(void *)o.file)) \ X6( arraytype, "array", Object *a, ("",o.length)) \ X6( dicttype, "dict", struct s_pair *d, ("<dict %u>",o.length)) \ X6(operatortype, "operator", void (*o)(), ("<op>")) \ #define X6(a, b, c, d) #a, char *typestring[] = { OBJECT_TYPES }; #undef X6 // the Object type //forward reference so s_object can contain s_objects typedef struct s_object Object; // the s_object structure: // a bit convoluted, but it boils down to four members: // type, flags, length, and payload (union of type-specific data) // the first named union member is integer, so a simple literal object // can be created on the fly: // Object o = {integertype,0,0,4028}; //create an int object, value: 4028 // Object nl = {nulltype,0,0,0}; struct s_object { #define X6(a, b, c, d) a, enum e_type { OBJECT_TYPES } type; #undef X6 unsigned int flags; #define Fread 1 #define Fwrite 2 #define Fexec 4 #define Fxflag 8 size_t length; //for lint, was: unsigned int #define X6(a, b, c, d) c; union { OBJECT_TYPES }; #undef X6 }; |
。
一个大问题是printf格式字符串。虽然看起来很酷,但这只是个骗局。因为它只在一个函数中使用,所以宏的过度使用实际上分离了应该在一起的信息;并且它使函数本身不可读。在像这样的调试函数中,混淆是加倍不幸的。
1 2 3 4 5 6 7 8 9 10 | //print the object using the type's format specifier from the macro //used by O_equal (ps: =) and O_equalequal (ps: ==) void printobject(Object o) { switch (o.type) { #define X6(a, b, c, d) \ case a: printf d; break; OBJECT_TYPES #undef X6 } } |
所以不要太激动。就像我一样。
在Oracle热点虚拟机中为JAVA?编程语言,有文件
请参见源代码:
- JDK 7
- JDK 8
- JDK 9
我喜欢使用x宏来创建"富枚举",它支持迭代枚举值以及获取每个枚举值的字符串表示形式:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 | #define MOUSE_BUTTONS \ X(LeftButton, 1) \ X(MiddleButton, 2) \ X(RightButton, 4) struct MouseButton { enum Value { None = 0 #define X(name, value) ,name = value MOUSE_BUTTONS #undef X }; static const int *values() { static const int a[] = { None, #define X(name, value) name, MOUSE_BUTTONS #undef X -1 }; return a; } static const char *valueAsString( Value v ) { #define X(name, value) static const char str_##name[] = #name; MOUSE_BUTTONS #undef X switch ( v ) { case None: return"None"; #define X(name, value) case name: return str_##name; MOUSE_BUTTONS #undef X } return 0; } }; |
。
这不仅定义了一个
1 2 3 4 5 | // Print names of all supported mouse buttons for ( const int *mb = MouseButton::values(); *mb != -1; ++mb ) { std::cout << MouseButton::valueAsString( (MouseButton::Value)*mb ) <<" "; } |
号
我使用相当大的x宏将ini文件的内容加载到配置结构中,其中包括围绕该结构旋转的其他内容。
这就是我的"configuration.def"-文件的外观:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | #define NMB_DUMMY(...) X(__VA_ARGS__) #define NMB_INT_DEFS \ TEXT("long int") , long , , , GetLongValue , _ttol , NMB_SECT , SetLongValue , #define NMB_STR_DEFS NMB_STR_DEFS__(TEXT("string")) #define NMB_PATH_DEFS NMB_STR_DEFS__(TEXT("path")) #define NMB_STR_DEFS__(ATYPE) \ ATYPE , basic_string<TCHAR>* , new basic_string<TCHAR>\ , delete , GetValue , , NMB_SECT , SetValue , * /* X-macro starts here */ #define NMB_SECT"server" NMB_DUMMY(ip,TEXT("Slave IP."),TEXT("10.11.180.102"),NMB_STR_DEFS) NMB_DUMMY(port,TEXT("Slave portti."),TEXT("502"),NMB_STR_DEFS) NMB_DUMMY(slaveid,TEXT("Slave protocol ID."),0xff,NMB_INT_DEFS) . . /* And so on for about 40 items. */ |
我承认,这有点令人困惑。很快我就明白了,我实际上并不想在每个字段宏之后编写所有这些类型声明。(别担心,有一个大评论可以解释我为了简洁而忽略的所有内容。)
这就是我如何声明配置结构:
1 2 3 4 5 6 7 | typedef struct { #define X(ID,DESC,DEFVAL,ATYPE,TYPE,...) TYPE ID; #include"configuration.def" #undef X basic_string<TCHAR>* ini_path; //Where all the other stuff gets read. long verbosity; //Used only by console writing functions. } Config; |
号
然后,在代码中,首先将默认值读取到配置结构中:
1 2 3 4 | #define X(ID,DESC,DEFVAL,ATYPE,TYPE,CONSTRUCTOR,DESTRUCTOR,GETTER,STRCONV,SECT,SETTER,...) \ conf->ID = CONSTRUCTOR(DEFVAL); #include"configuration.def" #undef X |
然后,使用library simpleini将ini读取到配置结构中,如下所示:
1 2 3 4 5 6 7 | #define X(ID,DESC,DEFVAL,ATYPE,TYPE,CONSTRUCTOR,DESTRUCTOR,GETTER,STRCONV,SECT,SETTER,DEREF...)\ DESTRUCTOR (conf->ID);\ conf->ID = CONSTRUCTOR( ini.GETTER(TEXT(SECT),TEXT(#ID),DEFVAL,FALSE) );\ LOG3A(<< left << setw(13) << TEXT(#ID) << TEXT(":") << left << setw(30)\ << DEREF conf->ID << TEXT(" (") << DEFVAL << TEXT(").") ); #include"configuration.def" #undef X |
。
命令行标志中的重写也使用相同的名称(GNU长格式)格式化,使用library simpleopt以如下方式应用:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 | enum optflags { #define X(ID,...) ID, #include"configuration.def" #undef X }; CSimpleOpt::SOption sopt[] = { #define X(ID,DESC,DEFVAL,ATYPE,TYPE,...) {ID,TEXT("--") #ID TEXT("="), SO_REQ_CMB}, #include"configuration.def" #undef X SO_END_OF_OPTIONS }; CSimpleOpt ops(argc,argv,sopt,SO_O_NOERR); while(ops.Next()){ switch(ops.OptionId()){ #define X(ID,DESC,DEFVAL,ATYPE,TYPE,CONSTRUCTOR,DESTRUCTOR,GETTER,STRCONV,SECT,...) \ case ID:\ DESTRUCTOR (conf->ID);\ conf->ID = STRCONV( CONSTRUCTOR ( ops.OptionArg() ) );\ LOG3A(<< TEXT("Omitted")<<left<<setw(13)<<TEXT(#ID)<<TEXT(" :")<<conf->ID<<TEXT(" ."));\ break; #include"configuration.def" #undef X } } |
等等,我还使用相同的宏来打印--help-flag输出和示例默认in i文件,configuration.def在我的程序中包含了8次。"方钉入一个圆孔",也许;一个真正称职的程序员会如何处理这个问题?大量的循环和字符串处理?
网址:https://github.com/whunmr/dataex
我使用下面的xMigs生成一个C++类,其中包含序列化和反序列化的内置函数。
1 2 3 4 5 6 7 8 9 10 | #define __FIELDS_OF_DataWithNested(_) \ _(1, a, int ) \ _(2, x, DataX) \ _(3, b, int ) \ _(4, c, char ) \ _(5, d, __array(char, 3)) \ _(6, e, string) \ _(7, f, bool) DEF_DATA(DataWithNested); |
。
用途:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 | TEST_F(t, DataWithNested_should_able_to_encode_struct_with_nested_struct) { DataWithNested xn; xn.a = 0xCAFEBABE; xn.x.a = 0x12345678; xn.x.b = 0x11223344; xn.b = 0xDEADBEEF; xn.c = 0x45; memcpy(&xn.d,"XYZ", strlen("XYZ")); char buf_with_zero[] = {0x11, 0x22, 0x00, 0x00, 0x33}; xn.e = string(buf_with_zero, sizeof(buf_with_zero)); xn.f = true; __encode(DataWithNested, xn, buf_); char expected[] = { 0x01, 0x04, 0x00, 0xBE, 0xBA, 0xFE, 0xCA, 0x02, 0x0E, 0x00 /*T and L of nested X*/, 0x01, 0x04, 0x00, 0x78, 0x56, 0x34, 0x12, 0x02, 0x04, 0x00, 0x44, 0x33, 0x22, 0x11, 0x03, 0x04, 0x00, 0xEF, 0xBE, 0xAD, 0xDE, 0x04, 0x01, 0x00, 0x45, 0x05, 0x03, 0x00, 'X', 'Y', 'Z', 0x06, 0x05, 0x00, 0x11, 0x22, 0x00, 0x00, 0x33, 0x07, 0x01, 0x00, 0x01}; EXPECT_TRUE(ArraysMatch(expected, buf_)); } |
。
另外,另一个例子是https://github.com/whunmr/msgrpc。