关于c ++ 11：c ++使用空指针访问静态成员

c++ access static members using null pointer

最近尝试了以下程序，它编译、运行良好并产生预期的输出，而不是任何运行时错误。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

#include <iostream>
class demo
{
public:
static void fun()
{
std::cout<<"fun() is called
";
}
static int a;
};
int demo::a=9;
int main()
{
demo* d=nullptr;
d->fun();
std::cout<<d->a;
return 0;
}

如果使用未初始化的指针访问类和/或结构成员的行为是未定义的，但为什么还允许它使用空指针访问静态成员。我的程序有什么害处吗？

相关讨论

TL；DR：您的示例定义很好。仅仅取消对空指针的引用并不会调用ub。

关于这个主题有很多争论，主要归结为是否通过空指针间接寻址本身就是ub。在您的示例中唯一有问题的事情是对对象表达式的评估。特别是，根据[expr.ref]/2，d->a相当于(*d).a：

The expression E1->E2 is converted to the equivalent form
(*(E1)).E2; the remainder of 5.2.5 will address only the first
option (dot).

*d刚评估：

The postfix expression before the dot or arrow is evaluated;65 the
result of that evaluation, together with the id-expression, determines
the result of the entire postfix expression.

65) If the class member access expression is evaluated, the subexpression evaluation happens even if the result is unnecessary
to determine the value of the entire postfix expression, for example if the id-expression denotes a static member.

让我们提取代码的关键部分。考虑表达式语句

*d;

在该语句中，*d是根据[stmt.expr]丢弃的值表达式。因此，*d是单独评估的d1，就像d->a一样。因此，如果*d;是有效的，或者换句话说，对表达式*d的评估也是有效的，那么您的示例也是有效的。

通过空指针进行间接寻址是否会导致未定义的行为？

有一个公开的CWG问题232，创建于15年前，涉及到这个确切的问题。提出了一个非常重要的论点。报告开头是

At least a couple of places in the IS state that indirection through a
null pointer produces undefined behavior: 1.9 [intro.execution]
paragraph 4 gives"dereferencing the null pointer" as an example of
undefined behavior, and 8.3.2 [dcl.ref] paragraph 4 (in a note) uses
this supposedly undefined behavior as justification for the
nonexistence of"null references."

请注意，所提到的示例已更改为涵盖const对象的修改，而[dcl.ref]中的注释(虽然仍然存在)则不规范。为了避免承诺，删除了规范性段落。

However, 5.3.1 [expr.unary.op] paragraph 1, which describes the unary
"*" operator, does not say that the behavior is undefined if the
operand is a null pointer, as one might expect. Furthermore, at least
one passage gives dereferencing a null pointer well-defined behavior:
5.2.8 [expr.typeid] paragraph 2 says

If the lvalue expression is obtained by applying the unary * operator
to a pointer and the pointer is a null pointer value (4.10
[conv.ptr]), the typeid expression throws the bad_typeid exception
(18.7.3 [bad.typeid]).

这是不一致的，应该清理。
< /块引用>
最后一点特别重要。[expr.typeid]中的引号仍然存在，并且属于多态类类型的glvalues，以下示例中就是这种情况：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
int main() try {

// Polymorphic type
class A
{
virtual ~A(){}
};

typeid( *((A*)0) );

}
catch (std::bad_typeid)
{
std::cerr <<"bad_exception
";
}

这个程序的行为是定义良好的(异常将被抛出并捕获)，表达式*((A*)0)的计算方式是因为它不是未计算操作数的一部分。现在，如果通过空指针的间接寻址导致了ub，那么表达式将编写为

1
*((A*)0);

就这么做，诱导ub，与typeid方案相比，这似乎是无稽之谈。如果上面的表达式只是按照每个丢弃的值表达式为1进行计算，那么在第二个代码段ub中进行计算的关键区别在哪里？目前还没有分析typeid操作数、查找最里面对应的解引用并用检查包围其操作数的实现，这也会导致性能损失。
在该问题中的一个注释结束了简短的讨论：

We agreed that the approach in the standard seems okay: p = 0; *p;
is not inherently an error. An lvalue-to-rvalue conversion would give
it undefined behavior.

也就是说，委员会同意了这一点。虽然本报告提出的决议，即引入所谓的"空lvalues"，从未被采纳…

However,"not modifiable" is a compile-time concept, while in fact
this deals with runtime values and thus should produce undefined
behavior instead. Also, there are other contexts in which lvalues can
occur, such as the left operand of . or .*, which should also be
restricted. Additional drafting is required.

…这不会影响基本原理。再者，应该注意到这个问题甚至先于C++ 03，这使得我们在接近C++ 17时不太有说服力。
CWG问题315似乎也涵盖了您的案例：

Another instance to consider is that of invoking a member function
from a null pointer:

1
2
3
4
5
6
struct A { void f () { } };
int main ()
{
A* ap = 0;
ap->f ();
}

[…]

Rationale (October 2003):

We agreed the example should be allowed. p->f() is rewritten as
(*p).f() according to 5.2.5 [expr.ref]. *p is not an error when
p is null unless the lvalue is converted to an rvalue (4.1
[conv.lval]), which it isn't here.

根据这个基本原理，如果没有进一步的lvalue-to-rvalue转换(=访问存储值)、引用绑定、值计算等，通过空指针本身进行间接寻址就不会调用ub。(注意：用空指针调用一个非静态成员函数应该调用ub，尽管只是被[class.mfct.non-static]模糊地禁用了]/2。这方面的理由已经过时了。)
也就是说，仅仅对*d的评估不足以调用ub。对象的标识不是必需的，它以前存储的值也不是必需的。另一方面，例如

1
*p = 123;

未定义，因为有左操作数的值计算，[expr.ass]/1:

In all cases, the assignment is sequenced after the value computation
of the right and left operands

因为左操作数应该是glvalue，所以该glvalue引用的对象的标识必须按照[intro.execution]/12中表达式的计算定义来确定，这是不可能的(因此会导致ub)。
1 [ EXPR]／11：

In some contexts, an expression only appears for its side effects.
Such an expression is called a discarded-value expression. The
expression is evaluated and its value is discarded. […]. The lvalue-to-rvalue conversion (4.1) is
applied if and only if the expression is a glvalue of
volatile-qualified type and […]

相关讨论

型看起来这项决议并没有成为任何标准。可能是因为它对参考的意义…

型@除尘器是的，决议有问题(没有双关语)。然而，得出的结论仍然存在。

型如果你知道决议从来没有被制定成法律，那为什么引用它就好像它是法律一样？最好找些能做到的，尤其是13岁以上的孩子(中间有两个次要标准和一个主要标准)。

型open-std.org/jtc1/sc22/wg21/docs/cwg_缺陷.html 1102

型@我没有引用任何解决方案。我引用了理性。

型@T.C.：是的，一个额外的指针指向那里有一个巨大的建筑工地。不过，目前还没有解决问题的办法，特别是没有一个办法使之成为标准；-(

型@除尘器…但我提到了引用绑定，即使是在同一句话中。

型"如果没有进一步的lvalue-to-rvalue转换(=访问存储值)或引用绑定，则取消对空指针的引用不会调用ub"，这是一些人想要的，而不是实际需要的。满意我的引言吗？

引用绑定是一种奇怪的情况，因为这里的标准肯定不代表它所说的内容。它当前拥有的内容("引用应初始化为引用有效的对象或函数")将要求每次违反该规则时都进行诊断，这显然是不切实际的。

@哥伦布：正如我在回答stackoverflow.com/a/28483477/6345中提到的，您的CWG参考并不否认上述是ub。

"当p为空时，除非lvalue转换为rvalue，否则*p不是一个错误"——所以int *p = NULL; *p = 5;不是一个错误？

@恐怕，排除"除非"位并不是唯一的例外，这个特殊的例子在聊天中提到过。我在试图解决这个案件的答案后面加了一个解释。

在OP或CWG 315的例子中，"不需要对象的标识"？

@在op的例子中是dyp，但是为什么调用成员函数固有地需要标识呢？IMO一旦访问了数据成员，就需要一个身份。

我不知道在这种情况下，"身份"究竟意味着什么。但是，我可以想象您需要成员函数的这个指针参数的地址(从实现的角度来看)。毕竟，该成员函数可以在另一个tu中定义。考虑到f().g()--我们需要计算f()，以获得对象表达式引用的对象的标识。没关系，因为我们知道有一个未解决的缺陷。

嗯，@除尘器，你说得对。我调整了我的答案。你觉得现在合适吗？

讨论CWG 232的倒数第二句话是"此外，还有其他可能发生lvalue的上下文，例如.或.*的左操作数，这些操作数也应受到限制。"而CWG 315的基本原理则说明这个例子应该是很好地形成的。因此，要么这两者矛盾，要么"存在"一组不包含CWG 315示例的特定限制。委员会似乎认为这个问题没有得到解决(或者他们没有更新状态)。我不确定实现者的想法(尤其是WRT UB优化)。

@那"推"一下怎么样？例如，通过讨论组中的一个线程？

当然，你可以试试看：)但我想委员会更喜欢讨论实际问题。所以，如果有一些令人信服的例子需要解决这个问题，那就太好了。(例如，Richard Smith的lambda技巧，但在我看来，它非常像一个黑客，可能无法令人信服。)编辑：许多ub通过常量表达式变得可以观察到，我认为自上次讨论该主题以来，还引入了一些ub优化。

"这个程序的行为是明确的"是的，但不是由于任何一般规则，而是由于您引用的typeid的特定和狭窄的例外情况。

@除尘器，这正是我的论点。为什么只有当表达式是typeid的操作数时才通过空指针执行间接寻址是有效的？注意这两个都是被评估的，但我在回答中提到了这一点。

嗯，因为typeid的定义为这种情况做了额外的规定。这意味着(不幸的是？)不可归纳。不管怎样，我现在更喜欢它了。

@我认为你没有抓住我想说的重点。我不是用这个来对一般情况下得出结论的。我正试图像米勒那样指出矛盾之处。顺便说一句，我下次再提这个问题：操作数是被计算出来的。如果评估没有在那里调用ub，它就不能自己调用，您同意吗？

是的，对typeid有例外当然是不一致的。我只是不太清楚你是怎么在那里争论的。好吧，干得不错。

"即使调用一个带有*d的成员函数作为对象参数也不需要"—是指完成该语句吗？另外，在非静态成员函数的情况下，[class.mfct.non-static]/p2是相关的。

@t.c.[class.mfct.non-static]/p2只处理引用某个对象的对象参数。没有对象与"空左值"关联。或者你认为这篇文章在这次讨论中仍然有一些分量？

@哥伦布，对我来说，在非对象上调用f()不是ub，而是在错误类型的对象上调用ub是没有意义的。

@T.C.如果不使用ODR，那么对象参数值对我来说就没有意义了。只要对象参数本身是一个有效的表达式，并且没有在成员函数中使用，我就看不出任何问题。

@Columbo我认为允许实现诊断调用非对象(或错误类型的对象)上的成员函数是合理的，即使不使用ODR，因为这通常表示某种程序员错误。

@T.C.好吧，一个实现可以诊断任何带有警告的东西。或者你说的是常量表达式，如果不允许这样的调用，就把它们设为ub？

@从技术上讲，在编译时无法诊断这些调用；使它们成为ub允许在运行时使用消毒剂捕获它们。不能在常量表达式中使用它们是一个不错的奖励。

@T.C.运行时消毒剂？从没听说过。不过，这一点很有道理。

@哥伦布·克拉恩和海湾合作委员会有一整套。gcc.gnu.org/onlinedocs/gcc/debugging-options.html，搜索-fsanitize。

@T.C.哎呀，完全忘了回答，我道歉。消毒剂没有标准化，因此可以诊断任何东西，甚至是定义明确的陈述(只要它们本质上不合理，即"精神错乱")。另外，我同意这样对[class.mfct.non-static]/p2的解释是不一致的/无意义的。但是，我认为应该删除段落，因为&167；3.10无论如何都包含了别名，并且没有理由限制this的可能值。

@哥伦布，一种能将定义良好的代码转化为错误的消毒剂，在我看来是相当烦人的。无论如何，我看不出为什么标准不应该限制它，如果允许的话，它只允许"疯狂"的代码。

@T.C.：如果每个认为一个构造有或应该有定义的行为的人都同意该行为应该是什么，这将向我建议应该定义该行为，除非这样做会带来不小的开销或产生实际的问题。事实上，有些人可能看不到它的用途，或认为这个构造是无意义的、疯狂的、令人厌恶的，或其他什么，这几乎不是一个很好的理由拒绝那些会发现它有用的构造。

型

从C++草案标准N33 37：

9.4 Static members

2 A static member s of class X may be referred to using the qualified-id expression X::s; it is not necessary to use the class member access syntax (5.2.5) to refer to a static member. A static member may be referred
to using the class member access syntax, in which case the object expression is evaluated.

号

在关于对象表达式的部分…

5.2.5 Class member access

4 If E2 is declared to have type"reference to T," then E1.E2 is an lvalue; the type of E1.E2 is T. Otherwise,
one of the following rules applies.

— If E2 is a static data member and the type of E2 is T, then E1.E2 is an lvalue; the expression designates the named member of the class. The type of E1.E2 is T.

号

根据本标准最后一段，表达式如下：

1
2
d->fun();
std::cout << d->a;

工作是因为它们都指定类的命名成员，而不管d的值如何。

相关讨论

型在这些引用中，它允许d不指向任何对象吗？

型"如果e2是静态数据成员…表达式指定了命名成员，"它就在那里说，这是有意义的，因为指针完全不相关。

型@肯尼奥斯特罗姆：对不起，我看不出有任何命令可以忽略引用中的E1一词所调用的ub。

型@重复数据消除程序在标准中，它实际上说取消对空指针的引用本身就是未定义的行为吗？

型@除尘器，我的理解是：d->fun()改为(*d)->fun()。然而，这只是在编译时。由于d->fun()在编译时已解析为demo::fun()，因此从不在运行时计算表达式(*d)。

型@rsahu：如果是这样的话，他们会把它指定为一个"没有价值的上下文"，但他们明确没有这样做。

型@除尘器，这可能是遗漏的缺陷吗？

型@rsahu：如果不进行计算，会打开大量的蠕虫病毒，因为将函数设置为静态或非静态，会极大地、意外地更改代码，特别是在模板中。允许"空的lvalues"是他们没有做的事情，因为这也会产生深远的不幸后果。

型@rsahu需要对.的lhs进行评估，即使它是静态的，或者g().f()可能不会对g()进行评估。

型@T.C.，这是有道理的。谢谢你的澄清。

runs fine and produces expected output instead of any runtime error.

这是一个基本假设错误。您所做的是未定义的行为，这意味着您对任何类型的"预期输出"的声明都是错误的。
附录：请注意，虽然有一份CWG缺陷(315)报告以"同意"的方式关闭，不制作上述UB，但它依赖于另一个仍处于活动状态的CWG缺陷(232)的正关闭，因此没有一个缺陷添加到标准中。
让我引用JamesMcNellis的一部分评论来回答类似的堆栈溢出问题：

I don't think CWG defect 315 is as"closed" as its presence on the"closed issues" page implies. The rationale says that it should be allowed because"*p is not an error when p is null unless the lvalue is converted to an rvalue." However, that relies on the concept of an"empty lvalue," which is part of the proposed resolution to CWG defect 232, but which has not been adopted.

相关讨论

@哥伦布：现在，如果你能证明这些决议曾经使它成为标准，你会有一个观点。

@哥伦布：我加了一个来自詹姆斯·麦克内利斯的Blurb附录，澄清了为什么你的答案并不怀疑它是ub。

现在这是唯一正确的答案。可惜我不能再投赞成票了。

在这种情况下，质量实现是否应该关心实例？我认为警告代码可能会被编译器设计者破坏是公平的，他们以找到"聪明"的方法来避免让他们的编译器做任何标准中没有规定的事情为荣。另一方面，标准只定义了"符合"的实现，而不是"有用性不会被迟钝所破坏的实现"；前者允许某些特定行为的事实并不意味着后者也可以这样做。

型

你在这里看到的是我认为在C++语言和许多属于同一个通用编程语言家族的其他语言的规范中，一个构思欠佳和不幸的设计选择。

这些语言允许您使用对类实例的引用来引用类的静态成员。当然，会忽略实例引用的实际值，因为访问静态成员不需要实例。

因此，在d->fun();中，编译器只在编译期间使用d指针来确定您引用的是demo类的成员，然后忽略它。编译器不会发出任何代码来取消对指针的引用，因此运行时指针将为空并不重要。

所以，您所看到的情况完全符合语言的规范，在我看来，规范在这方面受到了影响，因为它允许发生不合逻辑的事情：使用实例引用引用引用静态成员。

P.S.大多数语言的编译器实际上都能为这类东西发出警告。我不知道您的编译器，但您可能需要检查，因为您没有收到任何关于执行所做操作的警告，这可能意味着您没有启用足够的警告。

相关讨论

型您建议的更改可能会破坏现有代码。template f(T &t) { t.g(); } struct StillWorking { void g() {} }; struct NowBroken { static void g(); } }; f(StillWorking()); f(NowBroken());。

型"使用实例引用引用静态成员应该是不可能的。"那艘船已经航行了很久很久了。

型P.S.：我打算用const&编写一个示例(我的示例无论如何都不会编译)，但这一点是正确的。

型@T.C.是的，它已经航行了，但是我无权有这样的观点吗？

型@如果我写的是"不可能"而不是"不可能"，你会满意吗？

型@Mikenakis：我仍然不确定这样的限制在面对我发布的通用代码时是否合理(这种限制在标准算法函数中并不常见，例如std::copy_if)。另一方面，我没有否定你的回答。

型静态成员仍然是成员，所以无论是静态成员还是非静态成员，this->foo都是正常的。这是一个有意的设计选择，而不是一个错误。

型哦，我想我现在明白了，我想我知道什么能让你们都高兴。如果我将"规范中的一个bug"替换为"规范中一个构思不周且不幸的设计选择"，那该怎么办呢？是的，这应该能让你得到保障。

型对欧普问题的清晰而简洁的回答。+从我这里。