关于c ++:指向类数据成员“:: *”的指针

Pointer to class data member “::*”

我遇到了这个奇怪的代码片段,它编译得很好:

1
2
3
4
5
6
7
8
9
10
11
class Car
{
    public:
    int speed;
};

int main()
{
    int Car::*pSpeed = &Car::speed;
    return 0;
}

为什么C++将指针指向类的非静态数据成员?这个奇怪的指针在真正的代码中有什么用途?


它是一个"指向成员的指针"——下面的代码说明了它的用途:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#include <iostream>
using namespace std;

class Car
{
    public:
    int speed;
};

int main()
{
    int Car::*pSpeed = &Car::speed;

    Car c1;
    c1.speed = 1;       // direct access
    cout <<"speed is" << c1.speed << endl;
    c1.*pSpeed = 2;     // access via pointer to member
    cout <<"speed is" << c1.speed << endl;
    return 0;
}

至于你为什么要这样做,它给了你一个间接的层次,可以解决一些棘手的问题。但老实说,我从来没有在自己的代码中使用过它们。

编辑:我想不出一个令人信服的使用指向成员数据的指针的方法。指向成员函数的指针可以用在可插拔的体系结构中,但再次在小空间中生成一个示例会让我失望。以下是我的最佳(未测试)尝试-一个应用函数,在将用户选择的成员函数应用到对象之前,它将执行一些预处理和后处理:

1
2
3
4
5
void Apply( SomeClass * c, void (SomeClass::*func)() ) {
    // do hefty pre-call processing
    (c->*func)();  // call user specified function
    // do hefty post-call processing
}

c->*func的括号是必需的,因为->*运算符的优先级低于函数调用运算符。


这是我能想到的最简单的例子,它传达了与此特性相关的罕见情况:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
#include <iostream>

class bowl {
public:
    int apples;
    int oranges;
};

int count_fruit(bowl * begin, bowl * end, int bowl::*fruit)
{
    int count = 0;
    for (bowl * iterator = begin; iterator != end; ++ iterator)
        count += iterator->*fruit;
    return count;
}

int main()
{
    bowl bowls[2] = {
        { 1, 2 },
        { 3, 5 }
    };
    std::cout <<"I have" << count_fruit(bowls, bowls + 2, & bowl::apples) <<" apples
"
;
    std::cout <<"I have" << count_fruit(bowls, bowls + 2, & bowl::oranges) <<" oranges
"
;
    return 0;
}

这里需要注意的是,指针被传递到计数水果。这样就省去了编写单独的count-apples和count-oranges函数的麻烦。


另一个应用程序是侵入式列表。元素类型可以告诉列表下一个/上一个指针是什么。因此列表不使用硬编码名称,但仍可以使用现有指针:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
// say this is some existing structure. And we want to use
// a list. We can tell it that the next pointer
// is apple::next.
struct apple {
    int data;
    apple * next;
};

// simple example of a minimal intrusive list. Could specify the
// member pointer as template argument too, if we wanted:
// template<typename E, E *E::*next_ptr>
template<typename E>
struct List {
    List(E *E::*next_ptr):head(0), next_ptr(next_ptr) { }

    void add(E &e) {
        // access its next pointer by the member pointer
        e.*next_ptr = head;
        head = &e;
    }

    E * head;
    E *E::*next_ptr;
};

int main() {
    List lst(&apple::next);

    apple a;
    lst.add(a);
}


以后可以在任何实例上访问此成员:

1
2
3
4
5
6
7
8
9
10
11
12
13
int main()
{    
  int Car::*pSpeed = &Car::speed;    
  Car myCar;
  Car yourCar;

  int mySpeed = myCar.*pSpeed;
  int yourSpeed = yourCar.*pSpeed;

  assert(mySpeed > yourSpeed); // ;-)

  return 0;
}

请注意,您确实需要一个实例来调用它,因此它不像委托那样工作。它很少使用,我这几年可能需要它一两次。

通常使用接口(即C++中的纯基类)是更好的设计选择。


下面是我正在研究的一个现实世界的例子,来自信号处理/控制系统:

假设您有一些表示正在收集的数据的结构:

1
2
3
4
5
6
struct Sample {
    time_t time;
    double value1;
    double value2;
    double value3;
};

现在假设你把它们塞进一个向量中:

1
2
std::vector<Sample> samples;
... fill the vector ...

现在假设您想要计算某个变量在一个样本范围内的某个函数(比如平均值),并且您想要将这个平均值计算因素化为一个函数。指向成员的指针使操作变得简单:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
double Mean(std::vector<Sample>::const_iterator begin,
    std::vector<Sample>::const_iterator end,
    double Sample::* var)
{
    float mean = 0;
    int samples = 0;
    for(; begin != end; begin++) {
        const Sample& s = *begin;
        mean += s.*var;
        samples++;
    }
    mean /= samples;
    return mean;
}

...
double mean = Mean(samples.begin(), samples.end(), &Sample::value2);

注释:为了更简洁的模板函数方法,编辑了2016/08/05。

当然,您可以将其模板化,以计算任何前向迭代器和任何支持自身加法和按大小除法的值类型的平均值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
template<typename Titer, typename S>
S mean(Titer begin, const Titer& end, S std::iterator_traits<Titer>::value_type::* var) {
    using T = typename std::iterator_traits<Titer>::value_type;
    S sum = 0;
    size_t samples = 0;
    for( ; begin != end ; ++begin ) {
        const T& s = *begin;
        sum += s.*var;
        samples++;
    }
    return sum / samples;
}

struct Sample {
    double x;
}

std::vector<Sample> samples { {1.0}, {2.0}, {3.0} };
double m = mean(samples.begin(), samples.end(), &Sample::x);

编辑-上述代码具有性能影响

您应该注意,正如我很快发现的,上面的代码有一些严重的性能影响。总结是,如果您正在计算一个时间序列的汇总统计信息,或者计算一个FFT等,那么您应该在内存中连续存储每个变量的值。否则,对序列进行迭代将导致检索到的每个值的缓存丢失。

考虑此代码的性能:

1
2
3
4
5
6
7
8
9
10
11
12
13
struct Sample {
  float w, x, y, z;
};

std::vector<Sample> series = ...;

float sum = 0;
int samples = 0;
for(auto it = series.begin(); it != series.end(); it++) {
  sum += *it.x;
  samples++;
}
float mean = sum / samples;

在许多体系结构中,一个Sample实例将填充一条缓存线。因此,在循环的每次迭代中,将从内存中提取一个样本到缓存中。将使用来自缓存行的4个字节,其余的将被丢弃,下一次迭代将导致另一次缓存未命中、内存访问等。

这样做更好:

1
2
3
4
5
6
7
8
9
10
11
12
13
struct Samples {
  std::vector<float> w, x, y, z;
};

Samples series = ...;

float sum = 0;
float samples = 0;
for(auto it = series.x.begin(); it != series.x.end(); it++) {
  sum += *it;
  samples++;
}
float mean = sum / samples;

现在,当从内存中加载第一个x值时,接下来的三个值也将加载到缓存中(假设适当的对齐方式),这意味着您不需要为接下来的三个迭代加载任何值。

通过在EGSSE2体系结构上使用SIMD指令,可以进一步改进上述算法。但是,如果这些值在内存中都是连续的,并且您可以使用一条指令将四个样本一起加载(在以后的SSE版本中会更详细),那么这些方法的效果会更好。

YMMV-设计适合您算法的数据结构。


IBM有更多关于如何使用它的文档。简而言之,您使用指针作为类的偏移量。除了引用的类之外,不能使用这些指针,因此:

1
2
3
  int Car::*pSpeed = &Car::speed;
  Car mycar;
  mycar.*pSpeed = 65;

它看起来有点模糊,但一个可能的应用程序是,如果您试图编写代码将通用数据反序列化为许多不同的对象类型,并且您的代码需要处理它完全不知道的对象类型(例如,您的代码在库中,反序列化到的对象是由yo的用户创建的你的图书馆)成员指针为您提供了一种引用单个数据成员偏移量的通用、半清晰的方法,而不必像C结构那样使用无类型void*技巧。


它使以统一的方式绑定成员变量和函数成为可能。下面是您的汽车类的示例。在STL算法和地图增强中使用时,更常见的用法是绑定std::pair::first::second

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
#include <list>
#include
#include <iostream>
#include <iterator>
#include <boost/lambda/lambda.hpp>
#include <boost/lambda/bind.hpp>


class Car {
public:
    Car(int s): speed(s) {}
    void drive() {
        std::cout <<"Driving at" << speed <<" km/h" << std::endl;
    }
    int speed;
};

int main() {

    using namespace std;
    using namespace boost::lambda;

    list<Car> l;
    l.push_back(Car(10));
    l.push_back(Car(140));
    l.push_back(Car(130));
    l.push_back(Car(60));

    // Speeding cars
    list<Car> s;

    // Binding a value to a member variable.
    // Find all cars with speed over 60 km/h.
    remove_copy_if(l.begin(), l.end(),
                   back_inserter(s),
                   bind(&Car::speed, _1) <= 60);

    // Binding a value to a member function.
    // Call a function on each car.
    for_each(s.begin(), s.end(), bind(&Car::drive, _1));

    return 0;
}


可以使用指向(同构)成员数据的指针数组来启用双命名成员(即x.data)和数组下标(即x[idx])接口。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
#include <cassert>
#include <cstddef>

struct vector3 {
    float x;
    float y;
    float z;

    float& operator[](std::size_t idx) {
        static float vector3::*component[3] = {
            &vector3::x, &vector3::y, &vector3::z
        };
        return this->*component[idx];
    }
};

int main()
{
    vector3 v = { 0.0f, 1.0f, 2.0f };

    assert(&v[0] == &v.x);
    assert(&v[1] == &v.y);
    assert(&v[2] == &v.z);

    for (std::size_t i = 0; i < 3; ++i) {
        v[i] += 1.0f;
    }

    assert(v.x == 1.0f);
    assert(v.y == 2.0f);
    assert(v.z == 3.0f);

    return 0;
}


我使用它的一种方法是,如果我有两个如何在类中执行某项操作的实现,并且我希望在运行时选择一个,而不必连续地执行if语句,即。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
class Algorithm
{
public:
    Algorithm() : m_impFn( &Algorithm::implementationA ) {}
    void frequentlyCalled()
    {
        // Avoid if ( using A ) else if ( using B ) type of thing
        (this->*m_impFn)();
    }
private:
    void implementationA() { /*...*/ }
    void implementationB() { /*...*/ }

    typedef void ( Algorithm::*IMP_FN ) ();
    IMP_FN m_impFn;
};

显然,只有当您觉得代码被重锤击得足够厉害,以至于if语句正在减慢执行的速度时,这实际上才有用,例如,深入到某个密集算法的内部。我仍然认为它比if语句更优雅,即使在没有实际用途的情况下,但那只是我的观点。


指向类的指针不是真正的指针;类是逻辑构造,在内存中没有物理存在,但是,当构造指向类的成员的指针时,它会向成员类的对象提供偏移量,在该对象中可以找到该成员;这给出了一个重要的结论:因为静态成员不与任何对象,因此指向成员的指针不能指向任何静态成员(数据或函数)考虑以下内容:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
class x {
public:
    int val;
    x(int i) { val = i;}

    int get_val() { return val; }
    int d_val(int i) {return i+i; }
};

int main() {
    int (x::* data) = &x::val;               //pointer to data member
    int (x::* func)(int) = &x::d_val;        //pointer to function member

    x ob1(1), ob2(2);

    cout <<ob1.*data;
    cout <<ob2.*data;

    cout <<(ob1.*func)(ob1.*data);
    cout <<(ob2.*func)(ob2.*data);


    return 0;
}

资料来源:完整的参考C++ Herbert Schildt第四版


为了增加@anon's&;@oktalist答案的一些用例,这里有一个关于指向成员函数的指针和指向成员数据的指针的阅读材料。http://www. cwww. pd/f++-PTMF4.pdf


假设你有一个结构。结构内部是*某种名字*两个相同类型但含义不同的变量

1
2
3
4
struct foo {
    std::string a;
    std::string b;
};

好吧,现在假设您在一个容器中有一堆foos:

1
2
// key: some sort of name, value: a foo instance
std::map<std::string, foo> container;

好的,现在假设您从不同的源加载数据,但是数据以相同的方式呈现(例如,您需要相同的解析方法)。

你可以这样做:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
void readDataFromText(std::istream & input, std::map<std::string, foo> & container, std::string foo::*storage) {
    std::string line, name, value;

    // while lines are successfully retrieved
    while (std::getline(input, line)) {
        std::stringstream linestr(line);
        if ( line.empty() ) {
            continue;
        }

        // retrieve name and value
        linestr >> name >> value;

        // store value into correct storage, whichever one is correct
        container[name].*storage = value;
    }
}

std::map<std::string, foo> readValues() {
    std::map<std::string, foo> foos;

    std::ifstream a("input-a");
    readDataFromText(a, foos, &foo::a);
    std::ifstream b("input-b");
    readDataFromText(b, foos, &foo::b);
    return foos;
}

此时,调用readValues()将返回一个统一了"input-a"和"input-b"的容器;所有的键都将存在,并且具有a或b或两者的foo。


下面是一个示例,其中指向数据成员的指针可能很有用:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
#include <iostream>
#include <list>
#include <string>

template <typename Container, typename T, typename DataPtr>
typename Container::value_type searchByDataMember (const Container& container, const T& t, DataPtr ptr) {
    for (const typename Container::value_type& x : container) {
        if (x->*ptr == t)
            return x;
    }
    return typename Container::value_type{};
}

struct Object {
    int ID, value;
    std::string name;
    Object (int i, int v, const std::string& n) : ID(i), value(v), name(n) {}
};

std::list<Object*> objects { new Object(5,6,"Sam"), new Object(11,7,"Mark"), new Object(9,12,"Rob"),
    new Object(2,11,"Tom"), new Object(15,16,"John") };

int main() {
    const Object* object = searchByDataMember (objects, 11, &Object::value);
    std::cout << object->name << '
'
;  // Tom
}

我认为,只有当成员数据非常大(例如,另一个相当大的类的对象)并且有一些外部例程只对该类对象的引用起作用时,才希望这样做。您不想复制成员对象,所以这允许您传递它。