为什么Python中没有元组理解?

Why is there no tuple comprehension in Python?

我们都知道,有清单理解,比如

1
[i for i in [1, 2, 3, 4]]

还有字典的理解,比如

1
{i:j for i, j in {1: 'a', 2: 'b'}.items()}

但是

1
(i for i in (1, 2, 3))

结果将是一个生成器,而不是一个tuple理解。为什么?

我的猜测是,一个tuple是不变的,但这似乎不是答案。


可以使用生成器表达式:

1
tuple(i for i in (1, 2, 3))

但是圆括号已经有了……生成器表达式。


RaymondHettinger(Python核心开发人员之一)在最近的tweet中谈到了tuples:

#python tip:Generally, lists are for looping; tuples for structs. Lists are homogeneous; tuples heterogeneous.Lists for variable length.

这(对我来说)支持这样一种观点,即如果序列中的项足够相关,可以由生成器生成,那么它应该是一个列表。尽管tuple是不可重复的,看起来只是一个不变的列表,但它实际上是C结构的python等价物:

1
2
3
4
5
6
7
struct {
    int a;
    char b;
    float c;
} foo;

struct foo x = { 3, 'g', 5.9 };

变成Python

1
x = (3, 'g', 5.9)


由于python 3.5,您还可以使用splat *解包语法解包生成器expresion:

1
*(x for x in range(10)),


理解通过循环或迭代项并将它们分配到容器中来工作,元组无法接收分配。

一旦创建了一个元组,它就不能被附加、扩展或分配给。修改元组的唯一方法是,如果它的一个对象本身可以被分配给(非元组容器)。因为元组只包含对该类型对象的引用。

另外,元组有自己的构造函数tuple(),您可以给它任何迭代器。这意味着要创建元组,可以执行以下操作:

1
tuple(i for i in (1,2,3))


正如另一张海报macm所提到的,从生成器创建元组的最快方法是tuple([generator])

性能比较

  • 列表理解:

    1
    2
    $ python3 -m timeit"a = [i for i in range(1000)]"
    10000 loops, best of 3: 27.4 usec per loop
  • 列表理解中的元组:

    1
    2
    $ python3 -m timeit"a = tuple([i for i in range(1000)])"
    10000 loops, best of 3: 30.2 usec per loop

  • 来自生成器的元组:

    1
    2
    $ python3 -m timeit"a = tuple(i for i in range(1000))"
    10000 loops, best of 3: 50.4 usec per loop
  • 解包后的元组:

    1
    2
    $ python3 -m timeit"a = *(i for i in range(1000)),"
    10000 loops, best of 3: 52.7 usec per loop

我的python版本:

1
2
$ python3 --version
Python 3.6.3

因此,除非性能不是一个问题,否则您应该始终从列表理解创建一个元组。


我的最佳猜测是,它们没有括号,并且认为添加一个"丑陋的"语法不够有用…


元组不能像列表那样有效附加。

所以一个元组理解需要在内部使用一个列表,然后转换成一个元组。

这和你现在做的一样:tuple([理解])


括号不创建元组。aka one=(two)不是元组。唯一的方法是1=(2,)或1=tuple(2)。因此,解决方案是:

1
tuple(i for i in myothertupleorlistordict)


我们可以从列表理解中生成元组。下面的一个将两个数字按顺序添加到一个元组中,并给出一个从数字0到9的列表。

1
2
3
4
5
>>> print k
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
>>> r= [tuple(k[i:i+2]) for i in xrange(10) if not i%2]
>>> print r
[(0, 1), (2, 3), (4, 5), (6, 7), (8, 9)]

我相信这只是为了清晰起见,我们不想让语言中有太多不同的符号。另外,tuple的理解从来就不是必需的,列表的使用速度差异可以忽略不计,而不像听写理解,而不是列表理解。