为什么Python在迭代时修改列表时会跳过元素?

Why does Python skip elements when I modify a list while iterating over it?

我目前正在用Python开发一个程序,我注意到语言中的foreach循环有问题,或者列表结构有问题。我将给出我的问题的一个通用示例来简化,因为我在我的程序和通用示例上都得到了相同的错误行为:

1
2
3
4
5
6
x = [1,2,2,2,2]

for i in x:
    x.remove(i)

print x

好吧,这里的问题很简单,我认为这段代码应该删除列表中的所有元素。好吧,问题是在它执行之后,我总是得到列表中剩下的2个元素。

我做错什么了?感谢您的帮助。

编辑:我不想清空列表,这只是一个例子…


在Python中,这是一个有良好文档记录的行为,您不应该修改正在迭代的列表。试试这个:

1
2
for i in x[:]:
    x.remove(i)

[:]返回x的一个"切片",正好包含它的所有元素,因此实际上是x的一个副本。


当您删除一个元素,并且for循环进入下一个索引时,您将跳过一个元素。

向后做。或者请说明你真正的问题。


从广义上讲,我认为当你写作时:

1
2
for x in lst:
    # loop body goes here

在引擎盖下,python正在做这样的事情:

1
2
3
4
5
i = 0
while i < len(lst):
    x = lst[i]
    # loop body goes here
    i += 1

如果您为循环体插入lst.remove(x),那么您可能会看到为什么会得到这样的结果?

实际上,python使用移动指针遍历列表。指针从指向第一个元素开始。然后删除第一个元素,从而使第二个元素成为新的第一个元素。然后指针移动到新的第二个(以前是第三个)元素。等等。(如果使用[1,2,3,4,5]而不是[1,2,2,2,2]作为示例列表,可能会更清楚)


为什么不使用:

1
x = []

这可能是因为您更改了正在迭代的相同数组。

如果你想用自己的方式清除阵列,试试克里斯·杰斯特·杨的回答。


我知道这是一篇有着公认答案的老文章,但是对于那些可能还会出现的人……

前面的一些答案表明,在迭代过程中更改iterable是一个坏主意。但作为强调正在发生的事情的一种方式…

1
2
3
4
5
6
7
8
9
10
11
12
>>> x=[1,2,3,4,5]
>>> for i in x:
...     print i, x.index(i)
...     x.remove(i)
...     print x
...
1 0
[2, 3, 4, 5]
3 1
[2, 4, 5]
5 2
[2, 4]

希望视觉效果有助于澄清。


我同意约翰·福伊关于休息条件的看法。正如ChrisJester Young建议的那样,遍历列表的副本对remove()方法有效。但是,如果需要pop()特定的项,那么反向迭代可以工作,正如erik所提到的,在这种情况下,操作可以就地完成。例如:

1
2
3
4
5
6
7
8
9
10
11
12
def r_enumerate(iterable):
   """enumerator for reverse iteration of an iterable"""
    enum = enumerate(reversed(iterable))
    last = len(iterable)-1
    return ((last - i, x) for i,x in enum)

x = [1,2,3,4,5]
y = []
for i,v in r_enumerate(x):
    if v != 3:
        y.append(x.pop(i))
    print 'i=%d, v=%d, x=%s, y=%s' %(i,v,x,y)

或使用xrange:

1
2
3
4
5
6
x = [1,2,3,4,5]
y = []
for i in xrange(len(x)-1,-1,-1):
    if x[i] != 3:
        y.append(x.pop(i))
    print 'i=%d, x=%s, y=%s' %(i,x,y)