Why does Python skip elements when I modify a list while iterating over it?
我目前正在用Python开发一个程序,我注意到语言中的foreach循环有问题,或者列表结构有问题。我将给出我的问题的一个通用示例来简化,因为我在我的程序和通用示例上都得到了相同的错误行为:
1 2 3 4 5 6 | x = [1,2,2,2,2] for i in x: x.remove(i) print x |
好吧,这里的问题很简单,我认为这段代码应该删除列表中的所有元素。好吧,问题是在它执行之后,我总是得到列表中剩下的2个元素。
我做错什么了?感谢您的帮助。
编辑:我不想清空列表,这只是一个例子…
在Python中,这是一个有良好文档记录的行为,您不应该修改正在迭代的列表。试试这个:
1 2 | for i in x[:]: x.remove(i) |
当您删除一个元素,并且for循环进入下一个索引时,您将跳过一个元素。
向后做。或者请说明你真正的问题。
从广义上讲,我认为当你写作时:
1 2 | for x in lst: # loop body goes here |
在引擎盖下,python正在做这样的事情:
1 2 3 4 5 | i = 0 while i < len(lst): x = lst[i] # loop body goes here i += 1 |
。
如果您为循环体插入
实际上,python使用移动指针遍历列表。指针从指向第一个元素开始。然后删除第一个元素,从而使第二个元素成为新的第一个元素。然后指针移动到新的第二个(以前是第三个)元素。等等。(如果使用[1,2,3,4,5]而不是[1,2,2,2,2]作为示例列表,可能会更清楚)
为什么不使用:
1 | x = [] |
号
这可能是因为您更改了正在迭代的相同数组。
如果你想用自己的方式清除阵列,试试克里斯·杰斯特·杨的回答。
我知道这是一篇有着公认答案的老文章,但是对于那些可能还会出现的人……
前面的一些答案表明,在迭代过程中更改iterable是一个坏主意。但作为强调正在发生的事情的一种方式…
1 2 3 4 5 6 7 8 9 10 11 12 | >>> x=[1,2,3,4,5] >>> for i in x: ... print i, x.index(i) ... x.remove(i) ... print x ... 1 0 [2, 3, 4, 5] 3 1 [2, 4, 5] 5 2 [2, 4] |
。
希望视觉效果有助于澄清。
我同意约翰·福伊关于休息条件的看法。正如ChrisJester Young建议的那样,遍历列表的副本对remove()方法有效。但是,如果需要pop()特定的项,那么反向迭代可以工作,正如erik所提到的,在这种情况下,操作可以就地完成。例如:
1 2 3 4 5 6 7 8 9 10 11 12 | def r_enumerate(iterable): """enumerator for reverse iteration of an iterable""" enum = enumerate(reversed(iterable)) last = len(iterable)-1 return ((last - i, x) for i,x in enum) x = [1,2,3,4,5] y = [] for i,v in r_enumerate(x): if v != 3: y.append(x.pop(i)) print 'i=%d, v=%d, x=%s, y=%s' %(i,v,x,y) |
或使用xrange:
1 2 3 4 5 6 | x = [1,2,3,4,5] y = [] for i in xrange(len(x)-1,-1,-1): if x[i] != 3: y.append(x.pop(i)) print 'i=%d, x=%s, y=%s' %(i,x,y) |
。