关于列表：Python使用给定窗口运行累积和

Python Running cumulative sum with a given window

我要做的是生成一个numpy数组，它是给定一个窗口的另一个numpy数组的累积和。

例如，给定一个数组[1,2,3,4,5,6,7,8,9,10,11,12]，假设我想要一个窗口为3的累积和。我想要的输出是[1,3,6,9,12,15,18,21,24,27,30,33]。我有一个相对较大的numpy数组，希望用400个窗口进行累积和。

相关讨论

你应该使用numpy，除非你真的不在乎速度(尽管我还是更喜欢速度)。因此，您可以使用卷积或基于stride_tricks的方法(这些方法并不明显，但可以很好地解决这些问题)。

例如，给定这样的函数(您也可以找到更多更高级的版本)：

1
2
3
4
5
6
7
8
9
10

def embed(array, dim, lag=1):
"""Create an embedding of array given a resulting dimension and lag.
The array will be raveled before embedding.
"""
array = np.asarray(array)
array = array.ravel()
new = np.lib.stride_tricks.as_strided(array,
(len(array)-dim*lag+lag, dim),
(array.strides[0], array.strides[0]*lag))
return new

你可以做到：

1 2	embedded = embed(array, 400) result = embedded.sum(1)

内存效率高(嵌入或者你称之为嵌入，只创建一个视图)而且很快。当然，另一种方法是使用卷积：

1	np.convolve(array, np.ones(400), mode='valid')

我不知道您是否也想要非完整的窗口，这将与使用EDOCX1(默认值)进行卷积相同。对于另一种方法，必须用其他方法来处理。

1
2
3
4
5
6
7
8
9
10
11

In [42]: lis=[1,2,3,4,5,6,7,8,9,10,11,12]

In [43]: w=3 #window size

In [44]: [sum(lis[i-(w-1):i+1]) if i>(w-1) else sum(lis[:i+1]) for i in range(len(lis))]
Out[44]: [1, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33]

In [45]: w=4

In [46]: [sum(lis[i-(w-1):i+1]) if i>(w-1) else sum(lis[:i+1]) for i in range(len(lis))]
Out[46]: [1, 3, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42]

对于python 2.4或更低版本，请更改三元运算符：

用(falseValue, trueValue)[condition]代替trueValue if condition else falseValue。

1	[(sum(lis[:i+1]),sum(lis[i-(w-1):i+1]))[i>(w-1)] for i in range(len(lis))]