Python Running cumulative sum with a given window
我要做的是生成一个numpy数组,它是给定一个窗口的另一个numpy数组的累积和。
例如,给定一个数组
下面是一个简单的答案,基于减去移位的累积和。
1 2 3 4 5 | >>> a = np.array([1,2,3,4,5,6,7,8,9,10,11,12]) >>> b = a.cumsum() >>> b[3:] = b[3:] - b[:-3] >>> b array([ 1, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33]) |
你应该使用numpy,除非你真的不在乎速度(尽管我还是更喜欢速度)。因此,您可以使用卷积或基于
例如,给定这样的函数(您也可以找到更多更高级的版本):
1 2 3 4 5 6 7 8 9 10 | def embed(array, dim, lag=1): """Create an embedding of array given a resulting dimension and lag. The array will be raveled before embedding. """ array = np.asarray(array) array = array.ravel() new = np.lib.stride_tricks.as_strided(array, (len(array)-dim*lag+lag, dim), (array.strides[0], array.strides[0]*lag)) return new |
你可以做到:
1 2 | embedded = embed(array, 400) result = embedded.sum(1) |
内存效率高(嵌入或者你称之为嵌入,只创建一个视图)而且很快。当然,另一种方法是使用卷积:
1 | np.convolve(array, np.ones(400), mode='valid') |
我不知道您是否也想要非完整的窗口,这将与使用EDOCX1(默认值)进行卷积相同。对于另一种方法,必须用其他方法来处理。
1 2 3 4 5 6 7 8 9 10 11 | In [42]: lis=[1,2,3,4,5,6,7,8,9,10,11,12] In [43]: w=3 #window size In [44]: [sum(lis[i-(w-1):i+1]) if i>(w-1) else sum(lis[:i+1]) for i in range(len(lis))] Out[44]: [1, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33] In [45]: w=4 In [46]: [sum(lis[i-(w-1):i+1]) if i>(w-1) else sum(lis[:i+1]) for i in range(len(lis))] Out[46]: [1, 3, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42] |
对于python 2.4或更低版本,请更改三元运算符:
用
1 | [(sum(lis[:i+1]),sum(lis[i-(w-1):i+1]))[i>(w-1)] for i in range(len(lis))] |
塞伯格的回答比我的答案更好,也更一般,但请注意,你需要零垫你的样品,以获得你想要的结果。
1 2 3 4 5 6 7 8 9 10 11 12 13 | import numpy as np from numpy.lib.stride_tricks import as_strided as ast samples = 100 window = 3 padding = np.zeros(window - 1) # zero-pad your samples a = np.concatenate([padding,np.arange(1,samples + 1)]) newshape = (len(a) - window,window) newstrides = a.strides * 2 # this gets you a sliding window of size 3, with a step of 1 strided = ast(a,shape = newshape,strides = newstrides) # get your moving sum strided.sum(1) |