Split List into Sublists with LINQ
我是否可以用项目索引作为每个拆分的分隔符,将一个
让我举例说明:
我有一个>
如。:
原始清单:
[a, g, e, w, p, s, q, f, x, y, i, m, c] 。结果列表:
[a, g, e], [w, p, s], [q, f, x], [y, i, m], 。
我还需要得到的列表大小作为这个函数的参数。
尝试以下代码。
1 2 3 4 5 6 7 8 | public static IList<IList<T>> Split<T>(IList<T> source) { return source .Select((x, i) => new { Index = i, Value = x }) .GroupBy(x => x.Index / 3) .Select(x => x.Select(v => v.Value).ToList()) .ToList(); } |
其思想是首先按索引对元素进行分组。除以3的效果是将它们分成3组。然后将每组转换成一个列表,将
这个问题有点老,但我刚刚写了这篇文章,我认为它比其他建议的解决方案要优雅一点:
1 2 3 4 5 6 7 8 9 10 11 | /// <summary> /// Break a list of items into chunks of a specific size /// </summary> public static IEnumerable<IEnumerable<T>> Chunk<T>(this IEnumerable<T> source, int chunksize) { while (source.Any()) { yield return source.Take(chunksize); source = source.Skip(chunksize); } } |
一般情况下,caseyb建议的方法很好,事实上,如果您通过一个
1 2 3 4 5 6 7 8 9 | public static IEnumerable<IEnumerable<T>> ChunkTrivialBetter<T>(this IEnumerable<T> source, int chunksize) { var pos = 0; while (source.Skip(pos).Any()) { yield return source.Skip(pos).Take(chunksize); pos += chunksize; } } |
这将避免大规模的呼叫链。然而,这种方法有一个普遍的缺陷。它具体化每个块的两个枚举,以突出显示问题,尝试运行:
1 2 3 4 5 | foreach (var item in Enumerable.Range(1, int.MaxValue).Chunk(8).Skip(100000).First()) { Console.WriteLine(item); } // wait forever |
为了克服这一点,我们可以尝试卡梅伦的方法,它通过了上面的测试,因为它只经过一次枚举。
问题是它有一个不同的缺陷,它具体化了每个块中的每一个项目,这种方法的问题在于您的内存运行得很高。
要说明这一点,请尝试运行:
1 2 3 4 5 6 7 | foreach (var item in Enumerable.Range(1, int.MaxValue) .Select(x => x + new string('x', 100000)) .Clump(10000).Skip(100).First()) { Console.Write('.'); } // OutOfMemoryException |
最后,任何实现都应该能够处理块的无序迭代,例如:
1 2 | Enumerable.Range(1,3).Chunk(2).Reverse().ToArray() // should return [3],[1,2] |
许多高度优化的解决方案,比如我对这个答案的第一次修订,都失败了。同样的问题也可以在Casperone的优化答案中看到。
要解决所有这些问题,可以使用以下方法:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 | namespace ChunkedEnumerator { public static class Extensions { class ChunkedEnumerable<T> : IEnumerable<T> { class ChildEnumerator : IEnumerator<T> { ChunkedEnumerable<T> parent; int position; bool done = false; T current; public ChildEnumerator(ChunkedEnumerable<T> parent) { this.parent = parent; position = -1; parent.wrapper.AddRef(); } public T Current { get { if (position == -1 || done) { throw new InvalidOperationException(); } return current; } } public void Dispose() { if (!done) { done = true; parent.wrapper.RemoveRef(); } } object System.Collections.IEnumerator.Current { get { return Current; } } public bool MoveNext() { position++; if (position + 1 > parent.chunkSize) { done = true; } if (!done) { done = !parent.wrapper.Get(position + parent.start, out current); } return !done; } public void Reset() { // per http://msdn.microsoft.com/en-us/library/system.collections.ienumerator.reset.aspx throw new NotSupportedException(); } } EnumeratorWrapper<T> wrapper; int chunkSize; int start; public ChunkedEnumerable(EnumeratorWrapper<T> wrapper, int chunkSize, int start) { this.wrapper = wrapper; this.chunkSize = chunkSize; this.start = start; } public IEnumerator<T> GetEnumerator() { return new ChildEnumerator(this); } System.Collections.IEnumerator System.Collections.IEnumerable.GetEnumerator() { return GetEnumerator(); } } class EnumeratorWrapper<T> { public EnumeratorWrapper (IEnumerable<T> source) { SourceEumerable = source; } IEnumerable<T> SourceEumerable {get; set;} Enumeration currentEnumeration; class Enumeration { public IEnumerator<T> Source { get; set; } public int Position { get; set; } public bool AtEnd { get; set; } } public bool Get(int pos, out T item) { if (currentEnumeration != null && currentEnumeration.Position > pos) { currentEnumeration.Source.Dispose(); currentEnumeration = null; } if (currentEnumeration == null) { currentEnumeration = new Enumeration { Position = -1, Source = SourceEumerable.GetEnumerator(), AtEnd = false }; } item = default(T); if (currentEnumeration.AtEnd) { return false; } while(currentEnumeration.Position < pos) { currentEnumeration.AtEnd = !currentEnumeration.Source.MoveNext(); currentEnumeration.Position++; if (currentEnumeration.AtEnd) { return false; } } item = currentEnumeration.Source.Current; return true; } int refs = 0; // needed for dispose semantics public void AddRef() { refs++; } public void RemoveRef() { refs--; if (refs == 0 && currentEnumeration != null) { var copy = currentEnumeration; currentEnumeration = null; copy.Source.Dispose(); } } } public static IEnumerable<IEnumerable<T>> Chunk<T>(this IEnumerable<T> source, int chunksize) { if (chunksize < 1) throw new InvalidOperationException(); var wrapper = new EnumeratorWrapper<T>(source); int currentPos = 0; T ignore; try { wrapper.AddRef(); while (wrapper.Get(currentPos, out ignore)) { yield return new ChunkedEnumerable<T>(wrapper, chunksize, currentPos); currentPos += chunksize; } } finally { wrapper.RemoveRef(); } } } class Program { static void Main(string[] args) { int i = 10; foreach (var group in Enumerable.Range(1, int.MaxValue).Skip(10000000).Chunk(3)) { foreach (var n in group) { Console.Write(n); Console.Write(""); } Console.WriteLine(); if (i-- == 0) break; } var stuffs = Enumerable.Range(1, 10).Chunk(2).ToArray(); foreach (var idx in new [] {3,2,1}) { Console.Write("idx" + idx +""); foreach (var n in stuffs[idx]) { Console.Write(n); Console.Write(""); } Console.WriteLine(); } /* 10000001 10000002 10000003 10000004 10000005 10000006 10000007 10000008 10000009 10000010 10000011 10000012 10000013 10000014 10000015 10000016 10000017 10000018 10000019 10000020 10000021 10000022 10000023 10000024 10000025 10000026 10000027 10000028 10000029 10000030 10000031 10000032 10000033 idx 3 7 8 idx 2 5 6 idx 1 3 4 */ Console.ReadKey(); } } } |
您还可以为块的无序迭代引入一轮优化,这超出了这里的范围。
你应该选择哪种方法?这完全取决于你想解决的问题。如果你不关心第一个缺陷,那么简单的答案是非常有吸引力的。
注意,与大多数方法一样,对于多线程来说,这是不安全的,如果您希望使它线程安全,那么需要修改EDOCX1[1]的话,事情可能会变得很奇怪。
您可以使用一些使用
相反,我认为您应该创建自己的迭代器,如下所示:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 | public static IEnumerable<IEnumerable<T>> GetEnumerableOfEnumerables<T>( IEnumerable<T> enumerable, int groupSize) { // The list to return. List<T> list = new List<T>(groupSize); // Cycle through all of the items. foreach (T item in enumerable) { // Add the item. list.Add(item); // If the list has the number of elements, return that. if (list.Count == groupSize) { // Return the list. yield return list; // Set the list to a new list. list = new List<T>(groupSize); } } // Return the remainder if there is any, if (list.Count != 0) { // Return the list. yield return list; } } |
然后您可以调用它,它启用了LINQ,这样您就可以对结果序列执行其他操作。
根据萨姆的回答,我觉得如果没有:
- 再次遍历列表(我最初没有这样做)
- 在释放块之前将项目分组具体化(对于较大的项目块,可能存在内存问题)
- 山姆发布的所有代码
也就是说,这是另一个过程,我在
1 2 3 4 5 6 7 8 9 10 11 | public static IEnumerable<IEnumerable<T>> Chunk<T>(this IEnumerable<T> source, int chunkSize) { // Validate parameters. if (source == null) throw new ArgumentNullException("source"); if (chunkSize <= 0) throw new ArgumentOutOfRangeException("chunkSize", "The chunkSize parameter must be a positive value."); // Call the internal implementation. return source.ChunkInternal(chunkSize); } |
没有什么奇怪的,只是基本的错误检查。
继续前进到
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | private static IEnumerable<IEnumerable<T>> ChunkInternal<T>( this IEnumerable<T> source, int chunkSize) { // Validate parameters. Debug.Assert(source != null); Debug.Assert(chunkSize > 0); // Get the enumerator. Dispose of when done. using (IEnumerator<T> enumerator = source.GetEnumerator()) do { // Move to the next element. If there's nothing left // then get out. if (!enumerator.MoveNext()) yield break; // Return the chunked sequence. yield return ChunkSequence(enumerator, chunkSize); } while (true); } |
基本上,它获取
一旦检测到序列中有项目,则将内部
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | private static IEnumerable<T> ChunkSequence<T>(IEnumerator<T> enumerator, int chunkSize) { // Validate parameters. Debug.Assert(enumerator != null); Debug.Assert(chunkSize > 0); // The count. int count = 0; // There is at least one item. Yield and then continue. do { // Yield the item. yield return enumerator.Current; } while (++count < chunkSize && enumerator.MoveNext()); } |
由于
如果没有剩余的项目,那么
If MoveNext passes the end of the collection, the enumerator is
positioned after the last element in the collection and MoveNext
returns false. When the enumerator is at this position, subsequent
calls to MoveNext also return false until Reset is called.
此时,循环将中断,序列序列将终止。
这是一个简单的测试:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 | static void Main() { string s ="agewpsqfxyimc"; int count = 0; // Group by three. foreach (IEnumerable<char> g in s.Chunk(3)) { // Print out the group. Console.Write("Group: {0} -", ++count); // Print the items. foreach (char c in g) { // Print the item. Console.Write(c +","); } // Finish the line. Console.WriteLine(); } } |
输出:
1 2 3 4 5 | Group: 1 - a, g, e, Group: 2 - w, p, s, Group: 3 - q, f, x, Group: 4 - y, i, m, Group: 5 - c, |
一个重要的注意事项是,如果您不清空整个子序列或在父序列的任何点中断,这将不起作用。这是一个重要的警告,但是如果您的用例是使用序列序列的每个元素,那么这将对您有效。
另外,如果你玩这个命令,它会做一些奇怪的事情,就像山姆在某一点上做的那样。
好吧,这是我的看法:
- 完全懒惰:在无限可枚举项上工作
- 无中间复制/缓冲
- O(N)执行时间
- 当内部序列只被部分使用时也可以工作
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | public static IEnumerable<IEnumerable<T>> Chunks<T>(this IEnumerable<T> enumerable, int chunkSize) { if (chunkSize < 1) throw new ArgumentException("chunkSize must be positive"); using (var e = enumerable.GetEnumerator()) while (e.MoveNext()) { var remaining = chunkSize; // elements remaining in the current chunk var innerMoveNext = new Func<bool>(() => --remaining > 0 && e.MoveNext()); yield return e.GetChunk(innerMoveNext); while (innerMoveNext()) {/* discard elements skipped by inner iterator */} } } private static IEnumerable<T> GetChunk<T>(this IEnumerator<T> e, Func<bool> innerMoveNext) { do yield return e.Current; while (innerMoveNext()); } |
示例用法
1 2 3 4 5 6 7 8 | var src = new [] {1, 2, 3, 4, 5, 6}; var c3 = src.Chunks(3); // {{1, 2, 3}, {4, 5, 6}}; var c4 = src.Chunks(4); // {{1, 2, 3, 4}, {5, 6}}; var sum = c3.Select(c => c.Sum()); // {6, 15} var count = c3.Count(); // 2 var take2 = c3.Select(c => c.Take(2)); // {{1, 2}, {4, 5}} |
解释
代码通过嵌套两个基于
外部迭代器必须跟踪内部(块)迭代器有效地使用了多少元素。这是通过用
Note: The answer has been updated to address the shortcomings pointed out by @aolszowka.
完全懒惰,不计数或复制:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 | public static class EnumerableExtensions { public static IEnumerable<IEnumerable<T>> Split<T>(this IEnumerable<T> source, int len) { if (len == 0) throw new ArgumentNullException(); var enumer = source.GetEnumerator(); while (enumer.MoveNext()) { yield return Take(enumer.Current, enumer, len); } } private static IEnumerable<T> Take<T>(T head, IEnumerator<T> tail, int len) { while (true) { yield return head; if (--len == 0) break; if (tail.MoveNext()) head = tail.Current; else break; } } } |
我认为下面的建议是最快的。为了使用数组,我牺牲了可枚举源的懒散。提前复制并知道每个子列表的长度。
1 2 3 4 5 6 7 8 9 10 | public static IEnumerable<T[]> Chunk<T>(this IEnumerable<T> items, int size) { T[] array = items as T[] ?? items.ToArray(); for (int i = 0; i < array.Length; i+=size) { T[] chunk = new T[Math.Min(size, array.Length - i)]; Array.Copy(array, i, chunk, 0, chunk.Length); yield return chunk; } } |
我们可以改进@jaredpar的解决方案来进行真正的懒惰评估。我们使用
1 2 3 4 | sequence .Select((x, i) => new { Value = x, Index = i }) .GroupAdjacentBy(x=>x.Index/3) .Select(g=>g.Select(x=>x.Value)) |
由于群是一个接一个地产生的,所以这个解对长序列或无限序列有效地工作。
Interactive为此提供了
几年前我写了一个丛扩展方法。效果很好,是这里最快的实现。P
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 | /// <summary> /// Clumps items into same size lots. /// </summary> /// <typeparam name="T"></typeparam> /// <param name="source">The source list of items.</param> /// <param name="size">The maximum size of the clumps to make.</param> /// <returns>A list of list of items, where each list of items is no bigger than the size given.</returns> public static IEnumerable<IEnumerable<T>> Clump<T>(this IEnumerable<T> source, int size) { if (source == null) throw new ArgumentNullException("source"); if (size < 1) throw new ArgumentOutOfRangeException("size","size must be greater than 0"); return ClumpIterator<T>(source, size); } private static IEnumerable<IEnumerable<T>> ClumpIterator<T>(IEnumerable<T> source, int size) { Debug.Assert(source != null,"source is null."); T[] items = new T[size]; int count = 0; foreach (var item in source) { items[count] = item; count++; if (count == size) { yield return items; items = new T[size]; count = 0; } } if (count > 0) { if (count == size) yield return items; else { T[] tempItems = new T[count]; Array.Copy(items, tempItems, count); yield return tempItems; } } } |
这是我几个月前写的一个清单分割程序:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
这是一个古老的问题,但这是我最后得出的结论;它只枚举一次可枚举的,但为每个分区创建了列表。当像某些实现那样调用
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 | public static IEnumerable<IEnumerable<T>> Partition<T>(IEnumerable<T> source, int chunkSize) { if (source == null) { throw new ArgumentNullException("source"); } if (chunkSize < 1) { throw new ArgumentException("Invalid chunkSize:" + chunkSize); } using (IEnumerator<T> sourceEnumerator = source.GetEnumerator()) { IList<T> currentChunk = new List<T>(); while (sourceEnumerator.MoveNext()) { currentChunk.Add(sourceEnumerator.Current); if (currentChunk.Count == chunkSize) { yield return currentChunk; currentChunk = new List<T>(); } } if (currentChunk.Any()) { yield return currentChunk; } } } |
我发现这个小片段做得很好。
1 2 3 4 5 6 7 8 9 10 | public static IEnumerable<List<T>> Chunked<T>(this List<T> source, int chunkSize) { var offset = 0; while (offset < source.Count) { yield return source.GetRange(offset, Math.Min(source.Count - offset, chunkSize)); offset += chunkSize; } } |
我们发现大卫B的解决方案效果最好。但我们将其应用于更通用的解决方案:
1 2 3 |
旧代码,但这是我一直使用的:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | public static IEnumerable<List<T>> InSetsOf<T>(this IEnumerable<T> source, int max) { var toReturn = new List<T>(max); foreach (var item in source) { toReturn.Add(item); if (toReturn.Count == max) { yield return toReturn; toReturn = new List<T>(max); } } if (toReturn.Any()) { yield return toReturn; } } |
这个怎么样?
1 2 3 4 5 6 | var input = new List<string> {"a","g","e","w","p","s","q","f","x","y","i","m","c" }; var k = 3 var res = Enumerable.Range(0, (input.Count - 1) / k + 1) .Select(i => input.GetRange(i * k, Math.Min(k, input.Count - i * k))) .ToList(); |
据我所知,getrange()是线性的。所以这应该表现得很好。
下面的解决方案是我能想到的最紧凑的解决方案,即O(N)。
1 2 3 4 5 6 7 8 9 10 11 12 | public static IEnumerable<T[]> Chunk<T>(IEnumerable<T> source, int chunksize) { var list = source as IList<T> ?? source.ToList(); for (int start = 0; start < list.Count; start += chunksize) { T[] chunk = new T[Math.Min(chunksize, list.Count - start)]; for (int i = 0; i < chunk.Length; i++) chunk[i] = list[start + i]; yield return chunk; } } |
如果列表的类型为System.Collections.Generic,则可以使用"copy to"方法将数组的元素复制到其他子数组。指定要复制的开始元素和元素数。
您还可以对原始列表进行3个克隆,并使用每个列表上的"removerange"将列表缩小到您想要的大小。
或者只需创建一个助手方法来为您完成这项工作。
这是一个古老的解决方案,但我有不同的方法。我使用
1 2 3 4 5 6 7 8 9 10 11 12 | public static IEnumerable<IEnumerable<T>> Chunk<T>(this IEnumerable<T> source, int chunkSize) { if (chunkSize <= 0) throw new ArgumentOutOfRangeException($"{nameof(chunkSize)} should be > 0"); var nbChunks = (int)Math.Ceiling((double)source.Count()/chunkSize); return Enumerable.Range(0, nbChunks) .Select(chunkNb => source.Skip(chunkNb*chunkSize) .Take(chunkSize)); } |
就把我的两分钱放进去。如果您想"存储"列表(从左到右可视化),可以执行以下操作:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | public static List<List<T>> Buckets<T>(this List<T> source, int numberOfBuckets) { List<List<T>> result = new List<List<T>>(); for (int i = 0; i < numberOfBuckets; i++) { result.Add(new List<T>()); } int count = 0; while (count < source.Count()) { var mod = count % numberOfBuckets; result[mod].Add(source[count]); count++; } return result; } |
使用模块化分区:
1 2 3 4 5 | public IEnumerable<IEnumerable<string>> Split(IEnumerable<string> input, int chunkSize) { var chunks = (int)Math.Ceiling((double)input.Count() / (double)chunkSize); return Enumerable.Range(0, chunks).Select(id => input.Where(s => s.GetHashCode() % chunks == id)); } |
另一种方法是使用Rx缓冲运算符
1 2 3 4 5 6 7 | //using System.Linq; //using System.Reactive.Linq; //using System.Reactive.Threading.Tasks; var observableBatches = anAnumerable.ToObservable().Buffer(size); var batches = aList.ToObservable().Buffer(size).ToList().ToTask().GetAwaiter().GetResult(); |
对于任何对打包/维护解决方案感兴趣的人,morelinq库提供了符合您请求行为的
1 2 | IEnumerable<char> source ="Example string"; IEnumerable<IEnumerable<char>> chunksOfThreeChars = source.Batch(3); |
我得到了初步的答案,并将其作为一个IOC容器来决定在何处拆分。(对于谁来说,在搜索答案的同时阅读这篇文章,只想把3个项目分开?)
此方法允许根据需要对任何类型的项进行拆分。
1 2 3 4 5 6 7 8 9 10 11 12 13 | public static List<List<T>> SplitOn<T>(List<T> main, Func<T, bool> splitOn) { int groupIndex = 0; return main.Select( item => new { Group = (splitOn.Invoke(item) ? ++groupIndex : groupIndex), Value = item }) .GroupBy( it2 => it2.Group) .Select(x => x.Select(v => v.Value).ToList()) .ToList(); } |
所以对于操作来说,代码是
1 2 3 4 5 | var it = new List<string>() {"a","g","e","w","p","s","q","f","x","y","i","m","c" }; int index = 0; var result = SplitOn(it, (itm) => (index++ % 3) == 0 ); |
所以表现得像山姆·萨弗隆的方法。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 | public static IEnumerable<IEnumerable<T>> Batch<T>(this IEnumerable<T> source, int size) { if (source == null) throw new ArgumentNullException(nameof(source)); if (size <= 0) throw new ArgumentOutOfRangeException(nameof(size),"Size must be greater than zero."); return BatchImpl(source, size).TakeWhile(x => x.Any()); } static IEnumerable<IEnumerable<T>> BatchImpl<T>(this IEnumerable<T> source, int size) { var values = new List<T>(); var group = 1; var disposed = false; var e = source.GetEnumerator(); try { while (!disposed) { yield return GetBatch(e, values, group, size, () => { e.Dispose(); disposed = true; }); group++; } } finally { if (!disposed) e.Dispose(); } } static IEnumerable<T> GetBatch<T>(IEnumerator<T> e, List<T> values, int group, int size, Action dispose) { var min = (group - 1) * size + 1; var max = group * size; var hasValue = false; while (values.Count < min && e.MoveNext()) { values.Add(e.Current); } for (var i = min; i <= max; i++) { if (i <= values.Count) { hasValue = true; } else if (hasValue = e.MoveNext()) { values.Add(e.Current); } else { dispose(); } if (hasValue) yield return values[i - 1]; else yield break; } } |
}
可以使用无限生成器:
1 2 3 | a.Zip(a.Skip(1), (x, y) => Enumerable.Repeat(x, 1).Concat(Enumerable.Repeat(y, 1))) .Zip(a.Skip(2), (xy, z) => xy.Concat(Enumerable.Repeat(z, 1))) .Where((x, i) => i % 3 == 0) |
演示代码:https://ideone.com/gkml7m
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 | using System; using System.Collections.Generic; using System.Linq; public class Test { private static void DoIt(IEnumerable<int> a) { Console.WriteLine(String.Join("", a)); foreach (var x in a.Zip(a.Skip(1), (x, y) => Enumerable.Repeat(x, 1).Concat(Enumerable.Repeat(y, 1))).Zip(a.Skip(2), (xy, z) => xy.Concat(Enumerable.Repeat(z, 1))).Where((x, i) => i % 3 == 0)) Console.WriteLine(String.Join("", x)); Console.WriteLine(); } public static void Main() { DoIt(new int[] {1}); DoIt(new int[] {1, 2}); DoIt(new int[] {1, 2, 3}); DoIt(new int[] {1, 2, 3, 4}); DoIt(new int[] {1, 2, 3, 4, 5}); DoIt(new int[] {1, 2, 3, 4, 5, 6}); } } |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | 1 1 2 1 2 3 1 2 3 1 2 3 4 1 2 3 1 2 3 4 5 1 2 3 1 2 3 4 5 6 1 2 3 4 5 6 |
但实际上,我更喜欢编写没有LINQ的对应方法。
插入我的两分钱…
通过使用要分块的源的列表类型,我发现了另一个非常紧凑的解决方案:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | public static IEnumerable<IEnumerable<TSource>> Chunk<TSource>(this IEnumerable<TSource> source, int chunkSize) { // copy the source into a list var chunkList = source.ToList(); // return chunks of 'chunkSize' items while (chunkList.Count > chunkSize) { yield return chunkList.GetRange(0, chunkSize); chunkList.RemoveRange(0, chunkSize); } // return the rest yield return chunkList; } |