关于c＃：在LINQ中分组

Group by in LINQ

假设我们有一个像

1
2
3
4

class Person {
internal int PersonID;
internal string car ;
}

现在我有一张这个班的单子：List persons;。

现在，此列表可以有多个具有相同个人ID的实例，例如：

1
2
3

persons[0] = new Person { PersonID = 1, car ="Ferrari" };
persons[1] = new Person { PersonID = 1, car ="BMW" };
persons[2] = new Person { PersonID = 2, car ="Audi" };

有没有办法让我按personID分组，得到他所有汽车的清单？

例如，预期结果是

1
2
3
4

class Result {
int PersonID;
List<string> cars;
}

所以分组后，我会得到：

1
2
3
4
5

results[0].PersonID = 1;
List<string> cars = results[0].cars;

result[1].PersonID = 2;
List<string> cars = result[1].cars;

从我迄今为止所做的工作来看：

1
2
3

var results = from p in persons
group p by p.PersonID into g
select new { PersonID = g.Key, // this is where I am not sure what to do

有人能给我指个方向吗？

相关讨论

@乔恩·斯基特，如果我想添加另一个像name这样的属性怎么办？
@默罕默德：然后你把它包括在匿名类型中。
@用户123456这里是group by的一个很好的解释，它还包括一个按组合键分组的示例：如何：分组查询结果(C编程指南)
@Mohammad你可以做一些类似于.GroupBy(p => new {p.Id, p.Name}, p => p, (key, g) => new { PersonId = key.Id, PersonName = key.Name, PersonCount = g.Count()})的事情，你会得到所有出现的人，他们的身份证，名字，以及每个人出现的次数。
它应该是个人ID而不是个人ID。
@卡姆：我故意遵循.NET命名约定，基本上修改了操作的名称。会在答案中说明这一点。
你应该把实际类型的结果，而不是var放在更清楚的地方，这样做会产生什么结果。
@乔恩·斯基特：很好。然而，(这可能是一个新的问题)我实际上试图创建(使用与op的域等效的术语)SortedDictionary >。我用LINQ最接近的是IEnumerable >>。我最终使用了@akazmis的for(each)循环方法，顺便说一句，它的速度快了2倍(当然，调试也更容易)。
@汤姆：是的，这听起来像是一个新问题，而且听起来无论如何都不容易理解。我在这个答案中增加了使用Lookup的选项，我认为这是最简单的方法…
@乔恩·斯基特：(再说一遍，我是用Op的领域术语表达的，所以在他的领域可能不是一个实际的用例：)我有一个多项目可选择的Personid组合框，当每个项目被打开/关闭时，在一个多项目可选择的汽车组合框中重新默认(不是重新构建)汽车。因此，我应该使用这样一种结构(没有明显更多的内存/编码)，即允许对个人ID和康乃馨进行最有效的查找，这都在该个人ID的carsnames列表中。msdn没有显示Lookup属性的O。SortedDictionary为O(log n)。
@汤姆：我看不到任何证据表明这是OP的领域——至少，不是他们想解决的问题。(尤其是，他们不表示需要按车名查找)但我希望Lookup具有O(1)访问权限，因为我希望它基于Dictionary<,>或类似的权限。有关详细信息，请参阅codeblog.jonsket.uk/2010/12/31/&hellip；。
@乔恩·斯基特：1)哈哈！好吧，你对"域"的理解太多了。我只是把我的"域"的术语等同于他不是我的"域"的问题(也就是说，他的个人ID是我的部门ID，他的车(名字)是我的用户组ID，后者2是他/我要分组的项目，前者是他/我的组键)。我并不是说他在尝试重新设置组合框的默认值，或者甚至在给定的人的康乃馨中查找康乃馨。就像我说的，这"可能是一个新的Q"。…
@jon skeet:2)即使Lookup是o(1)(我也不知道它是怎样的，除非键恰好是一个整数类型，并且恰好是相对于插入顺序升序的，并且由相同的增量分隔(除了类型之外，没有一个是Lookup所要求/指定的)，这样它就可以被公式化地解析为n数组索引假定它甚至存储为数组)，上面使用它似乎只允许在检索到某个人的康乃馨后有效地查找该个人ID与另一个人的康乃馨。
@汤姆：对不起，你找不到我了。这与这个问题无关。听起来你应该问一个新问题。至于查找可以是O(1)(至少在普通情况下；如果所有的哈希代码都相同，则为绝对最坏情况O(N))：查找哈希表…
@乔斯基特：如果你想按PersonId分组，但是你仍然需要访问Person的其他属性，那该怎么办？
@jonathanwood:那么在我的代码中，您只需在示例中将p.car改为p，就可以得到一组Person元素。
@乔恩斯基特嘿，乔恩，他们给你换过医生了吗？您链接的文档现在声明："两个字母的首字母缩略词有一个特殊情况，其中两个字母都大写，如下面的标识符所示：iostream"personid将适合该类别，不是吗？
@迪尔：不，因为"id"是一个缩写，而不是一个缩写。它在表中被称为"将复合词和常用术语大写"——id和id，而不是id。

1
2
3
4

var results = from p in persons
group p by p.PersonID into g
select new { PersonID = g.Key,
/**/car = g.Select(g=>g.car).FirstOrDefault()/**/}

1
2
3

var results = from p in persons
group p by p.PersonID into g
select new { PersonID = g.Key, Cars = g.Select(m => m.car) };

你也可以试试这个。

1
2
3
4

var results= persons.GroupBy(n => new { n.PersonId, n.car})
.Select(g => new {
g.Key.PersonId,
g.Key.car)}).ToList();

尝试

1	persons.GroupBy(x => x.PersonId).Select(x => x)

或

要检查列表中是否有人重复，请尝试

1	persons.GroupBy(x => x.PersonId).Where(x => x.Count() > 1).Any(x => x)

我用查询语法和方法语法创建了一个工作代码示例。我希望它能帮助其他人：)

您也可以在.NET上运行代码：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71

using System;
using System.Linq;
using System.Collections.Generic;

class Person
{
public int PersonId;
public string car ;
}

class Result
{
public int PersonId;
public List<string> Cars;
}

public class Program
{
public static void Main()
{
List<Person> persons = new List<Person>()
{
new Person { PersonId = 1, car ="Ferrari" },
new Person { PersonId = 1, car ="BMW" },
new Person { PersonId = 2, car ="Audi"}
};

//With Query Syntax

List<Result> results1 = (
from p in persons
group p by p.PersonId into g
select new Result()
{
PersonId = g.Key,
Cars = g.Select(c => c.car).ToList()
}
).ToList();

foreach (Result item in results1)
{
Console.WriteLine(item.PersonId);
foreach(string car in item.Cars)
{
Console.WriteLine(car);
}
}

Console.WriteLine("-----------");

//Method Syntax

List<Result> results2 = persons
.GroupBy(p => p.PersonId,
(k, c) => new Result()
{
PersonId = k,
Cars = c.Select(cs => cs.car).ToList()
}
).ToList();

foreach (Result item in results2)
{
Console.WriteLine(item.PersonId);
foreach(string car in item.Cars)
{
Console.WriteLine(car);
}
}
}
}

结果如下：

1
2
3
4
5
6
7
8
9
10
11

1
Ferrari
BMW
2
Audi
-----------
1
Ferrari
BMW
2
Audi

试试这个：

1
2
3
4

var results= persons.GroupBy(n => n.PersonId)
.Select(g => new {
PersonId=g.Key,
Cars=g.Select(p=>p.car).ToList())}).ToList();

但是从性能上讲，下面的实践在内存使用方面更好、更优化(当我们的数组包含更多像数百万这样的项目时)：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

var carDic=new Dictionary<int,List<string>>();
for(int i=0;i<persons.length;i++)
{
var person=persons[i];
if(carDic.ContainsKey(person.PersonId))
{
carDic[person.PersonId].Add(person.car);
}
else
{
carDic[person.PersonId]=new List<string>(){person.car};
}
}
//returns the list of cars for PersonId 1
var carList=carDic[1];