从Python字典对象中提取键值对的子集?

Extract subset of key-value pairs from Python dictionary object?

我有一个大字典对象,它有几个键值对(大约16个),但我只对其中的3个感兴趣。实现这一目标的最佳方法(最短/最高效/最优雅)是什么?

我所知道的是:

1
2
bigdict = {'a':1,'b':2,....,'z':26}
subdict = {'l':bigdict['l'], 'm':bigdict['m'], 'n':bigdict['n']}

我相信还有比这更优雅的方式。思想?


您可以尝试:

1
dict((k, bigdict[k]) for k in ('l', 'm', 'n'))

…或在python 3python versions 2.7或更高版本中(感谢f_bio diniz指出它在2.7中也可以工作):

1
{k: bigdict[k] for k in ('l', 'm', 'n')}

更新:作为H?瓦德指出,我假设你知道字典里会有钥匙,如果你不能做出这样的假设,就看看他的答案。或者,正如Timbo在评论中指出的那样,如果您想要一个在bigdict中丢失的键映射到None中,您可以这样做:

1
{k: bigdict.get(k, None) for k in ('l', 'm', 'n')}

如果您使用的是python 3,并且只希望新dict中的键实际存在于原始dict中,那么您可以使用视图对象实现一些集合操作的事实:

1
{k: bigdict[k] for k in bigdict.keys() & {'l', 'm', 'n'}}


稍微短一点,至少:

1
2
wanted_keys = ['l', 'm', 'n'] # The keys you want
dict((k, bigdict[k]) for k in wanted_keys if k in bigdict)


1
2
interesting_keys = ('l', 'm', 'n')
subdict = {x: bigdict[x] for x in interesting_keys if x in bigdict}

所有上述方法的速度比较:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Python 2.7.11 |Anaconda 2.4.1 (64-bit)| (default, Jan 29 2016, 14:26:21) [MSC v.1500 64 bit (AMD64)] on win32
In[2]: import numpy.random as nprnd
keys = nprnd.randint(1000, size=10000)
bigdict = dict([(_, nprnd.rand()) for _ in range(1000)])

%timeit {key:bigdict[key] for key in keys}
%timeit dict((key, bigdict[key]) for key in keys)
%timeit dict(map(lambda k: (k, bigdict[k]), keys))
%timeit dict(filter(lambda i:i[0] in keys, bigdict.items()))
%timeit {key:value for key, value in bigdict.items() if key in keys}
100 loops, best of 3: 3.09 ms per loop
100 loops, best of 3: 3.72 ms per loop
100 loops, best of 3: 6.63 ms per loop
10 loops, best of 3: 20.3 ms per loop
100 loops, best of 3: 20.6 ms per loop

正如预期的那样:字典理解是最好的选择。


此答案使用与所选答案类似的词典理解,但不会仅限于缺少的项目。

python 2版本:

1
{k:v for k, v in bigDict.iteritems() if k in ('l', 'm', 'n')}

python 3版本:

1
{k:v for k, v in bigDict.items() if k in ('l', 'm', 'n')}


也许吧:

1
subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n']])

python 3甚至支持以下功能:

1
subdict={a:bigdict[a] for a in ['l','m','n']}

请注意,您可以按如下方式检查字典中是否存在:

1
subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n'] if x in bigdict])

RESP对于python 3

1
subdict={a:bigdict[a] for a in ['l','m','n'] if a in bigdict}


好吧,这件事让我困扰了好几次,所以谢谢Jayesh的要求。

上面的答案看起来像是一个很好的解决方案,但是如果您在代码中使用了这一点,那么在imho中包装功能是有意义的。此外,这里还有两个可能的用例:一个是您关心所有关键字是否都在原始字典中。还有一个你不喜欢的地方。两个都平等对待会很好。

因此,为了我的两便士的价值,我建议写一个子类的字典,例如。

1
2
3
4
5
6
7
8
9
10
class my_dict(dict):
    def subdict(self, keywords, fragile=False):
        d = {}
        for k in keywords:
            try:
                d[k] = self[k]
            except KeyError:
                if fragile:
                    raise
        return d

现在你可以用

1
orig_dict.subdict(keywords)

拉出一个子字典。

用法示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#
## our keywords are letters of the alphabet
keywords = 'abcdefghijklmnopqrstuvwxyz'
#
## our dictionary maps letters to their index
d = my_dict([(k,i) for i,k in enumerate(keywords)])
print('Original dictionary:
%r

'
% (d,))
#
## constructing a sub-dictionary with good keywords
oddkeywords = keywords[::2]
subd = d.subdict(oddkeywords)
print('Dictionary from odd numbered keys:
%r

'
% (subd,))
#
## constructing a sub-dictionary with mixture of good and bad keywords
somebadkeywords = keywords[1::2] + 'A'
try:
    subd2 = d.subdict(somebadkeywords)
    print("We shouldn't see this message")
except KeyError:
    print("subd2 construction fails:")
    print("\toriginal dictionary doesn't contain some keys

"
)
#
## Trying again with fragile set to false
try:
    subd3 = d.subdict(somebadkeywords, fragile=False)
    print('Dictionary constructed using some bad keys:
%r

'
% (subd3,))
except KeyError:
    print("We shouldn't see this message")

如果运行上述所有代码,则应该看到(类似于)以下输出(对于格式设置很抱歉):

Original dictionary:
{'a': 0, 'c': 2, 'b': 1, 'e': 4, 'd': 3, 'g': 6, 'f': 5,
'i': 8, 'h': 7, 'k': 10, 'j': 9, 'm': 12, 'l': 11, 'o': 14,
'n': 13, 'q': 16, 'p': 15, 's': 18, 'r': 17, 'u': 20,
't': 19, 'w': 22, 'v': 21, 'y': 24, 'x': 23, 'z': 25}

Dictionary from odd numbered keys:
{'a': 0, 'c': 2, 'e': 4, 'g': 6, 'i': 8, 'k': 10, 'm': 12, 'o': 14, 'q': 16, 's': 18, 'u': 20, 'w': 22, 'y': 24}

subd2 construction fails:
original dictionary doesn't contain some keys

Dictionary constructed using some bad keys:
{'b': 1, 'd': 3, 'f': 5, 'h': 7, 'j': 9, 'l': 11, 'n': 13, 'p': 15, 'r': 17, 't': 19, 'v': 21, 'x': 23, 'z': 25}


您也可以使用map(这是一个非常有用的函数,可以随时了解):

埃多克斯1〔2〕

例子:

埃多克斯1〔3〕

我从前面的答案中借用了.get(key,none):。


还有一个(我更喜欢马克·朗格的回答)

1
2
3
di = {'a':1,'b':2,'c':3}
req = ['a','c','w']
dict([i for i in di.iteritems() if i[0] in di and i[0] in req])