Python字典的底层实现

 我来答

1个回答

华源网络
2022-07-26 · TA获得超过5575个赞

知道小有建树答主

回答量：2486

采纳率：100%

帮助的人：144万

关注

展开全部

字典是一种可变、无序容器数据结构。元素以键值对存在，键值唯一。它的特点搜索速度很快：数据量增加10000倍，搜索时间增加不到2倍；当数据量很大的时候，字典的搜索速度要比列表快成百上千倍。

在Python中，字典是通过散列表（哈希表）实现的。字典也叫哈希数组或关联数组，所以其本质是数组（如下图），每个 bucket 有两部分：一个是键对象的引用，一个是值对象的引用。所有 bucket 结构和大小一致，我们可以通过偏移量来读取指定 bucket。

定义一个字典 dic = {}，假设其哈希数组长度为8。

Python会根据哈希数组的拥挤程度对其扩容。“扩容”指的是:创造更大的数组，这时候会对已经存在的键值对重新进行哈希取余运算保存到其它位置；一般接近 2/3 时，数组就会扩容。扩容后，偏移量的数字个数增加，如数组长度扩容到16时，可以用最右边4位数字作为偏移量。

计算键对象 name 的哈希值，然后比较哈希数组对应索引内的bucket是否为空，为空返回 None ，否则计算这个bucket的键对象的哈希值，然后与 name 哈希值比较，相等则返回值对象，否则继续左移计算哈希值。

注意：
1.键必须为可哈希的，如数字、元组、字符串；自定义对象需要满足支持hash、支持通过 __eq__() 方法检测相等性、若 a == b 为真，则 hash(a) == hash(b) 也为真。

2.字典的内存开销很大，以空间换时间。
3.键查询速度很快，列表查询是按顺序一个个遍历，字典则是一步到位。
4.往字典里面添加新键可能导致扩容，导致哈希数组中键的次序变化。因此，不要在遍历字典的同时进行字典的修改。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

为你推荐：