【DS】哈希表，哈希桶的实现

Mesar_

已于 2024-12-19 00:35:11 修改

阅读量1.2k

点赞数 13

分类专栏：数据结构文章标签：哈希算法散列表算法学习 c++ 数据结构

于 2024-10-17 10:46:12 首次发布

本文链接：https://blog.csdn.net/Mesar33/article/details/142315259

版权

平衡二叉树的学习中，学习及模拟实现了AVL树和红黑树，得益于其结构，查找效率可以达到惊人的

O (l o g N)

，但是平衡树中调平衡的开销及学习的成本也是不低的。于是今天再来学习一个同样高效，甚至更优的哈希表（桶），其实现难度也没有AVL树和红黑树高；而且 unordered系列的关联式容器的底层就是采用了哈希结构，unordered系列的关联式容器比inordered系列的关联式容器（map，set，multi…）效率甚至更优；之所以效率比较高，是因为其底层使用了哈希结构。

哈希概念

顺序结构以及平衡树中，元素关键码与其存储位置之间没有对应的关系，因此在查找一个元素时，必须要经过关键码的多次比较。顺序查找时间复杂度为O(N)，平衡树中为树的高度，即 $O(log_2 N)$ ，搜索的效率取决于搜索过程中元素的比较次数。

理想的搜索方法：可以不经过任何比较，一次直接从表中得到要搜索的元素。如果构造一种存储结构，通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立一一映射的关系，那么在查找时通过该函数可以很快找到该元素。

例如：

插入元素
- 根据待插入元素的关键码，通过函数计算出该元素的存储位置并按此位置进行存放。
搜索元素
- 对元素的关键码进行同样的计算，把求得的函数值当做元素的存储位置，在结构中按此位置取元素比较，若关键码相等，则搜索成功。

该方式即为哈希(散列)方法，哈希方法中使用的转换函数称为哈希(散列)函数，构造出来的结构称为哈希表(Hash Table)(或者称散列表)

哈希是一种概念，哈希表（桶）才是数据结构。

如以下例子：

例如：数据集合{1，7，6，4，5，9}；
哈希函数设置为：hash(key) = key % capacity; capacity为存储元素底层空间总的大小

用该方法进行搜索不必进行多次关键码的比较，因此搜索的速度比较快。而且插入操作也简单高效。

既然哈希方法的效率如此高，那么它有什么缺陷吗？

哈希冲突

对于两个数据元素的关键字 $k_i$ 和 $k_j$ (i != j)，有 $k_i$ != $k_j$ ，但有：Hash( $k_i$ ) == Hash( $k_j$ )，即：不同关键字通过相同哈希哈数计算出相同的哈希地址，该种现象称为哈希冲突或哈希碰撞。把具有不同关键码而具有相同哈希地址的数据元素称为“同义词”。