- 原题链接:208. 实现 Trie (前缀树)
题目
Trie(发音类似 “try”)或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补完和拼写检查。
请你实现 Trie 类:
- Trie() 初始化前缀树对象。
- void insert(String word) 向前缀树中插入字符串 word 。
- boolean search(String word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入);否则,返回 false 。
- boolean startsWith(String prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true ;否则,返回 false 。
1- 思路
字典树实现
Trie,又称前缀树或字典树,是一棵有根树,其每个节点包含以下字段:
- 指向子节点的指针数组
children
。对于本题而言,数组长度为26
,即小写英文字母的数量。此时children[0]
对应小写字母a
,children[1]
对应小写字母b
,…,children[25]
对应小写字母z
。
布尔字段 isEnd
,表示该节点是否为字符串的结尾。
插入字符串
我们从字典树的根开始,插入字符串。对于当前字符对应的子节点,有两种情况:
- 子节点存在。沿着指针移动到子节点,继续处理下一个字符。
- 子节点不存在。创建一个新的子节点,记录在
children
数组的对应位置上,然后沿着指针移动到子节点,继续搜索下一个字符。
重复以上步骤,直到处理字符串的最后一个字符,然后将当前节点标记为字符串的结尾。
查找前缀
我们从字典树的根开始,查找前缀。对于当前字符对应的子节点,有两种情况:
- 子节点存在。沿着指针移动到子节点,继续搜索下一个字符。
- 子节点不存在。说明字典树中不包含该前缀,返回空指针。
重复以上步骤,直到返回空指针或搜索完前缀的最后一个字符。
若搜索到了前缀的末尾,就说明字典树中存在该前缀。此外,若前缀末尾对应节点的isEnd
为真,则说明字典树中存在该字符串。
2- 题解
前缀树数据结构及构造过程
构造过程
- children 数组存储的是 Trie ,因此可以将其看做是一种映射关系。
- 将 26 个字母,通过
字母 - 'a'
的方式映射为下标,数组对应下标的结点不为空,证明存在该值。
插入 hello 模拟
-
- 初始化前缀树:创建根节点,其 children 数组包含26个空位,对应26个英文字母的每一个可能的子节点
-
- 插入 ‘h’:
- 计算 ‘h’ 在 children 数组中的索引:‘h’ - ‘a’ = 7。检查 children[7] 是否为空。是的话,创建一个新的 Trie 节点并放置在这个位置。
-
- 插入 ‘e’:
- 移动到 ‘h’ 对应的节点,即 children[7]。对于 ‘e’,计算索引:‘e’ - ‘a’ = 4。
- 检查 children[4] 是否为空(这里的 children 是 ‘h’ 节点的 children)。为空,则创建并放置新的 Trie 节点。
-
- 插入 ‘l’:
- 类似地,移动到 ‘e’ 对应的节点,检查并处理 ‘l’。
-
- 插入第二个 ‘l’:
- 从第一个 ‘l’ 的节点继续,处理第二个 ‘l’。
-
- 插入 ‘o’:
- 从第二个 ‘l’ 的节点继续,处理 ‘o’,并将 isEnd 设置为 true。
此时,children 数组的使用情况如下:
- 根节点的 children[7] 指向 ‘h’ 的节点。
- ‘h’ 的节点的 children[4] 指向 ‘e’ 的节点。
- ‘e’ 的节点的 children[11] 指向第一个 ‘l’ 的节点。
- 第一个 ‘l’ 的节点的 children[11] 指向第二个 ‘l’ 的节点。
- 第二个 ‘l’ 的节点的 children[14] 指向 ‘o’ 的节点。
- ‘o’ 的节点的 isEnd 被设置为 true。
注:虽然每个 Trie 结点都有一个 长为 24 的 children数组,但每个数组中存储的是其子节点的结点值,例如 hello 中的 h 结点,仅有 children数组中 仅有 index = e - 'a'
的 index 会存储值
⭐实现前缀树 Trie —— 代码实现思路
class Trie {
private Trie[] children;
private boolea isEnd;
public Trie() {
children = new Trie[26];
isEnd = false;
}
public void insert(String word) {
Trie node = this;
for(int i = 0 ; i < word.