Trie树

问题

为什么链表,Trie树和堆会用到idx来维护这个数据结构,而栈和队列就不用idx来维护,而是用hh和tt来维护呢?

解答

可以看出不管是链表,Trie树还是堆,他们的基本单元都是一个个结点连接构成的,可以成为“链”式结构。这个结点包含两个基本的属性:本身的值和指向下一个结点的指针。按道理,应该按照结构体的方式来实现这些数据结构的,但是做算法题一般用数组模拟,主要是因为比较快。各个节点之间用idx联系起来。idx的操作总是idx++,这就保证了不同的idx值对应不同的结点,这样就可以利用idx把结构体内两个属性联系在一起了。因此,idx可以理解为结点。

链表:

链表中会使用到这几个数组来模拟:

// head存储链表头指向的节点,e[]存储节点的值,ne[]存储节点的next指针,idx表示当前用到了哪个节点
h, e[N], ne[N], idx;
h表示头结点指针,一开始初始化指向-1,每次插入x的操作idx++。利用idx联系结构体本身的值和next指针,因此e[idx]可以作为结点的值,ne[idx]可以作为next指针。同理可以理解双链表。

//单链表
void add_to_head (int x)
{
    e[idx] =  x;
    ne[idx] = h;
    h = idx ++ ;
}
//双链表
// e[]表示节点的值,l[]表示节点的左指针,r[]表示节点的右指针,idx表示当前用到了哪个节点
void insert(int a,  int x)
{
    e[idx] = x;

    l[idx] = a;
    r[idx] = r[a];

    l[r[a]] = idx;
    r[a] = idx ++;
}
```C++
Trie树
Trie树中有个二维数组 son[N][26],表示当前结点的儿子,如果没有的话,可以等于++idx。Trie树本质上是一颗多叉树,对于字母而言最多有26个子结点。所以这个数组包含了两条信息。比如:son[1][0]=2表示1结点的一个值为a的子结点为结点2;如果son[1][0] = 0,则意味着没有值为a子结点。这里的son[N][26]相当于链表中的ne[N]。
```C++
void insert(char str[])
{
    int p = 0; //从根结点开始遍历
    for (int i = 0; str[i]; i ++ )
    {
        int u =str[i] - 'a';
        if (!son[p][u]) son[p][u] = ++ idx; //没有该子结点就创建一个
        p = son[p][u]; //走到p的子结点
    }

    cnt[p] ++; // cnt相当于链表中的e[idx]
}


堆中的每次插入都是在堆尾,但是堆中经常有up和down操作。所以结点与结点的关系并不是用一个ne[idx][2]可以很好地维护的。但是好在堆是个完全二叉树。子父节点的关系可以通过下标来联系(左儿子2n,右儿子2n+1)。就数组模拟来说,知道数组的下标就知道结点在堆中的位置。所以核心就在于即使有down和up操作也能维护堆数组的下标(k)和结点(idx)的映射关系。 比如说:h[k] = x, h数组存的是结点的值,按理来说应该h[idx]来存,但是结点位置总是在变的,因此维护k和idx的映射关系就好啦,比如说用ph数组来表示ph[idx] = k, 那么结点值为h[ph[idx]], 儿子为ph[idx] * 2和ph[idx] * 2 + 1, 这样值和儿子结点就可以通过idx联系在一起了。

if (op == "I")
{
    scanf("%d", &x);
    size ++ ;
    idx ++ ;
    ph[idx] = size, hp[size] = idx;//每次插入都是在堆尾插入
    h[size] = x;//h[k], k是堆数组的下标,h存储的是结点的值,也就是链表中的e[idx]
    up(size);
}

由于idx只有在插入的时候才会更新为idx ++,自然idx也表示第idx插入的元素。

Trie树


用来快速存储字符串集合的树(字母类型不会很多)。
集合的数据结构。
字符串:
abcdef
abdef
aced
bcdc

具体代码实现:

int son[N][26],cnt[N],idx;
//idx=0表示根节点
void insert(char str[]){
    int p=0;
    //str[i]如果为'\0'表示字符串尾
    for(int i = 0; str[i]; i ++ ){
        int u=str[i]-'a';
        if(son[p][u]==0)son[p][u]=++idx;
        p=son[p][u];
    }
    cnt[p]++;
}
int find(char str[]){
    int p=0;
    for(int i=0;str[i];i++){
        int u=str[i]-'a';
        if(son[p][u]==0)return 0;
        p=son[p][u];
    }
    return cnt[p];
}


例题


最大异或和:给定N个整数,A_1, A_2, A_3, ..., A_N,从当中任意挑两个整数,问最大的异或值是多少。
假设A_i=(010101)_2我们先看最高位,如果有一个A_j它的最高位是0,那么它的异或结果将比较大,对这些A_j组成的集合再进行筛查:看第二高位与A_i是否不一样,依次类推…

#include<iostream>
using namespace std;
const int N=100010,M=3000000;
int arr[N];
int son[M][2],idx;
void insert(int x){
    int p=0;
    for(int i = 30; ~i; i--){
        int& s=son[p][x>>i & 1];
        if(!s)s=++idx;
        p=s;
    }
}
int query(int x){
    int res=0,p=0;
    for(int i= 30; ~i;i--){
        int s=x>>i&1;
        if(son[p][!s]){
            res+=1<<i;
            p=son[p][!s];
        }
        else p=son[p][s];
    }
    return res;
}
int main(){
    int n;
    cin>>n;
    for(int i=0;i<n;i++){
        scanf("%d",&arr[i]);
        insert(arr[i]);
    }
    int res=0;
    for(int i=0;i<n;i++)res=max(res,query(arr[i]));
    printf("%d",res);
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值