可持久化线段树 2

本文详细介绍了可持久化线段树,特别是主席树的数据结构和应用,包括其原理、如何优化存储历史版本以及在区间第k小问题中的应用实例。作者通过实例和代码展示了如何构建和操作这些数据结构,以及它们在解决实际问题中的高效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

推荐在 cnblogs 上阅读。

可持久化线段树

前言

这个东西之前讲过,但是用得少,很快就忘了。

我又看了我之前的那篇笔记,简直就是胡言乱语。所了解的太浅了。

最近在刷数据结构,于是决定再写一篇。

但是,之前那篇不打算删了,想看黑历史的可以去看。

算法概要

可持久——即可以保存历史版本。

我们如何得到一棵可以保存历史数据的树呢?最笨的方法就是每个操作之后都建一棵线段树。

如何优化?

发现我们可以共用前面建好的结构,无需重新建树。

主席树

主席树是可持久化线段树的一种,由黄嘉泰发明,因名字缩写而被称为主席树。

主席树一开始是用来处理区间第 k k k 小的问题。

一句话概要思想:一棵权值线段树是由不在同一层的从根到叶子结点的链构成。

什么意思呢?

可以理解成一条时间轴将根节点穿起来,每个根节点都是一个历史版本的入口,每个历史版本都可以沿用以前的节点结构。

实现主席树——建树

难点其实就是建树,因为这与主席树的思想紧紧相关。

每次插入一个信息,就将它从根节点到叶子结点的这条链新建出来(权值线段树)。

当然,这条链上的节点都是新建,因为这是一个新的历史版本;其他节点就沿用以前的节点。

例 1 区间第 k k k

P3834 【模板】可持久化线段树 2

怎么做呢?

我们可以按顺序插入数组中的每个元素。

这样的话就有 n n n 个历史版本。

当我们想知道 [ l , r ] [l,r] [l,r] 的第 k k k 小时,我们可以只关注版本 l − 1 l-1 l1 和版本 r r r

这样的话,又因为这是棵权值线段树,所以可以通过当前节点的 s i z e size size 之差来判断第 k k k 小在什么地方。

注意,本题不带修。

带修怎么办呢?看例 3。

code

#include<bits/stdc++.h>
using namespace std;

#define int long long

const int MAXN=2e5+5,INF=1e9;

int n,m,tot;
int a[MAXN];
int rts[MAXN];
struct TREE
{
    int lc,rc,sz;
}tr[MAXN<<5];

void pushup(int rt)
{
    tr[rt].sz=tr[tr[rt].lc].sz+tr[tr[rt].rc].sz;
}

void update(int &rt,int lst,int l,int r,int val)
{
    rt=++tot;
    tr[rt]=tr[lst];
    if(l==r)
        tr[rt].sz++;
    else
    {
        int mid=(l+r)>>1;
        if(val<=mid)
            update(tr[rt].lc,tr[lst].lc,l,mid,val);
        else
            update(tr[rt].rc,tr[lst].rc,mid+1,r,val);
        pushup(rt);
    }
}

int query(int r1,int r2,int l,int r,int k)
{
    if(l==r)
        return l;
    int lc1=tr[r1].lc,lc2=tr[r2].lc;
    int mid=(l+r)>>1;
    int tmp=tr[lc2].sz-tr[lc1].sz;
    if(tmp>=k)
        return query(lc1,lc2,l,mid,k);
    return query(tr[r1].rc,tr[r2].rc,mid+1,r,k-tmp);
}

signed main()
{
    scanf("%lld%lld",&n,&m);
    for(int i=1;i<=n;i++)
    {
        scanf("%lld",&a[i]);
        update(rts[i],rts[i-1],-INF,INF,a[i]);
    }
    for(int i=1;i<=m;i++)
    {
        int x,y,z;
        scanf("%lld%lld%lld",&x,&y,&z);
        printf("%lld\n",query(rts[x-1],rts[y],-INF,INF,z));
    }
    return 0;
}

例 2 可持续化数组

P3919 【模板】可持久化线段树 1(可持久化数组)

这个就是很简单的了,不用权值线段树。

首先对于原数组建线段树,称为历史版本 0。

然后对于 m m m 次操作,每次都是一个历史版本;如果是查询操作,就复制前一个一模一样的。

剩下的就是中规中矩了,就是建一条链,其他节点就沿用。

code

#include<bits/stdc++.h>
using namespace std;

// #define int long long
#define ls tr[rt].lc
#define rs tr[rt].rc

const int MAXN=2e6+5;

int n,m;
int a[MAXN],rts[MAXN*20];
struct HJT
{
    int lc,rc,val;
}tr[MAXN*20];
int tot;

void build(int &rt,int l,int r)
{
    rt=++tot;
    if(l==r)
        return tr[rt].val=a[l],void();
	int mid=l+r>>1;
	build(ls,l,mid);
	build(rs,mid+1,r);
}

void update(int &rt,int old,int l,int r,int x,int k)
{
	rt=++tot;
	tr[rt]=tr[old];
	if(l==r)
		return tr[rt].val=k,void();
	int mid=l+r>>1;
	if(x<=mid) update(ls,tr[old].lc,l,mid,x,k);
	else update(rs,tr[old].rc,mid+1,r,x,k);
}

int query(int rt,int l,int r,int x)
{
	if(l==r)
		return tr[rt].val;
	int mid=l+r>>1;
	if(x<=mid) return query(ls,l,mid,x);
	return query(rs,mid+1,r,x);
}

signed main()
{
	scanf("%d%d",&n,&m);
	for(int i=1;i<=n;i++) scanf("%d",&a[i]);
	build(rts[0],1,n);
	for(int i=1,old,op,x,k;i<=m;i++)
	{
		scanf("%d%d%d",&old,&op,&x);
		if(op==1)
		{
			scanf("%d",&k);
			update(rts[i],rts[old],1,n,x,k);
		}
		else
			printf("%d\n",query(rts[i]=rts[old],1,n,x));
	}
    return 0;
}

例 3 区间第 k k k 小(带修)

首先你要知道树状数组是个什么东西。

这里要用到它的思想。

题面

给定一个长度为 n n n n ≤ 50 , 000 n \leq 50,000 n50,000)的数组 a 1 , a 2 . . . , a n a_1 , a_2 ... ,a_n a1,a2...,an q q q q ≤ 10 , 000 q \leq 10,000 q10,000)此询问,每次询问:

  1. Q i j k 表示区间 [ i , j ] [i,j] [i,j] 中第 k k k 小的数是多少,并输出这个数
  2. C i t 表示将第 i i i 个数改为 t t t

Solution

首先考虑最笨的办法,就是修改这个历史版本后,它后面的所有版本都跟着改写。

怎么优化呢?

想起树状数组就是通过类树分区间管辖,所以可以做到 O ( log ⁡ n ) O(\log n) O(logn)

那这里也可以沿用这种思想,就是分区间管辖,每次改写就改写管辖他们的“大哥”,查询的时候在下放。

概要就是这么个概要,洛谷上没有这道题,我也不打算写代码(看起来很麻烦的样子),自己去写吧(雾)。

参考文献

结尾

先草草结束吧,可能未来还会写可持久化平衡树什么的,也不确保这次一定就完全掌握了主席树。

先这样吧,多卷题,时而温故而知新。

可持久化线段树是一种支持历史版本查询的数据结构,其核心思想是在每次修改操作时保留完整的旧版本信息。这使得它在某些应用场景中非常有用,例如版本控制系统或需要回溯操作的算法问题。 ### 空间复杂度分析 可持久化线段树的空间复杂度与普通线段树相比有所增加。普通线段树的空间复杂度为 $O(n)$,其中 $n$ 是数据规模。而可持久化线段树由于需要保留历史版本,每次更新操作都会生成新的节点,因此其空间复杂度为 $O(n \log n)$。具体来说,每次更新操作最多会生成 $O(\log n)$ 个新节点,因为线段树的高度为 $O(\log n)$,每个节点最多分裂一次[^1]。 ### 实现原理 可持久化线段树的核心实现原理是**节点复用**和**路径复制**。当对线段树进行更新时,只有从根节点到目标节点的路径上的节点会被复制,其余节点保持不变。这种方式避免了对整个线段树的完全复制,从而节省了内存[^1]。 具体实现中,每个版本的线段树通过一个根节点指针来标识。当进行更新操作时,新版本的根节点指向一个新的节点,而未修改的子树则继续指向旧版本的节点。这种设计使得不同版本之间可以共享未修改的部分,从而减少内存开销。 以下是一个简单的可持久化线段树的实现示例,用于单点更新和区间查询: ```cpp #include <iostream> #include <vector> using namespace std; struct Node { int val; // 节点值,例如区间和 Node* left; Node* right; Node(int v) : val(v), left(nullptr), right(nullptr) {} }; class PersistentSegmentTree { private: vector<int> data; Node* build(Node* node, int l, int r) { if (l == r) { node->val = data[l]; return node; } int mid = (l + r) / 2; node->left = new Node(0); node->right = new Node(0); build(node->left, l, mid); build(node->right, mid + 1, r); node->val = node->left->val + node->right->val; return node; } Node* update(Node* node, int l, int r, int idx, int value) { if (l == r) { Node* new_node = new Node(value); return new_node; } int mid = (l + r) / 2; Node* new_node = new Node(0); if (idx <= mid) { new_node->left = update(node->left, l, mid, idx, value); new_node->right = node->right; } else { new_node->left = node->left; new_node->right = update(node->right, mid + 1, r, idx, value); } new_node->val = new_node->left->val + new_node->right->val; return new_node; } int query(Node* node, int l, int r, int ql, int qr) { if (qr < l || ql > r) return 0; if (ql <= l && r <= qr) return node->val; int mid = (l + r) / 2; return query(node->left, l, mid, ql, qr) + query(node->right, mid + 1, r, ql, qr); } public: vector<Node*> roots; // 存储每个版本的根节点 PersistentSegmentTree(vector<int>& arr) { data = arr; roots.push_back(new Node(0)); build(roots[0], 0, data.size() - 1); } void update(int version, int idx, int value) { Node* new_root = update(roots[version], 0, data.size() - 1, idx, value); roots.push_back(new_root); } int query(int version, int ql, int qr) { return query(roots[version], 0, data.size() - 1, ql, qr); } }; ``` ### 内存占用分析 可持久化线段树的内存占用主要由以下几个部分构成: 1. **节点存储**:每个节点需要存储值、左右子节点指针。通常每个节点的大小为常数级别(例如包含一个整数值和两个指针)。 2. **版本管理**:每个版本通过一个根节点指针进行管理,根节点指针的存储开销为 $O(1)$。 3. **路径复制**:每次更新操作会生成新的节点,这些新节点的总数为 $O(\log n)$,因此总内存占用为 $O(n \log n)$。 在实际应用中,内存占用还可能受到编程语言的内存管理机制影响。例如,在 C++ 中手动管理内存可能导致较高的内存碎片,而在 Java 或 Python 等具有垃圾回收机制的语言中,内存占用可能相对较低,但具体表现取决于实现细节。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值