【数据库】Postgresql 数据库索引_postgresql 索引-CSDN博客

本文介绍了PostgreSQL数据库的5种索引方式，包括主键、唯一、多属性、部分和表达式索引，以及4种索引类型：B-tree、hash、gist和gin倒排索引。详细阐述了每种索引的创建、使用场景和实现原理，特别是B-tree索引和hash索引的特点。还提到了如何查看索引的使用率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Postgresql 数据库索引

对表中指定属性建立一个逻辑排序，索引就是维护这样一个排序关系，在对表进行查询的时候，走索引其实就是扫描已经过排序的数据，可以快速匹配，达到快速查询的目的。

5种索引方式

主键索引
唯一索引
多属性索引
部分索引
表达式索引

4种索引类型

B-tree索引
hash索引
gin倒排索引
gist索引

B-tree索引

创建索引

--CREATE INDEX命令创建索引，默认是创建的B-tree索引
CREATE INDEX test1_id_index ON test1 (id);

使用场景

B-tree可以处理对可以排序成某些顺序的数据的等式和范围查询

<
<=
=
>=
>
BETWEEN
IN
IS NULL
IS NOT NULL
LIKE

示例

--往表test_tb1插入200000条测试数据
create table test_tb1(c1 int,c2 int);
insert into test_tb1 select round(random()*100),round(random()*1000) from generate_series(1,200000);
--查看数据表大小
select pg_size_pretty(pg_table_size('test_tb1'));
7104 kB

--全表扫描
select * from test_tb1;
0.209s
select count(*) from test_tb1;
0.079s

--比较单个字段索引和多个字段联合索引存储占用
--（1）创建c1单索引
create index test_tb1_idx1 on test_tb1(c1);
时间: 0.423s
select pg_size_pretty(pg_relation_size('test_tb1_idx1'));
4408 kB

drop index test_tb1_idx1;
--（2）创建c2单索引
create index test_tb1_idx2 on test_tb1(c2);
select pg_size_pretty(pg_relation_size('test_tb1_idx2'));
4408 kB

drop index test_tb1_idx2;
--（3）创建联合索引
create index test_tb1_idx3 on test_tb1(c1,c2);
select pg_size_pretty(pg_relation_size('test_tb1_idx3'));
4408 kB
--结论：创建单个索引和创建联合索引所占使用的磁盘空间相同

--执行计划分析
explain (analyze,buffers) select count(*) from test_tb1 where c1=99 and c2=999;
--该查询会走c1和c2联合索引

实现原理

B-tree索引基于B+树实现

B+树数据结构

B+树中所有关键字都在叶子节点出现，并且按照关键字排序以链表方式链接，同时叶子节点保存了指向相应记录的指针
所有非叶子节点可以看成是索引的一部分，并不指向实际的存储位置，非叶子节点包含其子树节点中最小的关键字

B+树结构图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Px6z4rho-1665997970352)(image/B+Tree.png)]

使用B+树实现的优点：压缩了树的层级，减少磁盘IO。

hash索引

使用hash函数，对关键字进行散列

创建索引

CREATE INDEX name ON table USING HASH (column);

使用场景

Hash索引只能处理简单的等式比较。当使用=运算符进行比较时，查询计划器将考虑使用Hash索引
实现原理

构建可动态扩展的hash表

gist

意为通用搜索树，严格来说，gist不是一种独立的索引类型，而是一种索引架构或者模板，可以在这种架构上实现不同的索引策略

gin倒排索引

存储对（key, posting list）集合的索引结构

当需要搜索多值类型内的VALUE时，适合多值类型，例如数组、全文检索

<@  包含于
@>  数组的操作符，表示“包含”的意思
=   相等
&&  重叠（是否有相同元素）

索引被使用率查看

SELECT
	pg_stat_all_indexes.relid,
	pg_stat_all_indexes.indexrelid,
	pg_stat_all_indexes.schemaname,
	pg_stat_all_indexes.relname,
	pg_stat_all_indexes.indexrelname,
	pg_stat_all_indexes.idx_scan,
	pg_stat_all_indexes.idx_tup_read,
	pg_stat_all_indexes.idx_tup_fetch 
FROM
	pg_stat_all_indexes 
WHERE
	( pg_stat_all_indexes.schemaname <> ALL ( ARRAY [ 'pg_catalog' :: NAME, 'information_schema' :: NAME ] ) ) 
	AND pg_stat_all_indexes.schemaname !~ '^pg_toast' :: TEXT;