安装 PostgreSQL
PostgreSQL 是一个功能强大的开源对象关系数据库系统。它经过数十年的积极开发和经过验证的架构,使其在可靠性、数据完整性和正确性方面赢得了良好的声誉。而其天生支持异步操作的特性,在高并发场景中倍受欢迎。同时,它的扩展性极强,只要你有能力,你可以使用任何你熟悉的其它开发语言来编写 PostgreSQL 脚本,比如:Rust、Python 等。PostgreSQL 对象
本章将介绍 PostgreSQL 常见的服务器和数据库对象。示例数据库
本章将介绍示例数据库,以便后续的演示。同时,你将学习到如何将已存在的数据导入到 PostgreSQL 中。基础 SELECT
本章将讨论如何使用简单的 `SELECT` 语句从 PostgreSQL 查询数据。PostgreSQL 的 `SELECT` 语句有诸多独特的特性,让我们一起感受一下。WHERE 子句
本章我们将学习 `WHERE` 子句,它不但能用于 `SELECT` 过滤查询结果,还能用于其它语句。LIMIT、OFFSET 和 FETCH 子句
本章我们学习 `LIMIT` 、`OFFSET` 和 `FETCH` 子句。和 `LIMIT` 一样,`FETCH` 也是为了限定返回的行数,但你不知道的是,`FETCH` 才是 SQL 标准,而 `LIMIT` 不是。LIKE 和 ILIKE
前面章节提过,在 PostgreSQL 中,`LIKE` 是区分大小写的。如果要像其它数据库那样不区分大小写,需要使用 `ILIKE`。PostgreSQL 还为它们提供了等价的运算符。连接
本章将讨论 PostgreSQL 的各种连接:内连接、左外连接、右外连接、交叉连接、自然连接、自连接和完全外连接。值得一提的是,哪怕到了 MySQL 8,MySQL 依然不支持完全外连接。分组
本章将讨论 PostgreSQL 的 `GROUP BY` 子句:将`SELECT` 语句返回的结果进行分组;对于每个分组,可以使用聚合函数。同时讨论与之相关的 `HAVING`、`CUBE`、`ROLLUP` 等。联合查询(并集)、交集查询及差集查询
本章将讨论 `UNION`:联合(并集)查询、`INTERSECT `:交集查询和`EXCEPT`:差集查询。子查询
本章我们将讨论如何使用 PostgreSQL 子查询来构建复杂的查询。同时会学习 `IN`、`EXISTS`、`ANY`、`SOME`、`ALL` 等操作。插入数据
本章将讨论如何使用 `INSERT` 向 PostgreSQL 中插入新行。同时介绍如何通过`REGURNING`子句返回最新插入行的ID以及批量插入数据的方法。修改数据
本章将讨论如何使用 `UPDATE` 语句修改 PostgreSQL 数据,以及配合 `RETURNING` 子句在修改数据的同时,返回修改后的内容。最后,还将介绍 `UPDATE JOIN`:根据另一张表中的数据进行修改。删除数据
本章将讨论如何使用 `DELETE` 语句删除 PostgreSQL 数据,以及配合 `RETURNING` 子句在删除数据的同时,返回已删除的内容。最后,还将介绍 `DELETE JOIN`:根据另一张表中的数据进行删除。插入或更新数据
在关系型数据库中,术语`upsert`称为合并:当插入数据时,如果数据已存在则进行更新,否则插入新行。PostgreSQL 使用 `INSERT ON CONFLICT` 实现这一功能。基础数据类型
本章我们讨论 PostgreSQL 的基本数据类型:布尔型、字符型、数值型和日期时间型。这些类型与其它数据库有着很多不同,让我们一起深入细节进行了解。表
本章将讨论和表相关的知识,包括:创建表、修改表、清空(截断)表和删除表。约束
本章将讨论 PostgreSQL 的约束,包括:主键约束、外键约束、唯一约束、非空约束、 CHECK 约束。条件表达式和运算符
本章将讨论 PostgreSQL 条件表达式和运算符,包括:使用 `CASE` 构造条件查询、使用 `COALESCE` 过滤非空参数、使用 `NULLIF` 处理 `NULL` 值以及使用 `CAST` 进行数据类型转换。视图
本章我们将讨论视图:创建、修改、删除视图。为高级篇的物化视图、递归视图等打好基础。性能分析
PostgreSQL 提供了 `EXPLAIN` 语句,它可以用来分析 SQL 的执行情况。本章将对其进行讨论。索引
PostgreSQL 索引是增强数据库查询性能的有效工具。然而,索引增加了数据库系统的写入和存储开销。因此,正确使用它们非常重要。本章我们将讨论如何使用索引。角色与权限
本章介绍角色与权限。PostgreSQL 使用角色来表示用户账号,而不是其它数据库那样使用用户概念。客户端鉴权
本章将讨论 PostgreSQL 客户端鉴权。回到之前安装 PostgreSQL 时的一个问题,为什么在本地登录 PostgreSQL 时,不需要输入密码?本章将回答这个问题。事务
本章将讨论如何使用 `BEGIN` 、 `COMMIT` 和 `ROLLBACK` 语句处理 PostgreSQL 事务。备份与还原
本章将介绍备份和还原 PostgreSQL 数据库。常用函数
本章对 PostgreSQL 常用函数进行汇总,包括:聚合函数、日期时间函数、字符串函数和数学函数。对于窗口函数,我们将在高级篇进行介绍。
索引
- 649
- 2023-08-01 05:37:10
PostgreSQL 索引是增强数据库查询性能的有效工具。然而,索引增加了数据库系统的写入和存储开销。因此,正确使用它们非常重要。本章我们将讨论如何使用索引。
实际生活中的类比
假如《新华字典》没有按拼音排序,或者没有按部首索引,你要查某个字的含义时,你必须逐页、逐行地查找,直到在某一页某一行查到该字为止。这种查找方式称为顺序扫描:需要遍历所有条目,直到找到所需要的条目。
与此类似,表中存储的数据应按特定顺序进行组织,以加快各种搜索速度。这就是索引发挥的作用。
索引是一种独立的数据结构,它可以加速数据检索,但需要额外的写入和存储来维护它。
创建索引
创建索引的简单版本:
CREATE INDEX 索引名称 ON 表名 [USING 索引方法]
(
字段名 [ASC | DESC] [NULLS {FIRST | LAST }],
...
);
-
首先指定索引名称
-
其次指定索引所属的表
-
然后,指定
索引方法
。可用的索引方法
有:btree
(默认值)、hash
、gist
、spgist
、gin
和brin
。 -
第四,列出要存储在索引中的一个或多个字段。
ASC
(默认值)和DESC
指定排序方式。NULLS FIRST
或NULL LAST
指定NULL
排以非空值的前面还是后面。当指定DESC
时,NULLS FIRST
是默认值;反之,NULLS LAST
是默认值。
首先指定索引名称
其次指定索引所属的表
然后,指定索引方法
。可用的索引方法
有:btree
(默认值)、hash
、gist
、spgist
、gin
和brin
。
第四,列出要存储在索引中的一个或多个字段。ASC
(默认值)和DESC
指定排序方式。NULLS FIRST
或 NULL LAST
指定 NULL
排以非空值的前面还是后面。当指定 DESC
时,NULLS FIRST
是默认值;反之,NULLS LAST
是默认值。
要检查某个查询是否使用了索引,请使用
EXPLAIN
语句
要检查某个查询是否使用了索引,请使用 EXPLAIN
语句
示例
我们使用示例数据库中的 address
进行演示。
假设我们想查找电话是223664661973
的地址信息:
EXPLAIN SELECT *
FROM address
WHERE phone = '223664661973';
/* 结果
QUERY PLAN
---------------------------------------------------------
Seq Scan on address (cost=0.00..15.54 rows=1 width=61)
Filter: ((phone)::text = '223664661973'::text)
*/
从分析结果可知,这个查询使用了顺序扫描。原因在于,我们并没有给 phone
建立索引。为此,我们可以给它建立索引:
EXPLAIN SELECT *
FROM address
WHERE phone = '223664661973';
/* 结果
QUERY PLAN
----------------------------------------------------------------------------------
Index Scan using idx_address_phone on address (cost=0.28..8.29 rows=1 width=61)
Index Cond: ((phone)::text = '223664661973'::text)
*/
已经使用了索引扫描。
删除索引
有时候可能会想要从数据库中删除现有索引,为此可以使用 DROP INDEX
语句,其语法如下:
DROP INDEX [ CONCURRENTLY]
[ IF EXISTS ] index_name
[ CASCADE | RESTRICT ];
- 当执行
DROP INDEX
时,PostgreSQL 会获取表上的独占锁并阻止其它访问,直到索引删除完成。要强制等待冲突完成后再删除索引,可以加上CONCURRENTLY
选项。但CONCURRENTLY
有一些限制:- 首先,它不支持
CASCADE
- 其次,不支持在事务中执行
- 首先,它不支持
- 尝试删除不存在的索引将引发错误,为避免这种情况,可以加上
IF EXISTS
。 CASCADE
:如果索引具有依赖对象,该选项将在删除该索引的同时,自动级联删除那些依赖对象RESTRICT
:如果索引具有依赖对象,则拒绝删除该索引。这是默认值。
- 首先,它不支持
CASCADE
- 其次,不支持在事务中执行
示例
我们使用示例数据库中的 actor
进行演示。
首先,为 first_name
字段创建索引:
CREATE INDEX idx_actor_first_name
ON actor (first_name);
我们想查找 first_name
为 John
的演员,分析一波:
EXPLAIN SELECT *
FROM actor
WHERE first_name = 'John';
/* 结果
QUERY PLAN
------------------------------------------------------
Seq Scan on actor (cost=0.00..4.50 rows=1 width=25)
Filter: ((first_name)::text = 'John'::text)
*/
从分析结果看到, PostgreSQL 并没有使用我们创建的 idx_actor_first_name
索引,而是使用顺序扫描来进行全表扫描:在某些情况下,PostgreSQL 会选择使用顺序扫描而无视索引,这是因为查询优化器认为全表扫描是最优解。这个时候创建索引就没必要了。
基于此,我们删除这个索引:
DROP INDEX idx_actor_first_name;
索引列表
可以使用 SQL 语句来列出所有创建的索引:
SELECT
tablename,
indexname,
indexdef
FROM
pg_indexes
WHERE
schemaname = 'public'
ORDER BY
tablename,
indexname;
psql 提供了对应的命令:
\d 表名
索引类型
PostgreSQL 有多种索引类型,下面分别进行介绍。
B-tree 索引
它是一种自平衡树,它维护排序的数据并允许在对数时间内,搜索、插入、删除和顺序访问。每当索引涉及使用以下比较运算符之一时,PostgreSQL 查询规划器将考虑使用该种索引:
<
<=
=
>=
BETWEEN
IN
IS NULL
IS NOT NULL
此外,如果模式是常量,并且锚定在查询的开头,则查询规划器对涉及 LIKE
和 ~
的查询使用该种索引。
如果模式以非字母字符开头,则查询规划器将考虑对 ILIKE
和 ~*
使用该种索引。
大部分情况下,如果你不知道使用何种类型的索引,选择B-tree即可。
大部分情况下,如果你不知道使用何种类型的索引,选择B-tree即可。
Hash 索引
Hash 索引只能处理简单的相等比较(=
)。这意味着,每当索引字段涉及使用=
运算符时,查询规划器都考虑使用该种索引 。要创建 Hash 索引,可以这样:
CREATE INDEX 索引名
ON 表名 USING HASH (字段名);
Gin 索引
Gin 索引代表广义倒排索引( generalized inverted)。当字段中存储多个值(例如 hstore、array、jsonb 和 range 等数据类型)时,该索引最有用。
BRIN 索引
BRIN 代表块范围索引( block range indexes),与B-Tree相比,它更小、维护成本也更低。它允许在非常大的表上使用索引,这在没有使用水平分区之前,B-Tree 根本不可能实现。
它通常用于具有线性排序的顺序字段,比如销售订单表的创建日期字段。
GiST索引
GiST 代表广义搜索树( Generalized Search Tree)。它允许构建通用树结构。它在索引几何数据类型和全文搜索时非常有用。
SP-GiST 索引
SP-GiST 代表空间划分的 GiST(space-partitioned GiST)。它支持分区搜索树,有助于开发各种不同的非平衡数据结构。对于具有自然聚类元素具不是相等平衡树的数据最有用,比如 GIS、多媒体、电话路由和IP路由等。
表达式索引
除了对某个/某些字段建立索引,有时候也需要对涉及字段的表达式创建索引,这就是表达式索引。它也称为基于函数的索引。
创建表达式索引的语法:
CREATE INDEX 索引名
ON 表名 (表达式);
一旦定义了表达式索引,那么在 WHERE
、ORDER BY
子句中,PostgreSQL 都将考虑使用该表达式索引。
请注意,表达式上的索引维护起来非常昂贵,因为 PostgreSQL 必须在插入或更新每一行时计算该表达式,并使用结果进行索引。因此,当检索速度比插入和更新速度更重要时,您应该在表达式上使用索引。
示例
为 curstomer
表创建 LOWER(last_name)
的表达式索引:
CREATE INDEX idx_ic_last_name
ON customer(LOWER(last_name));
之后,分析一波:
EXPLAIN
SELECT
customer_id,
first_name,
last_name
FROM
customer
WHERE
LOWER(last_name) = 'purdy';
部分索引
PostgreSQL 甚至允许为某些数据行创建索引。这部分索引有助于加快查询速度,同时减少索引大小。
如果 WHERE
条件使用常量值,则部分索引非常有用,比如:
SELECT *
FROM 表名
WHERE 字段名 = 常量值;
创建部分索引的语法如下:
CREATE INDEX 索引名
ON 表名(字段列表)
WHERE 条件;
分析一波:
EXPLAIN SELECT
customer_id,
first_name,
last_name,
email
FROM
customer
WHERE
active = 0;
重建索引
在实际生活中,由于硬件故障或软件错误,可能导致索引损坏。可以使用 REINDEX
来重建索引,以恢复受损的索引。它的语法如下:
REINDEX [ ( VERBOSE ) ] { INDEX | TABLE | SCHEMA | DATABASE | SYSTEM } name;
VERBOSE
是可选的,如果包括该关键字,则在重建过程中会显示进度
重建单个索引:
REINDEX INDEX 索引名;
重建某个表中的所有索引:
REINDEX TABLE 表名;
重建模式中的所有索引:
REINDEX SCHEMA 模式名;
重建数据库中所有索引:
重建数据中,系统目录上的所有索引:
REINDEX SYSTEM 数据库名;