PostgreSQL 中的并发创建索引-编程学习网

如下面的例子：

创建示例表

-- 创建测试表，并向其中插入 500w 行随机字符串数据

CREATE TABLE articles (
  id SERIAL8 NOT NULL PRIMARY KEY,
  a text,
  b text,
  c text
);

INSERT INTO articles(a, b, c)
SELECT
  md5(random()::text),
  md5(random()::text),
  md5(random()::text)
from (
  SELECT * FROM generate_series(1,5000000) AS id
) AS x;

打开一个 psql 客户端，执行创建索引操作

ubuntu=# create index idx_a on articles (a);

索引创建时打开另一个 psql 客户端，并向表中插入数据，此时另一个事务已经持有表锁了，所以会一直等待事务结束之后才会继续执行

ubuntu=# insert into articles(a, b, c) values ('1', '2', '3');

可以在事务执行期间，通过 pg_locks 表查看事务持有的锁，可以看到创建索引的操作占据了 ShareLock（5 号锁），插入操作需要获取 RowExclusiveLock 锁，而这两者是互斥的。

ubuntu=# select * from pg_locks where relation = 'articles'::regclass;
 locktype | database | relation | page | tuple | virtualxid | transactionid | classid | objid | objsubid | virtualtransaction |   pid   |       mode       | granted | fastpath |
         waitstart
----------+----------+----------+------+-------+------------+---------------+---------+-------+----------+--------------------+---------+------------------+---------+----------+-
-----------------------------
 relation |  2638325 |  2638341 |      |       |            |               |         |       |          | 3/22624            | 1236742 | RowExclusiveLock | f       | f        |
2023-01-13 14:08:32.54543+08
 relation |  2638325 |  2638341 |      |       |            |               |         |       |          | 4/209              | 1236951 | ShareLock        | t       | f        |
 relation |  2638325 |  2638341 |      |       |            |               |         |       |          | 6/20               | 1237182 | ShareLock        | t       | f        |
(3 rows)

索引创建和表更新操作的互斥，带来一个严重的后果，那便是如果表数据量较大，创建索引的时间可能很长，如果长时间锁表的话，会导致表无法更新，可能会对在线业务产生很大的影响。

于是 PostgreSQL 在 11 版本中支持了并发创建索引，即 CREATE INDEX CONCURRENTLY，其主要功能是在创建索引的时候，不阻塞表数据的更新。

还是看上面的示例，只需要将第一个事务的 sql 修改为 create index CONCURRENTLY idx_a on articles (a);，那么其他事务的表数据更新操作将会正常执行，不会被阻塞。

然后再看其持有的锁，可以看到已经变成了 ShareUpdateExclusiveLock（4 号锁）：

ubuntu=# select * from pg_locks where relation = 'articles'::regclass;
 locktype | database | relation | page | tuple | virtualxid | transactionid | classid | objid | objsubid | virtualtransaction |   pid   |           mode           | granted | fas
tpath | waitstart
----------+----------+----------+------+-------+------------+---------------+---------+-------+----------+--------------------+---------+--------------------------+---------+----
------+-----------
 relation |  2638325 |  2638341 |      |       |            |               |         |       |          | 4/214              | 1236951 | ShareUpdateExclusiveLock | t       | f
      |
(1 row)

在并发创建索引的时候，如果遇到了不符预期的错误，或者手动取消，那么这个索引将会留在表中，但是被标识为 INVALID，表示这个索引不可用，也就是说将不会使用这个索引进行索引扫描。

后续可以手动将其 DROP 掉，然后重新建立索引，也可以执行 REINDEX CONCURRENTLY 重建索引。

ubuntu=# \d articles
                            Table "public.articles"
 Column |  Type  | Collation | Nullable |               Default
--------+--------+-----------+----------+--------------------------------------
 id     | bigint |           | not null | nextval('articles_id_seq'::regclass)
 a      | text   |           |          |
 b      | text   |           |          |
 c      | text   |           |          |
Indexes:
    "articles_pkey" PRIMARY KEY, btree (id)
    "idx_body" btree (a) INVALID

注意：CREATE INDEX CONCURRENTLY 不能在事务块中执行，也就是说我们不能显式的 begin 开启事务然后执行 CREATE INDEX CONCURRENTLY。

二、CREATE INDEX CONCURRENTLY 的三个步骤

主要的代码位置在 https://github.com/postgres/postgres/blob/master/src/backend/commands/indexcmds.c#L488

DefineIndex 方法中主要是处理索引创建的逻辑，方法前面部分主要是做一系列校验和参数初始化等，然后调用 index_create 方法将索引的元信息存储到 pg_index、pg_class 等表中。

并且如果判断到不是 concurrently 创建索引的话，这里会直接返回，也就是说这之后的逻辑都是处理 CONCURRENTLY 并发索引创建的部分。

if (!concurrent)
{
    
    table_close(rel, NoLock);

    
    if (!OidIsValid(parentIndexId))
        pgstat_progress_end_command();

    return address;
}

接着上面的代码往下看，就是 postgres 的并发创建索引逻辑，主要分为了三个步骤，这部分代码的注释也有一些相应的说明。

开启一个事务，通过 index_create 方法，将索引的元数据信息存储到 pg_class、pg_index 表中，并且标识索引的 indisready 和 indisvalid 属性为 false，表示目前索引没有 ready 并且不可用_；_提交事务，并开启一个新的事务进入下一阶段。

此阶段相当于 DefineIndex 的前一部分，和正常的 create index 的逻辑是相同的。

1. 进入此阶段时，需要等待系统中其他正在写数据的事务提交，因为必须让新索引的定义对其他所有的事务都可见，保证 HOT 更新满足表的索引定义，调用 WaitForLockers 函数进行等待 2. 通过 index_concurrently_build 创建索引，同时持有 4 号锁，不阻塞表的增/删/改操作；获取一个 MVCC 快照，将此快照下可见的元组写入到索引中；此时如果有其他的事务有新的写入，将不会插入到索引中，只是保证 HOT 满足索引的定义；提交事务，将索引设置为 isready，后续如果有新的数据插入，将会维护这个索引，但是索引仍然是 invalid，不能用于索引扫描。并再开启一个新的事务，进入到下一阶段。
1. 又要等待当前所有写事务都提交，保证所有的事务都能看到新索引的定义 2. 在第二阶段的执行过程中，有可能又有新的元组插入到表中，所以需要再获取一个新的 MVCC 快照，并将新的元组插入到索引中，调用函数 validate_index 3. 此时还需要一次等待，将指定 xmin 的之前的事务提交，调用函数 WaitForOlderSnapshots 4. 最后将索引置为 valid，后续其他事务便可以使用该索引进行查询了