yaoxi-std 的博客

$\text{开}\mathop{\text{卷}}\limits^{ju\check{a}n}\text{有益}$

0%

【专题】后缀数组 SA

【专题】后缀数组 SA

警告:SA多次使用一定要清空,我也不知道为什么。

虽然有不少此类题目可以用字符串hash瞎搞

记住代码中每个数组的含义:

数组 含义
$sa_i$ 排名为$i$的后缀的起始位置
$rk_i$ 后缀$s_{i \cdots n}$的排名
$tp_i$ 临时数组,用来在基数排序中记录临时排名
$ht_i$ 第$rki$个后缀和第$rk{i-1}$个后缀的$LCP$

一些性质

可重叠最长重复子串

即$ht$数组的最大值。

不同子串个数

即$\frac{n \times (n + 1)}{2} - \sum\limits_{i=1}^{n}{ht_i}$(易证)。

任意两个后缀的$LCP$

设分别为后缀$s{i \cdots n}$和$s{j \cdots n}$,其中$i \lt j$,$LCP = \min\limits_{k=i+1}^{j}{ht_k}$,用$RMQ$解决。

题目

P2408 不同子串个数 题解
P4051 [JSOI2007] 字符加密 题解
[AHOI2013] 差异 题解
P3181 [HAOI2016] 找相同字符串
UVA11107 Life Forms
P2336 [SCOI2012] 喵星球上的点名
P4341 [BJWC2010] 外星联络
P4070 [SDOI2016] 生成魔咒
P5028 Annihilate
P4081 [USACO17DEC] Standing Out from the Herd P
P4094 [HEOI2016/TJOI2016] 字符串
P1117 [NOI2016] 优秀的拆分
P3900 [湖南集训] 图森
P4770 [NOI2018] 你的名字
P6095 [JSOI2015] 串分割

模版代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
struct SuffixArray {
int n, sa[MAXN], rk[MAXN], tp[MAXN], ht[MAXN], he[MAXN];
void clear() {
fill(sa, sa + n + 1, 0);
fill(rk, rk + n + 1, 0);
fill(tp, tp + n + 1, 0);
fill(ht, ht + n + 1, 0);
fill(he, he + n + 1, 0);
n = 0;
}
void radix_sort(int m) {
static int buc[MAXN];
for (int i = 0; i <= m; ++i)
buc[i] = 0;
for (int i = 1; i <= n; ++i)
buc[rk[i]]++;
for (int i = 1; i <= m; ++i)
buc[i] += buc[i - 1];
for (int i = n; i >= 1; --i)
sa[buc[rk[tp[i]]]--] = tp[i];
}
void init(int n, char* s) {
this->n = n;
int m = 200;
for (int i = 1; i <= n; ++i)
rk[i] = s[i] + 1, tp[i] = i;
radix_sort(m);
for (int w = 1, p = 0; p < n; m = p, w <<= 1) {
p = 0;
for (int i = 1; i <= w; ++i)
tp[++p] = n - w + i;
for (int i = 1; i <= n; ++i)
if (sa[i] > w)
tp[++p] = sa[i] - w;
radix_sort(m);
copy(rk + 1, rk + n + 1, tp + 1);
rk[sa[1]] = p = 1;
for (int i = 2; i <= n; ++i) {
if (tp[sa[i - 1]] == tp[sa[i]] && tp[sa[i - 1] + w] == tp[sa[i] + w])
rk[sa[i]] = p;
else
rk[sa[i]] = ++p;
}
}
for (int i = 1, k = 0; i <= n; ++i) {
if (k)
k--;
while (s[i + k] == s[sa[rk[i] - 1] + k])
k++;
ht[i] = he[rk[i]] = k;
}
}
};