给定两个正整数 $l, r$,称整数 $x$ 为众的,当且仅当 $l \leq x \leq r$。
对一个由 $\texttt {0-9}$ 中数字构成的字符串,定义它的权值为这样的非空子串个数:它不以 $0$ 开头,且将其看成数字后是众的。
你需要找到一个长度为 $n$ 的字符串,使得它的权值最大。如果有多个字符串,你需要寻找字典序最小的一个。
共三行,每行包含一个正整数 $l, r, n$ ($1 \leq l \leq r \leq 10^{800}; 1 \leq n \leq 2000$)。
输出两行,每行一个整数。第一行输出一个整数 $w$,表示字符串权值的最大值。
第二行输出一个长度为 $n$ 的字符串,表示字典序最小的权值为 $w$ 的字符串。
考虑 $r - l$ 比较小的情况。
此时,我们可以对 $l \sim r$ 中的所有字符串,建立 Aho-Corasick 自动机,然后在这个自动机上 DP,找到最大值即可。
但是这里 $l, r \leq 10^{800}$,内存无法存下这么多的节点,那该怎么办呢?
我们考察这个 Trie 树的结构,可以发现,对于大部分的节点,以它为根的子树都是一个满 $10$ 叉树。且子树中所有叶节点都有着相同的标记。
于是,可以想到将这些节点 "缩起来"。
我们将一个深度为 $l$ 的满十叉树 (i.e. 有 $10^l$ 个叶节点的满十叉树) 缩为一个点。于是,当走到这个点的时候,再任意走 $l$ 步,就一定能产生一个匹配。这里要注意,至少还需要走 $l$ 步,如果中途这个串戛然而止了,则这个贡献是无法产生的。
因此,我们对这个根节点,打上一个长度为 $l$ 的标记,表示:你只要再走足 $l$ 步,就可以得到 $1$ 的贡献。
当然,一个点可能被打上多个标记,因此实际上,我们对一个点存储的信息是,对每个 $l$,长度为 $l$ 的标记的数量。
于是,现在的 AC 自动机就 "瘦身" 很多了,可以轻松在内存中存储。构造也非常容易,使用 dfs 或各种边界讨论都可以办到。
对于 DP 的转移,只需要枚举下一个字符是 $\texttt {0-9}$ 中的哪一个,然后去 AC 自动机上跳,然后还要根据当前的串长 $l$ 决定加入哪些标记。具体地,设串长为 $l$,则长度小于 $l$ 的标记都是有效的。因此,在构造完 AC 自动机后,可以对标记求一个前缀和。
最后就是输出方案的问题,由于我们需要字典序最小,因此传统的转移方向会有一些问题 (它只能得到翻转后字典序最小的串)。
因此我们考虑换一个转移方向——即用 $f_{i, j}$ 表示总长度为 $i$ 的串,初始时自动机在位置 $j$ 所可以获得的最大权值。(通常的转移是假设初始时在位置 $1$,然后枚举最后到了哪儿)
转移的时候,设自动机从 $j \to k$,则我们用 $f_{i+1, k}$ 去更新 $f_{i, j}$。这样,顺便就可以记录 $F_{i, j}$,表示该选哪个字符最优,从而就成功地输出了方案。
总时间复杂度 $O \left( n \log r \cdot \Sigma^2 \right)$,其中 $\Sigma$ 为字符集大小,此处等于 $10$。
#include <bits/stdc++.h>
const int N = 2054, M = N * 16;
int n;
char L[N], R[N], fr[N][M];
int f[N][M];
namespace AC {
char tmp[N];
int cnt = 1, limit;
int d[M][10], f[M], que[M];
int v[M][N], sum[M][N];
void dfs(int x, int dep, bool bl = true, bool br = true) {
if (!(bl || br) || dep == limit) {++v[x][limit - dep]; return;}
int i, m = br ? R[dep] : 9;
for (i = (bl ? L[dep] : 0); i <= m; ++i)
dfs(d[x][i] ? d[x][i] : (d[x][i] = ++cnt), dep + 1, bl && i == L[dep], br && i == R[dep]);
}
void init() {
int i, j, nL = strlen(L), nR = strlen(R); char *p;
for (p = L; *p; *p++ &= 15); for (p = R; *p; *p++ &= 15);
if (nL == nR) return limit = nL, dfs(1, 0);
memcpy(tmp, R, nR), memset(R, 9, nL), limit = nL, dfs(1, 0);
memcpy(R, tmp, nR), memset(L, 0, nR), *L = 1, limit = nR, dfs(1, 0);
for (i = nL + 1; i < nR; ++i)
for (j = 1; j < 10; ++j) ++v[ d[1][j] ? d[1][j] : (d[1][j] = ++cnt) ][i - 1];
}
void build() {
int h, ta = 1, i, j, t, id;
*que = 1, f[1] = 0;
for (h = 0; h < ta; ++h)
for (i = que[h], id = 0; id < 10; ++id) {
t = (f[i] ? d[f[i]][id] : 1);
int &u = d[i][id];
if (!u) {u = t; continue;}
f[u] = t, que[ta++] = u;
for (j = 0; j < n; ++j) v[u][j] += v[t][j];
}
}
inline void partial_sum() {for (int i = 1; i <= AC::cnt; ++i) std::partial_sum(v[i], v[i] + n, sum[i]);}
}
inline void up(int &x, const int y) {x < y ? x = y : 0;}
int main() {
int i, j, d, nj, nv, t = 1;
scanf("%s%s%d", L, R, &n), AC::init(), AC::build(), AC::partial_sum();
for (i = 1; i <= n; ++i)
for (j = 1; j <= AC::cnt; ++j)
for (d = 0; d < 10; ++d)
nj = AC::d[j][d], nv = f[i - 1][nj] + AC::sum[nj][i - 1],
nv > f[i][j] && (f[i][j] = nv, fr[i][j] = d);
printf("%d\n", f[n][1]);
for (i = n; i; t = AC::d[t][fr[i][t]], --i) putchar(fr[i][t] | 48);
return 0;
}
坑1:AC 自动机中的节点数量一定要开大!它可以达到 $30000$ 多个节点的数量级!
坑2:在转移时注意标记的长度限制,不要多转移或写反了。