[Codeforces1305H]Kuroni the Private Tutor

有一场测验，共 $n$ 道试题，有 $m$ 名学生参加，每道题的分值为 $1$ 分。已知，做出第 $i$ 道题的学生人数在区间 $\left[ l_i, r_i \right]$ 中。特别地，所有学生的得分总和 (所有题目做出人数的总和) 为 $t$。

你瞥了一眼这场测验的排行榜，并记住了如下 $q$ 个额外信息：其中第 $i$ 个信息形如，排名为第 $p_i$ 的学生 (可能并列) 的得分为 $s_i$。

求至多有多少人并列第一，以及在并列第一的人数最多的条件下，(并列) 第一名的得分的最大值。

输入格式

第一行包含两个正整数 $n, m$ ($1 \leq n, m \leq 10^5)$，表示测验的试题数和参加的学生数。

接下来 $n$ 行，每行两个非负整数 $l_i, r_i$ ($0 \leq l_i \leq r_i \leq m$)，表示做出第 $i$ 道题的学生人数的范围。

第 $n + 2$ 行包含一个非负整数 $q$ ($0 \leq q \leq m$)，表示通过排行榜得到的额外信息数目。

接下来 $q$ 行，每行两个非负整数 $p_i, s_i$ ($1 \leq p_i \leq m; 0 \leq s_i \leq n$)，描述一条额外信息 (排名为第 $p_i$ 的学生的得分为 $s_i$)，保证所有 $p_i$ 互不相同，且对于 $i \neq j$，若 $p_i < p_j$，则必有 $s_i \geq s_j$。

最后一行包含一个非负整数 $t$ ($0 \leq t \leq n \cdot m$)，表示所有学生的得分总和。

输出格式

输出一行，包含两个整数，分别表示并列第一的人数的最大值，以及在并列第一的人数最多的条件下，得分的最大值。若不存在一种可能的情形满足所有条件，则输出两个 $-1$。

题解

先考虑如果我们已知得分分布 (即数组 $\left\{ s_n \right\}$)，当然这里需要满足 $s_1 \geq s_2 \geq \cdots \geq s_m$，如何来判断是否存在满足条件的答对/错题方法。

考虑对问题进行建模，可知它是一个类似方格表填数的问题，其中行和有上下界，列和已知。

根据熟知的套路，我们将方格表问题转化为二分图的问题 (其中左部表示行，右部表示列)，然后行和列和相当于一个点连出去的边的条数。

这样一来，就可以建立网络流的模型了 —— 这些 $l_i, r_i, s_i$ 就相当于对应边的容量限制。

具体地，对于每一道试题 $i$，我们连接一条从源点 $S$ 指向 $i$ 的，流量下界为 $l_i$，流量上界 (容量) 为 $r_i$ 的边；对于每一名学生 $j$，连接一条从 $j$ 指向汇点 $T$ 的，容量为 $s_j$ 的边；而对于任意一道试题 $i$ 和任意一名学生 $j$，连一条从 $i \to j$ 容量为 $1$ 的边。

这样，这组 $\left\{ s_n \right\}$ 合法当且仅当这张图存在大小为 $s_1 + s_2 + \cdots + s_m$ 的流。

那由于这张图是有上下界的网络流，可以通过一般的方法将其转化为一般的 (即没有下界的) 网络流：

具体地，注意到每个代表试题的点 $i$，都有 $l_i$ 的流量入超，因此我们需要从超级源点 $S'$ 向它提供大小为 $l_i$ 的流。

于是，(由于这张图显然不会存在大小超过 $s_1 + s_2 + \cdots + s_m$ 的流) 这张图存在大小为 $f$ 的流，当且仅当它存在大小 $\geq f$ 的流，由最大流最小割定理，上述条件有又等价于这张图的每一个割集的容量和 $\geq f$。

先考虑上界，考虑上界时我们将 $S$ 和 $S'$ 视为整体 (即看作一般的网络流)，设割集为 $\left( A \mid B \right)$，其中 $S, S' \in A, T \in B$，记试题代表的点集与 $A$ 和 $B$ 的交集分别为 $P_A, P_B$，学生代表的点集与 $A, B$ 的交集分别为 $S_A, S_B$。

于是，有 $$ \sum_{i \in P_B} r_i + \left| P_A \right| \cdot \left| S_B \right| + \sum_{j \in S_A} s_j \geq \sum_{j=1}^m s_j \tag 1 \label 1 $$

对 $\eqref 1$ 式稍作变形，即得 $$ \left( \sum_{i=1}^n r_i - \sum_{i \in P_A} r_i \right) + \left| P_A \right| \cdot \left| S_B \right| \geq \sum_{j \in S_B} s_j \tag 2 \label 2 $$

由于 $P_B, S_B$ 是任取的，因此在固定集合大小的前提下，我们一定是取最大的 $\left| S_B \right|$ 个 $s_j$ —— 即前 $\left| S_B \right|$ 名 $\left\{ 1, 2, \cdots, \left| S_B \right| \right\}$，对于 $r_i$ 同理。

于是不妨假设 $r_i$ 单调递减，于是这些不等式可以等价地简化为对于 $\forall \rho \in \left[ 0, n \right], \sigma \in \left[ 0, m \right]$，有 $$ \rho \cdot \sigma + \sum_{j=\sigma+1}^m s_j \geq t - \sum_{i=\rho+1}^n r_i \tag 3 \label 3 $$

接下来考虑下界 —— 即 $S'$ 的出边需要全部满流 ($S \in B, S' \in A$)。

通过类似地方法，而我们可以得到如下的不等式：$$ \sum_{i \in P_B} l_i + \left| P_A \right| \cdot \left| S_B \right| + \sum_{j \in S_A} s_j \geq \sum_{i=1}^n l_i \tag 4 \label 4 $$

同样通过变形，以及假设 $l_i$ 单调递减，可得 $$ \rho \cdot \sigma + \sum_{j=\sigma+1}^m s_j \geq \sum_{i=1}^\rho l_i \tag 5 \label 5 $$

当然还有一种情况是假设 $S \in A, S' \in B$，经过类似的推导可得 $$ \rho \cdot \sigma + \sum_{j=\sigma+1}^m s_j \geq t - \sum_{i=\rho+1}^n r_i - \sum_{i=1}^\rho l_i \tag 6 \label 6 $$

不过 $\eqref 6$ 式并没有实际价值 —— 因为当 $\eqref 3$ 式成立时，由于 $l_i \geq 0$，$\eqref 6$ 式自然成立。

综上，我们的条件就转化为了 $$ \color {teal} {\rho \cdot \sigma + \sum_{j=\sigma+1}^m s_j \geq \max \left\{ t - \sum_{i=\rho+1}^n r_i, \sum_{i=1}^\rho l_i \right\} \qquad \left( 0 \leq \rho \leq n; 0 \leq \sigma \leq m \right)} \tag 7 \label 7 $$

当然，这些条件也是充分的，由最大流最小割定理这保证了所有的割都不小于图中的一些显然上界 (如 $\displaystyle \sum_{i=1}^n l_i, \sum_{j=1}^m s_j \left( = t \right)$)，因此这三种流都必须满流，从而自然存在解啦。

于是问题转化为如何对 $\eqref 7$ 式进行快速判定。要知道，暴力判断还是有 $O \left( n m \right)$ 个不等式的呢。

考虑从小到大枚举 $\rho$，不难发现等式右端可以通过预处理部分和，且与 $\sigma$ 无关，于是我们只需要理清楚等式左端的最小值与 $\sigma$ 的关系即可。

注意到诸 $s_i$ 单调递减，因此 $\displaystyle \sum_{j=\sigma+1}^m$ 是关于 $\sigma$ 的下凸数列 (即差分递增)。

而 $\displaystyle \rho \cdot \sigma + \sum_{j=\sigma+1}^m s_j$ 相当于求两向量内积 $\displaystyle \left( \sigma, \sum_{j=\sigma+1}^m s_j \right) \cdot \left( \rho, 1 \right)$ 的最大值。

那么使这个向量取到最大值的点就是斜率为 $- \rho$ 的下切线与凸包的交点 (参考这里)，故这个点的横坐标 ($\sigma$) 是单调递减的，从而可以用双指针维护出 (固定 $\rho$ 后) 使等式左端取到最小值的 $\sigma$，从而判断复杂度就降为 $O \left( n + m \right)$，可以接受。

~~(A: 因为后面的过程不是很麻烦，所以前面讲得稍微详细些)~~

首先不难想到二分 —— 即二分并列第一的人数 $w$，判断是否可行。

(ps: 这里我们可以把要求定得稍微松些，即前 $w$ 名得分相同就算满足，因为如果第 $w + 1$ 名得分也与之相同说明答案可以更大)

首先，先来排除一些智障情形，比如给定的额外信息中已经有前 $w$ 名中两人得分不同的情形等。

首先，如果这 $w$ 名中有额外信息，那么显然得分的最大值就是额外信息中所给的分数。

考虑二分的分值 $s$，检验它是否满足。和前面道理一样，这里我们二分的是并列的分值能否 $\geq s$ (否则答案会不满足单调性)。

检验的过程其实和前面检验 $w$ 的过程一样，也是 "向后看齐" 填 "水洼"。

同理，若在填 "水洼" 的时候发现前 $w$ 名不一致，那么还是将这些分值设为更高的 $Q$ 后检验，并将新检验的结果作为原结果返回。

最后简单分析一下复杂度：判定过程可以线性完成，外面二分是一个 $\log$，故总时间复杂度为 $O \left( \left( n + m \right) \left( \log n + \log m \right) \right)$。

代码

#include <bits/stdc++.h>

typedef long long ll;
const int N = 100054;

int n, T;
int lb[N], ub[N], score[N], real[N];
bool fixed[N];
ll S, Lb[N], Ub[N];

inline void down(ll &x, const ll y) {x > y ? x = y : 0;}
inline int max(const int x, const int y) {return x < y ? y : x;}
inline ll max(const ll x, const ll y) {return x < y ? y : x;}

inline bool test(int *_arg) {
	int i, j; ll sum = 0;
	for (i = 0, j = n; i <= T; ++i, sum += j) {
		for (; j && _arg[j - 1] <= i; sum += _arg[--j] - i);
		if (sum < max(Lb[i], S - Ub[i])) return false;
	}
	return true;
}

inline ll allocate(int l, int r, int limit, ll sum) {
	int width = r - l + 1, base = real[l]; lldiv_t res;
	down(sum, (ll)limit * width), res = lldiv(sum, width);
	std::fill(real +  l, real + (l + res.rem), base + res.quot + 1);
	std::fill(real + (l + res.rem), real + (r + 1), base + res.quot);
	return sum;
}

bool check(int count, int value) {
	int i, j, _1, _rg, _crg; ll remain;
	_1 = std::count(score, score + count, -1);
	_rg = max(*std::max_element(score, score + n), 0);
	_crg = std::count(score, score + count, _rg);
	if (_1 + _crg != count || (_crg && _rg < value)) return false;
	if (!_crg) _rg = value;

	std::fill(real, real + count, _rg);
	for (i = n - 1; i >= count; --i) real[i] = ((fixed[i] = (bool)~score[i]) ? score[i] : real[i + 1]);
	if ((remain = -std::accumulate(real, real + n, -S)) < 0) return false;

	for (j = n, i = n - 1; i >= count; --i)
		if (fixed[i])
			i == --j || (remain -= allocate(i + 1, j, real[i] - real[j], remain), j = i);
	if (count != j) remain -= allocate(count, j - 1, real[count - 1] - real[j], remain);

	return remain ? !_crg && (value += (remain + j - 1) / j) <= T && check(count, value) : test(real);
}

int main() {
	int i, c, L, R, M;
	scanf("%d%d", &T, &n), memset(score, -1, (n + 1) << 2), score[n] = 0;
	for (i = 0; i < T; ++i) scanf("%d%d", lb + i, ub + i);
	std::sort(lb, lb + T, std::greater <int> ());
	std::sort(ub, ub + T, std::greater <int> ());
	for (i = T - 1; i >= 0; --i) Lb[i] = Lb[i + 1] + lb[i], Ub[i] = Ub[i + 1] + ub[i];
	for (i = T; i >= 0; --i) Lb[i] = *Lb - Lb[i];
	for (scanf("%d", &L); L; --L) scanf("%d%d", &i, &R), score[--i] = R;
	scanf("%lld", &S);
	for (L = 0, R = n; L < R; check(M = (L + R + 1) / 2, 0) ? L = M : (R = M - 1));
	if (!L) return puts("-1 -1"), 0;
	for (c = L, L = 0, R = T; L < R; check(c, M = (L + R + 1) / 2) ? L = M : (R = M - 1));
	printf("%d %d\n", c, L);
	return 0;
}

坑

坑1：在递归再做一遍时记得检查是否有 $Q \leq n$ 成立，因为理论上讲，如果不加限制那么填第一个 "水洼" 的过程将会是永无止境的。

坑2：注意 $l_i, r_i, s_i$ 排序的顺序，如果初始排序的顺序是反的，那么上面这些式子 ($\eqref 3, \eqref 5, \eqref 7$) 也需要做适当更改。

题目描述

输入格式

输出格式

题解

代码

坑