LC 715. Range 模块

题目描述

这是 LeetCode 上的 715. Range 模块 ,难度为 困难

Range 模块是跟踪数字范围的模块。设计一个数据结构来跟踪表示为 半开区间 的范围并查询它们。

半开区间 $[left, right)$ 表示所有 $left <= x < right$ 的实数 x

实现 RangeModule 类:

  • RangeModule() 初始化数据结构的对象。
  • void addRange(int left, int right) 添加 半开区间 [left, right),跟踪该区间中的每个实数。添加与当前跟踪的数字部分重叠的区间时,应当添加在区间 [left, right) 中尚未跟踪的任何数字到该区间中。
  • boolean queryRange(int left, int right) 只有在当前正在跟踪区间 [left, right) 中的每一个实数时,才返回 true ,否则返回 false
  • void removeRange(int left, int right) 停止跟踪 半开区间 [left, right) 中当前正在跟踪的每个实数。

示例 1:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
输入
["RangeModule", "addRange", "removeRange", "queryRange", "queryRange", "queryRange"]
[[], [10, 20], [14, 16], [10, 14], [13, 15], [16, 17]]

输出
[null, null, null, true, false, true]

解释
RangeModule rangeModule = new RangeModule();
rangeModule.addRange(10, 20);
rangeModule.removeRange(14, 16);
rangeModule.queryRange(10, 14); 返回 true (区间 [10, 14) 中的每个数都正在被跟踪)
rangeModule.queryRange(13, 15); 返回 false(未跟踪区间 [13, 15) 中像 14, 14.03, 14.17 这样的数字)
rangeModule.queryRange(16, 17); 返回 true (尽管执行了删除操作,区间 [16, 17) 中的数字 16 仍然会被跟踪)

提示:

  • $1 <= left < right <= 10^9$
  • 在单个测试用例中,对 addRangequeryRangeremoveRange 的调用总数不超过 $10^4$ 次

基本分析

线段树(动态开点)写过超多次了。

令 $m$ 为 addRangequeryRangeremoveRange 的调用总数,$n = 1e9$ 为值域大小。

由于值域过大,我们无法直接使用空间大小固定为 $4 \times n$ 的常规线段树,而要采用「动态开点」的方式,其中动态开点的方式有两种 :「需要进行估点的数组实现」和「无须估点的动态指针」。

设计 Node 节点维护什么信息:

  • lsrs 分别指向左右区间子节点(当采用「估点数组」方式时,记录的是左右区间子节点在线段树数组中的下标;在「动态指针」方式时,记录的是左右区间子节点对象);
  • sum 为记录当前区间有多少个整数被追踪;
  • add 为懒标记,当 add = -1 代表 removeRange 懒标记,当 add = 1 则代表 addRange 懒标记。

线段树(动态开点)- 数组估点

对于常规的线段树实现来说,都是一开始就调用 build 操作创建空树,而线段树一般以「满二叉树」的形式用数组存储,因此需要 $4 \times n$ 的空间,并且这些空间在起始 build 空树的时候已经锁死。

如果一道题仅仅是「值域很大」的离线题(提前知晓所有的询问),我们还能通过「离散化」来进行处理,将值域映射到一个小空间去,从而解决 MLE 问题。

但对于本题而言,由于「强制在线」的原因,我们无法进行「离散化」,同时值域大小达到 $1e9$ 级别,因此如果我们想要使用「线段树」进行求解,只能采取「动态开点」的方式进行。

动态开点的优势在于,不需要事前构造空树,而是在插入操作 add 和查询操作 query 时根据访问需要进行「开点」操作。由于我们不保证查询和插入都是连续的,因此对于父节点 $u$ 而言,我们不能通过 u << 1u << 1 | 1 的固定方式进行访问,而要将节点 $tr[u]$ 的左右节点所在 tr 数组的下标进行存储,分别记为 lsrs 属性。对于 $tr[u].ls = 0$ 和 $tr[u].rs = 0$ 则是代表子节点尚未被创建,当需要访问到它们,而又尚未创建的时候,则将其进行创建。

由于存在「懒标记」,线段树的插入和查询都是 $\log{n}$ 的,因此我们在单次操作的时候,最多会创建数量级为 $\log{n}$ 的点,因此空间复杂度为 $O(m\log{n})$,而不是 $O(4 \times n)$,而开点数的预估需不能仅仅根据 $\log{n}$ 来进行,还要对常熟进行分析,才能得到准确的点数上界。

动态开点相比于原始的线段树实现,本质仍是使用「满二叉树」的形式进行存储,只不过是按需创建区间,如果我们是按照连续段进行查询或插入,最坏情况下仍然会占到 $4 \times n$ 的空间,因此盲猜 $\log{n}$ 的常数在 $4$ 左右,保守一点可以直接估算到 $6$,因此我们可以估算点数为 $6 \times m \times \log{n}$,其中 $n = 1e9$ 和 $m = 1e4$ 分别代表值域大小和查询次数。

当然一个比较实用的估点方式可以「尽可能的多开点数」,利用题目给定的空间上界和我们创建的自定义类(结构体)的大小,尽可能的多开( Java128M 可以开到 $5 \times 10^6$ 以上)。

代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
class RangeModule {
class Node {
int ls, rs, sum, add;
}
int N = (int)1e9 + 10, M = 500010, cnt = 1;
Node[] tr = new Node[M];
void update(int u, int lc, int rc, int l, int r, int v) {
int len = rc - lc + 1;
if (l <= lc && rc <= r) {
tr[u].sum = v == 1 ? len : 0;
tr[u].add = v;
return ;
}
pushdown(u, len);
int mid = lc + rc >> 1;
if (l <= mid) update(tr[u].ls, lc, mid, l, r, v);
if (r > mid) update(tr[u].rs, mid + 1, rc, l, r, v);
pushup(u);
}
int query(int u, int lc, int rc, int l, int r) {
if (l <= lc && rc <= r) return tr[u].sum;
pushdown(u, rc - lc + 1);
int mid = lc + rc >> 1, ans = 0;
if (l <= mid) ans = query(tr[u].ls, lc, mid, l, r);
if (r > mid) ans += query(tr[u].rs, mid + 1, rc, l, r);
return ans;
}
void pushdown(int u, int len) {
if (tr[u] == null) tr[u] = new Node();
if (tr[u].ls == 0) {
tr[u].ls = ++cnt;
tr[tr[u].ls] = new Node();
}
if (tr[u].rs == 0) {
tr[u].rs = ++cnt;
tr[tr[u].rs] = new Node();
}
if (tr[u].add == 0) return;
if (tr[u].add == -1) {
tr[tr[u].ls].sum = tr[tr[u].rs].sum = 0;
} else {
tr[tr[u].ls].sum = len - len / 2;
tr[tr[u].rs].sum = len / 2;
}
tr[tr[u].ls].add = tr[tr[u].rs].add = tr[u].add;
tr[u].add = 0;
}
void pushup(int u) {
tr[u].sum = tr[tr[u].ls].sum + tr[tr[u].rs].sum;
}
public void addRange(int left, int right) {
update(1, 1, N - 1, left, right - 1, 1);
}
public boolean queryRange(int left, int right) {
return query(1, 1, N - 1, left, right - 1) == right - left;
}
public void removeRange(int left, int right) {
update(1, 1, N - 1, left, right - 1, -1);
}
}

  • 时间复杂度:addRangequeryRangeremoveRange 操作复杂度均为 $O(\log{n})$
  • 空间复杂度:$O(m\log{n})$

线段树(动态开点)- 动态指针

利用「动态指针」实现的「动态开点」可以有效避免数组估点问题,更重要的是可以有效避免 new 大数组的初始化开销,对于 LC 这种还跟你算所有样例总时长的 OJ 来说,在不考虑 static 优化/全局数组优化 的情况下,动态指针的方式要比估点的方式来得好。

代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
class RangeModule {
class Node {
Node ls, rs;
int sum, add;
}
int N = (int)1e9 + 10;
Node root = new Node();
void update(Node node, int lc, int rc, int l, int r, int v) {
int len = rc - lc + 1;
if (l <= lc && rc <= r) {
node.sum = v == 1 ? len : 0;
node.add = v;
return ;
}
pushdown(node, len);
int mid = lc + rc >> 1;
if (l <= mid) update(node.ls, lc, mid, l, r, v);
if (r > mid) update(node.rs, mid + 1, rc, l, r, v);
pushup(node);
}
int query(Node node, int lc, int rc, int l, int r) {
if (l <= lc && rc <= r) return node.sum;
pushdown(node, rc - lc + 1);
int mid = lc + rc >> 1, ans = 0;
if (l <= mid) ans = query(node.ls, lc, mid, l, r);
if (r > mid) ans += query(node.rs, mid + 1, rc, l, r);
return ans;
}
void pushdown(Node node, int len) {
if (node.ls == null) node.ls = new Node();
if (node.rs == null) node.rs = new Node();
if (node.add == 0) return ;
int add = node.add;
if (add == -1) {
node.ls.sum = node.rs.sum = 0;
} else {
node.ls.sum = len - len / 2;
node.rs.sum = len / 2;
}
node.ls.add = node.rs.add = add;
node.add = 0;
}
void pushup(Node node) {
node.sum = node.ls.sum + node.rs.sum;
}
public void addRange(int left, int right) {
update(root, 1, N - 1, left, right - 1, 1);
}
public boolean queryRange(int left, int right) {
return query(root, 1, N - 1, left, right - 1) == right - left;
}
public void removeRange(int left, int right) {
update(root, 1, N - 1, left, right - 1, -1);
}
}

  • 时间复杂度:addRangequeryRangeremoveRange 操作复杂度均为 $O(\log{n})$
  • 空间复杂度:$O(m\log{n})$

最后

这是我们「刷穿 LeetCode」系列文章的第 No.715 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:https://github.com/SharingSource/LogicStack-LeetCode

在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。