LC 352. 将数据流变为多个不相交区间
题目描述
这是 LeetCode 上的 352. 将数据流变为多个不相交区间 ,难度为 困难。
给你一个由非负整数 a1, a2, ..., an
组成的数据流输入,请你将到目前为止看到的数字总结为不相交的区间列表。
实现 SummaryRanges
类:
SummaryRanges()
使用一个空数据流初始化对象。void addNum(int val)
向数据流中加入整数val
。int[][] getIntervals()
以不相交区间[starti, endi]
的列表形式返回对数据流中整数的总结。
示例:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19输入:
["SummaryRanges", "addNum", "getIntervals", "addNum", "getIntervals", "addNum", "getIntervals", "addNum", "getIntervals", "addNum", "getIntervals"]
[[], [1], [], [3], [], [7], [], [2], [], [6], []]
输出:
[null, null, [[1, 1]], null, [[1, 1], [3, 3]], null, [[1, 1], [3, 3], [7, 7]], null, [[1, 3], [7, 7]], null, [[1, 3], [6, 7]]]
解释:
SummaryRanges summaryRanges = new SummaryRanges();
summaryRanges.addNum(1); // arr = [1]
summaryRanges.getIntervals(); // 返回 [[1, 1]]
summaryRanges.addNum(3); // arr = [1, 3]
summaryRanges.getIntervals(); // 返回 [[1, 1], [3, 3]]
summaryRanges.addNum(7); // arr = [1, 3, 7]
summaryRanges.getIntervals(); // 返回 [[1, 1], [3, 3], [7, 7]]
summaryRanges.addNum(2); // arr = [1, 2, 3, 7]
summaryRanges.getIntervals(); // 返回 [[1, 3], [7, 7]]
summaryRanges.addNum(6); // arr = [1, 2, 3, 6, 7]
summaryRanges.getIntervals(); // 返回 [[1, 3], [6, 7]]
提示:
- 0 <= val <= $10^4$
- 最多调用 addNum 和 getIntervals 方法 $3 * 10^4$ 次
进阶:如果存在大量合并,并且与数据流的大小相比,不相交区间的数量很小,该怎么办?
二分查找 + 朴素维护区间
一个朴素的做法是直接使用 ArrayList
(数组)来维护所有的不相交区间,然后调用 addNum
时先通过二分找到当前值相邻的区间,然后根据题意进行模拟即可。
同时为了简化复杂的分情况讨论,起始时我们可以先往 ArrayList
添加两个哨兵分别代表正无穷和负无穷。
代码(不使用哨兵的代码见 $P2$):1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43class SummaryRanges {
List<int[]> list = new ArrayList<>();
int[] head = new int[]{-10, -10}, tail = new int[]{10010, 10010};
public SummaryRanges() {
list.add(head);
list.add(tail);
}
public void addNum(int val) {
int n = list.size();
if (n == 0) {
list.add(new int[]{val, val});
return ;
}
int l = 0, r = n - 1;
while (l < r) {
int mid = l + r + 1 >> 1;
if (list.get(mid)[0] <= val) l = mid;
else r = mid - 1;
}
int[] cur = new int[]{val, val};
int[] prev = list.get(r);
int[] next = list.get(r + 1);
if ((prev[0] <= val && val <= prev[1]) || (next[0] <= val && val <= next[1])) {
// pass
} else if (prev[1] + 1 == val && val == next[0] - 1) {
prev[1] = next[1];
list.remove(next);
} else if (prev[1] + 1 == val) {
prev[1] = val;
} else if (next[0] - 1 == val) {
next[0] = val;
} else {
list.add(r + 1, cur);
}
}
public int[][] getIntervals() {
int n = list.size();
int[][] ans = new int[n - 2][2];
int idx = 0;
for (int i = 1; i < n - 1; i++) ans[idx++] = list.get(i);
return ans;
}
}
1 |
|
- 时间复杂度:令 $m$ 为不交区间个数,
addNum
操作中查询相邻区间的复杂度为 $O(\log{m})$,维护不相交区间时,由于需要针对 $list$ 的索引位置进行元素插入和删除,复杂度为 $O(m)$,整体复杂度为 $O(m)$;getIntervals
操作需要遍历所有的 $list$ 元素,复杂度为 $O(m)$ - 空间复杂度:$O(m)$
二分查找 + 优化维护区间
解法一中虽然在 addNum
使用到了复杂度诶 $O(\log{m})$ 的二分查找,但在维护区间时,由于要对 $list$ 进行针对索引的插入和删除,导致整体复杂度为 $O(m)$。
我们期望找到一种插入/删除操作复杂度同样为 $O(\log{m})$ 的方式来维护区间,这引导我们使用 TreeSet
(红黑树)等数据结构。
具体做法不变,仍然是先使用「二分」(TreeSet
自带的 floor/ceiling
)来找到当前值的相邻区间,
同时为了简化复杂的分情况讨论,起始时我们可以先往 TreeSet
添加两个哨兵分别代表正无穷和负无穷,以确保调用 floor/ceiling
时不会返回空。
代码:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44class SummaryRanges {
TreeSet<int[]> ts = new TreeSet<>((a, b)->a[0]-b[0]);
int[] head = new int[]{-10, -10}, tail = new int[]{10010, 10010};
public SummaryRanges() {
ts.add(head);
ts.add(tail);
}
public void addNum(int val) {
int[] cur = new int[]{val, val};
int[] prev = ts.floor(cur);
int[] next = ts.ceiling(cur);
if ((prev[0] <= val && val <= prev[1]) || (next[0] <= val && val <= next[1])) {
// pass
} else if (prev[1] + 1 == val && next[0] - 1 == val) {
prev[1] = next[1];
ts.remove(next);
} else if (prev[1] + 1 == val) {
prev[1] = val;
} else if (next[0] - 1 == val) {
next[0] = val;
} else {
ts.add(cur);
}
}
public int[][] getIntervals() {
// using ceiling
// int n = ts.size();
// int[][] ans = new int[n - 2][2];
// int[] cur = head;
// for (int i = 0; i < n - 2; i++) {
// ans[i] = ts.ceiling(new int[]{cur[0] + 1, cur[1] + 1});
// cur = ans[i];
// }
// return ans;
// using iterator
int n = ts.size();
int[][] ans = new int[n - 2][2];
Iterator<int[]> iterator = ts.iterator();
iterator.next();
for (int i = 0; i < n - 2; i++) ans[i] = iterator.next();
return ans;
}
}
- 时间复杂度:令 $m$ 为不交区间个数,
addNum
操作中「查询相邻区间」和「维护不相交区间」的复杂度为 $O(\log{m})$,整体复杂度为 $O(\log{m})$;getIntervals
操作需要获取有序集合中的所有元素,使用ceiling
复杂度为 $O(m\log{m})$。使用iterator
的话,由于TreeSet
底层同步维护了一个TreeMap
,迭代器由TreeMap
所提供,获取iterator
来遍历所有元素的复杂度为 $O(m)$ - 空间复杂度:$O(m)$
进阶
如果存在大量合并,并且与数据流的大小相比,不相交区间的数量很小,该怎么办?
即需要确保 addNum
的复杂度,而对 getIntervals
复杂度要求不高,上述解法就已经是这么做的了。
最后
这是我们「刷穿 LeetCode」系列文章的第 No.352
篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。
在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。
为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:https://github.com/SharingSource/LogicStack-LeetCode 。
在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!