LC 10. 正则表达式匹配
题目描述
这是 LeetCode 上的 10. 正则表达式匹配 ,难度为 困难。
给你一个字符串 s
和一个字符规律 p
,请你来实现一个支持 '.'
和 '*'
的正则表达式匹配。
'.'
匹配任意单个字符'*'
匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖整个字符串 s
的,而不是部分字符串。
示例 1:1
2
3
4
5输入:s = "aa" p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。
示例 2:1
2
3
4
5输入:s = "aa" p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:1
2
3
4
5输入:s = "ab" p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:1
2
3
4
5输入:s = "aab" p = "c*a*b"
输出:true
解释:因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:1
2
3输入:s = "mississippi" p = "mis*is*p*."
输出:false
提示:
- $0 <= s.length <= 20$
- $0 <= p.length <= 30$
s
可能为空,且只包含从a-z
的小写字母。p
可能为空,且只包含从a-z
的小写字母,以及字符.
和*
。- 保证每次出现字符
*
时,前面都匹配到有效的字符
动态规划
整理一下题意,对于字符串 p
而言,有三种字符:
- 普通字符:需要和
s
中同一位置的字符完全匹配 '.'
:能够匹配s
中同一位置的任意字符'*'
:不能够单独使用'*'
,必须和前一个字符同时搭配使用,数据保证了'*'
能够找到前面一个字符。能够匹配s
中同一位置字符任意次。
所以本题关键是分析当出现 a*
这种字符时,是匹配 $0$ 个 a
、还是 $1$ 个 a
、还是 $2$ 个 a
…
本题可以使用动态规划进行求解:
状态定义:
f(i,j)
代表考虑s
中以i
为结尾的子串和p
中的j
为结尾的子串是否匹配。最终我们要求的结果为f[n][m]
。状态转移:也就是我们要考虑
f(i,j)
如何求得,前面说到了p
有三种字符,所以这里的状态转移也要分三种情况讨论:p[j]
为普通字符:匹配的条件是前面的字符匹配,同时s
中的第i
个字符和p
中的第j
位相同。f(i,j) = f(i - 1, j - 1) && s[i] == p[j]
。p[j]
为'.'
:匹配的条件是前面的字符匹配,s
中的第i
个字符可以是任意字符。
f(i,j) = f(i - 1, j - 1) && p[j] == '.'
。p[j]
为'*'
:读得p[j - 1]
的字符,例如为字符a
。 然后根据a*
实际匹配s
中a
的个数是 $0$ 个、$1$ 个、$2$ 个 …3.1. 当匹配为 $0$ 个:
f(i,j) = f(i, j - 2)
3.2. 当匹配为 $1$ 个:
f(i,j) = f(i - 1, j - 2) && (s[i] == p[j - 1] || p[j - 1] == '.')
3.3. 当匹配为 $2$ 个:
f(i,j) = f(i - 2, j - 2) && ((s[i] == p[j - 1] && s[i - 1] == p[j - 1]) || p[j] == '.')
我们知道,通过「枚举」来确定 *
到底匹配多少个 a
这样的做法,算法复杂度是很高的。
我们需要挖掘一些「性质」来简化这个过程。
代码:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30class Solution {
public boolean isMatch(String ss, String pp) {
// 技巧:往原字符头部插入空格,这样得到 char 数组是从 1 开始,而且可以使得 f[0][0] = true,可以将 true 这个结果滚动下去
int n = ss.length(), m = pp.length();
ss = " " + ss;
pp = " " + pp;
char[] s = ss.toCharArray();
char[] p = pp.toCharArray();
// f(i,j) 代表考虑 s 中的 1~i 字符和 p 中的 1~j 字符 是否匹配
boolean[][] f = new boolean[n + 1][m + 1];
f[0][0] = true;
for (int i = 0; i <= n; i++) {
for (int j = 1; j <= m; j++) {
// 如果下一个字符是 '*',则代表当前字符不能被单独使用,跳过
if (j + 1 <= m && p[j + 1] == '*' && p[j] != '*') continue;
// 对应了 p[j] 为普通字符和 '.' 的两种情况
if (i - 1 >= 0 && p[j] != '*') {
f[i][j] = f[i - 1][j - 1] && (s[i] == p[j] || p[j] == '.');
}
// 对应了 p[j] 为 '*' 的情况
else if (p[j] == '*') {
f[i][j] = (j - 2 >= 0 && f[i][j - 2]) || (i - 1 >= 0 && f[i - 1][j] && (s[i] == p[j - 1] || p[j - 1] == '.'));
}
}
}
return f[n][m];
}
}
- 时间复杂度:$n$ 表示
s
的长度,$m$ 表示p
的长度,总共 $n \times m$ 个状态。复杂度为 $O(n \times m)$ - 空间复杂度:使用了二维数组记录结果。复杂度为 $O(n \times m)$
动态规划本质上是枚举(不重复的暴力枚举),因此其复杂度很好分析,有多少个状态就要被计算多少次,复杂度就为多少。
最后
这是我们「刷穿 LeetCode」系列文章的第 No.10
篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。
在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。
为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:https://github.com/SharingSource/LogicStack-LeetCode 。
在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!