# 动态规划系列答疑篇

![](https://labuladong.github.io/pictures/souyisou1.png) **通知：算法可视化编辑器上线，[点击体验](https://labuladong.online/algo/intro/visualize/)！另外，建议你在我的 [网站](https://labuladong.online/algo/) 学习文章，体验更好。** **-----------** > tip：本文有视频版：[动态规划详解进阶](https://www.bilibili.com/video/BV1uv411W73P/)。建议关注我的 B 站账号，我会用视频领读的方式带大家学习那些稍有难度的算法技巧。本文是两年前发的 [动态规划答疑篇](https://mp.weixin.qq.com/s/qvlfyKBiXVX7CCwWFR-XKg) 的修订版，根据我的不断学习总结以及读者的评论反馈，我给扩展了更多内容，力求使本文成为继 [动态规划核心套路框架](https://labuladong.online/algo/fname.html?fname=动态规划详解进阶) 之后的一篇全面答疑文章。以下是正文。这篇文章就给你讲明白以下几个问题： 1、到底什么才叫「最优子结构」，和动态规划什么关系。 2、如何判断一个问题是动态规划问题，即如何看出是否存在重叠子问题。 3、为什么经常看到将 `dp` 数组的大小设置为 `n + 1` 而不是 `n`。 4、为什么动态规划遍历 `dp` 数组的方式五花八门，有的正着遍历，有的倒着遍历，有的斜着遍历。 ### 一、最优子结构详解「最优子结构」是某些问题的一种特定性质，并不是动态规划问题专有的。也就是说，很多问题其实都具有最优子结构，只是其中大部分不具有重叠子问题，所以我们不把它们归为动态规划系列问题而已。我先举个很容易理解的例子：假设你们学校有 10 个班，你已经计算出了每个班的最高考试成绩。那么现在我要求你计算全校最高的成绩，你会不会算？当然会，而且你不用重新遍历全校学生的分数进行比较，而是只要在这 10 个最高成绩中取最大的就是全校的最高成绩。我给你提出的这个问题就**符合最优子结构**：可以从子问题的最优结果推出更大规模问题的最优结果。让你算**每个班**的最优成绩就是子问题，你知道所有子问题的答案后，就可以借此推出**全校**学生的最优成绩这个规模更大的问题的答案。你看，这么简单的问题都有最优子结构性质，只是因为显然没有重叠子问题，所以我们简单地求最值肯定用不出动态规划。再举个例子：假设你们学校有 10 个班，你已知每个班的最大分数差（最高分和最低分的差值）。那么现在我让你计算全校学生中的最大分数差，你会不会算？可以想办法算，但是肯定不能通过已知的这 10 个班的最大分数差推到出来。因为这 10 个班的最大分数差不一定就包含全校学生的最大分数差，比如全校的最大分数差可能是 3 班的最高分和 6 班的最低分之差。这次我给你提出的问题就**不符合最优子结构**，因为你没办通过每个班的最优值推出全校的最优值，没办法通过子问题的最优值推出规模更大的问题的最优值。前文 [动态规划详解](https://labuladong.online/algo/fname.html?fname=动态规划详解进阶) 说过，想满足最优子结，子问题之间必须互相独立。全校的最大分数差可能出现在两个班之间，显然子问题不独立，所以这个问题本身不符合最优子结构。 **那么遇到这种最优子结构失效情况，怎么办？策略是：改造问题**。对于最大分数差这个问题，我们不是没办法利用已知的每个班的分数差吗，那我只能这样写一段暴力代码： ```java int result = 0; for (Student a : school) { for (Student b : school) { if (a is b) continue; result = max(result, |a.score - b.score|); } } return result; ``` 改造问题，也就是把问题等价转化：最大分数差，不就等价于最高分数和最低分数的差么，那不就是要求最高和最低分数么，不就是我们讨论的第一个问题么，不就具有最优子结构了么？那现在改变思路，借助最优子结构解决最值问题，再回过头解决最大分数差问题，是不是就高效多了？当然，上面这个例子太简单了，不过请读者回顾一下，我们做动态规划问题，是不是一直在求各种最值，本质跟我们举的例子没啥区别，无非需要处理一下重叠子问题。前文不 [同定义不同解法](https://labuladong.online/algo/fname.html?fname=动态规划之四键键盘) 和 [高楼扔鸡蛋问题](https://labuladong.online/algo/fname.html?fname=高楼扔鸡蛋问题) 就展示了如何改造问题，不同的最优子结构，可能导致不同的解法和效率。再举个常见但也十分简单的例子，求一棵二叉树的最大值，不难吧（简单起见，假设节点中的值都是非负数）： ```java int maxVal(TreeNode root) { if (root == null) return -1; int left = maxVal(root.left); int right = maxVal(root.right); return max(root.val, left, right); } ``` 你看这个问题也符合最优子结构，以 `root` 为根的树的最大值，可以通过两边子树（子问题）的最大值推导出来，结合刚才学校和班级的例子，很容易理解吧。当然这也不是动态规划问题，旨在说明，最优子结构并不是动态规划独有的一种性质，能求最值的问题大部分都具有这个性质；**但反过来，最优子结构性质作为动态规划问题的必要条件，一定是让你求最值的**，以后碰到那种恶心人的最值题，思路往动态规划想就对了，这就是套路。动态规划不就是从最简单的 base case 往后推导吗，可以想象成一个链式反应，以小博大。但只有符合最优子结构的问题，才有发生这种链式反应的性质。找最优子结构的过程，其实就是证明状态转移方程正确性的过程，方程符合最优子结构就可以写暴力解了，写出暴力解就可以看出有没有重叠子问题了，有则优化，无则 OK。这也是套路，经常刷题的读者应该能体会。这里就不举那些正宗动态规划的例子了，读者可以翻翻历史文章，看看状态转移是如何遵循最优子结构的，这个话题就聊到这，下面再来看其他的动态规划迷惑行为。 ### 二、如何一眼看出重叠子问题经常有读者说：看了前文 [动态规划核心套路](https://labuladong.online/algo/fname.html?fname=动态规划详解进阶)，我知道了如何一步步优化动态规划问题；看了前文 [动态规划设计：数学归纳法](https://labuladong.online/algo/fname.html?fname=动态规划设计：最长递增子序列)，我知道了利用数学归纳法写出暴力解（状态转移方程）。 **但就算我写出了暴力解，我很难判断这个解法是否存在重叠子问题**，从而无法确定是否可以运用备忘录等方法去优化算法效率。对于这个问题，其实我在动态规划系列的文章中写过几次，在这里再统一总结一下吧。 **首先，最简单粗暴的方式就是画图，把递归树画出来，看看有没有重复的节点**。比如最简单的例子，[动态规划核心套路](https://labuladong.online/algo/fname.html?fname=动态规划详解进阶) 中斐波那契数列的递归树： ![](https://labuladong.github.io/pictures/动态规划详解进阶/1.jpg) 这棵递归树很明显存在重复的节点，所以我们可以通过备忘录避免冗余计算。但毕竟斐波那契数列问题太简单了，实际的动态规划问题比较复杂，比如二维甚至三维的动态规划，当然也可以画递归树，但不免有些复杂。比如在 [最小路径和问题](https://labuladong.online/algo/fname.html?fname=最小路径和) 中，我们写出了这样一个暴力解法： ```java int dp(int[][] grid, int i, int j) { if (i == 0 && j == 0) { return grid[0][0]; } if (i < 0 || j < 0) { return Integer.MAX_VALUE; } return Math.min( dp(grid, i - 1, j), dp(grid, i, j - 1) ) + grid[i][j]; } ``` 你不需要读过前文，光看这个函数代码就能看出来，该函数递归过程中参数 `i, j` 在不断变化，即「状态」是 `(i, j)` 的值，你是否可以判断这个解法是否存在重叠子问题呢？假设输入的 `i = 8, j = 7`，二维状态的递归树如下图，显然出现了重叠子问题： ![](https://labuladong.github.io/pictures/最优子结构/2.jpeg) **但稍加思考就可以知道，其实根本没必要画图，可以通过递归框架直接判断是否存在重叠子问题**。具体操作就是直接删掉代码细节，抽象出该解法的递归框架： ```java int dp(int[][] grid, int i, int j) { dp(grid, i - 1, j), // #1 dp(grid, i, j - 1) // #2 } ``` 可以看到 `i, j` 的值在不断减小，那么我问你一个问题：如果我想从状态 `(i, j)` 转移到 `(i-1, j-1)`，有几种路径？显然有两种路径，可以是 `(i, j) -> #1 -> #2` 或者 `(i, j) -> #2 -> #1`，不止一种，说明 `(i-1, j-1)` 会被多次计算，所以一定存在重叠子问题。再举个稍微复杂的例子，前文 [正则表达式问题](https://labuladong.online/algo/fname.html?fname=动态规划之正则表达) 的暴力解代码： ```cpp bool dp(string& s, int i, string& p, int j) { int m = s.size(), n = p.size(); if (j == n) return i == m; if (i == m) { if ((n - j) % 2 == 1) return false; for (; j + 1 < n; j += 2) { if (p[j + 1] != '*') return false; } return true; } if (s[i] == p[j] || p[j] == '.') { if (j < n - 1 && p[j + 1] == '*') { return dp(s, i, p, j + 2) || dp(s, i + 1, p, j); } else { return dp(s, i + 1, p, j + 1); } } else if (j < n - 1 && p[j + 1] == '*') { return dp(s, i, p, j + 2); } return false; } ``` 代码有些复杂对吧，如果画图的话有些麻烦，但我们不画图，直接忽略所有细节代码和条件分支，只抽象出递归框架： ```cpp bool dp(string& s, int i, string& p, int j) { dp(s, i, p, j + 2); // #1 dp(s, i + 1, p, j); // #2 dp(s, i + 1, p, j + 1); // #3 } ``` 和上一题一样，这个解法的「状态」也是 `(i, j)` 的值，那么我继续问你问题：如果我想从状态 `(i, j)` 转移到 `(i+2, j+2)`，有几种路径？显然，至少有两条路径：`(i, j) -> #1 -> #2 -> #2` 和 `(i, j) -> #3 -> #3`，这就说明这个解法存在巨量重叠子问题。所以，不用画图就知道这个解法也存在重叠子问题，需要用备忘录技巧去优化。 ### 三、dp 数组的大小设置比如说前文 [编辑距离问题](https://labuladong.online/algo/fname.html?fname=编辑距离)，我首先讲的是自顶向下的递归解法，实现了这样一个 `dp` 函数： ```java int minDistance(String s1, String s2) { int m = s1.length(), n = s2.length(); // 按照 dp 函数的定义，计算 s1 和 s2 的最小编辑距离 return dp(s1, m - 1, s2, n - 1); } // 定义：s1[0..i] 和 s2[0..j] 的最小编辑距离是 dp(s1, i, s2, j) int dp(String s1, int i, String s2, int j) { // 处理 base case if (i == -1) { return j + 1; } if (j == -1) { return i + 1; } // 进行状态转移 if (s1.charAt(i) == s2.charAt(j)) { return dp(s1, i - 1, s2, j - 1); } else { return min( dp(s1, i, s2, j - 1) + 1, dp(s1, i - 1, s2, j) + 1, dp(s1, i - 1, s2, j - 1) + 1 ); } } ``` 然后改造成了自底向上的迭代解法： ```java int minDistance(String s1, String s2) { int m = s1.length(), n = s2.length(); // 定义：s1[0..i] 和 s2[0..j] 的最小编辑距离是 dp[i+1][j+1] int[][] dp = new int[m + 1][n + 1]; // 初始化 base case for (int i = 1; i <= m; i++) dp[i][0] = i; for (int j = 1; j <= n; j++) dp[0][j] = j; // 自底向上求解 for (int i = 1; i <= m; i++) { for (int j = 1; j <= n; j++) { // 进行状态转移 if (s1.charAt(i-1) == s2.charAt(j-1)) { dp[i][j] = dp[i - 1][j - 1]; } else { dp[i][j] = min( dp[i - 1][j] + 1, dp[i][j - 1] + 1, dp[i - 1][j - 1] + 1 ); } } } // 按照 dp 数组的定义，存储 s1 和 s2 的最小编辑距离 return dp[m][n]; } ``` 这两种解法思路是完全相同的，但就有读者提问，为什么迭代解法中的 `dp` 数组初始化大小要设置为 `int[m+1][n+1]`？为什么 `s1[0..i]` 和 `s2[0..j]` 的最小编辑距离要存储在 `dp[i+1][j+1]` 中，有一位索引偏移？能不能模仿 `dp` 函数的定义，把 `dp` 数组初始化为 `int[m][n]`，然后让 `s1[0..i]` 和 `s2[0..j]` 的最小编辑距离要存储在 `dp[i][j]` 中？ **理论上，你怎么定义都可以，只要根据定义处理好 base case 就可以**。你看 `dp` 函数的定义，`dp(s1, i, s2, j)` 计算 `s1[0..i]` 和 `s2[0..j]` 的编辑距离，那么 `i, j` 等于 -1 时代表空串的 base case，所以函数开头处理了这两种特殊情况。再看 `dp` 数组，你当然也可以定义 `dp[i][j]` 存储 `s1[0..i]` 和 `s2[0..j]` 的编辑距离，但问题是 base case 怎么搞？索引怎么能是 -1 呢？所以我们把 `dp` 数组初始化为 `int[m+1][n+1]`，让索引整体偏移一位，把索引 0 留出来作为 base case 表示空串，然后定义 `dp[i+1][j+1]` 存储 `s1[0..i]` 和 `s2[0..j]` 的编辑距离。 ### 四、dp 数组的遍历方向我相信读者做动态规问题时，肯定会对 `dp` 数组的遍历顺序有些头疼。我们拿二维 `dp` 数组来举例，有时候我们是正向遍历： ```java int[][] dp = new int[m][n]; for (int i = 0; i < m; i++) for (int j = 0; j < n; j++) // 计算 dp[i][j] ``` 有时候我们反向遍历： ```java for (int i = m - 1; i >= 0; i--) for (int j = n - 1; j >= 0; j--) // 计算 dp[i][j] ``` 有时候可能会斜向遍历： ```java // 斜着遍历数组 for (int l = 2; l <= n; l++) { for (int i = 0; i <= n - l; i++) { int j = l + i - 1; // 计算 dp[i][j] } } ``` 甚至更让人迷惑的是，有时候发现正向反向遍历都可以得到正确答案，比如我们在 [团灭股票问题](https://labuladong.online/algo/fname.html?fname=团灭股票问题) 中有的地方就正反皆可。如果仔细观察的话可以发现其中的原因，你只要把住两点就行了： **1、遍历的过程中，所需的状态必须是已经计算出来的**。 **2、遍历结束后，存储结果的那个位置必须已经被计算出来**。下面来具体解释上面两个原则是什么意思。比如编辑距离这个经典的问题，详解见前文 [编辑距离详解](https://labuladong.online/algo/fname.html?fname=编辑距离)，我们通过对 `dp` 数组的定义，确定了 base case 是 `dp[..][0]` 和 `dp[0][..]`，最终答案是 `dp[m][n]`；而且我们通过状态转移方程知道 `dp[i][j]` 需要从 `dp[i-1][j]`, `dp[i][j-1]`, `dp[i-1][j-1]` 转移而来，如下图： ![](https://labuladong.github.io/pictures/最优子结构/1.jpg) 那么，参考刚才说的两条原则，你该怎么遍历 `dp` 数组？肯定是正向遍历： ```java for (int i = 1; i < m; i++) for (int j = 1; j < n; j++) // 通过 dp[i-1][j], dp[i][j - 1], dp[i-1][j-1] // 计算 dp[i][j] ``` 因为，这样每一步迭代的左边、上边、左上边的位置都是 base case 或者之前计算过的，而且最终结束在我们想要的答案 `dp[m][n]`。再举一例，回文子序列问题，详见前文 [子序列问题模板](https://labuladong.online/algo/fname.html?fname=子序列问题模板)，我们通过过对 `dp` 数组的定义，确定了 base case 处在中间的对角线，`dp[i][j]` 需要从 `dp[i+1][j]`, `dp[i][j-1]`, `dp[i+1][j-1]` 转移而来，想要求的最终答案是 `dp[0][n-1]`，如下图： ![](https://labuladong.github.io/pictures/最长回文子序列/4.jpg) 这种情况根据刚才的两个原则，就可以有两种正确的遍历方式： ![](https://labuladong.github.io/pictures/最长回文子序列/5.jpg) 要么从左至右斜着遍历，要么从下向上从左到右遍历，这样才能保证每次 `dp[i][j]` 的左边、下边、左下边已经计算完毕，得到正确结果。现在，你应该理解了这两个原则，主要就是看 base case 和最终结果的存储位置，保证遍历过程中使用的数据都是计算完毕的就行，有时候确实存在多种方法可以得到正确答案，可根据个人口味自行选择。

引用本文的文章

- [一个方法团灭 LeetCode 股票买卖问题](https://labuladong.online/algo/fname.html?fname=团灭股票问题) - [分治算法详解：运算优先级](https://labuladong.online/algo/fname.html?fname=分治算法) - [动态规划之子序列问题解题模板](https://labuladong.online/algo/fname.html?fname=子序列问题模板) - [动态规划解题套路框架](https://labuladong.online/algo/fname.html?fname=动态规划详解进阶) - [对动态规划进行降维打击](https://labuladong.online/algo/fname.html?fname=状态压缩技巧) - [经典动态规划：博弈问题](https://labuladong.online/algo/fname.html?fname=动态规划之博弈问题) - [经典动态规划：戳气球](https://labuladong.online/algo/fname.html?fname=扎气球) - [经典动态规划：正则表达式](https://labuladong.online/algo/fname.html?fname=动态规划之正则表达)

引用本文的题目

安装 [我的 Chrome 刷题插件](https://labuladong.online/algo/intro/chrome/) 点开下列题目可直接查看解题思路： | LeetCode | 力扣 | | :----: | :----: | | [115. Distinct Subsequences](https://leetcode.com/problems/distinct-subsequences/?show=1) | [115. 不同的子序列](https://leetcode.cn/problems/distinct-subsequences/?show=1) | | [139. Word Break](https://leetcode.com/problems/word-break/?show=1) | [139. 单词拆分](https://leetcode.cn/problems/word-break/?show=1) | | [221. Maximal Square](https://leetcode.com/problems/maximal-square/?show=1) | [221. 最大正方形](https://leetcode.cn/problems/maximal-square/?show=1) | | [256. Paint House](https://leetcode.com/problems/paint-house/?show=1)🔒 | [256. 粉刷房子](https://leetcode.cn/problems/paint-house/?show=1)🔒 | | [343. Integer Break](https://leetcode.com/problems/integer-break/?show=1) | [343. 整数拆分](https://leetcode.cn/problems/integer-break/?show=1) | | [576. Out of Boundary Paths](https://leetcode.com/problems/out-of-boundary-paths/?show=1) | [576. 出界的路径数](https://leetcode.cn/problems/out-of-boundary-paths/?show=1) | | [63. Unique Paths II](https://leetcode.com/problems/unique-paths-ii/?show=1) | [63. 不同路径 II](https://leetcode.cn/problems/unique-paths-ii/?show=1) | | [91. Decode Ways](https://leetcode.com/problems/decode-ways/?show=1) | [91. 解码方法](https://leetcode.cn/problems/decode-ways/?show=1) | | - | [剑指 Offer II 091. 粉刷房子](https://leetcode.cn/problems/JEj789/?show=1) | | - | [剑指 Offer II 097. 子序列的数目](https://leetcode.cn/problems/21dk04/?show=1) |

**＿＿＿＿＿＿＿＿＿＿＿＿＿** **《labuladong 的算法笔记》已经出版，关注公众号查看详情；后台回复「**全家桶**」可下载配套 PDF 和刷题全家桶**： ![](https://labuladong.github.io/pictures/souyisou2.png) ======其他语言代码====== ### javascript 正向遍历 ```js // 构建m*n的矩阵 let dp = new Array(m).fill(new Array(n)) for (let i = 0; i < m; i++) for (let j = 0; j < n; j++) // 计算 dp[i][j] ``` 反向遍历 ```js for (let i = m - 1; i >= 0; i--) for (let j = n - 1; j >= 0; j--) // 计算 dp[i][j] ``` 斜向遍历 ```js // 斜着遍历数组 for (let l = 2; l <= n; l++) { for (let i = 0; i <= n - l; i++) { let j = l + i - 1; // 计算 dp[i][j] } } ```