一个很有意思的数列变换问题

2017/12/25 posted in  数学随笔

已知数列 \(\{a_n\}\) 和 \(\{b_n\}\), 其中 \(n \ge 0\) (即两个数列的首项分别为 \(a_0\) 和 \(b_0\)). 若满足
\[
b_n = \sum_{k=0}^n (-1)^k C_n^k a_k
\,, \quad \forall n \in \mathbb N.
\]
求证:
\[
a_n = \sum_{k=0}^n (-1)^k C_n^k b_k
\,, \quad \forall n \in \mathbb N.
\]

证明

这里先给出证明, 如果你读这个证明过程毫无压力, 那就说明你对 \(\sum\) 求和符号的理解和运用已经非常熟练了.
如果觉得看不懂, 那么可以先跳过这一节, 看看后面的文字分析, 理解了以后再回来对照着看这个证明过程.
\[
\begin{aligned}
\sum_{k=0}^n (-1)^k C_n^k b_k
&= \sum_{k=0}^n (-1)^k C_n^k \cdot \sum_{l=0}^k (-1)^l C_k^l a_l \\
&= \sum_{k=0}^n \sum_{l=0}^k (-1)^k C_n^k \cdot (-1)^l C_k^l a_l \\
&= \sum_{\color{red}{l=0}}^n \sum_{\color{red}{k=l}}^n (-1)^k C_n^k \cdot (-1)^l C_k^l a_l \\
&= \sum_{l=0}^n (-1)^l a_l \sum_{k=l}^n (-1)^k C_n^k C_k^l \\
&= \sum_{l=0}^n (-1)^l a_l \sum_{k=l}^n (-1)^k C_n^l C_{n-l}^{k-l} \\
&= \sum_{l=0}^n (-1)^l C_n^l a_l \sum_{k=l}^n (-1)^l (-1)^{k-l} C_{n-l}^{k-l} \\
&= \sum_{l=0}^n C_n^l a_l \sum_{k=l}^n (-1)^{k-l} C_{n-l}^{k-l}
\end{aligned}
\]
注意最后一步中最后面的这个表达式 \(\sum\limits_{k=l}^n (-1)^{k-l} C_{n-l}^{k-l}\), 显然它的取值只跟 \(n\) 和 \(l\) 有关, 我们把它记作 \(F(n,l)\), 于是
\[ \tag{1}
\sum_{k=0}^n (-1)^k C_n^k b_k = \sum_{l=0}^n C_n^l a_l \cdot F(n,l)
\]
不妨做一下换元 \(j=k-l\), 那么
\[
F(n,l) = \sum_{j=0}^{n-l} (-1)^j C_{n-l}^j
\]
注意当 \(n-l > 0\), \(F(n,l) = [1+(-1)]^{n-l} = 0\); 但如果 \(n-l =0\), 情况会有点不一样, 此时 \(F(n,l) = \sum\limits_{j=0}^{0} (-1)^j C_{n-l}^j = (-1)^0 C_0^0 = 1\). 也就是说
\[
F(n,l) = \begin{cases} 1, & n=l \\ 0, & n>l \end{cases}
\]
因此, (1) 式右边的 \(\sum\) 和式中只有 \(l=n\) 时的那一项 (也就是最后一项) 非零, 因此
\[
\sum_{k=0}^n (-1)^k C_n^k b_k = C_n^n a_n \cdot F(n,n) = a_n
\]
这就完成了证明.

问题浅析

如果你对 \(\sum\) 符号的性质和变换技巧不熟, 那么这个题目最大的问题还是题干的叙述方式看上去很晦涩, 复杂的公式符号隐藏了它想表达的数学本质.

想解决这个问题其实也没有多么大的数学技巧, 就是不厌其烦, 勤勤恳恳, 简单粗暴的把这些公式的初等形式写出来.

题目的已知条件就是: \(\forall n \in \mathbb N\),
\[
b_n = C_n^0 a_0 - C_n^1 a_1 + C_n^2 a_2 - \dots + (-1)^n C_n^n a_n
\]
这个式子中恐怕仍看不出什么所以然, 那么只好给 \(n\) 取几个简单值试试, 找找规律了:
\[
\begin{aligned}
b_0 &= a_0 \\
b_1 &= a_0 - a_1 \\
b_2 &= a_0 - 2 a_1 + a_2 \\
b_3 &= a_0 - 3 a_1 + 3 a_2 - a_3 \\
& \vdots
\end{aligned}
\]
然后题目需要你证明的是 \(\forall n \in \mathbb N\),
\[
a_n = C_n^0 b_0 - C_n^1 b_1 + C_n^2 b_2 - \dots + (-1)^n C_n^n b_n
\]
也就是
\[
\begin{aligned}
a_0 &= b_0 \\
a_1 &= b_0 - b_1 \\
a_2 &= b_0 - 2 b_1 + b_2 \\
a_3 &= b_0 - 3 b_1 + 3 b_2 - b_3 \\
& \vdots
\end{aligned}
\]

稍加尝试就会发现, 上面这组式子中的每一个证明起来都不是很难, 只不过越到后面的式子, 项数越多, 验证起来越繁琐. 并且最麻烦的问题在于, 我们不可能通过逐个一一验证的方式来证明这组式子, 因为它有无穷多个.

所以必须得能够给出一个形式上统一的证明过程, 这个证明过程的每一步变形都会包含字母 \(n\), 从而能适用于待证结论中的所有项.

但写到这里, 你也应该能发现, 这样一个证明过程的思路应该很明确了, 它需要的最关键的东西不是数学技巧, 而是耐心.

要证明
\[
a_n = C_n^0 b_0 - C_n^1 b_1 + C_n^2 b_2 - \dots + (-1)^n C_n^n b_n
\]
这个式子的右边等于
\[
\begin{aligned}
& \phantom{{}+{}} C_n^0 (C_0^0 a_0) \\
& - C_n^1 (C_1^0 a_0 - C_1^1 a_1) \\
& + C_n^2 (C_2^0 a_0 - C_2^1 a_1 + C_2^2 a_2) \\
& - C_n^3 (C_3^0 a_0 - C_3^1 a_1 + C_3^2 a_2 - C_3^3 a_3) \\
& \vdots \\
& + (-1)^n C_n^n (C_n^0 a_0 - C_n^1 a_1 + C_n^2 a_2 - \dots + (-1)^n C_n^n a_n)
\end{aligned}
\]
接下来显然应该按照数列 \(\{a_n\}\) 的项重新合并同类项
\[
\begin{aligned}
& \phantom{{}+{}} (C_n^0 C_0^0 - C_n^1 C_1^0 + C_n^2 C_2^0 - C_n^3 C_3^0 + \dots + (-1)^n C_n^n C_n^0) \cdot a_0 \\
& + (C_n^1 C_1^1 - C_n^2 C_2^1 + C_n^3 C_3^1 - \dots + (-1)^{n-1} C_n^n C_n^1) \cdot a_1 \\
& + (C_n^2 C_2^2 - C_n^3 C_3^2 + \dots + (-1)^{n-2} C_n^n C_n^2) \cdot a_2 \\
& \vdots \\
& + (C_n^{n-1} C_{n-1}^{n-1} - C_n^n C_n^{n-1}) \cdot a_{n-1} \\
& + (C_n^n C_n^n) \cdot a_n
\end{aligned}
\]
这样, 我们需要证明的就是除了最后一项 \(a_n\) 以外, 其余各项的系数都恰好能抵消为零. 这些不用 \(\sum\) 符号的初等形式虽然繁琐, 但能帮助我们找到问题的本质. 上一小节中的那个晦涩的证明过程其实也就是在完成这些证明工作.

一个有意思的矩阵性质

这个题目中所描述的两个数列之间的变换关系, 如果用矩阵形式来表示, 会得到一个有意思的结论.

考虑两个数列的前 \(n+1\) 项 (\(a_0, \dots, a_n\) 以及 \(b_0, \dots, b_n\)), 根据已知条件有
\[
\begin{pmatrix}
b_0 \\ b_1 \\ b_2 \\ \vdots \\ b_n
\end{pmatrix}
= \begin{pmatrix}
C_0^0 & 0 & 0 & \cdots & 0 \\
C_1^0 & -C_1^1 & 0 & \cdots & 0 \\
C_2^0 & -C_2^1 & C_2^2 & \cdots & 0 \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
C_n^0 & -C_n^1 & C_n^2 & \cdots & C_n^n
\end{pmatrix}
\begin{pmatrix}
a_0 \\ a_1 \\ a_2 \\ \vdots \\ a_n
\end{pmatrix}
\]
下面把中间这个矩阵记作 \(\mathbf A_n\). 例如 \(\mathbf A_0 = \begin{pmatrix} 1 \end{pmatrix}\), \(\mathbf A_1 = \begin{pmatrix} 1 & 0 \\ 1 & -1\end{pmatrix}\), \(\mathbf A_2 = \begin{pmatrix} 1 & 0 & 0 \\ 1 & -1 & 0 \\ 1 & -2 & 1 \end{pmatrix}\); 对于 \(n=3\) 的情况有
\[
\mathbf A_3 = \begin{pmatrix}
1 & 0 & 0 & 0 \\
1 & -1 & 0 & 0 \\
1 & -2 & 1 & 0 \\
1 & -3 & 3 & -1
\end{pmatrix}
\]
根据已知条件有
\[
\begin{pmatrix}
b_0 \\ b_1 \\ b_2 \\ b_3
\end{pmatrix}
= \mathbf A_3
\begin{pmatrix}
a_0 \\ a_1 \\ a_2 \\ a_3
\end{pmatrix}
\]
而如果待证结论成立, 就有
\[
\begin{pmatrix}
a_0 \\ a_1 \\ a_2 \\ a_3
\end{pmatrix}
= \mathbf A_3
\begin{pmatrix}
b_0 \\ b_1 \\ b_2 \\ b_3
\end{pmatrix}
= \mathbf A_3 \cdot \mathbf A_3
\begin{pmatrix}
a_0 \\ a_1 \\ a_2 \\ a_3
\end{pmatrix}
\]
这就意味着 \(\mathbf A_3 \cdot \mathbf A_3\) 应该是 4 阶单位矩阵. 进一步我们知道所有的 \(\mathbf A_n \cdot \mathbf A_n\) 应该是 4 阶单位矩阵.