10.3 马尔可夫矩阵、人口和经济

本节内容是关于正矩阵（postive matrices）： 每个元素 $a_{ij}>0$ ，它核心的结论是：最大的特征值为正实数，其对应的特征向量也是如此。 在经济学、生态学、人口动力系统和随机游走过程中都充分运用了该结论： $Consumption:λmax<1\begin{array}{rl}\color{blue}\pmb{马尔可夫矩阵\,\textrm{Markov}}:&\lambda_{\textrm{max}}=1\\\color{blue}\pmb{人口动力系统\,\textrm{Population}}:&\lambda_{\textrm{max}}>1\\\color{blue}\pmb{消耗矩阵\,\textrm{Consumption}}:&\lambda_{\textrm{max}}<1\end{array}$ $λmax\lambda_{\textrm{max}}$ 控制着 $A$ 的幂的增长速度。我们先看 $λmax=1\lambda_{\textrm{max}}=1$ 的情况。

一、马尔可夫矩阵

在一个正向量 $u0\boldsymbol u_0$ 重复左乘矩阵 $A$ ： $matrixA=[0.80.30.20.7]u1=Au0,u2=Au1=A2u0\begin{array}{c}\pmb{马尔可夫矩阵}\\{\pmb{\textrm{Markov matrix}}}\end{array}\kern 15ptA=\begin{bmatrix}0.8&0.3\\0.2&0.7\end{bmatrix}\kern 5pt\boldsymbol u_1=A\boldsymbol u_0,\kern 5pt\boldsymbol u_2=A\boldsymbol u_1=A^2\boldsymbol u_0$ 进行 $k$ 步后，我们得到 $Aku0A^k\boldsymbol u_0$ ，向量 $u1,u2,u3,⋯\boldsymbol u_1,\boldsymbol u_2,\boldsymbol u_3,\cdots$ 会趋于 “稳定状态” $u∞=(0.6,0.4)\boldsymbol u_{\infty}=(0.6,0.4)$ ，这最终的结果并不取决于起始向量 $u0\boldsymbol u_0$ ，每个 $u0=(a,1−a)\boldsymbol u_0=(a,1-a)$ 都会收敛于 $u∞=(0.6,0.4)\boldsymbol u_{\infty}=(0.6,0.4)$ . 为什么呢？
稳态方程 $Au∞=u∞A\boldsymbol u_{\infty}=\boldsymbol u_{\infty}$ 表明 $u∞\boldsymbol u_{\infty}$ 为对应了特征值为 $1$ 的特征向量： $state[0.80.30.20.7][0.60.4]=[0.60.4]=u∞\begin{array}{c}\pmb{稳定状态}\\\pmb{\textrm{Steady state}}\end{array}\kern 15pt\begin{bmatrix}0.8&0.3\\0.2&0.7\end{bmatrix}\begin{bmatrix}0.6\\0.4\end{bmatrix}=\begin{bmatrix}0.6\\0.4\end{bmatrix}=\boldsymbol u_{\infty}$ 左乘 $A$ 不会改变 $u∞\boldsymbol u_{\infty}$ ，但是这还不能解释为什么那么多的向量 $u0\boldsymbol u_0$ 一直用 $A$ 左乘最终收敛于 $u∞\boldsymbol u_{\infty}$ . 其它的例子也可能会有一个稳态，但是却没那么吸引人： $不是马尔可夫矩阵B=[1002]有一个不那么吸引人的稳态B[10]=[10]\pmb{不是马尔可夫矩阵}\kern 15ptB=\begin{bmatrix}1&0\\0&2\end{bmatrix}\kern 5pt有一个不那么吸引人的稳态\kern 5ptB\begin{bmatrix}1\\0\end{bmatrix}=\begin{bmatrix}1\\0\end{bmatrix}$ 这种情形，如果将初始向量 $u0=(0,1)\boldsymbol u_0=(0,1)$ 将会得出 $u1=(0,2)\boldsymbol u_1=(0,2)$ 和 $u2=(0,4)\boldsymbol u_2=(0,4)$ ，第二个分量每次都翻倍。用特征值的语言来描述， $B$ 有一个特征值 $λ=1\lambda=1$ ，同时也有一个特征值 $λ=2\lambda=2$ ，而后一个特征值产生了不稳定性。 $u0\boldsymbol u_0$ 沿着不稳定特征向量的分量会一直乘 $λ\lambda$ ，而 $∣λ∣>1|\lambda|>1$ 意味着会爆炸。
这一节是讨论确保 $A$ 有稳定状态的两个特殊性质，这些性质定义了一个正的马尔可夫矩阵，上面的 $A$ 就是一个特例：

马尔可夫矩阵 $1.\kern 20pt\begin{array}{l}\color{blue}1、A\,的每个元素都是正的：a_{ij}>0\\\color{blue}2、A\,的每一列元素加起来都是 \,1.\end{array}$

注：需要注意的是，上述的定义是针对的是正的马尔可夫矩阵，而马尔可夫矩阵的性质 $1$ 仅要求元素非负。

上面的矩阵 $B$ 的第 $2$ 列加起来是 $2$ ，不是 $1$ ，所以它不是马尔可夫矩阵。当 $A$ 为马尔可夫矩阵时，可以立刻得到两个事实：
由性质 $1$ ： $A$ 左乘 $u0≥0\boldsymbol u_0\ge0$ 会得到一个非负向量 $u1=Au0≥0\boldsymbol u_1=A\boldsymbol u_0\ge0$ .
由性质 $2$ ：如果 $u0\boldsymbol u_0$ 的分量相加为 $1$ ，则 $u1=Au0\boldsymbol u_1=A\boldsymbol u_0$ 分量的和也为 $1$ .
原因： 当 $[11⋯1]\begin{bmatrix}1&1&\cdots&1\end{bmatrix}$ $u0=1\boldsymbol u_0=1$ 时， $u0\boldsymbol u_0$ 分量的和为 $1$ . 由性质 $2$ 可知这对 $A$ 的每一列都成立，则由矩阵乘法 $[11⋯1]A=[11⋯1]\begin{bmatrix}1&1&\cdots&1\end{bmatrix}A=\begin{bmatrix}1&1&\cdots&1\end{bmatrix}$ ： $1[11⋯1]Au0=[11⋯1]u0=1\color{blue}A\boldsymbol u_0\,分量的和为\,1\kern 17pt\begin{bmatrix}1&1&\cdots&1\end{bmatrix}A\boldsymbol u_0=\begin{bmatrix}1&1&\cdots&1\end{bmatrix}\boldsymbol u_0=1$ 这个事实同样可以用在 $u2=Au1\boldsymbol u_2=A\boldsymbol u_1$ 和 $u3=Au2\boldsymbol u_3=A\boldsymbol u_2$ 上。所以可知每个向量 $Aku0A^k\boldsymbol u_0$ 都是非负的，且它的分量求和都为 $1$ . 这些是 “概率向量 probability vectors”，极限 $u∞\boldsymbol u_{\infty}$ 也是一个概率向量 —— 但是我们还需要证明这个极限存在。后面会证明对于一个正的马尔可夫矩阵有 $λmax=1\lambda_{\textrm{max}}=1$ .

【例1】设丹佛（Denver）的租用车占全国的比例开始为 $150=0.02\dfrac{1}{50}=0.02$ ，丹佛外的地方占比为 $0.98$ . 每个月丹佛的汽车有 $80%80\%$ 留在丹佛，另外 $20%20\%$ 会离开；同时丹佛外的汽车会有 $5%5\%$ 进入丹佛，另外 $95%95\%$ 仍然留在丹佛外。这表明每个月结束，丹佛和丹佛以外的汽车占全国汽车的比例都用矩阵 $A$ 左乘一次 $u0=(0.02,0.98)\boldsymbol u_0=(0.02,0.98)$ ： $A=[0.800.050.200.95]推出u1=Au0=A[0.020.98]=[0.0650.935]\pmb{第一个月}\kern 15pt由\,\pmb{A=\begin{bmatrix}0.80&0.05\\0.20&0.95\end{bmatrix}}\kern 5pt推出\kern 5pt\boldsymbol u_1=A\boldsymbol u_0=A\begin{bmatrix}0.02\\0.98\end{bmatrix}=\begin{bmatrix}0.065\\0.935\end{bmatrix}$ 注意到 $0.065 + 0.935 = 1$ ，表明所有的汽车都计入了。每一步都用 $A$ 左乘： $下一个月u2=Au1=(0.09875,0.90125)=A2u0\pmb{下一个月}\kern 15pt\boldsymbol u_2=A\boldsymbol u_1=(0.09875,0.90125)=A^2\boldsymbol u_0$ 由于 $A$ 是正的，那么所有的这些向量都是正的。每个向量 $uk\boldsymbol u_k$ 的分量加起来都为 $1$ . 第一个分量从 $0.02$ 开始增长，表明汽车是在驶入丹佛。那么长时间以后会怎样呢？
这一节涉及了矩阵的幂。要理解 $A^k$ ，我们首先将其对角化，这是对角化最好的应用。 $A^k$ 可能会很复杂，但是对角矩阵 $Λk\Lambda^k$ 很简单，特征向量矩阵 $X$ 将它们联系了起来： $Ak=XΛkX−1A^k=X\Lambda^kX^{-1}$ . 马尔可夫矩阵的应用使用了特征值（在 $Λ\Lambda$ 中）和特征向量（在 $X$ 中）。下面证明 $u∞\boldsymbol u_{\infty}$ 是 $A$ 特征值 $λ=1\lambda=1$ 对应的特征向量。
因为 $A$ 每列元素相加都等于 $1$ ，这表明什么也没失去，同时什么也没得到。比如我们移动租用汽车或人口，没有汽车或人口的突然出现（或消失）。如果向量的分量和为 $1$ ，那么用矩阵 $A$ 左乘这个向量该性质将会保持。那么现在的问题是在我们用矩阵 $A$ 左乘 $k$ 次后这个向量的分量是如何分布的 —— 这就导出了 $A^k$ 的性质。
解： $Aku0A^k\boldsymbol u_0$ 给出了在第 $k$ 个月后丹佛内和丹佛外汽车的比例。我们将 $A$ 对角化以理解 $A^k$ 的性质。 $A$ 的特征值是 $λ=1\lambda=\pmb1$ 和 $0.75\pmb{0.75}$ （迹为 $1.75$ ）. $Ax=λxA[0.20.8]=1[0.20.8],A[−11]=0.75[−11]{\color{blue}A\boldsymbol x=\lambda\boldsymbol x}\kern 15pt A\begin{bmatrix}0.2\\0.8\end{bmatrix}=1\begin{bmatrix}0.2\\0.8\end{bmatrix},\kern 15ptA\begin{bmatrix}-1\\\kern 7pt1\end{bmatrix}=0.75\begin{bmatrix}-1\\\kern 7pt1\end{bmatrix}$ 将起始向量 $u0\boldsymbol u_0$ 写成特征向量 $x1\boldsymbol x_1$ 和 $x2\boldsymbol x_2$ 的线性组合，这里系数分别为 $1$ 和 $0.18$ ： $特征向量的线性组合u0=[0.020.98]=[0.20.8]+0.18[−11]\pmb{特征向量的线性组合}\kern 20pt\boldsymbol u_0=\begin{bmatrix}0.02\\0.98\end{bmatrix}=\begin{bmatrix}0.2\\0.8\end{bmatrix}+0.18\begin{bmatrix}-1\\\kern 7pt1\end{bmatrix}$ 现在用 $A$ 左乘 $u0\boldsymbol u_0$ 求出 $u1\boldsymbol u_1$ ，特征向量将分别乘上特征值 $λ1=1\lambda_1=1$ 和 $λ2=0.75\lambda_2=0.75$ ： $λiu1=1[0.20.8]+(0.75)⋅(0.18)[−11]\pmb{每个\,\boldsymbol x_i\,都乘以对应的\,\lambda_i}\kern 20pt\boldsymbol u_1=1\begin{bmatrix}0.2\\0.8\end{bmatrix}+(0.75)\cdot(0.18)\begin{bmatrix}-1\\\kern 7pt1\end{bmatrix}$ 每过一个月，向量 $x2\boldsymbol x_2$ 都会多乘一次 $λ2=0.75\lambda_2=0.75$ ，而特征向量 $x_1$ 保持不变： $个月以后uk=Aku0=1k[0.20.8]+(0.75)k⋅(0.18)[−11]\pmb{k\,个月以后}\kern 20pt\boldsymbol u_k=A^k\boldsymbol u_0=1^k\begin{bmatrix}0.2\\0.8\end{bmatrix}+(0.75)^k\cdot(0.18)\begin{bmatrix}-1\\\kern 7pt1\end{bmatrix}$ 这个等式就揭示了 $uk\boldsymbol u_k$ 的实质。特征值 $λ=1\lambda=1$ 对应的特征向量 $x1\boldsymbol x_1$ 是稳定状态。 另一个特征向量 $x2\boldsymbol x_2$ 最终会消失，因为它所对应的特征值 $∣λ∣<1|\lambda|<1$ . 我们进行的步骤越多，就越接近 $u∞=(0.2,0.8)\boldsymbol u_{\infty}=(0.2,0.8)$ . 极限情况下， $210\dfrac{2}{10}$ 的汽车在丹佛，而 $810\dfrac{8}{10}$ 的汽车在丹佛外。这是马尔可夫链（Markov chains）的特征，即使初始向量 $u0=(0,1)\boldsymbol u_0=(0,1)$ 也是一样：

如果 $A$ 是一个正的马尔可夫矩阵（每个元素 $a_{ij}>0$ ，每列元素的和都为 $1$ ），则 $λ1=1\lambda_1=1$ 是最大的特征值，其对应的特征向量 $x1\boldsymbol x_1$ 是稳定状态：若 $u0=x1+c2x2+⋯+cnxn\boldsymbol u_0 = \boldsymbol x_1+c_2\boldsymbol x_2+\cdots+c_n\boldsymbol x_n$ ，则 $uk=x1+c2(λ2)kx2+⋯+cn(λn)kxn总是趋于u∞=x1\color{blue}\boldsymbol u_k=\boldsymbol x_1+c_2(\lambda_2)^k\boldsymbol x_2+\cdots+c_n(\lambda_n)^k\boldsymbol x_n\kern 15pt总是趋于\kern 10pt\boldsymbol u_{\infty}=\boldsymbol x_1$

第一点要明白的是， $λ=1\lambda=1$ 一定是 $A$ 的一个特征值。原因： $A - I$ 每列的元素相加为 $1 - 1 = 0$ ，则 $A - I$ 所有的行加起来是零行，所以这些行线性相关，那么 $A - I$ 是奇异的，它的行列式为零且 $λ=1\lambda=1$ 是 $A$ 的一个特征值。
第二点是没有满足 $∣λ∣>1|\lambda|>1$ 的特征值。因为若有这样的特征值， $A^k$ 将会一直增长。但是 $A^k$ 也是一个马尔可夫矩阵！即 $A^k$ 的元素均为正值，且每列元素之和仍然为 $1$ （保留了列元素和为 $1$ 的这个性质） —— 这没有留下让元素变大的空间。
还有一些特征值 $∣λ∣=1|\lambda|=1$ 的这样的矩阵也受到很多关注。

【例2】由于特征值 $λ2=−1\lambda_2=-1$ ，所以矩阵 $A=[0110]A=\begin{bmatrix}0&1\\1&0\end{bmatrix}$ 没有稳定状态。
这个矩阵每个月都将丹佛内外的所有汽车互换。 $A^k$ 交替等于 $A$ 和 $I$ 。第二个特征向量 $x2=(−1,1)\boldsymbol x_2=(-1,1)$ 每一步都会乘上 $λ2=−1\lambda_2=-1$ ，它并不会变小，所以没有稳定状态。
假设 $A$ 或 $A$ 的任意次幂的元素都是正的 —— 不允许为零。在这种 “正则 regular” 或 “本原 primitive” 的情况下， $λ=1\lambda=1$ 是严格大于其它特征值的。当 $k→∞k\rightarrow\infty$ 时，幂 $A^k$ 趋于每列都为稳定状态的秩一矩阵。

【例3】（“每个人都移动 Everbody moves”）我们从三组人数（向量 $u0\boldsymbol u_0$ ）开始。每一步，第 $1$ 组一半的人数进入第 $2$ 组，另一半人数进入第 $3$ 组。另外两组也将各自的人数平分两半后分别进去其他两组。下面是从最初的人口 $p_1,p_2,p_3$ 经过第一步： $新的人口u1=Au0=[012121201212120][p1p2p3]=[12p2+12p312p1+12p312p1+12p3]\pmb{新的人口}\kern 20pt\boldsymbol u_1=A\boldsymbol u_0=\begin{bmatrix}0&\dfrac{1}{2}&\dfrac{1}{2}\\[1.5ex]\dfrac{1}{2}&0&\dfrac{1}{2}\\[1.5ex]\dfrac{1}{2}&\dfrac{1}{2}&0\end{bmatrix}\begin{bmatrix}p_1\\p_2\\p_3\end{bmatrix}=\begin{bmatrix}\dfrac{1}{2}p_2+\dfrac{1}{2}p_3\\[1.5ex]\dfrac{1}{2}p_1+\dfrac{1}{2}p_3\\[1.5ex]\dfrac{1}{2}p_1+\dfrac{1}{2}p_3\end{bmatrix}$ $A$ 是一个马尔可夫矩阵，没有人口出生也没有人口死亡。 $A$ 含有零元素，例 $2$ 中的零元素带来了麻烦，但是这个例子中在两步后，零元素从 $A^2$ 中消失了： $两步矩阵u2=A2u0=[121414141214141414][p1p2p3]\pmb{两步矩阵}\kern 20pt\boldsymbol u_2=A^2\boldsymbol u_0=\begin{bmatrix}\dfrac{1}{2}&\dfrac{1}{4}&\dfrac{1}{4}\\[1.5ex]\dfrac{1}{4}&\dfrac{1}{2}&\dfrac{1}{4}\\[1.5ex]\dfrac{1}{4}&\dfrac{1}{4}&\dfrac{1}{4}\end{bmatrix}\begin{bmatrix}p_1\\p_2\\p_3\end{bmatrix}$ $A$ 的特征值是 $λ1=1\lambda_1=1$ （因为 $A$ 是马尔可夫矩阵）， $λ2=λ3=12\lambda_2=\lambda_3=\dfrac{1}{2}$ . 对于 $λ1=1\lambda_1=1$ ，特征向量 $x1=(13,13,13)\boldsymbol x_1=(\dfrac{1}{3},\dfrac{1}{3},\dfrac{1}{3})$ 会保持稳定状态。当三组人数相等时，再经过 “平方-移动” 人数仍然相等。若起始向量 $u0=(8,16,32)\boldsymbol u_0=(8,16,32)$ ，马尔可夫链趋于稳定状态： $u0=[81632]u1=[242012]u2=[161822]u3=[201917]\boldsymbol u_0=\begin{bmatrix}8\\16\\32\end{bmatrix}\kern 15pt\boldsymbol u_1=\begin{bmatrix}24\\20\\12\end{bmatrix}\kern 15pt\boldsymbol u_2=\begin{bmatrix}16\\18\\22\end{bmatrix}\kern 15pt\boldsymbol u_3=\begin{bmatrix}20\\19\\17\end{bmatrix}$ 第四步时 $u4\boldsymbol u_4$ 会出现将一个人分成两半的情况，这现实中不可能出现，但是这里假设人数可以为分数。每一步的总人口都是 $8 + 16 + 32 = 56$ ，稳定状态是 $56$ 乘 $(13,13,13)(\dfrac{1}{3},\dfrac{1}{3},\dfrac{1}{3})$ ，我们可以看到，这三组人数将趋近于它们的最终极限 $563\dfrac{56}{3}$ ，但是永远不可能达到。
根据网站之间的链接数量可以创建一个马尔可夫矩阵 $A$ ，稳定状态 $u∞\boldsymbol u_{\infty}$ 将给出谷歌的排名。谷歌通过跟随链接随机游走的方法得到 $u∞\boldsymbol u_{\infty}$ . 特征向量来自计算每个网站的访问比例 —— 这是一种快速计算稳定状态的方法。
第二个特征值的大小 $∣λ2∣|\lambda_2|$ 控制着收敛到稳定状态的速度。

二、佩隆 - 弗罗贝尼乌斯定理

佩隆-弗罗贝尼乌斯定理（Perron-Frobenius Theorem）在研究矩阵稳定状态时起决定性的作用，该定理仅要求矩阵的所有元素 $aij≥0a_{ij}\ge0$ ，而没有要求列的和相加为 $1$ . 这里证明最简单的情形：当所有的 $a_{ij}>0$ 时，任意的正矩阵 $A$ （不需要是正定的！）.

$A > O$ 时的佩隆-弗罗贝尼乌斯定理 $中所有的数都是正的.\kern 20pt\color{blue}A\boldsymbol x=\lambda_{\textrm{max}}\boldsymbol x\,中所有的数都是正的.$

证明： 证明的关键是考虑 $Ax≥txA\boldsymbol x\ge t\boldsymbol x$ 对某个非负向量 $x\boldsymbol x$ （ $x≠0\boldsymbol x\neq\boldsymbol 0$ ）成立的所有实数 $t$ ，这里允许不等式 $Ax≥txA\boldsymbol x\ge t\boldsymbol x$ 的目的是为了取得更多的正的候选的 $t$ 值。其上界 $tmaxt_{\textrm{max}}$ （这样的值是可以取到的，因为 $t$ 是非空有上界的集合，一定存在上确界），我们先证明等式成立： $Ax=tmaxxA\boldsymbol x=t_{\textrm{max}}\boldsymbol x$ .
如果 $Ax≥tmaxxA\boldsymbol x\ge t_{\text{max}}\boldsymbol x$ 的等号不成立，我们在两端同时左乘 $A$ ，由于 $A$ 是正的，所以这将得到一个严格的不等式 $A2x>tmaxAxA^2\boldsymbol x>t_{\textrm{max}}A\boldsymbol x$ ，因此正向量 $y=Ax\boldsymbol y=A\boldsymbol x$ 满足 $Ay>tmaxyA\boldsymbol y>t_{\textrm{max}}\boldsymbol y$ ，这里 $tmaxt_{\textrm{max}}$ 可以增大，因为这和上一个 $tmaxt_{\textrm{max}}$ 并不一致。这个矛盾导推出等式 $Ax=tmaxxA\boldsymbol x=t_{\textrm{max}}\boldsymbol x$ 成立，此时我们将得到一个特征值。由于等式左边为正，所以它的特征向量 $x\boldsymbol x$ 为正。
下面证明没有比 $tmaxt_{\textrm{max}}$ 更大的特征值。假设 $Az=λzA\boldsymbol z=\lambda\boldsymbol z$ ，由于 $λ\lambda$ 和 $z\boldsymbol z$ 可能包含有负数或复数，我们对所有的分量取绝对值，则由三角不等式可得： $∣λ∣∣z∣=∣Az∣≤A∣z∣|\lambda||\boldsymbol z|=|A\boldsymbol z|\le A|\boldsymbol z|$ . 这里 $∣z∣|\boldsymbol z|$ 表示的是一个非负的向量，所以 $∣λ∣|\lambda|$ 是一个可能的候选数 $t$ ，因此 $∣λ∣|\lambda|$ 比可能超过 $tmaxt_{\textrm{max}}$ ，即 $λmax\lambda_{\textrm{max}}$ 就等于 $tmaxt_{\textrm{max}}$ .

三、人口增长

将 $60$ 岁以下的人口按年龄分成三组：小于 $20$ 岁的， $20$ 到 $39$ 岁的， $40$ 到 $59$ 岁的。第 $T$ 年，这三组的人数分别为 $n_1,n_2,n_3$ . 二十年以后，这三组的人数会出现改变，原因是：出生、死亡和衰老。

生育（Reproduction）： $n1new=F1n1+F2n2+F3n3n_1^{\pmb{\textrm{new}}}=F_1n_1+F_2n_2+F_3n_3$ 给出了新的第一组的人口，都是新生人口；
存活（Survial）： $n2new=P1n1n_2^{\pmb{\textrm{new}}}=P_1n_1$ 和 $n3new=P2n2n_3^{\pmb{\textrm{new}}}=P_2n_2$ 给出了新的第二组和第三组的人口。

$F_1,F_2$ 和 $F_3$ （ $F_2$ 最大）分别为这三个年龄组的生育率，可以用莱斯利矩阵（Leslie matrix） $A$ 来关联这些数据，设： $[n1n2n3]new=[F1F2F3P1000P20][n1n2n3]=[0.041.10.010.980000.920][n1n2n3]\begin{bmatrix}n_1\\n_2\\n_3\end{bmatrix}^{\pmb{\textrm{new}}}=\begin{bmatrix}F_1&F_2&F_3\\P_1&0&0\\0&P_2&0\end{bmatrix}\begin{bmatrix}n_1\\n_2\\n_3\end{bmatrix}=\begin{bmatrix}0.04&\pmb{1.1}&0.01\\0.98&0&0\\0&\pmb{0.92}&0\end{bmatrix}\begin{bmatrix}n_1\\\pmb{n_2}\\n_3\end{bmatrix}$ 这个形式是最简单的人口投影，每一步（ $20$ 年）的矩阵 $A$ 都是相同的。在现实模型中， $A$ 会随着时间改变（因为环境或内部因素）。研究者可能会加入年龄大于 $60$ 岁的作为第四个年龄组，但这里不考虑这种情况。
矩阵 $A$ 满足 $A≥OA\ge O$ ，但是不满足 $A > O$ . 而由于 $A^3>O$ ，正矩阵情形的佩隆-弗罗贝尼乌斯定理仍然有效。最大的特征值是 $λmax≈1.06\lambda_{\textrm{max}}\approx1.06$ . 我们假设中间组的人口从 $n_2=1$ 起始，以观察人口的变化： $eig(A)=1.06−1.01−0.01A2=[1.080.050.000.041.080.010.9000]A3=[0.101.190.010.060.050.000.040.990.01]\textrm{\pmb{eig}}(A)=\begin{matrix}\kern 7pt1.06\\-1.01\\-0.01\end{matrix}\kern 15ptA^2=\begin{bmatrix}1.08&0.05&0.00\\0.04&1.08&0.01\\0.90&0&0\end{bmatrix}\kern 15ptA^3=\begin{bmatrix}0.10&\pmb{1.19}&0.01\\0.06&\pmb{0.05}&0.00\\0.04&\pmb{0.99}&0.01\end{bmatrix}$ 为了快速的看出人口的变化，我们设 $u0=(0,1,0)\boldsymbol u_0=(0,1,0)$ ，经过一个 $20$ 年，中间组会生育 $1.1$ 同时存活 $0.92$ ， $u1=(1.1,0,0.92)\boldsymbol u_1=(1.1,0,0.92)$ 对应 $A$ 的第 $2$ 列。再过 $20$ 年， $u2=Au1=A2u0\boldsymbol u_2=A\boldsymbol u_1=A^2\boldsymbol u_0$ 是 $A^2$ 的第 $2$ 列。开始的一些数据（短期内各组的人口）很大程度上依赖于 $u0\boldsymbol u_0$ ，但是无论起始向量是什么，渐进增长率 $λmax\lambda_{\textrm{max}}$ 都是相同的。它对应的特征向量 $x=(0.63,0.58,0.51)\boldsymbol x=(0.63,0.58,0.51)$ 表明这三组所有的人口数一起稳定增长。
上述模型肯定不是完全准确的，如果矩阵中的 $F_i$ 和 $P_i$ 变化 $10%10\%$ ， $λmax\lambda_{\textrm{max}}$ 会小于 $1$ 吗（这意味着人口灭绝）？由矩阵变化 $ΔA\Delta A$ 将导出特征值变化 $Δλ=yT(ΔA)x\Delta \lambda=\boldsymbol y^T(\Delta A)\boldsymbol x$ . 这里的 $x\boldsymbol x$ 和 $yT\boldsymbol y^T$ 分别是 $A$ 的右特征向量和左特征向量，即 $Ax=dxA\boldsymbol x=d\boldsymbol x$ 和 $ATy=λyA^T\boldsymbol y=\lambda\boldsymbol y$ .

四、经济学中的线性代数：消耗矩阵

这里不会详细讲解经济学中的线性代数，只简单的介绍一下消耗矩阵（consumpution matrix）. 消耗矩阵表示的是每产出一个单位，每种的投入需要多少单位。这个描述的是经济学的制造业方面。
消耗矩阵： 有 $n$ 个工厂，如化学品、食品和石油等。为了生产 $1$ 单位的化学品需要 $0.2$ 单位的化学品、 $0.3$ 单位食品和 $0.4$ 单位石油。将这些数放在消耗矩阵 $A$ 的第 $1$ 行： $[化学品产出食品产出石油产出]=[0.20.30.40.40.40.10.50.10.3][化学品投入食品投入石油投入]\begin{bmatrix}化学品产出\\食品产出\\石油产出\end{bmatrix}=\begin{bmatrix}0.2&0.3&0.4\\0.4&0.4&0.1\\0.5&0.1&0.3\end{bmatrix}\begin{bmatrix}化学品投入\\食品投入\\石油投入\end{bmatrix}$ 第 $2$ 行表明生产食品的投入 —— 需要大量的化学品和食品，石油的消耗比较少。 $A$ 的第 $3$ 行表明提炼 $1$ 单位的石油需要的投入。美国在 $1958$ 年实际的消耗矩阵包含 $83$ 个工厂，而 $1990$ 年的模型要更大、更精确。我们选择的消耗矩阵有一个方便使用的特征向量。
现在问题来了：这种经济能满足对化学品、食品和石油各自的需求 $y_1,y_2,y_3$ 吗？为了满足需求，投入 $p_1,p_2,p_3$ 必须要更高 —— 因为在生产 $y\boldsymbol y$ 的过程中，消耗掉了一部分 $p\boldsymbol p$ . 投入为 $p\boldsymbol p$ ，消耗的为 $ApA\boldsymbol p$ ，那么产出为 $p−Ap\boldsymbol p-A\boldsymbol p$ . 这个净产量就是可以满足外部的需求 $y\boldsymbol y$ （即需要产出的 $y\boldsymbol y$ ）：

问题： 求一个向量 $p\boldsymbol p$ ，使得 $p−Ap=y\color{blue}\boldsymbol p-A\boldsymbol p=\boldsymbol y$ 即 $p=(I−A)−1y\color{blue}\boldsymbol p=(I-A)^{-1}\boldsymbol y$ .

显然，对于线性代数的来说，就是确定 $I - A$ 是否可逆。但是这里有更多的限制，产出向量 $y\boldsymbol y$ 是非负的， $A$ 也是非负的， $p=(I−A)−1y\boldsymbol p=(I-A)^{-1}\boldsymbol y$ 中的生产水平也要是非负的。真正的问题是： $(I−A)−1是一个非负矩阵？\pmb{什么时候\,(I-A)^{-1} 是一个非负矩阵？}$ 这是关于产出型经济对应的 $I-A)^{-1}$ 的检验法，该经济可以满足任何需求。如果 $A$ 比 $I$ 小，则 $ApA\boldsymbol p$ 就会小于 $p\boldsymbol p$ ，就会有足够的产出。如果 $A$ 太大，那么生产就消耗的太多，产出 $y\boldsymbol y$ 的需求就无法满足。
“小” 或 “大” 是由 $A$ 最大的特征值 $λ1\lambda_1$ （正的）决定的：

如果 $λ1>1\lambda_1>1$ ，则 $I-A)^{-1}$ 有负元素
如果 $λ1=1\lambda_1=1$ ，则 $I-A)^{-1}$ 不存在
如果 $λ1<1\lambda_1<1$ ，则 $I-A)^{-1}$ 就是所需的非负矩阵

重点就是最后一个，推导时会使用一个表示 $I-A)^{-1}$ 很棒的公式。数学中最重要的无穷级数是几何级数（geometric series） $1+x+x2+⋯1+x+x^2+\cdots$ . 当 $- 1 < x < 1$ 时，这个级数的和是 $11−x\dfrac{1}{1-x}$ ；当 $x = 1$ 时，级数为 $1+1+1+⋯=∞1+1+1+\cdots=\infty$ ；当 $∣x∣≥1|x|\ge1$ 时， $x^n$ 的极限不为零，这个级数不会收敛。
表示 $I-A)^{-1}$ 的公式是矩阵的几何级数（geometric series of matrices）:

$series(I−A)−1=I+A+A2+A3+⋯\pmb{几何级数\,\textrm{Geometric\,series}}\kern 20pt\color{blue}(I-A)^{-1}=I+A+A^2+A^3+\cdots$

如果级数 $S=I+A+A2+A3+⋯S=I+A+A^2+A^3+\cdots$ 两边左乘 $A$ ，可以得到除了 $I$ 以外的同样的级数，因此 $S - A S = I$ ，即 $(I - A) S = I$ . 如果该级数收敛，它的和为 $S=(I-A)^{-1}$ . 如果 $A$ 所有的特征值都满足 $∣λ∣<1|\lambda|<1$ ，则级数 $S$ 收敛。
我们这种情况是 $A≥OA\ge O$ ，这个级数所有的项都是非负的，和为 $(I−A)−1≥O(I-A)^{-1}\ge O$ .

【例4】矩阵 $A=[0.20.30.40.40.40.10.50.10.3]A=\begin{bmatrix}0.2&0.3&0.4\\0.4&0.4&0.1\\0.5&0.1&0.3\end{bmatrix}$ 最大的特征值 $λmax=0.9\lambda_{\textrm{max}}=\pmb{0.9}$ ，则 $(I−A)−1=1093[412527333624342336](I-A)^{-1}=\dfrac{10}{93}\begin{bmatrix}41&25&27\\33&36&24\\34&23&36\end{bmatrix}$ .
这个经济是产出型的。因为 $λmax=0.9\lambda_{\textrm{max}}=0.9$ ，所以 $A$ 比 $I$ 要小。为了满足需求 $y\boldsymbol y$ ，从投入 $p=(I−A)−1y\boldsymbol p=(I-A)^{-1}\boldsymbol y$ 开始，则 $ApA\boldsymbol p$ 就是生产时的消耗，剩余 $p−Ap\boldsymbol p-A\boldsymbol p$ ，就是 $(I−A)−1p=y(I-A)^{-1}\boldsymbol p=\boldsymbol y$ ，满足了需求。

【例5】 $A=[0410]A=\begin{bmatrix}0&4\\1&0\end{bmatrix}$ 最大的特征值 $λmax=2\lambda_{\textrm{max}}=\pmb2$ ，则 $(I−A)−1=−13[1411](I-A)^{-1}=-\dfrac{1}{3}\begin{bmatrix}1&4\\1&1\end{bmatrix}$ .
这个消耗矩阵 $A$ 太大了，无法满足生产的需求，因为消耗要比产出更多。由于 $λmax>1\lambda_{\textrm{max}}>1$ ，所以它对应的几何级数是 $I+A+A2+⋯I+A+A^2+\cdots$ 不会收敛到 $I-A)^{-1}$ . 事实上，这个级数不断增长，矩阵 $I-A)^{-1}$ 是负矩阵。
同理， $1+2+4+⋯1+2+4+\cdots$ 并不等于 $11−2=−1\dfrac{1}{1-2}=-1$ ，但这也不是完全错误！