§10.4 Характеристический многочлен

В п. 2 мы уже определили Характеристический многочлен преобразования $A$ как определитель матрицы $ A- \alpha E,$ где $A$ - матрица преобразования $A,$ а $E$ - единичная матрица. Докажем, что Характеристический многочлен не зависит от выбора базиса. Действительно, при переходе к другому базису матрица $A$ преобразования $A$ принимает вид $ C^{-1} AC,$ где $C$ - есть матрица перехода к новому базису. Таким образом, в новом базисе Характеристический многочлен есть определитель матрицы $ C^{-1} AC - \lambda E. $ Но
$$ | C^{-1} AC - \lambda E| = | C^{-1} AC - \lambda C^{-1} EC | = |C^{-1} (A - \lambda E) C|, $$
и так как определитель произведения равен произведению определителей, то
$$ | C^{-1} AC - \lambda E| = |C^{-1} || A - \lambda E|| C| = | A - \lambda E|, $$
и утверждение доказано. Таким образом мы в дальнейшем можем говорить о характерестическом многочлена преобразования $A$ (а не о характерестическом многочлена матрицы преобразования $A).$

Упражнения.
1. Найти Характеристический многочлен матрицы
$$ \begin{pmatrix}
\lambda_0 & 0 & ... & 0 & 0 \\
1 & \lambda_0 & 0 & ... 0 & 0 \\
0 & 1 & \lambda_0 & ... & 0 & 0 \\
\cdots & \cdots & \cdots & \cdots \\
0 & 0 & 0 & ... & 1 & \lambda_0
\end{pmatrix} $$
2. Найти характерестический многочлен матрицы
$$ \begin{pmatrix}
a_1 & a_2 & a_3 ... a_{n-1} & a_n \\
1 & 0 & 0 ... 0 & 0 \\
0 & 1 & 0 ... 0 & 0 \\
\cdots & \cdots & \cdots \\
0 & 0 & 0 ... 1 & 0
\end{pmatrix} $$
Ответ. $ (-1)^n (\lambda^n - a_1 \lambda^{n-1} - a_2 \lambda^{n-2} - ... - a_n). $

Выразим характерестический многочлен явно через элементы матрицы $A$ преобразования $A.$ Вычислим сначала более общий определитель (который позже в параграфе 12 нам тоже встретится): $|A - \lambda B|, $ где $A \text{и} B$ - две заданные матрицы. Нам нужно, следовательно, вычеслить следующий многочлен относительно $\lambda:$
$$ Q(\lambda) = \begin{vmatrix}
a_{11} - \lambda b_{11} & a_{12} - \lambda b_{12} ... a_{1n} - \lambda b_{1n} \\
a_{21} - \lambda b_{21} & a_{22} - \lambda b_{22} ... a_{2n} - \lambda b_{2n} \\
\cdots & \cdots & \cdots & \cdots & \cdots \\
a_{n1} - \lambda b_{n1} & a_{n2} - \lambda b_{n2} ... a_{nn} - \lambda b_{nn}
\end{vmatrix} $$
Так как в этом определителе каждый столбец есть сумма двух столбцов, то определитель может быть разложен на сумму определителей. Свободный член в $Q(\lambda) $ есть
$$ q_0 = \begin{vmatrix}
a_{11} & a_{12} ... a_{1n} \\
a_{21} & a_{22} ... a_{2n} \\
\cdots & \cdots & \cdots \\
a_{n1} & a_{n2} ... a_{nn}
\end{vmatrix} \qquad \qquad (4) $$
Ясно, что коэффициент при $(- \lambda)^k $ в $Q(\lambda)$ равен сумме определителей, каждый из которых получается заменой в (4) каких либо $k$ столбцов матрицы $ ||\alpha_{ik} ||$ соответствующими столбцами матрицы $ ||b_{ik} ||. $

Перейдем теперь к вычислению $ |A-\lambda E.|$ Для вычисления коэффициента при $ (- \lambda)^k$ мы должны взять сумму определителей, каждый из которых получается заменой $k$ столбцов матрицы $|| \alpha_{ik}|| k $ столбцами единичной матрицы. Но каждый такой определитель есть главный минор $(n-k) $ - го порядка матрицы $||\alpha_{ik}||$. Таким образом, окончательно, характерестический многочлен $ P(\lambda) $ матрицы $A$ имеет вид
$$P ( \lambda) = (-1)^n (\lambda^n - p_1 \lambda^{n-1} + p_2 \lambda^{n-2} - ... ± p_n), $$
где $p_1$ есть сумма диагональных элементов, $ p_2$ - сумма главных миноров второго порядка и т. д. ; наконец, $ p_n $ есть определитель матрицы $A.$

Числа $ p_1, p_2, ..., p_n,$ построенные по матрице $A$ преобразования $A,$ зависят лишь от самого преобразования, поскольку этим свойством, как мы показали, обладает характерестический многочлен. Среди коэффициентов $p_1$ наибольшую роль играют $p_n$ - определитель матрицы $A$ и $p_1$ - сумма диагональных элементов матрицы $A.$ Сумма диагональных элементов называется следом матрицы $A.$ След матрицы $A$ обозначается $ tr A$$ ( от английского слова trace - след). Ясно, что след матрицы равен сумме всех корней характестического многочлена (собственных значений), причем каждый корень считается с той кратностью, с которой он входит в характерестический многочлен.

Упражнения.
1. Показать, что если $A$ и $B$ - матрицы n-го порядка, то
$$ tr AB = tr BA. $$
2. Показать, что если $C$ - невырожденная матрица n-го порядка, то для любой матрицы $A$ n-го порядка имеем:
$$ tr(C^{-1} AC) = tr A. $$
Вычисление собственных векторов линейного преобразования требует знания собственных значений и, следовательно, решения уравнения n-й степени - характерестического уравнения. В одном важно частном случае корни характерестического многочлена можно найти непосредственно.

Если матрица преобразования $A$ треугольная, т. е. имеет вид
$$ \begin{pmatrix}
a_{11} & a_{12} & a_{13} ... a_{1n} \\
0 & a_{22} & a_{22} ... a_{2n} \\
0 & 0 & a_{33} ... a_{3n} \\
\cdots & \cdots & \cdots \\
0 & 0 & 0 ... a_{nn}
\end{pmatrix}, \qquad (5) $$
то собственными значениями будут числа, стоящие на диагонали, т. е. $ a_{11}, a_{22}, ..., a_{nn}. $

В самом деле, характерестический многочлен данной матрицы вычисляется непосредственно и есть
$$ P(\lambda) = (a_{11} - \lambda) (a_{22} - \lambda) ... (a_{nn} - \lambda), $$
и следовательно, его корни - $ a_{11}, a_{22}, ..., a_{nn}. $

Упражнение.Найти собственные векторы, отвечающие собственным значениям $a_{11}, a_{22}, a_{33} $ треугольной матрицы (5).

В заключение этого пункта укажем одно интересное свойство характерестического многочлена. Как мы уже указывали в п. 3 предыдущего параграфа, существует такой многочлен $P(t),$ что если в него подставить вместо $t$ матрицу $A,$ то он обратится в нуль. Мы покажем сейчас, что одним из таких многочленов является характерестический многочлен. Докажем предварительно лемму:

Лемма. Пусть многочлен
$$ P(\lambda) = a_0 \lambda^m + a_1 \lambda^{m-1} + ... + a_m $$
и матрица $A$ связаны соотношением
$$ P(\lambda) E= (A- \lambda E) C (\lambda), \qquad \qquad (6) $$
где $ C (\lambda) $ - многочлен от $ \lambda,$ коэффициенты которого являются матрицами, т. е.
$$ C(\lambda) = C_0 \lambda^{m-1} + C_1 \lambda^{m-2} + ... + C_{m-1}, C_i $$ - матрицы.
Тогда $P(A) = 0. $
Заметим, что эта Лемма является обобщением на многочлены с матричными коэффициентами теоремы Безу.
$$ (A- \lambda E) C (\lambda) = AC_{m-1} + (Ac_{m-2} - C_{m-1} ) \lambda + \\
+ (AC_{m-3} - C_{m-2} ) \lambda^2 + ... - C_0 \lambda^m. \qquad (7) $$
Сравнивая между собой коэффициенты при одинаковых степенях $ \lambda$ в обеих частях равенства (6), мы получаем последовательность равенств:
$$ AC_{m-1} = a_m E, \\
AC_{m-2} - C_{m-1} = a_{m-1} E, \\
AC_{m-3} - C_{m-2} = a_{m-2} E, \\
. . . . . . . . . . . . . . . . . . . . . . . \\
AC_0 - C_1 = a_1 E, \\
- C_0 = a_0 E. \qquad \qquad (8) $$
Умножим теперь слева первое равенство на $E$, второе на $A,$ третье на $A^2, ..., $ последнее на $A^m$ и сложим их. Мы получим справа $P(A) = a_m E + a_{m-1} A+ ... + a_0 A^m, $ а слева 0. Таким образом, $P(A) =0, $ и лемма доказана *).

Теорема. Если $P(\lambda) $ - характерестический многочлен матрицы $A,$ то $P(A) = 0.$
Доказательство.Рассмотрим матрицу, обратную матрице $ A-\lambda E. $ Мы имеем $(A- \lambda E) (A- \lambda E)^{-1} = E. $ Как известно, обратная матрица может быть записана в виде
$$ (A - \lambda E)^{-1} = {{1} \over {P(\lambda}} C (\lambda), $$
где $ C(\lambda) $- матрица из миноров $(n-1)$ -го порядка матрицы $A-\lambda E, $ а $ P(\lambda) $ - определитель матрицы $ A- \lambda E, $ т. е. характерестический многочлен матрицы $A.$ Отсюда
$$ (A- \lambda E) C(\lambda) = P(\lambda) E. $$
Так как элементами матрицы $C ( \lambda) $ являются миноры матрицы $ A-\lambda E,$ т. е. многочленыстепени не выше $ n-1$ относительно $\lambda$, о согласно доказанной лемме
$$ P(A) = 0, $$
и теорема доказана.

Заметим, что если у характерестического многочлена матрицы $A$ нет кратных корней, то не существует многочлена степени ниже $n,$ обращающегося в нуль при подстановке в него матрицы $A$ (см. следующее упражнение).
Упражнение. Пусть $ A$ - диагональная матрица вида
$$ A= \begin{pmatrix}
\lambda_1 & 0 ... 0 \\
0 & \lambda_2 ... 0 \\
. . . . . . . . . . . . . . \\
0 & 0 ... \lambda_n
\end{pmatrix}, $$
где все числа $ \lambda_i $ различны. Найти многочлен $P(t) $ возможно более низкой степени, для которого $P(A) = 0.$ (См. пример в параграфе 9, п. 3.)