§21.1 Инвариантные множители

В этом параграфе мы укажем способ, дающий возможность находить жорданову нормальную форму линейного преобразования. Из результатов этого параграфа будет также вытекать до сих пор ещё не доказанная единственность этой формы.

Определение 1. Матрицы $A$ и $A_1 = C^{-1} AC,$ где $C$- произвольная невырожденная матрица, называемая подобными.

Если матрица $A_1$ подобна матрице $A_2$, то и обратно, $A_2$ подобна $A_1$. Действительно, пусть
$$ A_1 = C^{-1} A_2 C. $$
Тогда отсюда
$$ A_2 = CA_1 C^{-1}, $$
т. е. если положить $C^{-1} = C_1, $ имеем:
$$ A_2 = C_1^{-1} A_1 C_1 $$
и, следовательно, $A_2$ подобна $A_1$.

Легко также показать, что если две матрицы $A_1$ и $A_2$ подобны одной и той же матрице $A,$ то они подобны между собой. Действительно, пусть
$$ A = C_1^{-1} A_1 C_1, A= C_2^{-1} A_2 C_2. $$
Тогда $ C_1^{-1} A_1 C_1 = C_2^{-1} A_2 C_2,$ т. е.
$$ A_1 = C_1 C_2^{-1} A_2 C_2 C_1^{-1}, $$
и если положить $C_2 C_1^{-1} = C,$ то получим:
$$ A_1 = C^{-1} A_2 C, $$
т. е. $ A_1$ и $A_2$ подобны.

Пусть $ A$ - матрица преобразования $A$ в некотором базисе. При переходе к другому базису матрица $A$ заменяется подобной ей матрицей $ C^{-1} AC,$ где $C$- матрица перехода от первого базиса ко второму. Таким образом, подобные матрицы - это матрицы одного и того же линейного преобразования в различных базисах.

Наша задача - по матрице преобразования построить инварианты самого преобразования, т. е. выражения, зависящие лишь от самого преобразования $A.$ Другими словами, нам нужно построить функции от элементов матрицы, совпадающие для подобных матриц.

Один такой инвариант установлен уже в параграфе 10. Именно, там было доказано, что характерестический многочлен матрицы $A,$ т. е. определитель матрицы $ A- \lambda E:$
$$ D_n (\lambda) = |A - \lambda E| $$
не меняется при замене матрицы $A$ подобной матрицей. Мы построим здесь ряд инвариантов, среди которых будет содержаться и характерестический многочлен; они будут полной системой инвариантов, в том смысле, что из их совпадения для двух матриц следует подобие этих матриц.

Пусть $A$ - произвольная матрица n-го порядка. Миноры k-го порядка матрицы $A - \lambda E$ суть некоторые многочлены от $ \lambda.$ Обозначим через $ D_k (\lambda)$ их наибольший общий делитель). В частности, $ D_n (\lambda)$- определитель матрицы $A - \lambda E,$ т. е. характерестический многочлен матрицы $A$. В дальнейшем мы покажем, что все $D_k (\lambda)$ являются инвариантами.

Заметим, что $ D_n (\lambda)$ делится на $ D_{n-1} (\lambda).$ Действительно, по определению $ D_{n-1} (\lambda)$ все миноры $ (n-1)$-го порядка делятся на $ D_{n-1} (\lambda).$ Разлагая определитель на сумму произведений элементов какой-нибудь строки на их алгебраические дополнения, мы получаем, что и определитель $ D_n (\lambda)$ делить на $ D_{n-1} (\lambda).$ Аналогично, $ D_{n-1} (\lambda)$ делится на $ D_{n-2} (\lambda)$ и т. д.

Упражнение. Найти $ D_k (\lambda) (k =1, 2, 3) $ для матрицы
$$ \begin{pmatrix}
\lambda_0 & 1 & 0 \\
0 & \lambda_0 & 1 \\
0 & 0 & \lambda_0
\end{pmatrix}. $$
Ответ. $ D_3 (\lambda) = (\lambda - \lambda_0)^3, D_2 (\lambda) = D_1 (\lambda) = 1. $

Лемма 1. Если $C$- произвольная невырожденная матрица, то общие наибольшие делители миноров k-го порядка матриц $ A - \lambda E$ и $ C(A - \lambda E)$ совпадают. Аналогичное утверждение имеет место и для $(A - \lambda E) C.$
Доказательство.
Строки матрицы $ C (A - \lambda E)$ являются линейными комбинациями строк матрицы $ A- \lambda E$ с коэффициентами, являющимися элементами матрицы $C,$ т. е. не зависящим от $ \lambda$. Действительно, обозначим через $ \alpha_{ik} $ элементы матрицы $ A - \lambda E$ и через $ \alpha_{ik}$ элементы матрицы $ C (A - \lambda E).$ Тогда, например,
$$ \alpha_{ik} = \sum_{i=1}^n c_{1j} \alpha_{jk}, $$

т. е. элементы первой строки матрицы $ C (A - \lambda E)$ являются линейными комбинациями строк матрицы $ A - \lambda D$ с коэффициентами $ c_{1j}.$ Аналогично показываем это и для других строк.

Поэтому минор матрицы $ C (A - \lambda E)$ разлагается на сумму миноров матрицы $ A - \lambda E$ с некоторыми численными коэффициентами. Следовательно, всякий делитель миноров k-го порядка матрицы $ A-\lambda E$ будет также делителем миноров того же порядка матрицы $ C(A - \lambda E).$ Так как от матрицы $ C(A - \lambda E)$ мы можем перейти к матрице $ A - \lambda E$ умножением на $C^{-1}$, то и обратно, каждый делитель миноров k-го порядка матрицы $ C (A - \lambda E)$ является делителем миноров k-го порядка матрицы $ A - \lambda E.$ Следовательно, у $ A - \lambda E$ и $ C (A - \lambda E)$ общие делители миноров k-го порядка совпадают.

Лемма 2. У подобных матриц многочлены $ D_k (\lambda)$ совпадают.

Доказательство. Пусть $ A$ и $ A' = C^{-1} AC$ - две подобные матрицы. Согласно предыдущей лемме, общие наибольшие делители миноров k-го порядка у $ A - \lambda E$ и $ (A - \lambda E) C$ совпадают. По той же лемме совпадают между собой общие наибольшие делители миноров k-го порядка у $ C^{-1} (A - \lambda S)$ и $ C^{-1} (A - \lambda E) C = A' - \lambda E.$ Следовательно, $ D_k (\lambda)$ для $ A$ и $ A'$ равны между собой.

Так как при переходе от одного базиса к другому матрица линейного преобразования заменяется подобной, то из леммы 2 вытекает следующая

Теорема 1. Пусть $A$ - линейное преобразование. Тогда наибольший общий делитель $ D_k (\lambda)$ миноров k-го порядка матрицы $ A - \lambda E,$ где $ A$ - матрица преобразования $ A$ в некотором базисе, не зависит от выбора базиса.

Перейдем к вычислению многочленов $ D_k (\lambda)$ для данного линейного преобразования $A.$ В силу теоремы 1, при их вычислении можно пользоваться матрицей линейного преобразования в любом базисе. Выберем базис, в котором матрица линейного преобразования имеет жорданову нормальную форму. Нам нужно, следовательно, вычислить многочлены $ D_k (\lambda)$ для матрицы $ A,$ имеющий нормальную форму.

Найдем сначала все $ D_k (\lambda)$ для матрицы n-го порядка вида
$$ \begin{vmatrix}
\lambda_9 & 1 & 0 ... 0 \\
0 & \lambda_0 & 1 ... 0 \\
\cdots & \cdots & \cdots \\
0 & 0 & 0 ... 1 \\
0 & 0 & 0 ... \lambda_0
\end{vmatrix} \qquad \qquad (1)$$
т . е. для определения одной "клетки" нормальной формы. Мы имеем $ D_n(\lambda) = (\lambda - \lambda_0)^n.$ Если матрице (1) зачеркнуть первый столбец и последнюю строку, то получим матрицу $A_1,$ в которой по диагонали стоят единицы, а над диагональю нули. Поэтому $ D_{n-1} (\lambda) = 1.$ Вычеркивая далее в матрице $ A_1$ строки и столбцы с одинаковыми номерами, мы сможем доказать, что и $ D_{n-2} (\lambda) = ... = D_1 (\lambda) = 1.$ Окончательно мы имеем, что для отдельной клетки последовательность $ D_k (\lambda)$ следующая:
$$ (\lambda - \lambda_0)^n, 1, 1, ..., 1.$$

Далее, заметим: пусть матрица $ B$ имеет вид
$$ \begin{pmatrix}
B_1 & 0 \\
0 & B_2
\end{pmatrix}, $$
где $B_1$ и $ B_2$ - какие-либо матрицы порядков $n_1$ и $n_2.$ Тогда отличные от нуля миноры m-го порядка матрицы $ B$ имеют вид
$$ \delta_m = \Delta_{m_1}^1 \Delta_{m_2}^2, m_1 + m_2 = m, $$
где $ \Delta_{m_1}^1$ - миноры $m_1$-го порядка матрицы $ B_1,$ а $\Delta_{m_2}^2$- миноры $ m_2$ - но порядка матрицы $B_2$ *). Действительно, если выделить те из первых $n_1$ строк, которые входят в состав данного минора, и разложить по ним минор (воспользовавшись теоремой Лапласа), то этот минор будет либо равен нулю, либо иметь вид $ \Delta_{m_1}^1 \Delta_{m-m_1}^2.$

Найдем теперь многочлены $ D_k (\lambda)$ для произвольной матрицы $A,$ имеющей жорданову нормальную форму. Мы предположим, что в матрице $ A$ имеет $p$ клеток, отвечающих собственному значению $ \lambda_1, q$ клеток, отвечающих собственному значению $ \lambda_1, q$ клеток, отвечающих собственному значению $ \lambda_2,$ и т. д. Обозначим порядки клеток, отвечающих значению $ \lambda_1,$ через $ n_1, n_2, ..., n_p (n_1 \geqslant n_2 \geqslant n_3 ... \geqslant n_p).$

Матрица $ B=A - \lambda E$ распадается на отдельные клетки $ B_i,$ из которых, например, $B_1$ имеет вид
$$ B_1 = \begin{vmatrix}
\lambda_1 - \lambda & 1 & 0 ... 0 \\ 0 & \lambda_1 - \lambda & 1 ... 0 \\
\cdots & \cdots \cdots ll
0 & 0 & 0 ... 1 \\
0 & 0 & 0 .... \lambda_1 - \lambda
\end{vmatrix} $$
Вычислим сначала $ D_n (\lambda),$ т. е. определитель матрицы $B.$ Он равен произведению определителей матриц $B_i,$ т. е.
$$ D_n (\lambda) = (\lambda - \lambda_1)^{n_1 + n_2} + ... + n_p (\lambda - \lambda_2)^{m_1 + m_2} + ... + m_q ... $$

Перейдем теперь к вычислению $ D_{n-1} (\lambda).$ Так как $ D_{n-1} (\lambda)$ есть делитель многочлена $ D_n (\lambda),$ то $ D_{n-1} (\lambda)$ состоит из множителей $ \lambda - \lambda_1, \lambda - \lambda_2, ... $ Вычислим, в какой степени в $ D_{n-1} (\lambda)$ входит $ \lambda - \lambda_1.$ Для этого заметим, что произвольный отличный от нуля минор $ (n -1)$ - го порядка матрицы $ B=A - \lambda E$ имеет вид
$$ \Delta_{n-1} = \Delta_t^1, \Delta_{t2}^2 ... \Delta_{tk}^k, $$
где $ t_1 + t_2 + ... + t_k = n - 1, \Delta_t^i$ - миноры порядка $ t_i$ матрицы $B_i.$ Так как сумма порядков миноров $ \Delta_{t1}^1, ... $ равна $ n - 1,$ то один и только один из этих миноров имеет порядок на единице ниже, чем порядок соответствующей матрицы $ B_i,$ т. е. получается из соответствующей клетки матрицы $B$ вычеркиванием одной клетки строки и одного столбца. Мы видели, что в отдельной клетке мы можем вычеркиванием одной строки и одного столбца получить минор, равный единице. Поэтому мы можем подобрать $ \Delta_{n-1}$ так, чтобы какой-нибудь один из миноров $ \Delta_{ti}^i $ стал равным единице, не меняя при этом остальных, равных определителя соответствующих клеток. Отсюда ясно, что, для того чтобы получить минор, содержащтй $ \lambda - \lambda_1$ в возможно более низкой степени, достаточно вычеркнуть строку и столбец в клетке, отвечающей $ \lambda_1$ и имеющий наибольший порядок, а именно порядков $ n_1.$ Таким образом, наибольший общий делитель $ D_{n-1} (\lambda)$ миноров $ (n - 1)$ - го порядка содержит $ \lambda - \lambda_1$ в степени $ n_2 + n_3 + ... + n_p.$

Аналогично, среди миноров $ (n-2)$ - го порядка наинизшую степень $ \lambda - \lambda_1$ содержит минор $ \Delta_{n-2},$ полученный вычеркиванием по строке и столбцу из клеток, соответствующих собственному значению $ \lambda_1$ и имеющих порядки $n_1$ и $n_2$. Таким образом, $ D_{n-2} (\lambda)$ содержит $ \lambda - \lambda_1$ в степени $ n_3 + n_4 + ... + n_p$ и т. д. Наконец, $ D_{n-p} (\lambda), D_{n-p-1} (\lambda), ..., D_1 (\lambda)$ вовсе не содержат $ \lambda - \lambda_1.$

Совершенно так же мы выясняем, в каких степенях в $D_k (\lambda)$ входят множиткли $ \lambda - \lambda_2, \lambda - \lambda_3, ... $
Итак, мы доказали следующее утверждение:
Пусть матрица преобразования $A$ имеет жорданову нормальную форму, в которой имеется $p$ клеток порядков $ n_1, n_2, ..., n_p (n_1 \geqslant n_2 \geqslant ... \geqslant n_p),$ отвечающих собственному значению $ \lambda_1, q$ клеток порядков $ m_1, m_2, ...., m_q (m_1 \geqslant m_2 \geqslant ... \geqslant m_q),$ отвечающих собственному значению $ \lambda_2$ и т. д. тогда
$$ D_n (\lambda) = (\lambda - \lambda_1)^{n1+n2+n3...np} (\lambda - \lambda_2)^{m1+m2+m3...+mq}..., \\
D_{n-1}. (\lambda) = (\lambda - \lambda_1)^{n2 + n3 + ...+np} (\lambda - \lambda_2)^{m2+m3+...+mq} ..., \\
D_{n-2} (\lambda) = (\lambda - \lambda_1)^{n3+...+np} (\lambda - \lambda_2)^{m3+...+mq} ..., \\
. . . . . . . . . . . . . . . . . . . . . . . . . . . $$

При этом, начиная с $ D_{n-p} (\lambda),$ множитель $ (\lambda - \lambda_1) ...$ заменяется единицей, начиная с $ D_{n-q} (\lambda),$ множитель $ (\lambda - \lambda_2) ...$ заменяется единицей и т. д.

Рассмотрим важный пример. Пусть собственному значению $ \lambda_1$ отвечает лишь одна клетка, порядка которой равен $n_1,$ собственному значению $ \lambda_2$ - только одна клетка порядка $ m_1, \lambda_3$ - одна клетка порядка $k_1$ и т. д. (т. е. собственные значения, отвечающие различным клеткам, различны). Тогда $ D_i (\lambda)$ имеют вид
$$ D_n (\lambda) = ( \lambda - \lambda_1)^{n1} (\lambda - \lambda_2)^{m1} (\lambda - \lambda_3)^{k1} ..., \\
D_{n-1} (\lambda) = 1, \\
D_{n-2} (\lambda) = 1, \\
. . . . . . . . . . . . . . . . . . . . . . $$

Указанный выше вид для $ D_k(\lambda)$ показывает, что вместо многочленов $ D_k (\lambda)$ удобнее ввести их отношения
$$ E_k (\lambda) = {{D_k(\lambda)} \over {D_{k-1} (\lambda}}. $$

Многочлены $ E_k (\lambda)$ называются инвариантным множителями. Таким образом, если матрица $A$ имеет жорданову нормальную форму, в которой имеется $p$ "клеток" порядков $n_1, n_2, ..., n_p (n_1 \geqslant n_2 \geqslant ... \geqslant n_p),$ отвечающих собственному значению $ \lambda_1, q$ "клеток" порядков $ m_1, m_2, ..., m_q (m_1 \geqslant m_2 \geqslant ... \geqslant m_q),$ отвечающих собственному значению $ \lambda_2$ и т. д., то инвариантные множители $ E_k (\lambda)$ имеют вид
$$ E_n (\lambda) ,= (\lambda - \lambda_2)^{n1} (\lambda - \lambda_1)^{m1} ... , \\
E_{n-1} (\lambda) = (\lambda - \lambda_1)^{n2} (\lambda - \lambda_2)^{m2} ... , \\
E_{n-2} (\lambda) = (\lambda - \lambda_1)^{n3} (\lambda - \lambda_2)^{m3} ... \\
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . $$

Мы видим, что задание последовательности инвариантных множителей $ E_n (\lambda), E_{n-1} (\lambda), ... $ полностью определяет жорданову нормальную форму матрицы $A;$ собственные значения $\lambda_i$ получаются как корни уравнения $ E_n (\lambda) = 0.$ Размеры же $ n_1, n_2, ..., n_p$ клеток, отвечающих данному собственному значению $ \lambda_1,$ равны степеням, с которыми двучлен $ \lambda - \lambda_1$ содержится соответственно в $ E_n(\lambda), E_{n-1} (\lambda), ... $

Мы теперь в состоянии сформулировать необходимые и достаточные условия существования базиса, в котором матрица линейного преобразования диагональна.

Для того чтобы существовал базис, в котором матрица преобразования диагональна, необходимо и достаточно, чтобы инвариантные множители этой матрицы имели лишь простые корни.

Действительно, мы видели, что кратности корней $ \lambda_1, \lambda_2, ... $ инвариантных множителей определяют порядки клеток в жордановой нормальной форме. Простота корней инвариантных множителей означает, таким образом, что эти клетки первого порядка, т. е. что жорданова нормальная форма матрицы сводится к диагональной.

Теорема 2. Для того чтобы две матрицы были подобны, необходимо и достаточно, чтобы их инвариантные множители совпадали.

Доказательство. Мы доказали, что у подобных матриц совпадают многочлены $ D_k(\lambda).$ Следовательно, совпадают и инвариантные множители $ E_k (\lambda),$ являющиеся их отношениями.

Обратно, пусть инвариантные множители матриц $ A$ и $B$ совпадают. Мы знаем, что каждая матрица подобна некоторой матрице, имеющей жорданову нормальную форму. Так как инвариантные множители у $A$ и $B$ совпадают, то их нормальные жордановы формы тоже совпадают. Таким образом матрицы $ A$ и $B$ подобны одной и той же матрице и, значит, $A$ подобна $B.$

Теорема 3. Нормальная форма линейного преобразования однозначно определяется самим линейным преобразованием.

Доказательство. Матрицы преобразования $A$ в различных базисах подобны. Так как подобны матрицы имеют одинаковые инвариантные множители, а инвариантным множителями однозначно определяется нормальная форма, то нормальная форма данного линейного преобразования определена однозначно, и теорема доказана.

Мы в состоянии теперь найти жорданову нормальную форму матрицы линейного преобразования. Для этого достаточно взять матрицу линейного преобразования в каком-нибудь базисе и найти инвариантные множители матрицы $A.$ Разложив инвариантные множители в произведение вида $ (\lambda - \lambda_1)^n (\lambda - \lambda_2)^m ..., $ мы будем знать как собственные значения, так и отвечающие им порядки клеток.