Tải bản đầy đủ (.pdf) (67 trang)

bài giảng đại số tuyến tính nâng cao

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (451.22 KB, 67 trang )

TÓM TẮT BÀI GIẢNG
Đại số tuyến tính nâng cao
BIÊN SOẠN: NGUYỄN MINH TRÍ
ĐỒNG NAI - 2013
Mục lục
1 Cấu trúc của một tự đồng cấu 3
1.1 Đa thức tối tiểu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Tổng tr ực tiếp các không gian con . . . . . . . . . . . . . . . . . . 9
1.3 Không gian con bất biến . . . . . . . . . . . . . . . . . . . . . . . 15
1.4 Tự đồng cấu lũy linh . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.5 Dạng chuẩn Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.6 Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2 Không gian vectơ Euclide 37
2.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Ánh xạ tuyến tính tr ực giao . . . . . . . . . . . . . . . . . . . . . . 43
2.3 Tự đồng cấu đối xứng . . . . . . . . . . . . . . . . . . . . . . . . . 50
3 Dạng song tuyến tính, dạng toàn phương 55
3.1 Các khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 Ma trận và biểu thức tọa độ . . . . . . . . . . . . . . . . . . . . . . 56
3.3 Dạng chính tắc của dạng toàn phương . . . . . . . . . . . . . . . . 58
3.4 Luật quán tính và phân loại các dạng toàn phương . . . . . . . . . . 63
3.5 Đưa dạng toàn phương về dạng chính tắc bằng phép biến đổi trực giao 64
Tài liệu tham khảo 67
2
Chương 1
Cấu trúc của một tự đồng cấu
Bài toán: Cho một ma trận vuông A. Ta hãy tìm một ma trận đồng dạng với A mà
nó có dạng đơn giản nhất.
Trước tiên ta cần nhắc lại khái niệm hai ma trận tương đương. Hai ma trận
A và B được gọi là tương đương nếu có một ma trận P không suy biến sao cho
P


−1
AP = B. Tích P
−1
AP được gọi là phép biến đổi đồng dạng trên A.
Ta nhận thấy rằng, các ma trận chéo là có dạng đơn giản nhất. Vì thế ta tự hỏi
"Mọi ma trận vuông đều đồng dạng với ma trận chéo?" Trong học phần trước ta đã
chứng minh rằng điều này là không đúng. Ta có thể lấy ví dụ ma trận
A =

0 1
0 0

và thấy rằng A
2
= 0. Nếu tồn tại một ma trận không suy biến P sao cho P
−1
AP =
D với D là ma trận chéo thì
D
2
= P
−1
AP P
−1
AP = P
−1
A
2
P = 0 ⇒ D = 0 ⇒ A = 0,
điều này mâu thuẫn. Do đó ma trận A không đồng dạng với ma trận chéo. Ta nhận

thấy A là một ma trận lũy linh và tổng quát hơn mọi ma trận lũy linh khác ma trận
không đều không chéo hóa được??? Ma trận lũy linh đóng một vai trò quan trọng
trong việc không chéo hóa được.
Tiếp theo ta sẽ nhắc đến một số khái niệm có liên quan đến việc chéo hóa. Một
tập đầy đủ các vectơ riêng của ma trận A cấp n là một tập bất kì gồm n vectơ riêng
độc lập tuyến tính của A. Chú ý rằng: Không phải mọi ma trận đều có một tập đầy
đủ các vectơ riêng.
Ma trận vuông A cấp n chéo hóa được nếu và chỉ nếu A có một tập đầy đủ các
vectơ riêng. Hơn nữa, P
−1
AP = diag(λ
1
, λ
2
, . . . , λ
n
) nếu và chỉ nếu các cột của P
là các vectơ của tập đầy đủ các vectơ riêng của A.
Vì không phải mọi ma trận vuông đều chéo hóa được nên một câu hỏi được đặt ra
là: "Mọi ma trận đều đồng dạng với ma trận dạng tam giác?" Câu trả lời là "Đúng."
3
Ta chú ý rằng, nếu hai ma trận đồng dạng thì chúng có cùng các giá trị riêng kể cả
bội. Tuy nhiên các vectơ riêng của chúng là khác nhau.
Đối với một tự đồng cấu tuyến tính f, ta đã biết rằng các giá trị riêng của ma trận
của f không thây đổi trong các cơ sở khác nhau. Hay ta nói các giá trị riêng của f
độc lập đối với việc chọn cơ sở.
Ta sẽ phát biểu một định lý quan trọng của Schur nói về phép biến đổi đồng dạng
của ma trận như sau.
Định lí 1.0.1. Định lý tam giác hóa của Schur Mọi ma trận vuông A đều đồng dạng
với một ma trận tam giác trên. Tức là tồn tại ma trận không suy biến P và ma trận

tam giác trên T sao cho P
−1
AP = T. Hơn nữa các phần tử nằm trên đường chéo
của ma trận T chính là các giá trị riêng của ma trận A.
Như vậy, ta có thể đặt ra tiếp một câu hỏi là "Mọi ma trận vuông A có thể đồng
dạng với một dạng ma trận nào đơn giản hơn dạng tam giác trên không?" Câu trả lời
là "Có" và ma trận đó được gọi là ma trận chuẩn Jordan. Trong chương này chúng
ta sẽ thấy rằng nếu A ∈ M
n
(C) (tức là ta xét ma trận vuông trên tập số phức) thì A
sẽ đồng dạng với một ma trận chuẩn Jordan nào đó.
Đối với một tự đồng cấu f : V → V ta cũng có các câu hỏi như sau:
• Với mọi tự đồng cấu f, có tồn tại một cơ sở của V sao cho sao cho ma trận của
f đối với cơ sở này là một ma trận chéo?
Nếu có một cơ sở thỏa yêu cầu như trên thì ta nói f chéo hóa được. Tuy nhiên,
ta đã biết rằng không phải mọi tự đồng cấu đều chéo hóa được.
• Trong trường hợp f không chéo hóa được thì ta tìm một cơ sở nào của V sao
cho ma trận của f có đối với cơ sở đó có dạng đơn giản nhất có thể.
1.1 Đa thức tối tiểu
Cho K là một trường, xét không gian vectơ các ma trận vuông M
n
(K) trên K.
Ta có dim M
n
(K) = n
2
. Tập các ma trận
A
0
= I, A, . . . , A

n
2
phụ thuộc tuyến tính vì nó có n
2
+ 1 phần tử. Do đó có một đa thức khác không bậc
n
2
p(x) = a
0
+ a
1
x + . . . + a
n
2
x
n
2
∈ K[x]
sao cho p(A) = 0.
Đa thức nhận A làm "nghiệm" bên trên có bậc n
2
, tuy nhiên ta có thể tìm được
đa thức có bậc nhỏ hơn n
2
và nhận A làm nghiệm. Đó chính là nội dung của Định lý
Cayley-Hamilton mà ta sẽ nói dưới đây.
4
1.1. Đa thức tối tiểu
Ta nhắc lại rằng nếu A ∈ M
n

(K) là một ma trận vuông cấp n thì đa thức đặc
trưng của A là
P
A
(x) = det(A − xI)
với P
A
(x) là đa thức có bậc n.
Định lí 1.1.1 (Định lý Cayley-Hamilton). Cho A ∈ M
n
(K). Khi đó P
A
(A) = 0.
Chứng minh. Ta nhớ rằng nếu A ∈ M
n
(K) và ta kí hiệu adjA là ma trận phụ hợp
của A, thì ta có
A(adjA) = (detA)I.
Đặc biệt đối với ma trận A − xI, ta có
(A −xI)B(x) = det(A −xI)I
với B(x) = adj(A −xI) là ma trận phụ hợp của A −xI. Vì mỗi phần tử trong ma
trận B(x) là định thức của ma trận con cấp n −1 của ma trận A −xI, nên các phần
tử của B(x) là các đa thức có bậc không quá n − 1. Như vậy B(x) có thể phân tích
thành
B(x) = B
0
+ B
1
x + . . . + B
n−1

x
n−1
với B
i
∈ M
n
(K). Ví dụ, nếu
B(x) =



x
2
+ 2 3 −1
x + 1 2 0
2 x x
2
+ 1



thì
B(x) =



1 0 0
0 0 0
0 0 1




x
2
+



0 0 0
1 0 0
0 1 0



x +



2 3 −1
1 2 0
2 0 1



Bây giờ ta có
P
A
(x) = det(A − xI) = a
0
+ a

1
x + . . . + a
n−1
x
n−1
+ a
n
x
n
.
Khi đó
(A −xI)(B
0
+ B
1
x + . . . + B
n−1
x
n−1
) = (a
0
+ a
1
x + . . . + a
n−1
x
n−1
+ a
n
x

n
)I.
Đồng nhất các hệ số của các lũy thừa của x ở hai vế, ta được
AB
0
= a
0
I
AB
1
− B
0
= a
1
I
AB
2
− B
1
= a
2
I
.
.
.
AB
n−1
− B
n−2
= a

n−1
I
−B
n−1
= a
n
I
5 tr
Bây giờ ta nhân bên trái các đẳng thức như sau: đẳng thức thứ nhất với A
0
= I, đẳng
thức thứ hai với A
1
= A, đẳng thức thứ ba với A
2
, . . . , đẳng thức cuối cùng với A
n
.
Khi đó ta được
AB
0
= a
0
I
A
2
B
1
− AB
0

= a
1
A
A
3
B
2
− A
2
B
1
= a
2
A
2
.
.
.
A
n
B
n−1
− A
n−1
B
n−2
= a
n−1
A
n−1

−A
n
B
n−1
= a
n
A
n
Cộng vế với vế của các đẳng thức ta được
0 = a
0
I + a
1
A + . . . + a
n−1
A
n−1
+ a
n
A
n
.
Điều này chứng tỏ A là nghiệm của đa thức đặc trưng.
Chú ý: Ta có thể nhầm lẫn với một cách chứng minh đơn giản bằng cách thay ma
trận A vào x trong đa thức đặc trưng P
A
(x) = det(A − xI) để được P
A
(A) =
det(A − AI) = det0 = 0. Ta thấy rằng việc thay thế như trên là không đúng. Đầu

tiên, trong định lý Cayley-Hamilton P
A
(A) là một ma trận cấp n trong khi đó vế phải
là giá trị của một định thức, nó là một vô hướng (det0 = 0 là một phần tử thuộc
trường K). Thứ hai, ta xét trong khai triển của det(A −xI). Ta lấy
det(A −xI) =





1 −x 2
3 4 − x





nếu ta thay ma trận A vào vị trí của x ta được
det(A −AI) =











1I
2


1 2
3 4

2I
2
3I
2
4I
2


1 2
3 4











.
Khi đó định thức này không chắc bằng 0 và ma trận mở rộng này không thể so

sánh với A − AI và định thức của nó cũng không thể so sánh với P
A
(A). Vì thế
P
A
(A) = det(A − AI) là không đúng.
Định lý Cayley-Hamilton khá đặc biệt vì với mỗi ma trận vuông cấp n ta sẽ tìm
được một đa thức có bậc n sao cho ma trận đó là nghiệm của đa thức vừa tìm được.
6
1.1. Đa thức tối tiểu
Ta thấy rằng tập các đa thức nhận ma trận A làm nghiệm là một tập khác rỗng.
Giả sử rằng p(x) là đa thức có bậc nhỏ nhất là k sao cho p(A) = 0. Chia p(x) cho
hệ số cao nhất của nó, ta được đa thức chuẩn tắc m(x) có bậc k nhận A làm nghiệm
(đa thức chuẩn tắc là đa thức có hệ số cao nhất là 1).
Định nghĩa 1.1.2. Cho A ∈ M
n
(K). Khi đó đa thức tối tiểu của A, kí hiệu là
m
A
(x), là đa thức chuẩn tắc có bậc nhỏ nhất sao cho m
A
(A) = 0.
Đa thức tối tiểu của ma trận A là duy nhất. Thật vậy, giả sử rằng có một đa thức
chuẩn tắc m

(x) có bậc k sao cho m

(A) = 0. Khi đó m(x) − m

(x) là đa thức

khác không có bậc nhỏ hơn k nhận A làm nghiệm. Điều này mâu thuẫn với việc giả
sử k là bậc nhỏ nhất. Do đó, đa thức m(x) đó là đa thức chuẩn tắc duy nhất có bậc
nhỏ nhất nhận A làm nghiệm.
Định lí 1.1.3. Nếu p(x) là một đa thức sao cho p(A) = 0 thì m
A
(x) | p(x).
Chứng minh. Giả sử p(A) = 0 và khi chia p(x) cho m
A
(x) ta được
p(x) = s(x)m
A
(x) + r(x)
với degr(x) < degm
A
(x). Ta có
0 = p(A) = s(A)m
A
(A) + r(A) = s(A).0 + r(A) = r(A).
Vì m
A
(x) là đa thức tối thiểu của A và degr(x) < degm
A
(x), từ đó ta suy ra
r(x) = 0. Như vậy ta được p(x) = s(x)m
A
(x) và do đó m
A
(x) chia hết p(x).
Hệ quả 1.1.4. Ta có m
A

(x) chia hết P
A
(x).
Từ đây, ta thấy các nghiệm của m
A
(x) cũng là nghiệm của P
A
(x). Điều ngược lại
cũng đúng sẽ được trình bày trong định lý dưới đây.
Định lí 1.1.5. Các đa thức m
A
(x) và P
A
(x) có cùng tập nghiệm.
Chứng minh. Từ hệ quả 1.1.4, ta thấy mọi nghiệm của đa thức tối tiểu đều là nghiệm
của đa thức đặc trưng. Ngược lại, nếu λ là một nghiệm của P
A
(x) thì λ là giá trị riêng
của A và vì thế có một ma trận cột khác không x ∈ M
n×1
(K) sao cho Ax = λx.
Chú ý rằng p(λ) là giá trị riêng của p(A) với p(x) là một đa thức bất kì. Do đó
p(λ) là nghiệm của P
p(A)
(x). Đặc biệt đối với m
A
(x) ta có m
A
(A) = 0 và
P

m
A
(A)
(x) = P
0
(x) = det(−xI) = (−1)
n
x
n
.
Với mỗi giá trị riêng λ của A thì λ là nghiệm của P
A
(x) và m
A
(λ) là nghiệm của
P
m
A
(A)
(x) = (−1)
n
x
n
. Vì đa thức (−1)
n
x
n
chỉ có nghiệm là 0 nên m
A
(λ) = 0 hay

λ là nghiệm của đa thức m
A
(x).
7
Nhận xét: Nếu đa thức đặc trưng của A có dạng
P
A
(x) = (−1)
n
(x −λ
1
)
d
1
(x −λ
2
)
d
2
. . . (x − λ
k
)
d
k
;
thì đa thức tối tiểu của A có dạng
m
A
(x) = (x − λ
1

)
e
1
(x −λ
2
)
e
2
. . . (x − λ
k
)
e
k
;
với e
i
≤ d
i
với 1 ≤ i ≤ k.
Ví dụ 1.1.1. Đa thức đặc trưng của
A =



1 0 1
0 2 1
−1 0 3




là P
A
(x) = (x −2)
3
. Vì A −2I = 0 và (A −2I)
2
= 0 nên ta có m
A
(x) = P
A
(x).
Ví dụ 1.1.2. Ma trận
A =



5 −6 −6
−1 4 2
3 −6 −4



có đa thức đặc trưng là P
A
(x) = −(x −1)(x −2)
2
. Theo Định lý 1.1.5, đa thức tối
tiểu của A là (x −1)(x −2) hoặc (x − 1)(x −2)
2
. Vì (A − I)(A −2I) = 0 nên

đa thức tối tiểu là m
A
(x) = (x − 1)(x − 2).
Tập hợp các tự đồng cấu tuyến tính trên V kí hiệu là L(V ). Ta kiểm tra được rằng
L(V ) cùng với phép cộng và phép nhân với vô hướng là một K−không gian vectơ.
Nếu số chiều của V là n thì số chiều của L(V ) là n
2
.
Hợp thành của hai tự đồng cấu tuyến tính là một tự đồng cấu tuyến tính. Ta có thể
coi việc lấy ánh xạ hợp như là một phép nhân trong L(V ). Đặc biệt, ánh xạ đồng nhất
id
V
là một tự đồng cấu tuyến tính có vai trò giống như phần tử đơn vị trong L(V ).
Ngoài những tính chất chung của không gian các ánh xạ tuyến tính, không gian
các tự đồng cấu tuyến tính có các tính chất sau:
Bổ đề 1.1.6. Cho α, β, γ ∈ L(V ) và k ∈ K. Ta có
1. (α + β)γ = αγ + βγ.
2. α(β + γ) = αβ + αγ.
3. k(αβ) = (kα)β = α(kβ).
8
1.2. Tổng trực tiếp các không gian con
Cho p = a
0
+ a
1
x + . . . + a
n
x
n
∈ K[x] là đa thức bất kỳ với biến x. Khi đó, với

bất kỳ tự đồng cấu tuyến tính f ∈ L(V ), ta có tự đồng cấu tuyến tính p(f) ∈ L(V )
là đa thức mà trong đó tự đồng cấu tuyến tính f được thay thế vào biến x như sau:
p(f) = a
0
id + a
1
f + . . . + a
n
f
n
trong đó id là phép đồng nhất trên V. Ta dễ dàng kiểm tra được f ◦p(f) = p(f) ◦f.
Để đơn giản ta kí hiệu fp(f) thay cho f ◦p(f). Tổng quát hơn, nếu p(x) và q(x) là
các đa thức thì ta có p(f)q(f) = q(f)p(f).
Cho tự đồng cấu tuyến tính f : V → V và A là ma trận của f đối với một cơ sở
cố định nào đó của V. Khi đó ma trận của f đối với một cơ sở khác có dạng P
−1
AP
với P là ma trận chuyển cơ sở từ cơ sở ban đầu sang cơ sở lúc sau. Khi đó đa thức
đặc trưng của P
−1
AP có dạng
det(P
−1
AP − xI) = det[P
−1
(A −xI)P ]
= detP
−1
det(A −xI)detP
= det(A −xI),

tức là ta có
P
P
−1
AP
(x) = P
A
(x).
Điều này cho ta thấy rằng đa thức đặc trưng không phụ thuộc vào cách chọn cơ sở.
Vì thế, ta có thể định nghĩa đa thức đặc trưng của f là đa thức đặc trưng của bất kì
ma trận nào của f đối với một cơ sở nào đó.
Tương tự, ta cũng có đa thức tối tiểu của một tự đồng cấu tuyến tính chính là
đa thức tối tiểu của ma trận của ánh xạ đó đối với một cơ sở nào đó. Ta lần lượt kí
hiệu đa thức đặc trưng và đa thức tối tiểu của f là P
f
và m
f
. Chú ý rằng ta cũng có
P
f
(f) = 0 và m
f
(f) = 0.
1.2 Tổng trực tiếp các không gian con
Nếu A, B là các tập con khác rỗng của không gian vectơ V trên trường K thì
không gian con sinh bởi A ∪ B là không gian con nhỏ nhất của V chứa cả A và B.
Đó cũng là tập tất cả các tổ hợp tuyến tính của các phần tử của A ∪B. Hay nói cách
khác, đó là tập các phần tử có dạng
m


i=1
λ
i
a
i
+
n

i=1
µ
i
b
i
với a
i
∈ A, b
i
∈ B và λ
i
, µ
i
∈ K. Trong trường hợp đặc biệt A và B là các không
gian con của V ta có
m

i=1
λ
i
a
i

∈ A và
n

i=1
µ
i
b
i
∈ B, vì thế tập này có thể được mô
9 tr
tả như sau
{a + b | a ∈ A, b ∈ B}.
Ta gọi đó là tổng của hai không gian con A, B kí hiệu A + B. Tổng quát hơn, nếu
A
1
, . . . , A
n
là các không gian con của V khi đó ta định nghĩa tổng của chúng là
không gian con sinh bởi
n

i=1
A
i
. Ta kí hiệu không gian con này là A
1
+ A
2
+ . . . + A
n

hay
n

i=1
A
i
. Từ đó suy ra
n

i=1
A
i
= {a
1
+ a
2
+ . . . + a
n
| a
i
∈ A
i
}.
Định nghĩa 1.2.1. Tổng
n

i=1
A
i
của các không gian con A

1
, . . . , A
n
được gọi là tổng
trực tiếp nếu mỗi phần tử x ∈
n

i=1
A
i
có thể biểu diễn được duy nhất dưới dạng
x = a
1
+ . . . + a
n
với a
i
∈ A
i
với mọi i.
Khi tổng
n

i=1
A
i
là tổng trực tiếp ta kí hiệu là
n

i=1

A
i
hay A
1
⊕. . . ⊕A
n
và gọi là
tổng tr ực tiếp của các không gian con A
1
, . . . , A
n
.
Ví dụ 1.2.1. Trong R
3
xét các không gian con
A = {(x, y, z) | x + y + z = 0}, B = {(x, x, z) | x, z ∈ R}.
Khi đó R
3
= A + B vì mỗi phần tử (x, y, z) có thể biểu diễn dưới dạng

1
2
(x −y), −
1
2
(x −y), 0

+

1

2
(x + y),
1
2
(x + y), z

nó có dạng a + b với a ∈ A và b ∈ B. Tổng A + B không là tổng trực tiếp vì sự
biểu diễn đó là không duy nhất. Thật vậy, ta có một các biểu diễn khác của (x, y, z)


1
2
(x −y + 1), −
1
2
(x −y − 1), −1

+

1
2
(x + y − 1),
1
2
(x + y − 1), z+

có dạng a

+ b


với a

∈ A, b

∈ B và a = a

, b = b

.
Một tiêu chuẩn thường được sử dụng để chứng minh tổng trực tiếp được trình bày
trong định lý sau.
Định lí 1.2.2. Nếu A
1
, . . . , A
n
là các không gian con của V thì các điều sau đây là
tương đương:
10
1.2. Tổng trực tiếp các không gian con
(i) tổng
n

i=1
A
i
là tổng tr ực tiếp;
(ii) nếu
n

i=1

a
i
= 0 với a
i
∈ A
i
thì a
i
= 0;
(iii) A
i


j=i
A
j
= {0} với mọi i.
Chứng minh. Chứng minh xem như bài tập.
Hệ quả 1.2.3. V = A
1
⊕ A
2
khi và chỉ khi V = A
1
+ A
2
và A
1
∩ A
2

= {0}.
Ví dụ 1.2.2. Cho V = M
n
(R). Nếu A, B lần lượt là các không gian vectơ con của
V gồm các ma trận đối xứng và phản đối xứng thì V = A ⊕B. Tức là mỗi ma trận
đều có một sự biểu diễn duy nhất dưới dạng tổng của một ma trận đối xứng và một
ma trận phản đối xứng. (Chứng minh xem như bài tập).
Một tính chất quan trọng của tổng trực tiếp liên quan đến cơ sở của các không
gian con được trình bày trong định lý dưới đây.
Định lí 1.2.4. Cho V
1
, . . . , V
n
là các không gian con khác không của không gian
vectơ hữu hạn chiều V sao cho V =
n

i=1
V
i
. Nếu B
i
là một cơ sở của V
i
thì
n

i=1
B
i


một cơ sở của V.
Chứng minh. Với mỗi i, giả sử không gian con V
i
có chiều là d
i
và cơ sở B
i
=
{b
i1
, . . . , b
id
i
}. Vì V =
n

i=1
V
i
nên ta có V
i


j=i
V
j
= {0} và do đó V
i
∩V

j
= {0}
với mọi i = j. Do đó B
i
∩ B
j
= ∅ với mọi i = j. Ta lấy một phần tử thuộc không
gian sinh bởi
n

i=1
B
i
thì phần tử đó có dạng
d
1

j=1
λ
1j
b
1j
+ . . . +
d
n

j=1
λ
nj
b

nj
(1.1)
tức là nó có dạng
x
1
+ . . . + x
n
với x
i
=
d
i

j=1
λ
ij
b
ij
. (1.2)
Vì V =
n

i=1
V
i
và B
i
là một cơ sở của V
i
nên mỗi phần tử x ∈ V có thể biểu diễn

dưới dạng (1.1) và vì thế V được sinh bởi
n

i=1
B
i
. Tiếp theo, nếu trong (1.2) ta có
11 tr
x
1
+ . . . + x
n
= 0 thì theo Định lý 1.2.2 ta có x
i
= 0 do đó λ
ij
= 0. Như vậy
n

i=1
B
i
là một cơ sở của V.
Hệ quả 1.2.5. Giả sử V =
n

i=1
V
i
. Khi đó

dim V =
n

i=1
dim V
i
.
Mục đích của chúng ta là xác định khi nào một không gian vectơ là tổng trực tiếp
của hữu hạn các không gian con khác không. Chúng ta sẽ thấy rằng việc này có liên
quan đến ánh xạ tuyến tính.
Định nghĩa 1.2.6. Cho A, B là các không gian con của không gian vectơ V sao cho
V = A ⊕B. Khi đó với mỗi x ∈ V có thể biểu diễn duy nhất dưới dạng x = a + b
với a ∈ A và b ∈ B. Phép chiếu lên A song song với B là một ánh xạ tuyến tính
p
A
: V → V xác định bởi p
A
(x) = a.
Ví dụ 1.2.3. Ta biết R
2
= X ⊕D với X = {(x, 0) | x ∈ R} và D = {(x, x) | x ∈
R}. Phép chiếu lên X song song với B xác định như sau p
X
(x, y) = (x −y, 0). Do
đó ảnh của điểm (x, y) là giao của X và đường thẳng đi qua (x, y) và song song với
đường thẳng D.
Định nghĩa 1.2.7. Một ánh xạ tuyến tính f : V → V được gọi là một phép chiếu
nếu có các không gian con A, B của V sao cho V = A ⊕ B và f là phép chiếu lên
A song song với B. Một tự đồng cấu tuyến tính f được gọi là lũy đẳng nếu f
2

= f.
Định lí 1.2.8. Nếu V = A ⊕ B và p là một phép chiếu lên A song song với B thì
(i) A = Imp = {x ∈ V | x = p(x)};
(ii) B = Kerp;
(iii) p lũy đẳng.
Chứng minh. (i) Ta có Imp ⊂ A. Nếu lấy a ∈ A thì có duy nhất một sự biểu diễn
thành tổng của một phần tử của A và một phần tử của B, và rõ ràng a = a + 0. Do
đó p(a) = a và như thế ta có đẳng thức cần chứng minh.
(ii) Lấy x ∈ V, ta có duy nhất một sự biểu diễn x = a + b với a ∈ A và b ∈ B.
Khi đó p(x) = a, ta có
p(x) = 0 ⇔ 0 = a ⇔ x = b ∈ B.
Hay nói cách khác Kerp = B.
(iii) Với mỗi x ∈ V ta có p(x) ∈ A và vì thế p[p(x)] = p(x). Do đó p
2
= p.
12
1.2. Tổng trực tiếp các không gian con
Phép chiếu và các đồng cấu lũy đẳng đóng vai trò quan trọng như ta sẽ thấy trong
định lý dưới đây.
Định lí 1.2.9. Một ánh xạ tuyến tính f : V → V là phép chiếu khi và chỉ khi nó là
lũy đẳng, khi đó ta có V = Imf ⊕ Kerf và f là phép chiếu lên Imf song song với
Kerf.
Chứng minh. Giả sử f là một phép chiếu. Khi đó có các không gian con A, B của V
sao cho V = A ⊕B và f là phép chiếu lên A song song với B. Theo Định lý 1.2.8
(iii), ta có f lũy đẳng.
Ngược lại, nếu f : V → V lũy đẳng. Ta chứng minh V = Imf ⊕ Kerf. (Bài
tập).
Cuối cùng, giả sử x = a + b với a ∈ Imf và b ∈ Kerf. Khi đó ta có y ∈ V sao
cho a = f(y) và f(b) = 0. Do đó
f(x) = f(a + b) = f(a) + 0 = f[f(y)] = f(y) = a.

Như thế f là một phép chiếu lên Imf song song với Kerf.
Hệ quả 1.2.10. Nếu f : V → V là một phép chiếu thì id
V
− f cũng là một phép
chiếu và Imf = Ker(id
V
− f).
Chứng minh. Theo Định lý 1.2.8 ta có f lũy đẳng, tức là f
2
= f. Khi đó
(id
V
− f)
2
= id
V
− f − f + f
2
= id
V
− f.
Hơn nữa, theo cũng theo Định lý 1.2.8, ta lại có
x ∈ Imf ⇔ x = f(a), a ∈ V ⇔ x = f(a) = f(f(a)) = f(x) ⇔ (id
V
−f)(x) = 0
và vì thế Imf = Ker(id
V
− f).
Bây giờ ta sẽ chỉ ra rằng sự phân tích của một không gian vectơ thành tổng trực
tiếp của hữu hạn các không gian con khác không có thể biểu diễn thông qua phép

chiếu.
Định lí 1.2.11. Cho V là một không gian vectơ và V
1
, . . . , V
n
là các không gian
con của V. Ta có V =
n

i=1
V
i
khi và chỉ khi có các ánh xạ tuyến tính khác không
p
1
, . . . , p
n
: V → V sao cho
(i)
n

i=1
p
i
= id
V
;
(ii) p
i
◦ p

j
= 0 với i = j.
13 tr
Hơn nữa, mỗi p
i
là một phép chiếu lên V
i
= Imp
i
.
Chứng minh. (⇒) Đầu tiên ta giả sử rằng V =
n

i=1
V
i
. Khi đó với i = 1, . . . , n ta
có V = V
i


j=i
V
j
. Gọi p
i
là phép chiếu lên V
i
song song với


j=i
V
j
. Với x ∈ V
và i = j, ta có
p
i
[p
j
(x)] ∈ p
i
(Imp
j
) = p
i
(V
j
) theo Định lý 1.2.8
⊆ p
i
(

k=i
V
k
) (vì V
j


k=i

V
k
)
= p
i
(Kerp
i
) (theo Định lý 1.2.9 ta có Kerp
i
=

k=i
V
k
)
= {0}
và do đó p
i
◦ p
j
= 0.
Vì mỗi x ∈ V đều có sự biểu diễn duy nhất dưới dạng x =
n

i=1
x
i
với x
i
∈ V

i
, ta

x =
n

i=1
x
i
=
n

i=1
p
i
(x
i
) =

n

i=1
p
i

(x).
Do đó
n

i=1

p
i
= id
V
.
(⇐) Ngược lại, giả sử p
1
, . . . , p
n
thỏa các điều kiện (i) và (ii). Khi đó ta chú ý
rằng
p
i
= p
i
◦ id
V
= p
i

n

j=1
p
j
=
n

j=1
(p

i
◦ p
j
) = p
i
◦ p
i
và vì thế p
i
lũy đẳng và như thế theo Định lý 1.2.9 nó là một phép chiếu.
Bây giờ ta lấy x ∈ V ta có
x = id
V
(x) =

n

i=1
p
i

(x) =
n

i=1
p
i
(x) ∈
n


i=1
Imp
i
.
Điều này chứng tỏ V =
n

i=1
Imp
i
.
Nếu lấy x ∈ Imp
i


i=i
Imp
j
thì theo Định lý 1.2.8, ta có x = p
i
(x) và
x =

j=i
x
j
với p
j
(x
j

) = x
j
với mọi j = i. Suy ra
x = p
i
(x) = p
i


j=i
x
j

= p
i


j=i
p
j
(x
j
)

=


j=i
p
i

[p
j
(x
j
)]

= 0.
14
1.3. Không gian con bất biến
Điều này cho ta thấy rằng V =
n

i=1
Imp
i
.
1.3 Không gian con bất biến
Định nghĩa 1.3.1. Nếu V là một K−không gian vectơ và f : V → V là một tự
đồng cấu tuyến tính. Không gian con U của V được gọi là không gian con bất biến
đối với f (hay f−bất biến) nếu f(U) ⊂ U, tức là nếu x ∈ U thì f(x) ∈ U.
Ví dụ 1.3.1. Nếu f : V → V là một tự đồng cấu thì Imf và Kerf là các không gian
con f−bất biến của V.
Ví dụ 1.3.2. Cho D là ánh xạ đạo hàm trên không gian vectơ R[x] tập các đa thức
với hệ số thực. Khi đó D tuyến tính và không gian con R
n
[x] gồm các đa thức có bậc
không quá n là một D−bất biến vì đạo hàm của một đa thức có bậc không quá n
cũng là một đa thức có bậc không quá n.
Ví dụ 1.3.3. Cho f : V → V là một tự đồng cấu tuyến tính và 0 = x ∈ V. Khi
đó không gian con sinh bởi x là f−bất biến khi và chỉ khi x là một vectơ riêng của

f. Thật vậy nếu x là f−bất biến thì f(x) ∈ x, tức là tồn tại k ∈ K sao cho
f(x) = kx hay x chính là vectơ riêng của f.
Định lí 1.3.2. Cho f : V → V là một tự đồng cấu tuyến tính và đa thức p ∈ K[x].
Khi đó các không gian con Imp(f) và Kerp(f) là các f−bất biến.
Chứng minh. Chú ý rằng với mọi đa thức p, ta có f ◦p(f) = p(f) ◦f. Để thuận tiện
ta viết fp(f) thay cho f ◦p(f). Do đó nếu x = p(f)(y) thì f(x) = f [p(f)(y)] =
p(f)[f(y)] ∈ Imp(f), do đó Imp(f) là f−bất biến. Tương tự, nếu x ∈ Kerp(f)
tức là p(f)(x) = 0 thì 0 = f(p(f)(x)) = p(f)[f(x)], hay f(x) ∈ Kerp(f). Do
đó Kerp(f) là f−bất biến.
Từ tính chất f ◦ p(f) = p(f) ◦ f, ta suy ra được một kết quả tổng quát như sau.
Cho p(x), q(x) ∈ K[x] và f là một tự đồng cấu p(f) ◦ q(f) = q(f) ◦ p(f).
Các đa thức hệ số thực có thể không có nghiệm thực nhưng luôn có nghiệm phức.
Từ đây ta có định lý sau:
Định lí 1.3.3. Mỗi tự đồng cấu của không gian vectơ thực đều có không gian con bất
biến 1 chiều hoặc 2 chiều.
Chứng minh. Giả sử V là môt không gian vectơ thực và tự đồng cấu f : V → V
có ma trận A trong cơ sở {e
1
, . . . , e
n
} của V. Khi đó đa thức đặc trưng P
f
(λ) =
det(A −λI) là một đa thức hệ số thực.
15 tr
Nếu phương trình det(A−λI) = 0 có một nghiệm thực thì f có một giá trị riêng
thực, do đó nó có không gian con bất biến một chiều.
Ngược lại, giả sử phương trình det(A − λI) = 0 không có nghiệm thực. Gọi
λ = a + bi (a, b ∈ R và i là đơn vị ảo) là một nghiệm phức không thực của nó
và (z

1
, . . . , z
n
) ∈ C
n
/{(0, . . . , 0)} là một nghiệm của hệ phương trình tuyến tính
thuần nhất
(A −λI)x = 0.
Giả sử z
j
= x
j
+ iy
j
(x
j
, y
j
∈ R) thì
n

j=1
a
kj
(x
j
+ iy
j
) = λ(x
k

+ iy
k
)

n

j=1
a
kj
(x
j
+ iy
j
) = (a + ib)(x
k
+ iy
k
)
Suy ra












n

j=1
a
kj
x
j
= ax
k
− by
k
n

j=1
a
kj
y
j
= bx
k
+ ay
k
Nếu ta đặt α =
n

j=1
x
j
e
j

và β =
n

j=1
y
j
e
j
. Khi đó các hệ thức bên trên tương đương

f(α) = aα −bβ
f(β) = bα + aβ.
Nghĩa là α, β là không gian con bất biến đối với f. Rõ ràng nó có số chiều nhỏ hơn
hoặc bằng 2. Ta sẽ chứng minh số chiều của α, β bằng 2.
Nếu α = 0 thì f(α) = −bβ suy ra β = 0 vì b = 0. Do đó (z
1
, . . . , z
n
) =
(0, . . . , 0), điều này dẫn đến mâu thuẫn.
Nếu α = 0 và β = kα thì f(β) = kf(α) suy ra bα + aβ = k(aα −bβ). Do đó
(b−ka)α = −(a+ kb)β = −(a+kb)kα. Từ đây ta có (b −ka + ka+ k
2
b)α = 0
hay b(1 + k
2
)α = 0. Điều này mâu thuẫn với b = 0 và α = 0. Từ đó {α, β}độc lập
tuyến tính, suy ra dimα, β = 2.
Giả sử f ∈ L(V ) và U là một không gian con f−bất biến của V. Khi đó f cảm
sinh ánh xạ tuyến tính f : U → U xác định bởi x → f(x) = f(x) ∈ U. Tức là f là

thu hẹp của f trên U. Ta chọn một cơ sở {u
1
, . . . , u
r
} của U và mở rộng thành cơ sở
{u
1
, . . . , u
r
, v
1
, . . . , v
n−r
}
16
1.3. Không gian con bất biến
của V. Xét ma trận của f đối với cơ sở này. Vì U là f−bất biến nên với mỗi i ta có
f(u
i
) ∈ U do đó f(u
i
) có sự biểu diễn
f(u
i
) = λ
i1
u
1
+ . . . + λ
ir

u
r
+ 0v
1
+ . . . + 0v
n−r
,
do đó ma trận của f có dạng

A B
0 C

với A là ma trận cấp r × r chính là ma trận của f trên U.
Giả sử V = V
1
⊕ V
2
với V
1
và V
2
là các không gian con f−bất biến của V. Nếu
B
1
là cơ sở của V
1
và B
2
là một cơ sở của V
2

thì ta có B = B
1
∪B
2
là một cơ sở của
V. Khi đó ta có ma trận của f đối với cơ sở B có dạng

A
1
0
0 A
2

,
trong đó A
1
, A
2
lần lượt là các ma trận của f cảm sinh trên V
1
, V
2
.
Tổng quát hơn, nếu V =
k

i=1
V
i
với V

i
là các f−bất biến và nếu B
i
là cơ sở của
V
i
với mỗi i thì ma trận của f đối với cơ sở B =
k

i=1
B
i
là ma trận chéo dạng khối
như sau





A
1
A
2
.
.
.
A
k






với A
i
là ma trận của f cảm sinh trên V
i
. Vì vậy A
i
là ma trận vuông có cấp dim V
i
.
Tiếp theo chúng ta sẽ sử dụng các khái niệm tổng trực tiếp và không gian con bất
biến để tìm một cơ sở của V mà ma trận của f đối với cơ sở này có dạng chéo khối.
Việc nghiên cứu các vấn đề này được tr ình bày trong định lý sau.
Định lí 1.3.4 (Định lý phân tích nguyên sơ) . Cho f ∈ L(V ). Giả sử đa thức đặc
trưng và đa thức tối tiểu của f lần lượt là
P
f
= p
d
1
1
p
d
2
2
. . . p
d
k

k
và m
f
= p
e
1
1
p
e
2
2
. . . p
e
k
k
,
trong đó p
1
, p
2
, . . . , p
k
là các đa thức bất khả qui trong K[x]. Khi đó mỗi không gian
con V
i
= Kerp
e
i
i
(f) là các f−bất biến và V =

k

i=1
V
i
. Các V
i
được gọi là các thành
phần nguyên sơ của V.
Hơn nữa, nếu f
i
: V
i
→ V
i
là một ánh xạ tuyến tính cảm sinh trên V
i
bởi f thì đa
thức đặc trưng của f
i
là p
d
i
i
và đa thức tối tiểu của f
i
là p
e
i
i

.
17
Chứng minh. Nếu k = 1 thì p
e
1
1
(f) = m
f
(f) = 0 và V = Kerp
e
1
1
(f) = V
1
. Giả
sử k ≥ 2. Với i = 1, 2, . . . , k đặt
q
i
= m
f
/p
e
i
i
=

j=i
p
e
j

j
.
Khi đó ước chung lớn nhất của q
1
, q
2
, . . . , q
k
là 1 vì thế tồn tại a
1
, . . . , a
k
∈ K[x]
sao cho
a
1
q
1
+ a
2
q
2
+ . . . + a
k
q
k
= 1.
Đặt a
i
q

i
= t
i
, thay f vào x ta được tự đồng cấu đồng nhất
t
1
(f) + t
2
(f) + . . . + t
k
(f) = id
V
. (1.3)
Theo định nghĩa của các đa thức q
i
, ta có m
f
chia hết q
i
q
j
nếu i = j. Do đó
q
i
(f)q
j
(f) = 0 với mọi i = j và khi đó
t
i
(f)t

j
(f) = 0. (1.4)
Từ (1.3), (1.4) và Định lý 1.2.11 ta thấy rằng mỗi t
i
(f) là một phép chiếu và do đó
V =
k

i=1
Imt
i
(f).
Hơn nữa, theo Định lý 1.3.2, mỗi không gian con Imt
i
(f) là f−bất biến.
Bây giờ ta chỉ ra rằng
Imt
i
(f) = Kerp
e
i
i
(f).
Đầu tiên, vì p
e
i
i
q
i
= m

f
nên ta có p
e
i
i
(f)q
i
(f) = m
f
(f) = 0 và p
e
i
i
(f)q
i
(f)a
i
(f) =
0 do đó Imt
i
(f) ⊆ Kerp
e
i
i
(f). Để có chiều ngược lại, với mỗi j ta có
t
j
(f) = a
j
(f)q

j
(f) = a
j
(f)

i=j
p
e
i
i
(f),
từ đó ta thấy rằng
Kerp
e
i
i
(f) ⊆

j=i
Kert
j
(f)
⊆ Ker

j=i
t
j
(f)
= Ker(id
V

− t
i
(f)) do (1.3)
= Imt
i
(f) theo Hệ quả 1.2.10.
Với mỗi ánh xạ cảm sinh f
i
: V
i
→ V
i
, đặt m
f
i
là đa thức tối tiểu của nó. Theo giả
thiết ta có V
i
= Kerp
e
i
i
(f) nên p
e
i
i
(f) là ánh xạ không trên V
i
và do đó p
e

i
i
(f
i
) cũng
18 tr
1.3. Không gian con bất biến
là ánh xạ không. Suy ra m
f
i
| p
e
i
i
cho nên m
f
i
| m
f
và các đa thức m
f
i
nguyên tố
cùng nhau. Tiếp theo ta chứng minh m
f
là bội chung nhỏ bất của m
f
1
, m
f

2
, . . . , m
f
k
.
Giả sử rằng g ∈ K[x] là bội chung của các m
f
i
với mọi i, ta sẽ chỉ ra m
f
| g. Rõ
ràng g(f
i
) là ánh xạ không trên V
i
vì m
f
i
là ánh xạ không. Với mỗi x ∈
k

i=1
v
i

k

i=1
V
i

= V khi đó ta có
g(f)(x) =
k

i=1
g(f)(v
i
) =
k

i=1
g(f
i
)(v
i
) = 0
và vì thế g(f) = 0 do đó m
f
| g. Như vậy ta thấy rằng m
f
là bội chung nhỏ bất
của m
f
1
, m
f
2
, . . . , m
f
k

. Vì các đa thức này đôi một nguyên tố cùng nhau nên ta có
m
f
=
k

i=1
m
f
i
. Nhưng ta biết rằng m
f
=
k

i=1
p
e
i
i
và m
f
i
| p
e
i
i
. Do tất cả các đa thức
đều là đa thức chuẩn tắc nên m
f

i
= p
e
i
i
với mọi i = 1, . . . , k.
Cuối cùng, sử dụng Định lý 1.2.4 ta có thể hợp các cơ sở của các không gian con
V
i
với nhau để tạo thành cơ sở của V. Khi đó ma trận của f đối với cơ sở này có dạng
chéo khối
M =





A
1
A
2
.
.
.
A
k






Từ cách tính định thức ta có
det(M − xI) =
k

i=1
det(A
i
− xI)
và P
f
=
k

i=1
P
f
i
. Ta đã có m
f
i
= p
e
i
i
. Vì m
f
i
và P
f

i
có cùng tập nghiệm nên
P
f
i
= p
r
i
i
với r
i
≥ e
i
. Do đó
k

i=1
p
r
i
i
= P
f
=
k

i=1
p
d
i

i
từ đó suy ra r
i
= d
i
với mọi
i = 1, . . . , k.
Hệ quả 1.3.5. Ta có dim V
i
= d
i
degp
i
.
Chứng minh. Ta có bậc của đa thức đặc trưng của ánh xạ tuyến tính f : V → V
bằng số chiều của V. Do đó dim V
i
là bậc của P
f
i
= p
d
i
i
và ta có điều phải chứng
minh.
19 tr
Trong trường hợp p
i
là các đa thức bậc nhất thì p

e
i
i
có dạng (x − λ
i
)
e
i
và V
i
=
Ker(p
e
i
i
)(f) = Ker(f −λ
i
id
V
)
e
i
. Ta có hệ quả sau.
Hệ quả 1.3.6. Nếu tất cả các giá tr ị riêng của f đều thuộc K, thì ta có
P
f
= (x −λ
1
)
d

1
(x −λ
2
)
d
2
. . . (x − λ
k
)
d
k
;
m
f
= (x −λ
1
)
e
1
(x −λ
2
)
e
2
. . . (x − λ
k
)
e
k
;

thì V
i
= Ker(f −λ
i
id
V
)
e
i
là f−bất biến có chiều là d
i
và V =

k
i=1
V
i
.
Ví dụ 1.3.4. Xét ánh xạ tuyến tính f : R
3
→ R
3
xác định bởi
f(x, y, z) = (−z, x + z, y + z).
Ta có ma trận của f đối với cơ sở chính tắc là
A =



0 0 −1

1 0 1
0 1 1



Khi đó, ta có P
f
= m
f
= (x + 1)(x −1)
2
. Theo Hệ quả 1.3.6 của Định lý 1.3.4,
ta có
R
3
= Ker(f + id) ⊕ Ker(f − id)
2
với số chiều của Ker(f + id) là 1 và số chiều của Ker(f −id)
2
là 2. Ta thấy rằng
(f + id)(x, y, z) = (x −z, x + y + z, y + 2z)
vì thế cơ sở của Ker(f + id) là {(1, −2, 1)}. Tương tự, ta có
(f − id)
2
(x, y, z) = (x −y + z, −2x + 2y − 2z, x − y + z)
vì thế cơ sở của (f −id)
2
là {(0, 1, 1), (1, 1, 0)}. Do đó có một cơ sở của R
3
để ma

trận của f có dạng chéo khối là
B = {(1, −2, 1), (0, 1, 1), (1, 1, 0)}.
Ma trận chuyển cơ sở từ cơ sở chính tắc sang B là
P =



1 0 1
−2 1 1
1 1 0



và ma trận chéo khối của f đối với cơ sở B là
P
−1
AP =



−1
2 1
−1 0



20
1.3. Không gian con bất biến
Ta xem xét một trường hợp đặc biệt của Định lý phân tích nguyên sơ. Ta xem trong
trường hợp mỗi nhân tử của m

f
là tuyến tính, tức là
m
f
= (x −λ
1
)(x −λ
2
) . . . (x − λ
k
).
Ta nhắc lại một kết quả quan trọng như sau: tự đồng cấu f : V → V được gọi là
chéo hóa được nếu có một cơ sở của V gồm các vectơ riêng của f hay tương đương
với V có một cơ sở sao cho ma trận của f đối với cơ sở đó là ma trận chéo.
Định lí 1.3.7. Cho V là một không gian vectơ hữu hạn chiều khác không và f : V →
V là một tự đồng cấu tuyến tính. Khi đó các điều sau đây là tương đương:
(i) Đa thức tối tiểu m
f
của f là tích của các nhân tử tuyến tính;
(ii) f chéo hóa được.
Chứng minh. (i) ⇒ (ii): Từ (i) ta có
m
f
= (x −λ
1
)(x −λ
2
) . . . (x − λ
k
)

với λ
1
, . . . , λ
k
là các giá trị phân biệt của K. Theo Định lý 1.3.4, V là tổng trực tiếp
của các không gian con f−bất biến V
i
= Ker(f − λ
i
id
V
). Với mỗi x ∈ V
i
ta có
(f − λ
i
id
V
)(x) = 0, vì thế f(x) = λ
i
x. Do đó λ
i
là một giá trị riêng của f và mỗi
phần tử khác không của V
i
là một vectơ riêng của f tương ứng với giá trị riêng λ
i
.
Theo Định lý 1.2.4, ta lấy các phần tử trong các cơ sở của V
1

, . . . , V
k
hợp thành một
cơ sở của V. Khi đó V có một cơ sở gồm các vectơ riêng của f và vì thế f chéo hóa
được.
(ii) ⇒(i): Giả sử f chéo hóa được và λ
1
, . . . , λ
k
là các giá trị riêng phân biệt của
f. Xét đa thức
p = (x − λ
1
)(x −λ
2
) . . . (x − λ
k
).
Rõ ràng p(f) là một đồng cấu biến mỗi vectơ của cơ sở thành vectơ không và do đó
p(f) = 0. Suy ra đa thức tối tiểu m
f
chia hết p và nó phải trùng với p vì mỗi giá trị
riêng của f là nghiệm của m
f
.
Ví dụ 1.3.5. Xét tự đồng cấu f : R
3
→ R
3
xác định bởi

f(x, y, z) = (7x − y − 2z, −x + 7y + 2z, −2x + 2y + 10z).
Ma trận của f đối với cơ sở chính tắc của R
3

A =



7 −1 −2
−1 7 2
−2 3 10



Ta chứng minh được rằng P
f
= (x − 6)
2
(x − 12) và m
f
= (x − 6)(x − 12). Do
đó theo Định lý 1.3.7, f chéo hóa được.
21 tr
1.4 Tự đồng cấu lũy linh
Định lý phân tích nguyên sơ chỉ ra rằng một ánh xạ tuyến tính f trên một không
gian vectơ hữu hạn chiều V có một cơ sở sao cho ma trận của f đối với cơ sở đó là
ma trận chéo khối. Ta chú ý rằng trong trường hợp đặc biệt, nếu đa thức tối tiểu của
f là tích của các nhân tử tuyến tính thì ma trận của f có dạng chéo. Bây giờ ta xét
trường hợp tổng quát hơn là đa thức tối tiểu của f phân tích được thành tích các nhân
tử tuyến tính nhưng chúng nhất thiết không khác nhau, tức là nó có dạng

m
f
=
k

i=1
(x −λ
i
)
e
i
với mỗi e
i
≥ 1.
Ta xem lại Hệ quả 1.3.6 của Định lý 1.3.4, khi đó V là tổng trực tiếp của các
không gian con f−bất biến V
i
= Ker(f − λ
i
id
V
)
e
i
. Đặt f
i
: V
i
→ V
i

là ánh
xạ tuyến tính cảm sinh bởi f trên các thành phần nguyên sơ V
i
, và xét ánh xạ
f
i
− λ
i
id
V
i
: V
i
→ V
i
. Ta có (f − λ
i
id
V
)
e
i
là ánh xạ không trên V
i
, và vì thế
f − λ
i
id
V
gọi là lũy linh.

Định nghĩa 1.4.1. Tự đồng cấu f : V → V được gọi là lũy linh nếu f
m
= 0 với m
là một số nguyên dương nào đó. Nếu tự đồng cấu f : V → V là lũy linh thì có một
số tự nhiên k nhỏ nhất sao cho f
k
= 0. Số tự nhiên nhỏ nhất đó được gọi là bậc lũy
linh. Tương tự, một ma trận A được gọi là lũy linh nếu có một số nguyên dương m
sao cho A
m
= 0.
Ví dụ 1.4.1. Ánh xạ tuyến tính f : R
3
→ R
3
xác định bởi f(x, y, z) = (0, x, y) là
lũy linh. Thực vậy f
2
(x, y, z) = f(0, x, y) = (0, 0, x) và khi đó f
3
= 0. Do đó bậc
lũy linh của f là 3.
Ví dụ 1.4.2. Nếu f : C
n
→ C
n
là một ánh xạ tuyến tính sao cho tất cả các giá
trị riêng của f đều là 0 thì ta có P
f
= x

n
. Theo Định lý Cayley-Hamilton, ta có
f
n
= P
f
(f) = 0 vì vậy f lũy linh.
Ví dụ 1.4.3. Ánh xạ đạo hàm D : R
n
[x] → R
n
[x] là lũy linh.
Định nghĩa 1.4.2. Ma trận Jordan cơ sở liên kết với λ ∈ K là ma trận cấp 1 có dạng
[λ] hoặc là ma trận vuông có dạng










λ 1 0 . . . 0 0
0 λ 1 . . . 0 0
0 0 λ . . . 0 0
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 . . . λ 1
0 0 0 . . . 0 λ










22
1.4. Tự đồng cấu lũy linh
với các phần tử thuộc đường chéo chính là λ, các phần tử nằm ngay trên đường chéo

chính là 1 và các phần tử còn lại bằng 0.
Định lí 1.4.3. Cho J là ma trận Jordan cơ sở liên kết với λ cấp m. Khi đó P
J
(x) =
(−1)
m
(x −λ)
m
và m
J
(x) = (x − λ)
m
.
Chứng minh. Chứng minh xem như bài tập.
Ma trận chéo khối gồm các khối Jordan cơ sở liên kết với λ được gọi là ma trận
khối Jordan liên kết với λ.
Ma trận chuẩn Jordan là ma trận có dạng





J
1
J
2
.
.
.
J

k





trong đó J
i
là các ma trận Jordan cơ sở và các phần tử còn lại là 0. Các khối J
i
được
gọi là các khối Jordan.
Bổ đề 1.4.4. Cho V là một không gian vectơ hữu hạn chiều khác không và f : V →
V là một tự đồng cấu lũy linh có bậc k. Giả sử x là một vectơ khác không của V sao
cho f
i
(x) = 0 và f
i+1
(x) = 0. Khi đó tập
{x, f(x), f
2
(x), . . . , f
i
(x)}
độc lập tuyến tính.
Định nghĩa 1.4.5. Cơ sở Jordan của ánh xạ tuyến tính f : V → V là một cơ sở của
V sao cho ma trận của f đối với cơ sở đó là ma trận chuẩn Jordan.
Định lí 1.4.6. Cho V là một không gian vectơ hữu hạn chiều khác không và f : V →
V là một tự đồng cấu lũy linh có bậc k. Khi đó có một cơ sở của V mà ma trận của
f đối với cơ sở này có dạng khối Jordan liên kết với 0.

Chứng minh. Đặt M
i
= Imf
i
∩ Kerf với i = 0, 1, . . . , k − 1. Ta có một dãy các
không gian con lồng nhau như sau
0 = M
k
⊂ M
k−1
⊂ . . . ⊂ M
1
⊂ M
0
= Kerf.
Đặt S
k−1
là cơ sở của M
k−1
, ta bổ sung vào S
k−1
tập S
k−2
để được S
k−1
∪S
k−2
là cơ
sở của M
k−2

. Tiếp tục bổ sung thêm S
k−3
để được S
k−1
∪ S
k−2
∪ S
k−3
là cơ sở của
M
k−3
. Cứ như vậy, ta được S
k−1
∪S
k−2
∪. . .∪S
1
∪S
0
là một cơ sở của M
0
= Kerf.
Giả sử số phần tử của S
i
là v
i
và ta đặt S
i
= {b
i1

, b
i2
, . . . , b
iv
i
}. Khi đó, ta đặt
B = {b
k−1,1
, b
k−1,2
, . . . , b
k−1,v
k−1
, . . . , b
11
, b
12
, . . . , b
1v
1
, b
01
, b
02
, . . . , b
0v
0
} là một
cơ sở của Kerf.
23

Lấy b
ij
∈ B, khi đó b
ij
∈ S
i
⊂ Imf
i
∩ Kerf ⊂ Imf
i
. Do đó, ta có x
ij
∈ V
sao cho f
i
(x
ij
) = b
ij
. Đặt
J
b
ij
= {f
i
(x
ij
), f
i−1
(x

ij
), . . . , f(x
ij
), x
ij
}

J
i
= J
b
i1
∪ J
b
i2
∪ . . . ∪ J
b
iv
i
.
Ta sẽ chứng minh
J = J
k−1
∪ J
k−2
∪ . . . J
1
∪ J
0
là cơ sở Jordan của V.

Đầu tiên ta chứng minh số vectơ của J là n = dim V. Đặt d
i
= dim M
i

r
i
= dim Imf
i
, suy ra số phần tử trong S
i
là v
i
= d
i
−d
i+1
. Chú ý rằng d
k
= 0 = r
k
và r
0
= dim id
V
= n. Theo ta có tính chất sau (theo [7, 4.5.1])
dim(Imf
i
∩ Kerf) = dim Imf
i

− dim Im(f
i
f)
suy ra d
i
= r
i
− r
i+1
. Số phần tử trong J
b
ij
là i + 1 với i = 0, 1, . . . , k − 1 và
j = 1, 2, . . . , v
i
. Số phần tử trong J là
k−1

i=1
số phần tử của J
i
=
k−1

i=0
(i + 1)v
i
=
k−1


i=0
(i + 1)(d
i
− d
i+1
)
= (d
0
− d
1
) + 2(d
1
− d
2
) + . . . + k(d
k−1
− d
k
)
= d
0
+ d
1
+ . . . + d
k−1
= (r
0
− r
1
) + (r

1
− r
2
) + . . . + (r
k−1
− r
k
)
= r
0
− r
k
= n −0 = n.
Tiếp theo, ta sẽ chứng minh J là một tập độc lập tuyến tính. Chú ý rằng B là một cơ
sở của Kerf nên các vectơ b
ij
là độc lập tuyến tính.
Giả sử
k−1

i=0
a
(i)
k−1,1
f
i
(x
k−1,1
) + . . . +
k−1


i=0
a
(i)
k−1,v
k−1
f
i
(x
k−1,v
k−1
)
+
k−2

i=0
a
(i)
k−2,1
f
i
(x
k−2,1
) + . . . +
k−2

i=0
a
(i)
k−2,v

k−2
f
i
(x
k−2,v
k−2
)
+ . . .
+
1

i=0
a
(i)
1,1
f
i
(x
1,1
) + . . . +
1

i=0
a
(i)
1,v
1
f
i
(x

1,v
1
)
+a
(0)
0,1
b
0,1
+ . . . + a
(0)
0,v
0
b
0,v
0
= 0
24 tr
1.4. Tự đồng cấu lũy linh
Chú ý rằng f
i+1
(J
b
ij
) = {0}, f
i
(J
b
ij
) = {b
ij

} và f
i
(J
i
) = {b
i1
, b
i2
, . . . , b
iv
i
}.
• Lấy ảnh của tổ hợp tuyến tính trên qua ánh xạ f
k−1
. Ta được
a
(0)
k−1,1
f
k−1
(x
k−1,1
) + a
(0)
k−1,2
f
k−1
(x
k−1,2
) + . . . + a

(0)
k−1,v
1
f
k−1
(x
k−1,v
k−1
) = 0
hay
a
(0)
k−1,1
b
k−1,1
+ a
(0)
k−1,2
b
k−1,2
+ . . . + a
(0)
k−1,v
1
b
k−1,v
k−1
= 0.
Do b
k−1,1

, b
k−1,2
, . . . , b
k−1,v
k−1
độc lập tuyến tính nên a
(0)
k−1,1
= a
(0)
k−1,2
= . . . =
a
(0)
k−1,v
k−1
= 0.
• Tiếp theo, ta lấy ảnh của tổ hợp tuyến tính trên qua ánh xạ f
k−2
. Ta được
a
(1)
k−1,1
f
k−1
(x
k−1,1
) + a
(1)
k−1,2

f
k−1
(x
k−1,2
) + . . . + a
(1)
k−1,v
k−1
f
k−1
(x
k−1,v
k−1
)
+a
(0)
k−2,1
f
k−2
(x
k−2,1
) + a
(0)
k−2,2
f
k−2
(x
k−2,2
) + . . . + a
(0)

k−2,v
k−2
f
k−2
(x
k−2,v
k−2
) = 0
hay
a
(1)
k−1,1
b
k−1,1
+ a
(1)
k−1,2
b
k−1,2
+ . . . + a
(1)
k−1,v
k−1
b
k−1,v
k−1
+a
(0)
k−2,1
b

k−2,1
+ a
(0)
k−2,2
b
k−2,2
+ . . . + a
(0)
k−2,v
k−2
b
k−2,v
k−2
= 0
Do b
k−1,1
, b
k−1,2
, . . . , b
k−1,v
k−1
, b
k−2,1
, b
k−2,2
, . . . , b
k−2,v
k−2
độc lập tuyến tính
nên a

(1)
k−1,1
= a
(1)
k−1,2
= . . . = a
(1)
k−1,v
k−1
= 0 và a
(0)
k−2,1
= a
(0)
k−2,2
= . . . =
a
(0)
k−2,v
k−2
= 0.
• Tiếp tục, ta lấy ảnh của tổ hợp tuyến tính trên qua ánh xạ f
k−3
. Ta được
a
(2)
k−1,j
= 0, j = 1, 2, . . . , v
k−1
;

a
(1)
k−2,j
= 0, j = 1, 2, . . . , v
k−2
;
a
(0)
k−3,j
= 0, j = 1, 2, . . . , v
k−3
.
• Tiếp tục quá trình như trên, lấy ảnh tổ hợp tuyến tính đó qua ánh xạ f
k−4
, . . . , f
2
, f
ta được tất cả các hệ số của tổ hợp tuyến tính bên trên bằng 0.
Vậy J là một tập độc lập tuyến tính có n vectơ, do đó nó là một cơ sở của V. Ta sắp
xếp các vectơ trong B theo thứ tự
J = J
k−1
∪ J
k−2
∪ . . . J
1
∪ J
0
với
J

i
= J
b
i1
∪ J
b
i2
∪ . . . ∪ J
b
iv
i
.
Khi đó ma trận của f đối với cơ sở J có dạng là ma trận chuẩn Jordan liên kết với
0.
25 tr

×