Tải bản đầy đủ (.pdf) (35 trang)

Nghịch đảo suy rộng (Luận văn thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (319.97 KB, 35 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
-------------------------------

NGÔ THỊ LOAN

NGHỊCH ĐẢO SUY RỘNG

LUẬN VĂN THẠC SĨ TOÁN HỌC

THÁI NGUYÊN - 2019


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
-------------------------------

NGÔ THỊ LOAN

NGHỊCH ĐẢO SUY RỘNG
Chuyên ngành: Toán ứng dụng
Mã số
: 8 46 01 12

LUẬN VĂN THẠC SĨ TOÁN HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC
GS.TSKH. Đinh Nho Hào

THÁI NGUYÊN - 2019



i

Mục lục
Lời cảm ơn

iii

Lời cam đoan

1

Mở đầu

1

Chương 1 Các khái niệm cơ bản về đại số tuyến tính và giải
tích hàm

3

1.1. Không gian Euclide . . . . . . . . . . . . . . . . . . . . . .

3

1.2. Không gian Banach và toán tử liên tục . . . . . . . . . . .

5

1.2.1. Không gian Banach . . . . . . . . . . . . . . . . . .


5

1.2.2. Toán tử tuyến tính liên tục . . . . . . . . . . . . .

6

1.3. Đạo hàm theo nghĩa Fréchet . . . . . . . . . . . . . . . . .

7

Chương 2 Nghịch đảo suy rộng trong không gian Hilbert

9

2.1. Nghiệm bình phương tối thiểu . . . . . . . . . . . . . . . .

9

2.2. Nghịch đảo suy rộng . . . . . . . . . . . . . . . . . . . . .

10

2.3. Định lý Picard

14

. . . . . . . . . . . . . . . . . . . . . . . .

Chương 3 Nghịch đảo suy rộng trong không gian hữu hạn

chiều

15

3.1. Phân tích giá trị kỳ dị của ma trận . . . . . . . . . . . . .

15

3.2. Giả nghịch đảo (nghịch đảo suy rộng) . . . . . . . . . . . .

19


ii

3.3. Nghiệm bình phương tối thiểu . . . . . . . . . . . . . . . .

24

Kết luận

27

Tài liệu tham khảo

28


iii


Lời cảm ơn
Luận văn này được thực hiện tại Trường Đại học Khoa học - Đại
học Thái Nguyên và hoàn thành dưới sự hướng dẫn của GS.TSKH. Đinh
Nho Hào. Em xin được bày tỏ lòng biết ơn chân thành và sâu sắc tới
người hướng dẫn khoa học của mình, người đã đặt vấn đề nghiên cứu,
dành nhiều thời gian hướng dẫn và tận tình giải đáp những thắc mắc của
em trong suốt quá trình làm luận văn.
Em cũng xin trân trọng cảm ơn Ban Giám hiệu Trường Đại học
Khoa học - Đại học Thái Nguyên, Ban Chủ nhiệm Khoa Toán-Tin, cùng
các giảng viên đã tham gia giảng dạy, đã tạo mọi điều kiện tốt nhất để
em học tập và nghiên cứu. Đồng thời, em cũng xin gửi lời cảm ơn tới tập
thể lớp cao học Toán K11C (khóa 2017-2019), cảm ơn gia đình bạn bè đã
động viên và giúp đỡ em rất nhiều trong quá trình học tập.


1

Lời cam đoan

Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của thầy
giáo GS.TSKH Đinh Nho Hào cùng với sự cố gắng của bản thân. Trong
quá trình nghiên cứu luận văn, tôi đã kế thừa những thành quả nghiên
cứu của các nhà khoa học, các nhà nghiên cứu với sự trân trọng và biết
ơn.
Tôi xin cam đoan những kết quả trong luận văn này là kết quả
nghiên cứu của bản thân, không trùng với luận văn của tác giả khác.
Thái Nguyên, ngày

tháng


Tác giả

năm 2019


1

Mở đầu
Phương pháp bình phương tối thiểu xuất phát từ các nghiên cứu về
thiên văn và khoa đo đạc. Từ các quan sát khác nhau của hiện tượng người
ta cần xấp xỉ nó. Phương pháp này có cội nguồn từ các nghiên cứu khác
nhau bắt đầu từ Roger Cotes vào năm 1722, Tobias Mayer khi nghiên
cứu về chuyển động của mặt trăng năm 1750, Pierre-Simon Laplace khi
nghiên cứu chuyển động của sao Mộc và sao Thổ năm 1788 ...
Người đầu tiên mô tả một cách tường minh và ứng dụng phương
pháp bình phương tối thiểu đó là Adrien-Marie Legendre [5] vào năm
1805 khi ông phân tích các dữ kiện của Laplace về hình dạng quả đất.
Phương pháp của Legendre được các nhà thiên văn học và các nhà đo đạc
hàng đầu thời đó công nhận và sử dụng. Vào năm 1809, Carl Friedrich
Gauss công bố phương pháp của ông về cách tính quỹ đạo của các thiên
thể [4] và khẳng định rằng, phương pháp này do ông tìm ra từ năm 1795,
trước cả Legendre. Gauss còn liên hệ phương pháp bình phương tối thiểu
với các kết quả quan trọng trong lý thuyết xác suất về phân bố chuẩn
... Có khá nhiều tranh cãi về việc có đúng hay không, Gauss đã tìm ra
phương pháp bình phương tối thiểu trước Legendre mặc dù ông công bố
sau. Công trình của [10] đưa ra khẳng định, có lẽ điều này là đúng. Dù
ai là người phát minh ra phương pháp này đầu tiên đi nữa, thì cho đến
nay phương pháp bình phương tối thiểu là một phương pháp hết sức toàn
năng và hiệu quả trong giải tích số, thống kê, ...
Phương pháp bình phương tối thiểu cho ta một các hiểu nghiệm

của hệ phương trình đại số tuyến tính, gọi là nghiệm bình phương tối
thiểu - phần tử tối thiểu hóa bình phương chuẩn Euclide của độ lệch
(discrepancy). Nghiệm bình phương tối thiểu là một giải pháp lý tưởng


2

để hiểu được hệ phương trình đại số tuyến tính có số phương trình nhiều
hơn số ẩn - hệ thường xuyên gặp trong các bài toán đo đạc. Tuy nhiên,
nghiệm bình phương tối thiểu có thể không duy nhất, để khắc phục khiếm
khuyết này, Moore [6] vào năm 1920 và sau đó là Penrose [8, 9] vào những
năm 1955, 1956 đã đưa ra khái niệm nghịch đảo suy rộng và nghiệm suy
rộng dựa trên lý thuyết phổ. Có nhiều cách tiếp cận đến nghịch đảo suy
rộng khác nhau, nhưng trong luận văn này chúng tôi sử dụng định nghĩa
nghiệm suy rộng là nghiệm bình phương tối thiểu có chuẩn nhỏ nhất.
Chúng tôi dùng khái niệm này vì dùng nó ta có thể tiếp cận các bài toán
đặt không chỉnh. Các kết quả trong luận văn này dựa vào các tài liệu
[1, 2, 3, 7].
Luận văn gồm ba chương. Trong chương đầu chúng tôi tóm tắt một
số khái niệm trong Đại số tuyến tính và Giải tích hàm. Chương 2 đề cập
đến nghịch đảo suy rộng trong không gian Hilbert còn chương cuối đề cập
đến khái niệm này nhưng trong không gian Rn .


3

Chương 1

Các khái niệm cơ bản về đại số
tuyến tính và giải tích hàm

1.1.

Không gian Euclide

Định nghĩa 1.1
Cho E là không gian vectơ trên trường số thực R, một tích vô hướng
trên E là một ánh xạ <, >: E × E → R
(x, y) →< x, y >
thỏa mãn các điều kiện sau
1. < x, y >=< y, x >,
2. < x + y, z >=< x, z > + < y, z >,
3. < λx, y >= λ < x, y >,
4. < x, x >≥ 0 ∀x ∈ E và < x, x >= 0 ⇔ x = 0.
Định nghĩa 1.2
Không gian vectơ E trên trường số thực R được gọi là không gian
vectơ Euclide nếu trên E có một tích vô hướng.
Định nghĩa 1.3


4

Độ dài của một vectơ x của không gian vectơ Euclide E với tích vô
hướng <, > được xác định bởi:

x = < x, x >
Định nghĩa 1.4
Đối với hai vectơ x và y của không gian vectơ Euclide thì ta gọi góc
ϕ giữa x và y được xác định bởi công thức:
< x, y >
cos ϕ =

x y
Khi không gian vector Euclide E là Rn , ta viết vector x ∈ Rn dưới dạng
 
x
 1
 
x =  ... 
 
xn
với xi ∈ R. Khi đó vector chuyển vị của x là xt = (x1 , . . . , xn ).
Giả sử M = (mij ) ∈ Rm,n , u, v ∈ Rk , α1 , . . . , α ∈ R, u1 , . . . , u ∈ Rk .
Ta ký hiệu
I

ma trận đơn vị,

Mt

ma trận chuyển vị củaM,

ut v

tích vô hướng của u với v,
chuẩn max{ M x |x ∈ Rn , x ≤ 1},

M
M

F


chuẩn Frobenius of M,
M

F

:=

2
i,j |mi,j |

2

,

< u1 , . . . , u >

bao tuyến tính của u1 , . . . , u ,

diag(α1 , . . . , α )

ma trận đường chéo trong Rp,
với các thành phần α1 , . . . , α
trên đường chéo của nó (p ≥ 1),

(u1 | . . . |u )

ma trận trong Rk,
với các cột là u1 , . . . , u .



5

1.2.

Không gian Banach và toán tử liên tục

1.2.1.

Không gian Banach

Định nghĩa 1.5 (Không gian định chuẩn)
Một không gian định chuẩn (hay không gian tuyến tính định chuẩn)
là không gian tuyến tính X trên trường P (P = R hoặc P = C) cùng với
một ánh xạ từ X vào tập số thực R, được gọi là chuẩn và ký hiệu là .
thỏa mãn các tiên đề sau:
1. (∀x ∈ X) x ≥ 0, x = 0 ⇔ x = θ (ký hiệu phần tử không là θ);
2. (∀x ∈ X) , (∀α ∈ P ), αx = |α|. x ;
3. (∀x, y ∈ X) x + y ≤ x + y .
Số x gọi là chuẩn của vectơ x . Ta cũng kí hiệu không gian định chuẩn
là X. Các tiên đề (1), (2), (3) được gọi là hệ tiên đề chuẩn.
Định nghĩa 1.6 (Sự hội tụ trong không gian định chuẩn)
Dãy điểm {xn } của không gian định chuẩn X được gọi là hội tụ tới
điểm x ∈ X nếu lim xn − x = 0 Kí hiệu lim xn = x hay xn → x khi
n→∞
n→∞
n→∞
Định nghĩa 1.7 (Dãy cơ bản)
Dãy {xn } trong không gian định chuẩn X được gọi là dãy cơ bản
nếu lim xn − xm = 0.
n,m→∞


Định nghĩa 1.8 (Không gian Banach)
Không gian định chuẩn X được gọi là không gian Banach nếu mọi
dãy cơ bản trong X đều hội tụ.
Ví dụ 1.1
Xét không gian véc tơ k - chiều Rk , với mỗi x ∈ Rk , x = (x1 , x2 , . . . , xk )trong
đó xi ∈ R, i = 1, 2, . . . , k. Đặt x =
gian Banach.

k
2
i=1 |xi | .

Khi đó Rk là không


6

Ví dụ 1.2
Cho không gian véc tơ C[a,b] . Đối với hàm số bất kì xt ∈ C[a,b] , ta
đặt x = max[a,b] |xt |. Khi đó C[a,b] là không gian Banach.
1.2.2.

Toán tử tuyến tính liên tục

Cho X, Y là hai không gian định chuẩn.
Định nghĩa 1.9 (Toán tử tuyến tính)
Một toán tử A : X → Y gọi là một toán tử tuyến tính nếu thỏa
mãn các điều kiện sau
1. (∀x, y ∈ X)A(x + y) = A(x) + A(y);

2. (∀x ∈ X)(∀α ∈ P )A(αx) = αA(x).
Ta viết Ax thay cho A(x). Nếu X ≡ Y ta nói A là toán tử trong X.
Ta kí hiệu
ImA = {y ∈ Y |y = Ax, ∀x ∈ X} là miền giá trị của toán tử A
KerA = {x ∈ X|Ax = 0} là hạch (hạt nhân) của toán tử A.
Ví dụ 1.3
b
X ≡ Y ≡ C[a,b] , Ax(t) = a K(t, s)x(s)ds, trong đó K(t, s) là hàm
liên tục theo hai biến t, s trong hình vuông a ≤ t, s ≤ b. A là toán tử
tuyến tính và được gọi là toán tử tích phân.
Định nghĩa 1.10 (Toán tử liên tục )
Giả sử X, Y là hai không gian định chuẩn. Toán tử A : X → Y gọi
là liên tục tại x0 ∈ X nếu
∀{xn } ⊂ X, xn → x0 (n → ∞)thì Axn → Ax0 (n → ∞)
Toán tử A được gọi là liên tục trên X nếu nó liên tục tại mọi điểm thuộc
X.
Định nghĩa 1.11 (Toán tử compact. ) Toán tử A : X → Y được gọi là
compact nếu ảnh của các tập giới nội trong X là tiền compact trong Y .


7

Ta biết rằng, toán tử compact có không quá một số đếm được các
giá trị riêng. Ta có kết quả sau
Định lý 1.1 [1, pp. 60-61] Giả sử A : X → Y là toán tử tuyến tính
compact. Khi đó tồn tại một hệ chỉ số J = {1, . . . , n} hoặc J = N, hệ
trực chuẩn (ej )j∈J trong X và (fj )j∈J trong Y và dãy các số thực dương
(δj )j∈J thỏa mãn các điều kiện sau:
i) (σj )j∈J đơn điệu không tăng, limj σj = 0 nếu J = N,
ii) Aej = σj fj ,


A∗ fj = σj ej , j ∈ J,

iii) Với mọi x ∈ X tồn tại phần tử x0 ∈ N (A) với
x = x0 +

< x, ej > ej ,

Ax =

j∈J

σj < x, ej > fj .

(1.1)

j∈J

iv) Với mọi y ∈ Y :
A∗ y =

σj < y, fj > ej .
j∈J

Định nghĩa 1.12 Giả sử toán tử compact A : X → Y có biểu diễn (1.1).
Khi đó các số σj , j ∈ J được gọi là giá trị kỳ dị của A, bộ {(σj , ej , fj )|j ∈
J} được gọi là hệ kỳ dị của A còn biểu diễn (1.1) được gọi là phân tích
giá trị kỳ dị của A.

1.3.


Đạo hàm theo nghĩa Fréchet

Cho X, Y là hai không gian Banach. Toán tử f : X → Y (không
nhất thiết tuyến tính)
Định nghĩa 1.13
Cho x là một điểm cố định trong không gian Banach X. Toán tử
f : X → Y gọi là khả vi (theo nghĩa Fréchet) tại x nếu tồn tại một toán
tử tuyến tính liên tục A : X → Y sao cho
f (x + h) − f (x) = A(h) + φ(x, h), (∀h ∈ X)


8
φ(x,h)
h
h →0

và lim

f (x+h)−f (x)−A(h)
h
h →0

= 0 (hay tương đương lim

= 0). A(h)

gọi là vi phân cấp một của toán tử f tại x. Ký kiệu là df (x, h).Toán tử A
gọi là đạo hàm cấp một (theo nghĩa Fréchet) của f tại x. Kiệu là: f (x).
Vậy df (x, h) = f (x).h

Định lý 1.2
Nếu đạo hàm F tồn tại, nó là duy nhất.
Định lý 1.3
Nếu một toán tử được xác định trên một tập con mở của một không
gian Banach là khả vi Fréchet tại một điểm, thì nó liên tục tại điểm đó.
Định lý 1.4
Một toán tử tuyến tính A từ một không gian Banach vào một không
gian Banach là khả vi Fréchet nếu và chỉ nếu A là bị chặn. Trong trường
hợp đó, A ≡ A.
Định nghĩa 1.14 (Đạo hàm Fréchet cấp hai)
Nếu A : B1 → B2 là khả vi Fréchet trên một tập mở Ω ⊂ B1 và A
là khả vi Fréchet tại x ∈ Ω, thì A được gọi là khả vi Fréchet cấp hai tại
x. Đạo hàm Fréchet của A tại x được gọi là đạo hàm Fréchet cấp hai của
A và được kí hiệu là A (x).


9

Chương 2

Nghịch đảo suy rộng trong không
gian Hilbert
Trong chương này, ta giả sử X, Y là các không gian Hilbert và toán
tử A ∈ L(X, Y ). Chúng ta nghiên cứu giải phương trình tuyến tính
Ax = y,

(2.1)

trong đó y cho trước. Nếu phương trình không có nghiệm, chúng ta có
thể tìm véctơ x ∈ X sao cho Ax − y ≤ Au − y với mọi u ∈ X.


2.1.

Nghiệm bình phương tối thiểu

Nội dung phần này là phân tích loại nghiệm này. Xuyên suốt luận
văn này, nếu không nói gì thêm ta luôn ký hiệu rằng N (A) = ker A =
{x ∈ X|Ax = 0} là hạt nhân của toán tử A còn R(A) = ImA = {y ∈
Y |y = Ax, ∀x ∈ X} là miền giá trị của toán tử A. Dùng Q để chỉ phép
chiếu của V trên R(A), trong đó
Ay − y ≤ z − y , ∀z ∈ R(A), Q(y) ∈ R(A), y ∈ Y.
Từ định lý phép chiếu, giải theo tất cả y ∈ Y , ta có
y − Q(y) ∈ R(A) = R(A)⊥ .
Định lý 2.1 Cho x ∈ X, y ∈ Y . Các mệnh đề sau là tương đương


10

a) Ax = Qy
b) Ax − y ≤ Au − y , ∀u ∈ X,
c) A∗ Ax = A∗ y.
Chứng minh:

a ⇒ b. Cho u ∈ X. Do Qy − y ∈ R(A) nên ta có
Au − y

2

= Au − Qy


2

+ Qy − y

2

= Au − Qy

2

+ Ax − y

2

≥ Ax − y 2 (vì Qy = Ax).

b ⇒ c. Cho Qy ∈ R(A) nên tồn tại dãy (xn ) ∈ X sao cho Qy = lim Axn .
n→∞

Khi đó,
Qy − y

2

Ax − y

2

= lim Axn − y
n→∞


2

≥ Ax − y

= Ax − Qy + Qy − y

2

2

≥ Ax − Qy + Ax − y 2 .


Suy ra, Ax = Qy, Ax−y = Qy−y ∈ R(A) = N (A∗ ) hay A∗ (Ax−y) = 0.
c ⇒ a. Ta có Ax − y ∈ N (A∗ ) = R(A)⊥ . Suy ra θ = Q(Ax − y) =
QAx − Qy = Ax − Qy. Suy ra Ax = Qy.
Định nghĩa 2.1 Một véctơ x ∈ X thỏa mãn các điều kiện tương đương
a, b, c của Định lý 2.1 được gọi là “nghiệm bình phương tối thiểu” của
phương trình Ax = y.

2.2.

Nghịch đảo suy rộng

Hệ quả 2.1 Cho y ∈ Y . Khi đó
1. L(y) = {x ∈ X| A∗ Ax = A∗ y} = ∅ nếu và chỉ nếu y ∈ R(A) ⊕
R(A)⊥ .
2. Nếu y ∈ R(A) ⊕ R(A)⊥ thì Ly là tập lồi đóng khác rỗng của X.
Chứng minh:



11

1. Cho x ∈ L(y). Từ Định lý 2.1, ta có


Ax − y ∈ N (A∗ ) = R(A) = R(A)⊥ .
Do vậy, y = Ax + (y − Ax) ∈ R(A) ⊕ R(A)⊥ .
Ngược lại, nếu y ∈ R(A) ⊕ R(A)⊥ thì y = y 1 + y 2 với y 1 ∈ R(A) và
y 2 ∈ R(A)⊥ . Khi đó, Qy = y 1 , y 1 = Ax với x nào đó thộc X. Theo
Định lý 2.1 suy ra tồn tại x ∈ L(y) nên L(y) = ∅.
2. Cho xn ⊂ L(y), xn → x. Vì A∗ y = lim A∗ Axn = A∗ Ax. Suy ra
n→∞

x ∈ L(y) và L(y) đóng.
Dễ dàng chứng minh được L(y) lồi. Vậy L(y) là tập lồi đóng khác ∅
của X.
Bằng Hệ quả 2.1 và định lý phép chiếu, tập L(y) chứa các nghiệm
bình phương tối thiểu của phương trình Ax = y sẽ có x nhỏ nhất nếu
y ∈ R(A) ⊕ R(A)⊥
x = min{ u | u ∈ L(y)}.
Vì thế ta có định nghĩa sau
Định nghĩa 2.2 Cho ánh xạ A+ với miền xác định D(A+ ) := R(A) ⊕
R(A)⊥ tương ứng với y ∈ D(A+ ). Với X + ∈ L(y) có chuẩn nhỏ nhất được
gọi là nghịch đảo suy rộng của phương trình Ax = y.
Hệ quả 2.2 Ta có
1. A(A+ ) trù mật trong Y và D(A+ ) = Y nếu R(A) là đóng.
2. Nếu R(A) đóng thì A−1 tồn tại và A+


R(A)

= A−1 .

3. R(A+ ) = N (A)⊥
4. A+ là ánh xạ tuyến tính.
5. A+ giới hạn bởi (sup{ A+ y ; y ∈ D(A+ ); y ≤ 1} < ∞) nếu R(A)
đóng.
6. Cho mỗi y ∈ D(A+ ), véctơ A+ y là nghiệm bình phương tối thiểu của
phương trình Ax = y nằm trong N (A)⊥ .


12

Chứng minh:


1. D(A+ ) = R(A) ⊕ R(A)⊥ ⊃ R(A) ⊕ R(A) = Y . Từ đó, D(A+ ) trù
mật trong Y . Nếu R(A) là đóng thì D(A+ ) = R(A) ⊕ R(A)⊥ = Y .
2. Từ định nghĩa của A+ ta có
A+

R(A)

= A−1 .

3. Cho w ∈ R(A+ ), w = A+ y với y ∈ D(A+ ). Ta có thể tách w = w1 +w2
với w1 ∈ N (A)⊥ , w2 ∈ N (A). Theo Định lý 2.1, ta có
Aw = A(w1 + w2 ) = Aw1 = AA+ y = Qy.
Vậy w1 là nghiệm bình phương tối thiểu của phương trình Ax = y.

Từ đó suy ra
A+ y

2

= w = w 1 + w 2 ≥ A+ y

2

+ w2 2 .

Suy ra w2 = θ hay w ∈ N (A)⊥ và R(A+ ) ⊂ N (A)⊥ .
Cho w ∈ N (A)⊥ và đặt y := Aw. Khi đó,
Aw = QAw = Qy.
Suy ra w là nghiệm bình phương tối thiểu của phương trình Ax = y.
Giải sử v là nghiệm bình phương tối thiểu khác của phương trình
Ax = y. Khi đó
Av = Qy = Arv, v − rv ∈ N (A)
và v 2 = w 2 + v − w 2 ≥ w 2 . Vậy w là nghiệm bình phương
tối thiểu có chuẩn nhỏ nhất hay w = A+ y ∈ R(A+ ). Suy ra N (A)⊥ ⊂
R(A+ ).
Vậy R(A+ ) = N (A)⊥ .


13

4. Cho y, y˜ ∈ D(A+ ). Khi đó
AA+ y = Qy; AA+ y˜ = Q˜
y
⇒AA+ y + AA+ y˜ = Qy + Q˜

y = Q(y + y˜) = AA+ (y + y˜)
⇒A(A+ y + A+ y˜ − A+ (y + y˜)) = θ
⇒A+ y + A+ y˜ − A+ (y + y˜) ∈ N (A)
mà R(A+ ) = N (A)⊥ , suy ra
A+ y + A+ y˜ − A+ (y + y˜) ∈ N (A) ∩ N (A)⊥ = ∅.
Từ đây suy ra
A+ (y + y˜) = A+ y + A+ y˜.
Chứng minh tương tự A+ (αy) = αA+ (y). Vậy A+ là ánh xạ tuyến
tính.
5. Giả sử A+ giới nội. Vì AA+ y = Qy, ∀y ∈ D(A+ ) và D(A+ ) trù mật
trong Y nên ánh xạ A+ có thể thác triển thành một toán tử giới nội
˜ = Qy với mọi y ∈ Y . Điều này chứng tỏ rằng
A˜ ∈ B(Y, X) với AAy
R(A) = R(Q) ⊂ R(A) hay R(A) đóng.
Bây giờ, ta giả sử W := R(A) là đóng. Vì R(A+ ) = N (A)⊥ và
X = N (A) ⊕ N (A)⊥ nên ánh xạ A : N (A)⊥ → W ; Au := Au là
song ánh. Vì A là liên tục và W là không gian đóng của không gian
Hilbert Y nên tồn tại ánh xạ nghịch đảo A−1 và theo định lý Banach
thì nó liên tục. Bởi vậy, tồn tại m > 0 sao cho
A+ y = A−1 (AA+ y) ≤ m AA+ y = m AA+ y , ∀y ∈ D(A+ ) = Y.
Từ đó ta có
y ≥ Qy = AA+ y ≥ m−1 A+ y , y ∈ Y.
Suy ra A+ ∈ B(Y, X), A+ ≤ m.
6. Từ Định nghĩa của A+ y và R(A+ ) = N (A)⊥ ta suy ra (6).


14

2.3.


Định lý Picard

Định lý 2.2 (Định lý Picard) Cho A : X → Y là compact và cho
(σj , ej , fj )j∈N là một hệ kỳ dị của của A. Khi đó,




σj−1 (Qy, fj )ej

+

A y=

σ −1 (y, fj )ej , y ∈ D(A+ ).

=

j=1

j=1

Chứng minh: Ta để ý rằng, Qy ∈ R(A), với y ∈ D(A+ ). Ta có


σj2 |(Qy, fj )|2 < ∞.
j=1

Vì fj ∈ R(A), ∀j ∈ N nên ta có
(Qy, fj ) = (y, Qfj ) = (y, fj ).

Bởi vậy, các chuỗi




σj−1 (y, fj )ej

σj−1 (Qy, fj )ej ;
j=1

j=1

là hội tụ. Lại có, với mỗi ej ∈ N (A)⊥ , nên véctơ


σj−1 (Qy, fj )ej

x :=
j=1

cũng nằm trong N (A)⊥ . Ngoài ra,


Ax =

σj−1 (Qy, fj )Aej

=

(Qy, fj )fj = Qy

j=1

vì Qy ∈ R(A) và span{fj | j ∈ N} = R(A). Do vậy, x là nghiệm bình
phương tối thiểu của phương trình Ax = y trong N (A+ ), suy ra x = A+ y,
điều phải chứng minh.
Trong chương sau ta sẽ xét trường hợp cụ thể khi X và Y là các
không gian Euclid và toán tử A sinh bởi ma trận.


15

Chương 3

Nghịch đảo suy rộng trong không
gian hữu hạn chiều
3.1.

Phân tích giá trị kỳ dị của ma trận

Định lý 3.1 Giả sử A ∈ Rm,n . Khi đó tồn tại các ma trận U ∈ Rm,m và
V ∈ Rn,n và các số thực σ1 ≥ . . . ≥ σn ≥ 0 sao cho
A = U DV t ,

U t U = U U t = I,

V t V = V V t = I,

(3.1)

với D = diag(σ1 , . . . , σn ) ∈ Rm,n .

Chứng minh. Vì ma trận At A là đối xứng và xác định không âm, nên tồn
tại các số thực σ1 ≥ . . . ≥ σn ≥ 0 sao cho σ12 , . . . , σn2 là giá trị riêng của
At A. Gọi v1 , . . . , vn ∈ Rn là hệ các vector riêng trực giao tương ứng với
σ12 , . . . , σn2 và giả sử r ≤ n với σr > 0, 0 = σr+1 = . . . = σn . Đặt
V1 := (v1 | . . . |vr ),
V2 := (vr+1 | . . . |vn )

D1 := diag(σ1 | . . . |σr ) ∈ Rr,r .


16

Ta có
D1−1 = diag(σ1−1 , . . . , σr−1 ), V1t V t AV1 = D12 ,
D1−1 V1t At AV1 D1−1 = I ∈ Rr,r , V2t At AV2 = 0,
AV2 = 0.
Đặt U1 = A1 V1 D1−1 ∈ Rm,r . Nếu ta chọn U2 ∈ Rm,m−r sao cho U =
(U1 |U2 ) ∈ Rm,m và U t U = U U t = I ta nhận được

 

t
t
U1 AV1 U1 AV2
D 0
= 1

U t AV = 
t
t

U2 AV1 U2 AV2
0 0.
Nhận xét 3.1

1. Số r trong chứng minh trên là hạng của ma trân A.

2. Do giá trị riêng của At A xác định duy nhất, nên σ1 , . . . , σn cũng xác
định duy nhất.
Định nghĩa 3.1 Cho A ∈ Rm,n với m ≥ n. Phân tích có dạng (3.1)được
gọi là phân tích giá trị kỳ dị của A và σ1 , . . . , σn được gọi là các giá trị
kỳ dị của A.
Từ định nghĩa trên ta nhận được các kết quả sau:
Hệ quả 3.1 Giả sử A ∈ Rm,n và A = U DV t là phân tích giá trị kỳ dị của
A trong đó U = (u1 | . . . |um ), V = (v1 | . . . |vn ) và D = diag(σ1 , . . . , σr , 0, . . . , 0),
σ1 ≥ · · · ≥ σr > 0. Khi đó,
i) At Avi = σi2 vi , AAt ui = σi2 ui , 1 ≤ i ≤ r;
ii) Avi = σi ui , At ui = σi vi , 1 ≤ i ≤ r;
iii) rank(A) = r;
iv) v1 , . . . , vr = N (A)⊥ , vr+1 , . . . , vr = N (A);
v) u1 , . . . , ur = R(A), ur+1 , . . . , um = R(A)⊥ ;
vi) A = σ1 = At ; A+ =

1
.
σr


17

Hệ quả 3.2 Giả sử rằng A ∈ Rm,n có hạng r. Khi đó, tồn tại các ma

trận B ∈ Rm,r và C ∈ Rr,n và các số thực σ1 ≥ · · · ≥ σr > 0 sao cho
A = BC, B t B = I, CC t = diag(σ12 , . . . , σr2 )

(3.2)

rank (B) = rank (C) = r.
Chứng minh. Không mất tính tổng quát, ta giả sử m ≥ n. Giả sử A =
U DV t là phân tích giá trị kỳ dị của A với
D = diag(σ1 , . . . , σr , 0, . . . , 0), U = (u1 | . . . |um ),
V = (v1 | . . . |vn ).
Khi đó, nếu ta đặt B := (u1 | . . . |ur ), C1 := (v1 | . . . |vr ), C := diag(σ1 , . . . , σr )C1
và ta suy ra điều phải chứng minh.
Kết quả sau đây liên quan đến nhiễu của giá trị riêng của ma trận
đối xứng. Chúng ta cần đến kết quả này để thấy được các giá trị kỳ dị
của ma trận có thể bị ảnh hưởng bởi các nhiễu nhỏ.
Ta ký hiệu
Vjn := {V ∈ Rn | V là không gian con với dim V ≤ j}.
Định lý 3.2 Giả sử rằng C ∈ Rn,n là ma trận đối xứng với các giá trị
riêng λ1 ≥ · · · ≥ λn . Khi đó với k = 1, . . . , n ta có
λk =

min

max

n
V ∈Vn−k+1
x∈V, x =1

xt Cx = maxn


min

V ∈Vk x∈V, x =1

xt Cx.

Chứng minh: Gọi v1 , . . . , vn là hệ các véctơ riêng trực chuẩn tương ứng
n
với λ1 , . . . , λn . Giả sử V ∈ Vn−k+1
. Khi đó, dim V ∩ v1 , . . . , vk ≥ 1 và
k

αi vi ∈ V ∩ v1 , . . . , vk với x = 1, ta thu được

nếu x =
i=1

k
t

αi2 λi ≥ λk .

x Cx =
i=1

Điều này chứng tỏ rằng λk ≤

min


max

n
V ∈Vn−k+1
x∈V, x =1

xt Cx.


18
n

Mặt khác, với mỗi x =

αi vi trong V := vk , . . . , vn , x = 1 ta
i=k



n
t

αi2 λi ≤ λk ,

x Cx =
i=k

chứng tỏ rằng
λk ≥


min
n

max

V ∈Vn−k+1 x∈V, x =1

xt Cx.

Do đó, đẳng thức thứ nhất được chứng minh. Ta áp dụng đẳng thức này
với −C thì thu được đẳng thức thứ hai.
Định lý 3.3 Giả sử rằng C, F ∈ Rn,n là các ma trận đối xứng và cho
λ1 ≥ . . . , λn , γ1 ≥ · · · ≥ γn và µ1 ≥ · · · ≥ µn lần lượt là các giá trị riêng
của C, F và C + F . Khi đó, với mọi k ∈ {1, . . . , n}, ta có
i) λk + γn ≤ µk ≤ λk + γ1 ;
ii) |λk − µk | ≤ F .
Chứng minh: Cho v1 , . . . , vn là hệ các véctơ riêng trực chuẩn của C.
n
i) Với mọi V ∈ Vn−k+1
, ta có

µk ≤


max

xt (C + F )x

x∈V, x =1


max

xt Cx +

x∈V, x =1

max

xt F x.

x∈V, x =1

Áp dụng khẳng định này vào không gian V := vk , . . . , vn , ta thu
được
µk ≤ λk + max xt F x = λk + γ1 .
x∈V, x =1

Bằng các lập luận tương tự, ta thu được bất đẳng thức còn lại.
ii) Từ phần i), ta có µk − λk ≤ |γ1 |, λk − µk ≤ −γn ≤ |γn |. Vì |γ1 |, |γn | ≤
F nên ta suy ra điều phải chứng minh.
Áp dụng Định lý 3.2 vào C := At A ta có kết quả sau:


19

Định lý 3.4 Cho A ∈ Rm,n và σ1 ≥ · · · ≥ σn là các giá trị kỳ dị của A.
Khi đó, với mọi k ∈ {1, . . . , n}
σk =

min


max

n
V ∈Vn−k+1
x∈V, x =1

Ax = maxn

min

V ∈Vk x∈V, x =1

Ax .

Để thuận tiện, từ nay về sau ta ký hiều các giá trị kỳ dị của ma
trận C ∈ Rm,n là
σ1 (C), . . . , σn (C),
trong đó ta luôn giải thiết chúng thỏa mãn
σ1 (C) ≥ · · · ≥ σn (C).
Từ Định lý 3.4 với các lập luận tương tự như trường hợp trong Định
lý 3.3 từ Định lý 3.2, ta suy ra:
Định lý 3.5 Cho A, F ∈ Rm,n . Khi đó với mọi k ∈ {1, . . . , n}
|σk (A) − σk (A + F )| ≤ F .




0 0
1 −1

.
, F = 
Ví dụ 3.1 Cho A = 
0 0.1
0 0
Bằng các tính toán trực tiếp cho thấy
F = 0.1
σ1 (A) = 1.4142 σ1 (A + F ) = 1.4160
σ2 (A) = 0.0000 σ2 (A + F ) = 0.0707.

3.2.

Giả nghịch đảo (nghịch đảo suy rộng)
Ta xét bài toán tìm nghiệm của phương trình
Ax = y

(3.3)

trong đó A ∈ Rm,n và y ∈ Rm cho trước. Nếu m = n và A không suy
biến thì bài toán có duy nhất nghiệm được cho bởi công thức x = A−1 y.
Trong trường hợp tổng quát, khi A có thể suy biến hoặc ma trận hình


×