Tải bản đầy đủ (.pdf) (41 trang)

Giảm bậc của hệ điều khiển tuyến tính không phụ thuộc thời gian sử dụng phân tích trực giao

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (381.22 KB, 41 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
NGUYỄN VĂN LỘC
GIẢM BẬC CỦA HỆ ĐIỀU KHIỂN
TUYẾN TÍNH KHÔNG PHỤ THUỘC THỜI GIAN
SỬ DỤNG PHÂN TÍCH TRỰC GIAO
LUẬN VĂN THẠC SĨ TOÁN HỌC
Thái Nguyên - 2015
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
NGUYỄN VĂN LỘC
GIẢM BẬC CỦA HỆ ĐIỀU KHIỂN
TUYẾN TÍNH KHÔNG PHỤ THUỘC THỜI GIAN
SỬ DỤNG PHÂN TÍCH TRỰC GIAO
Chuyên ngành: Toán ứng dụng
Mã số: 60 46 01 12
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học:
TS. NGUYỄN THANH SƠN
Thái Nguyên - 2015
i
Mục lục
Tóm tắt nội dung iii
Lời cảm ơn iv
Danh sách ký hiệu v
Mở đầu 1
0.1 Lý do chọn đề tài . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
0.2 Mục đích nghiên cứu . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.3 Nhiệm vụ nghiên cứu . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.4 Đối tượng và phạm vi nghiên cứu . . . . . . . . . . . . . . . . . . . . 2
0.5 Phương pháp nghiên cứu . . . . . . . . . . . . . . . . . . . . . . . . . 3


1 Kiến thức chuẩn bị 4
1.1 Những lí thuyết căn bản của hệ động lực tuyến tính không phụ thuộc
thời gian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.1 Tính đạt được . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Tính quan sát được . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Phân tích giá trị kì dị của ma trận . . . . . . . . . . . . . . . . . . . . 9
1.2.1 Phân tích giá trị kỳ dị của ma trận (SVD) . . . . . . . . . . . . 9
1.2.2 Ý nghĩa hình học của giá tr ị kì dị của ma trận . . . . . . . . . 14
2 Phương pháp phân tích trực giao 16
ii
2.1 Ý tưởng của phương pháp . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Trường hợp dữ liệu rời rạc . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Trường hợp dữ liệu liên tục . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4 Phương pháp giảm bậc sử dụng phân tích trực giao . . . . . . . . . . . 22
2.5 Mối quan hệ với phương pháp chặt cân bằng . . . . . . . . . . . . . . 23
2.5.1 Sơ lược về phương pháp chặt cân bằng . . . . . . . . . . . . . 23
2.5.2 Phương pháp POD cân bằng (balanced POD) . . . . . . . . . 24
3 Ví dụ số 26
3.1 Hệ hình thức FOM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2 Hệ Eady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Kết luận 30
Tài liệu tham khảo 31
iii
TÓM TẮT NỘI DUNG
Trong thực tiễn, thường xuất hiện những hệ điều khiển mà mô hình toán học của
nó có cỡ rất lớn. Thực tế này gây khó khăn cho việc mô phỏng trên máy tính vì làm
việc với hệ lớn thường đòi hỏi máy tính có tốc độ cao và bộ nhớ lớn. Do đó xuất hiện
nhu cầu xấp xỉ hệ cỡ lớn bởi hệ cỡ nhỏ, hay còn gọi là giảm bậc của mô hình, để việc
tính toán được diễn ra thuận lợi. Tùy theo thông tin đầu vào và nhu cầu xấp xỉ mà
người ta có nhiều phương pháp giảm bậc khác nhau.

Luận văn này sẽ trình bày chi tiết phương pháp giảm bậc của hệ điều khiển tuyến
tính không phụ thuộc thời gian bằng phương pháp phân tích trực giao (Proper Or-
thogonal Decomposition). Ngoài ra chúng tôi cũng phân tích mối quan hệ của nó với
phương pháp Chặt cân bằng. Hai ví dụ số được trình bày để minh họa cho phương
pháp.
iv
Lời cảm ơn
Trước tiên tôi xin gửi lời cám ơn sâu sắc tới Tiến sĩ Nguyễn Thanh Sơn - Giảng
viên khoa Toán - Tin, Trường Đại học Khoa học, Đại học Thái Nguyên, người thầy đã
hướng dẫn, chỉ bảo tận tình cho tôi trong suốt quá trình hoàn thành luận văn này.
Tôi cũng xin được gửi lời cám ơn chân thành đến các thầy, cô đã và đang tham gia
giảng dạy tại trường Đại học Khoa học Thái Nguyên. Các thầy cô đã nhiệt tình giảng
dạy và tạo mọi điều kiện thuận lợi cho tôi hoàn thành khóa học tại trường.
Đồng thời, tôi xin được bày tỏ lòng biết ơn tới tất cả bạn bè, đồng nghiệp và người
thân đã động viên, giúp đỡ tôi trong suốt quá trình học tập và viết luận văn.
Mặc dù đã dành nhiều thời gian nghiên cứu tím hiểu, song bản luận văn không
thể tránh khỏi những hạn chế, thiếu sót. Vì vậy, tôi rất mong muốn nhận được những
góp ý để luận văn này được hoàn thiện hơn.
Thái Nguyên, 2015 Nguyễn Văn Lộc
Học viên Cao học Toán K7A,
Trường Đại học Khoa học - Đại học Thái Nguyên
v
Danh sách ký hiệu
Trong toàn luận văn, ta dùng những ký hiệu với các ý nghĩa xác định trong bảng
dưới đây:
R
+
tập các số thực dương
R


tập các số thực âm
R
n×r
tập các ma trận thực cỡ n × r
A
T
ma trận chuyển của ma trận A
˙x(t) đạo hàm của x theo biến t
span(X) không gian con sinh bởi X
diag (σ
1
, , σ
n
) ma trận chéo với các phần tử đường chéo là σ
1
, , σ
n
Λ(A) tập hợp các giá tr ị kì dị của ma trận A
Im ảnh của một ma trận/ánh xạ tuyến tính
Ker nhân của một ma trận/ánh xạ tuyến tính
rank(R) hạng của ma trận R
σ
i
(A) giá trị kỳ dị thứ i của ma trận A
trace tổng các phần tử trên đường chéo chính của ma trận
vi
Danh sách hình vẽ
3.1 Sai số tuyệt đối của mô hình FOM: bậc giảm r = 20 (a) và bậc giảm
r = 30 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2 Sai số tương đối của mô hình FOM: bậc giảm r = 20 (a) và bậc giảm

r = 30 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3 Sai số tuyệt đối của mô hình Eady: bậc giảm r = 20 (a) và bậc giảm
r = 40 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.4 Sai số tương đối của mô hình Eady: bậc giảm r = 20 (a) và bậc giảm
r = 40 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
vii
Danh sách bảng
1
Mở đầu
0.1 Lý do chọn đề tài
Trong thực tiễn hệ điều khiển xuất hiện thường xuyên; khi sử dụng hệ đó như là
một mô hình toán học trên máy tính, cỡ của hệ thường rất lớn, hàng nghìn đến hàng
tr iệu biến. Với máy tính thông thường, việc mô phỏng trở thành rất khó khăn, chậm
chạp do máy tính phải làm việc với dữ liệu lớn. Từ đó, xuất hiện nhu cầu xấp xỉ, theo
nghĩa nào đó, hệ có cỡ lớn bằng hệ có cỡ nhỏ hơn. Công việc đó gọi là giảm bậc của
mô hình (model order reduction).
Có ba phương pháp giảm bậc thường dùng (cho hệ tuyến tính, không phụ thuộc
thời gian):
• Phương pháp phân tích trực giao-POD (Proper Orthogonal Decomposition).
• Phương pháp chặt cân bằng (Balanced truncation).
• Phương pháp không gian con Krylov.
Mỗi phương pháp có những điểm mạnh và điểm yếu riêng. Phương pháp POD là
phương pháp có ý tưởng và thực hiện tương đối đơn giản; phạm vi của nó không
chỉ giới hạn cho hệ tuyến tính mà còn có thể áp dụng cho cả hệ phi tuyến. Ngoài
ra, chúng tôi cũng muốn nghiên cứu phương pháp này để so sánh với phương pháp
Chặt cân bằng vốn có quan hệ gần gũi với phương pháp POD. Chính vì vậy, chúng tôi
đã chọn "Giảm bậc của hệ điều khiển tuyến tính không phụ thuộc thời gian sử dụng
phân tích trực giao" làm đề tài nghiên cứu cho luận văn thạc sĩ. Luận văn này gồm 3
chương.
2

Chương 1: trình bày sơ lược về hệ điều khiển tuyến tính không phụ thuộc thời
gian và định nghĩa cũng như tính chất của phân tích giá trị kỳ dị của ma trận.
Chương 2: là chương chính của luận văn. Chúng tôi diễn giải ý tưởng của phương
pháp phân tích tr ực giao, phân tích phương pháp đối với dữ liệu rời rạc, với dữ liệu
liên tục, nêu thuật toán thực hiện phương pháp, nêu mối quan hệ của phương pháp
phân tích trực giao với phương pháp Chặt cân bằng.
Chương 3: minh họa phương pháp phân tích trực giao thông qua 2 ví dụ số, phân
tích một số ưu điểm và nhược điểm của phương pháp phân tích trực giao.
0.2 Mục đích nghiên cứu
Mục đích của luận văn này là nhằm tìm hiểu về phương pháp giảm bậc của hệ
điều khiển tuyến tính không phụ thuộc thời gian, sử dụng phương pháp phân tích trực
giao.
0.3 Nhiệm vụ nghiên cứu
Luận văn tập trung làm rõ các vấn đề sau đây:
- Một số kiến thức liên quan đến phương pháp phân tích trực giao: Hệ động lực
tuyến tính không phụ thuộc thời gian, phân tích giá trị kì dị của ma trận.
- Trình bày ý tưởng của phương pháp phân tích trực giao, nội dung phương pháp,
một số nhận xét, và cuối cùng là áp dụng phương pháp này cho hai ví dụ thực tế.
0.4 Đối tượng và phạm vi nghiên cứu
• Đối tượng nghiên cứu: Phương pháp phân tích trực giao trong giảm bậc của mô
hình điều khiển tuyến tính.
• Phạm vi nghiên cứu: Hệ điều khiển tuyến tính không phụ thuộc thời gian.
3
0.5 Phương pháp nghiên cứu
• Đọc và tìm hiểu một số tài liệu liên quan như sách, bài báo tạp chí, luận án tiến
sĩ, luận văn thạc sĩ.
• Sử dụng các kiến thức toán học đã biết để phân tích, so sánh, nhận xét, tổng hợp.
• Kiểm chứng các kết quả lý thuyết bằng ví dụ số lập trình trên MATLAB và các
dữ liệu đã được công nhận rộng rãi trong cộng đồng những nhà nghiên cứu về lý
thuyết giảm bậc.

4
Chương 1
Kiến thức chuẩn bị
1.1 Những lí thuyết căn bản của hệ động lực tuyến tính
không phụ thuộc thời gian
Trong luận văn này, chúng tôi chỉ xét hệ điều khiển tuyến tính không phụ thuộc
thời gian liên tục dạng
.
x
(t) = Ax (t) + Bu (t) ,
y (t) = Cx (t) + Du (t) ,
(1.1)
với A ∈ R
N×N
, B ∈ R
N×m
, C ∈ R
l×N
, D ∈ R
l×m
. Trong đó
• t ∈ (0, +∞): biến thời gian,
• u(t) ∈ R
m
: đầu vào hay hàm điều khiển,
• y(t) ∈ R
l
: đầu ra,
• x(t): vectơ trạng thái,
• A ∈ R

N×N
: ma trận động lực,
• B ∈ R
N×m
: ma trận đầu vào,
• C ∈ R
l×N
: ma trận đầu ra,
• D ∈ R
l×m
: ma trận ghép cặp đầu vào - đầu ra.
5
Ở đây A, B, C, D là các ma trận hằng, nghĩa là chúng không phụ thuộc vào thời gian
t. Phương trình thứ nhất của (1.1) được gọi là phương trình trạng thái. Để cho gọn,
chúng tôi viết Σ = (A, B, C, D) cho hệ thống (1.1).
Nếu l = m = 1, hệ chỉ có một đầu vào và một đầu ra, do đó, nó được gọi là hệ
thống đơn đầu vào đơn đầu ra (SISO). Nếu m > 1, l > 1, hệ được gọi là đa đầu vào đa
đầu ra (MIMO).
Giả sử phương trình trạng thái (1.1) được kết hợp với điều kiện ban đầu x (t
0
) = x
0
,
sử dụng phương pháp biến thiên hằng số, nghiệm của phương trình trạng thái của (1.1)
có thể được viết như sau
φ(t; t
0
; x
0
; u(.)) := x (t) = e

A(t−t
o
)
x
o
+
t

t
o
e
A(t−τ)
Bu (τ ) dτ, t ∈ R.
Từ đó, đầu ra y(t) được tính theo công thức
y(t) = C(e
A(t−t
o
)
x
o
+
t

t
o
e
A(t−τ)
Bu (τ ) dτ, t ∈ R).
1.1.1 Tính đạt được
Không phải tất cả trạng thái của không gian trạng thái R

N
trong cấu trúc của hệ
thống Σ = (A, B, C, D) có thể đạt được từ một trạng thái nhất định với một điều khiển
hợp lý. Những trạng thái có thể đạt được tạo thành một không gian con của X. Khái
niệm này được xây dựng như sau.
Định nghĩa 1.1. • Một trạng thái x ∈ X được gọi là đạt được từ 0, nếu có tồn tại
một điều khiển năng lượng hữu hạn u (.) ∈ U, một thời gian hữu hạn t sao cho
x = ϕ

t; t
o
, 0, u (.)

.
• Không gian con đạt được X
r
⊂ X được định nghĩa là tập hợp của tất cả các trạng
thái đạt được.
6
• Hệ Σ được gọi là đạt được nếu X
r
= X.
• Ma trận vô hạn chiều R(A, B) :=

B AB A
2
B

được gọi là ma trận đạt
được của Σ.

Cụm từ "năng lượng hữu hạn" liên quan đến điều khiển u(.) có nghĩa là u có chuẩn
hữu hạn trong U. Thông thường, ta hay xét U = L
2
(R
+
, R
m
).
Lưu ý rằng định nghĩa trên chỉ liên quan đến các cặp (A, B) của Σ, tuy nhiên
chúng tôi muốn gắn khái niệm này vào một hệ động lực cụ thể.
Ma trận đạt được có mối quan hệ chặt chẽ với các gramian đạt được, được định
nghĩa như sau.
Định nghĩa 1.2. Các gramian đạt được hữu hạn tại thời điểm t ∈ R
+
của hệ thống
Σ = (A, B, C, D),
là ma trận
P (t) :=
t

0
e

BB
T
e
A
T
τ
dτ.

Tính chất của gramian đạt được được biểu thị bằng các kết quả sau.
Định lí 1.1. • P (t) = P
T
(t) và nửa xác định dương.
• Với mỗi t ∈ R
+
, ImP (t) = ImR(A, B).
Dựa trên Định lý 1.1.3, ta có kết quả quan trọng và hệ quả của nó như sau:
Định lí 1.2. • X
r
= Im R(A, B).
• X
r
là một A-không gian con bất biến, nghĩa là, AX
r
⊂ X
r
.
• Σ là đạt được khi và chỉ khi rank (R(A, B)) = N.
• X
r
là bất biến đối với phép biến đổi tọa độ.
7
Theo nội dung Định lý Cayley-Hamilton, hạng của R(A, B) được xác định bởi

A
i
B, i = 0, , N − 1

.

Từ Định lý 1.1.3 và 1.1.4, ∀ x ∈ X
r
, ∀ t ∈ R
+
, ∃ ξ sao cho x = P

t

ξ. Do đó
u (t) = B
T
e
A
T
(
t−t
)
ξ
là một điều khiển chạy từ 0 đến x tại thời điểm t. Khi đó u (t) có năng lượng tối thiểu
trong tất cả các điều khiển làm nhiệm vụ tương tự, tức là,
u
2
 u
2
, ∀u (t) ∈ L
2
(R
+
, R
m

) , ϕ

t : 0, 0, u (.)

= x.
Nếu Σ là đạt được, bởi một số tính toán đơn giản, chúng tôi có

u
2
2
= x
T
P

t

−1
x.
(1.2)
1.1.2 Tính quan sát được
Định nghĩa 1.3. • Một trạng thái x ∈ X của Σ = (A, B, C, D) là không quan sát
được nếu y (t) = Cϕ (t; 0, x, 0) = 0, ∀t  0.
• Các không gian con không quan sát được X
uo
⊂ X được định nghĩa là tập hợp
của tất cả các trạng thái không quan sát được của Σ.
• Hệ thống Σ được gọi là quan sát được nếu X
uo
= {0}.
• Ma trận vô hạn chiều O(A, C) :=


C
T
A
T
C
T

A
T

2
C
T


T
được gọi là
ma trận quan sát được của Σ.
• Các gramian quan sát được hữu hạn tại t ∈ R
+

Q(t) :=
t

0
e
A
T
τ

C
T
Ce

dτ.
Trong phần tiếp theo, chúng tôi tóm tắt tính chất của quan sát được. Nó, theo một
nghĩa nào đó, là đối ngẫu của tính đạt được.
8
Định lí 1.3. • Với mọi t ∈ R
+
, X
uo
= KerO(A, C) = KerQ(t).
• X
uo
là A-bất biến.
• Σ là quan sát được khi và chỉ khi rank (O(A, C)) = N.
• Tính quan sát được là độc lập đối với cơ sở.
Tương tự như (1.2), năng lượng trong L
2

R
+
, R
l

của các hàm đầu ra
y(t) = Cx(t) gây bởi trạng thái x tại thời điểm t được tính bằng
y
2

= x
T
Q

t

x.
Theo định nghĩa, P và Q là không giảm trong R
+
. Nếu Σ là đạt được, thì P (t)
là không suy biến và nghịch đảo của nó P
−1
(t) là không tăng. Nếu chúng ta thay đổi
một trạng thái x và sử dụng (1.2), thì thời gian điều khiển u(.) sẽ chạy từ 0 đến x, giảm
năng lượng mà nó tiêu thụ. Ta suy ra rằng năng lượng tối thiểu chạy từ 0 đến x tại thời
điểm t là đạt được khi t → ∞. Tương tự như vậy, thời gian trạng thái x hoạt động càng
dài, năng lượng quan sát nó tạo ra càng lớn. Những điều đó đòi hỏi sự cần thiết phải
xác định gramians vô hạn.
Định nghĩa 1.4. Đối với một hệ thống ổn định Σ = (A, B, C, D), hai gramian đạt được
vô hạn và gramian quan sát vô hạn được được định nghĩa là
P : =


0
e

BB
t
e
A

T
τ
dτ, (1.3)
Q : =


0
e
A
T
τ
C
T
Ce

dτ. (1.4)
Để tính gramian đạt được và gramian quan sát được ta thường dựa trên kết quả
sau đây.
9
Định lí 1.4. Gramian đạt được và gramian quan sát được của hệ thống ổn định Σ là
những nghiệm của phương trình Lyapunov:
AP + PA
T
+ BB
T
= 0 (1.5)
A
T
Q + QA + C
T

C = 0 (1.6)
Bằng những lập luận trên và ký hiệu năng lượng tối thiểu để đạt được x từ 0 là
xP
−1
x,
năng lượng quan sát được lớn nhất được sinh ra bởi x là
xQx.
Chúng tôi xét tiếp theo một phép biến đổi tọa độ x = φx có thể ảnh hưởng đến
gramians như thế nào.

P =


0
e



B

B
T
e

A
T
τ
dτ (1.7)
=



0
e
φ
−1
Aφτ
φ
−1
BB
T
φ
−T
e
φ
T
A
T
φ
−T
τ
dτ (1.8)
= φ
−1

−T
. (1.9)
Tương tự như vậy,

Q = φ
T

Qφ. (1.10)
(1.9) và (1.10) dẫn đến một phát hiện quan trọng: giá trị riêng của PQ là bất biến đối
với phép biến đổi của không gian trạng thái.
1.2 Phân tích giá trị kì dị của ma trận
1.2.1 Phân tích giá trị kỳ dị của ma trận (SVD)
SVD là một phân tích rất quan trọng được sử dụng cho nhiều mục đích khác nhau
cả trong lý thuyết cũng như trong thực tiễn tính toán.
10
Định lí 1.5. Cho A là một ma trận cỡ m × n tùy ý với m  n. Khi đó, chúng ta có
thể viết A = UΣV
T
, với U cỡ m × n và thỏa mãn U
T
U = I, V cỡ n × n và thỏa mãn
V
T
V = I, và Σ = diag (σ
1
, , σ
n
), với σ
1
  σ
n
 0.
Chứng minh. Chúng tôi quy nạp theo m và n: Giả sử A = 0; nếu không chúng ta có
thể lấy Σ = 0 còn U và V là ma trận trực giao tùy ý. Khi n = 1 (vì m ≥ n), ta viết
A = UΣV
T
với U = A/A

2
, Σ = A
2
, và V = 1. Giả sử rằng SVD tồn tại cho ma
trận cấp (m − 1) × (n − 1) và chứng minh điều đó cho m × n.
Chọn v sao cho v
2
= 1 và A
2
= Av
2
> 0. Vectơ v như vậy tồn tại theo định
nghĩa của A
2
= max
v
2
=1
Av
2
. Cho u = Av/Av
2
, đó là một vectơ đơn vị. Chọn

U và

V sao cho U =

u,


U

là ma trận trực giao cấp m × m, và V =

u,

V

là ma trận
trực giao cấp n × n. Bây giờ có thể viết
U
T
AV =


u
T

U
T


A

v

V

=



u
T
Av u
T
A

V

U
T
Av

U
T
A

V


.
Sau đó
u
T
Av =
(Av)
T
(Av)
Av
2

=
Av
2
2
Av
2
= Av
2
= A
2
≡ σ


U
T
Av =

U
T
uAv
2
= 0. Ta suy ra u
T
A

V = 0 bởi vì nếu không
σ = A
2
=



U
T
AV


2



[1, 0, , 0] U
T
AV


2
=




σ|u
T
A

V





2
> σ,
mâu thuẫn. Như vậy
U
T
AV =


σ 0
0

U
T
A

V


=


σ 0
0

A


.
Bây giờ chúng ta có thể áp dụng các giả thuyết để quy nạp cho


A để có được

A = U
1
Σ
1
V
1
T
,
với U
1
cấp (m − 1) × (n − 1), Σ
1
cấp (n − 1) × (n − 1), V
1
cấp (n − 1) × (n − 1).
11
Như vậy
U
T
AV =


σ 0
0 U
1
Σ
1
V

1
T


=


1 0
0 U
1




σ 0
0 Σ
1




1 0
0 V
1


T
hoặc
A =



U


1 0
0 U
1






σ 0
0 Σ
1




V


1 0
0 V
1





T
,
đó là điều phải chứng minh.
Định nghĩa 1.5. Các cột u
1
, , u
n
của U trong phân tích A = UΣV
T
nói trong Định
lí 1.2.1 được gọi là các vectơ kì dị trái. Các cột v
1
, , v
n
của V được gọi là các vectơ
kì dị phải. Các σ
i
được gọi là các giá trị kì dị. (Nếu m < n SVD được xác định bằng
cách xét A
T
)
SVD có nhiều tính chất đại số và hình học quan trọng, quan trọng nhất là những
tính chất sau đây.
Định lí 1.6. Cho A = UΣV
T
là SVD của ma trận A cỡ m × n, trong đó m  n. (Kết
quả tương tự cho m < n)
1. Giả sử rằng A là đối xứng, với giá trị riêng λ
i
và vectơ riêng trực giao u

i
. Nói
cách khác A = UΛU
T
là một phân tích riêng của A, với Λ = diag(λ
1
, λ
n
),
U = [u
1
, , u
n
], và UU
T
= I. Khi đó, một SVD của A là A = UΣV
T
, với σ
i
= |λ
i
|,
v
i
= sign (λ
i
) u
i
, và sign(0) = 1.
2. Các giá trị riêng của ma trận đối xứng A

T
A là σ
2
i
. Các vectơ kì dị phải v
i
là vectơ
riêng trực giao tương ứng.
3. Các giá trị riêng của ma trận đối xứng AA
T
là σ
2
i
và m −n số 0. Các vectơ kì dị
trái u
i
được vectơ riêng trực giao cho các giá trị riêng σ
2
i
tương ứng. Người ta có
thể thực hiện bất kỳ m −n vectơ trực giao khác là vectơ riêng cho giá trị riêng 0.
12
4. Cho H =


0 A
T
A 0



, trong đó A là ma trận vuông và A = UΣV
T
là SVD của
A. Cho Σ = diag (σ
1
, , σ
n
), U = [u
1
, , u
n
], và V = [v
1
, , v
n
]. Khi đó, 2n giá
trị riêng của H là ±σ
i
, với các vectơ riêng đơn vị tương ứng 1/

2


v
i
±u
i


.

5. Nếu A có hạng đầy đủ, các nghiệm của min
x
Ax − b
2
là x = V Σ
−1
U
T
b.
6. A
2
= σ
1
. Nếu A là ma trận vuông và không kì dị, thì


A
−1


−1
2
= σ
n

A
2
.



A
−1


2
= σ
1

n
.
7. Giả sử σ
1
  σ
r
> σ
r+1
= = σ
n
= 0. Thì hạng của A là r. Hạt nhân của
A, nghĩa là không gian con của vectơ v mà Av = 0, là không gian kéo dài bởi cột
r + 1 đến n của V : span (v
r+1
, , v
n
). Ảnh của A, không gian con của vectơ có
dạng Aw với mọi w, là không gian kéo dài bởi cột 1 đến r của U: span (u
1
, , u
r
) .

8. Nếu S
n−1
là hình cầu đơn vị trong R
n
: S
n−1
= {x ∈ R
n
: x
2
= 1} và AS
n−1

ảnh của S
n−1
dưới A : AS
n−1
= {Ax : x ∈ R
n
, x
2
= 1}, thì AS
n−1
là một tâm
ellipsoid gốc của R
m
, với trục chính σ
i
u
i

.
9. Viết V = [v
1
, v
2
, , v
n
] và U = [u
1
, u
2
, , u
n
], để A = UΣV
T
=

n
i=1
σ
i
u
i
v
T
i
. Khi
đó, một ma trận hạng k < n gần nhất với A (đo bằng .
2
) là A

k
=

k
i=1
σ
i
u
i
v
T
i
và A −A
k

2
= σ
k+1
. Chúng ta cũng có thể viết
A
k
= UΣ
k
V
T
, với Σ
k
= diag (σ
1
, , σ

k
, 0, , 0).
Chứng minh. Chúng tôi có:
1. Điều này đúng theo định nghĩa của SVD.
2. A
T
A = V ΣU
T
UΣV
T
= V Σ
2
V
T
. Đây là một phân tích riêng của A
T
A với các cột
của V là các vectơ riêng và đường chéo của Σ
2
là các giá trị riêng.
13
3. Chọn một ma trận

U cấp m × (m − n) để

U,

U

là vuông và trực giao. Sau đó

viết
AA
T
= UΣV
T
V ΣU
T
= UΣ
2
U
T
=

U,

U



Σ
2
0
0 0



U,

U


T
Đây là một phân tích riêng của AA
T
.
4. Áp dụng định định nghĩa của SVD
5. Ax −b
2
2
=


UΣV
T
x − b


2
2
. Từ đó A có hạng đầy đủ, do đó xuất hiện Σ và Σ
khả nghịch. Bây giờ chúng ta thấy

U,

U

là vuông và trực giao như trên nên


UΣV
T

x − b


2
2
=








U
T

U
T



UΣV
T
x − b








2
2
=








ΣV
T
x − U
T
b


U
T
b









2
2
=


ΣV
T
x − U
T
b


2
2
+




U
T
b



2
2
Nghiệm được làm gọn bằng cách bỏ bớt các số 0 đầu tiên, tức là x = V Σ
−1

U
T
b.
6. Từ định nghĩa, chuẩn 2 của ma trận đường chéo là giá trị tuyệt đối của số lớn nhất
trên đường chéo. Từ đó ta có,
A
2
=


U
T
AV


2
= Σ
2
= σ
1



A
−1


2
=



V
T
A
−1
U


2
=


Σ
−1


2
= σ
−1
n
.
7. Lại một lần nữa chọn một ma trận

U cấp m ×(m − n) để ma trận cấp m × m,

U =

U,

U


là trực giao. Từ

U và V là không kì dị, A và

U
T
AV =



Σ
n×n
0
(m−n)×n





Σ có cùng hạng, cụ thể là hạng r theo giả định của chúng tôi về Σ. Ngoài ra v
thuộc hạt nhân của A nếu và chỉ nếu V
T
v thuộc hạt nhân của

U
T
AV =

Σ, từ

Av = 0 nếu và chỉ nếu

U
T
AV

V
T
v

= 0. Nhưng hạt nhân của

Σ rõ ràng là mở
rộng ra bởi cột r + 1 đến n của ma trận cấp n ×n gốc I
n
, bởi vậy hạt nhân của A
được mở rộng ra bởi những cột của V , tức là v
r+1
đến v
n
. Lập luận tương tự cho
14
thấy rằng ảnh của A là ảnh thông qua

U của ảnh của

U
T
AV =


Σ, tức là,

U nhân
với r cột đầu tiên của I
m
, hoặc u
1
đến u
r
.
8. Áp dụng định nghĩa của SVD
9. A
k
đã có hạng k được xây dựng và
A − A
k

2
=





n

i=k+1
σ
i
u

i
v
i
T





=













U










0
σ
k+1

σ
n









V
T














= σ
k+1
.
Ta còn phải chỉ ra rằng không còn ma trận nào hạng k gần ma trận A hơn. Cho
B là ma trận bất kì hạng k, vì hạt nhân của nó có chiều là n −k. Không gian mở
rộng ra bởi {v
1
, , v
k+1
} có số chiều là k + 1. Từ đó tổng số chiều của chúng là
(n − k) + (k + 1) > n, hai không gian này phải trùng nhau. Chọn h là một vecto
đơn vị ở giao của chúng. Khi đó
A − B
2
2
 (A − B) h
2
2
= Ah
2
2
=


UΣV
T
h



2
2
=


Σ

V
T
h



2
2
 σ
2
k+1


V
T
h


2
2
= σ

2
k+1
1.2.2 Ý nghĩa hình học của giá trị kì dị của ma trận
Cho bất kì ma trận A cấp m × n, coi nó như một ánh xạ từ vectơ x ∈ R
n
đến một
vectơ y = Ax ∈ R
m
. Khi đó, chúng ta có thể chọn một hệ trục tọa độ trực giao cho
R
n
(nơi các tr ục đơn vị là các cột của V ) và một hệ trục tọa độ trực giao cho R
m
(nơi
các trục đơn vị là các cột của U) sao cho A là ma trận chéo (Σ), nghĩa là, ánh xạ vectơ
x =
n

i=1
β
i
v
i
đến y = Ax =
n

i=1
σ
i
β

i
u
i
. Nói cách khác, mỗi ma trận là ma trận chéo, với
15
điều kiện là ta chọn hệ trục tọa độ trực giao thích hợp cho các miền xác định và ảnh
của nó.
16
Chương 2
Phương pháp phân tích trực giao
2.1 Ý tưởng của phương pháp
Có thể nói, tất cả các phương pháp giảm bậc đều dựa trên việc chiếu bài toán lên
một không gian con có số chiều nhỏ hơn không gian trạng thái ban đầu. Tùy vào thông
tin có sẵn và mục đích xấp xỉ mà người ta chọn các không gian chiếu khác nhau và vì
thế mà sinh ra các phương pháp khác nhau.
Trong thực tế, nhiều khi thông tin có sẵn thu được từ đo đạc các trạng thái của hệ.
Về mặt kí hiệu, chúng là vectơ trạng thái tại một số thời điểm x (t
1
) , x (t
2
) , , x (t
n
) .
Vì việc chọn thời điểm là ngẫu nhiên, sẽ là hợp lí nếu chúng ta cho rằng các trạng thái
đó là phổ biến cho hệ và nó thích hợp để chiếu toàn bộ hệ lên không gian con sinh bởi
các trạng thái đó.
2.2 Trường hợp dữ liệu rời rạc
Lẽ dĩ nhiên, ta không chọn toàn bộ spanX = span [x (t
1
) , , x (t

n
)] làm không
gian chiếu. Ta luôn mong muốn tìm được một nhóm nhỏ các vectơ, tốt nhất là trực
giao, {v
i
}
k
i=1
, k  d , sao cho nhóm này là đại diện tốt nhất của X. Nhiệm vụ này có
thể được viết lại như một bài toán tối ưu hóa
arg max
v
i
∈R
N
k

i=1
n

j=1
|x
j
, v
i
|
2
, với v
i
, v

j
 = δ
ij
, 1  i, j  k.
(2.1)
Phân tích SVD của ma trận là một công cụ lý tưởng để giải quyết vấn đề này.

×