Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.36 MB, 88 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
<small>1.3. Bài toán tối ưu. ... 14 </small>
<small>1.4. Cấu trúc của điều khiển tối ưu và điều khiển 𝜺 −tối ưu. ... 24 </small>
<small>1.5. Xích Markov điều khiển được... 48 </small>
<small>1.6. Xích Markov điều khiển được thuần nhất. ... 61 </small>
<small>Chương II. Ứng dụng để giải một bài toán trong lý thuyết hồi phục. ... 73 </small>
<small>2.1. Phát biểu bài toán. ... 73 </small>
<small>2.2. Xây dựng mơ hình điều khiển cho bài tốn. ... 74 </small>
<small>2.3. Sự tồn tại chiến lược tối ưu. ... 77 </small>
<small>2.4. Phương pháp xây dựng chiến lược tối ưu và chiến lược 𝜺 −tối ưu. ... 81 </small>
<small>2.5. Chiến lược tối ưu và giá tối ưu trong trường hợp thời gian sống là đại lượng ngẫu nhiên 𝝃 có phân phối mũ... 82 </small>
<small>KẾT LUẬN ... 85 </small>
<small>TÀI LIỆU THAM KHẢO ... 86 </small>
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2"><small>1 </small>
Để có thể hoàn thành được bài luận văn này, em xin được bày tỏ sự cảm kích đặc biệt đối với giảng viên hướng dẫn của mình, Tiến sĩ Nguyễn Hồng Hải – người đã định hướng, dẫn dắt và giúp đỡ em trong suốt quá trình em thực hiện đề tài nghiên cứu. Em cảm ơn thầy đã ln kiên nhẫn, tận tình chỉ bảo em từng chút một để em có thể hồn thiện và chau chuốt hơn cho bài luận văn của mình.
Em cũng xin gửi lời cảm ơn chân thành tới các thầy cơ giáo Khoa Tốn Tin, Trường Đại học Sư phạm Hà Nội đã tận tình giảng dạy cho em những kiến thức quý báu, không chỉ giúp em có được nền tảng kiến thức vững chắc để hồn thành luận văn mà cịn trở thành hành trang tri thức trong suốt q trình cơng tác sau này.
Em xin cảm ơn các thầy giáo đã dành thời gian quý báu của mình để đọc và nhận xét cho luận văn này. Những lời góp ý và nhận xét đó có ý nghĩa rất lớn để em hoàn thiện luận văn hơn nữa.
Đây là lần đầu tiên em làm đề tài nên không thể tránh khỏi những thiếu sót. Em rất mong nhận được những lời đóng góp từ q thầy cơ giáo và các độc giả để nội dung bài viết được hoàn thiện hơn.
Em xin chân thành cảm ơn!
Hà Nội, tháng 10 năm 2021 Tác giả
Bùi Thị Minh Chi.
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3"><small>2 </small>
Tôi xin cam đoan bản luận văn này là nghiên cứu của cá nhân tôi dưới sự hướng dẫn của Tiến sĩ Nguyễn Hồng Hải, khơng có sự trùng lặp nào với các đề tài luận văn đã công bố.
Tôi xin chịu trách nhiệm với lời cam đoan của mình.
Hà Nội, tháng 10 năm 2021. Tác giả
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4"><small>3 </small>
I. LÝ DO CHỌN ĐỀ TÀI.
Lý thuyết về các quá trình điều khiển được là một trong những lĩnh vực lý thuyết Toán học có nhiều ứng dụng quan trọng trong kỹ thuật hiện đại cũng như ứng dụng thực tiễn. Trong đó, mơ hình xích Markov điều khiển được đang được rất nhiều các nhà Toán học quan tâm nghiên cứu vì tính ứng dụng cao của nó.
Với mong muốn tìm hiểu kỹ hơn về quá trình Markov điều khiển được cũng như ứng dụng của nó, tơi quyết định chọn đề tài “Lý thuyết các quá trình ngẫu nhiên điều khiển được và ứng dụng giải một bài toán trong lý thuyết hồi phục” cho luận văn thạc sĩ của mình.
II. MỤC TIÊU NGHIÊN CỨU.
Mục tiêu của đề tài này là nghiên cứu về quá trình Markov điều khiển được và ứng dụng.
III. ĐỐI TƯỢNG NGHIÊN CỨU. - Quá trình Markov điều khiển được.
- Các ứng dụng của mô hình quá trình Markov điều khiển được. IV. PHƯƠNG PHÁP NGHIÊN CỨU
- Phương pháp nghiên cứu lý luận: Đọc tài liệu, sách và tạp chí Tốn học có liên quan, các tài liệu tìm kiếm được trên Internet.
- Sử dụng phương pháp tổng hợp để tổng hợp các kiến thức và trình bày theo thứ tự logic.
Nội dung của luận văn bao gồm 2 chương:
Chương I. Quá trình ngẫu nhiên điều khiển được với tham số rời rạc. Chương II. Ứng dụng để giải một bài toán trong lý thuyết hồi phục.
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">• Quá trình ngẫu nhiên:
Xét với tham số 𝑡 ∈ [0, 𝑇], trong đó 𝑇 là hữu hạn hoặc vô hạn, quá trình 𝑋 = 𝑋(𝑡, 𝜔) được gọi là quá trình ngẫu nhiên nếu ∀𝑡 ∈ [0, 𝑇], 𝑋(𝑡) là biến ngẫu nhiên.
Định nghĩa 1.2.
Xét q trình ngẫu nhiên 𝑋(𝑡), 𝑡 ≥ 0.
• Ta nói rằng 𝑋(𝑡) là q trình Markov nếu
∀ 𝑡 < 𝑡 < ⋯ < 𝑡 < 𝑡 , và 𝑖 , … , 𝑖 , 𝑖, 𝑗 ∈ 𝐸, ta có hệ thức: 𝑃{𝑋(𝑡 ) = 𝑗|𝑋(𝑡 ) = 𝑖 , 𝑋(𝑡 ) = 𝑖 , … , 𝑋(𝑡 ) = 𝑖 , 𝑋(𝑡 ) = 𝑖} = 𝑃{𝑋(𝑡 ) = 𝑗|𝑋(𝑡 ) = 𝑖}.
Điều này có nghĩa là quy luật xác suất trong tương lai chỉ phụ thuộc vào hiện tại và độc lập với quá khứ. Tính chất này được gọi là tính Markov.
Giả sử
𝑝(𝑠, 𝑖, 𝑡, 𝑗) = 𝑃{𝑋(𝑡) = 𝑗|𝑋(𝑠) = 𝑖}, (𝑠 < 𝑡)
là xác suất có điều kiện để q trình tại thời điểm 𝑠 ở trạng thái 𝑖 chuyển sang thời điểm 𝑡 ở trạng thái 𝑗, được gọi là xác suất chuyển của hệ.
Nếu xác suất chuyển chỉ phụ thuộc vào (𝑡 − 𝑠), tức là 𝑝(𝑠, 𝑖, 𝑡, 𝑗) = 𝑝(𝑠 + ℎ, 𝑖, 𝑡 + ℎ, 𝑗), ∀ℎ ≥ 0 thì ta nói 𝑋(𝑡) là quá trình thuần nhất theo thời gian.
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6"><small>5 </small>
Ký hiệu 𝐸 là tập giá trị của 𝑋(𝑡), khi đó 𝐸 được gọi là khơng gian trạng thái của 𝑋(𝑡).
• Nếu q trình Markov 𝑋(𝑡) với không gian trạng thái 𝐸 là không q đếm được thì 𝑋(𝑡) được gọi là xích Markov.
• Nếu xích Markov có 𝑡 ∈ 𝑁<small>∗</small> thì 𝑋(𝑡) được gọi là xích Markov với thời gian rời rạc.
• Nếu xích Markov có 𝑡 ∈ [0, +∞) thì 𝑋(𝑡) được gọi là xích Markov với thời gian liên tục.
Định nghĩa 1.3. Ma trận xác suất chuyển.
Giả sử (𝑋 ), 𝑛 = 0, 1, 2, … là xích Markov rời rạc và thuần nhất. Khi đó, tính Markov và tính thuần nhất của (𝑋 ) có nghĩa là:
khơng phụ thuộc vào 𝑛.
ℙ = (𝑝 ) được gọi là ma trận xác suất chuyển sau 1 bước, trong đó 𝑝 là xác suất có điều kiện để hệ tại thời điểm 𝑛 ở trạng thái 𝑖 chuyển sang trạng thái 𝑗 ở thời điểm 𝑛 + 1.
Xác suất chuyển sau 𝑛 bước được định nghĩa theo công thức: 𝑝<sup>( )</sup> = 𝑃(𝑋 = 𝑗|𝑋 = 𝑖) = 𝑃(𝑋 = 𝑗|𝑋 = 𝑖).
Đây là xác suất để hệ tại thời điểm xuất phát ở trạng thái 𝑖, sau 𝑛 bước chuyển sang trạng thái 𝑗. Rõ ràng 𝑝<sup>( )</sup> = 𝑝 . Ta quy ước
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">Cho hai tập hợp 𝑋 và 𝑈 và trong chúng có hai 𝜎 − đại số tương ứng của các tập con đo được 𝒰 𝑣à ℬ, tức là cho hai không gian đo được (𝑋, 𝒰) và (𝑈, ℬ). Không gian thứ nhất được gọi là khơng gian pha của q trình cơ bản và không gian thứ hai được gọi là không gian pha của điều khiển. Cho N là tập các số nguyên không âm. Trong chương này mọi quá trình được định nghĩa trên N. Để xác định quá trình điều khiển được, ta cần xác định phân phối xác suất của một quá trình ngẫu nhiên với giá trị trong 𝑋 với điều kiện là khi biết một dãy điều khiển tại mỗi thời điểm đã biết và đồng thời xác định quy tắc chọn các điều khiển này. Ta sẽ mơ tả thành phần của một q trình điểu khiển được một cách cụ thể hơn.
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8"><small>7 </small>
Dễ thấy phân phối của biến ngẫu nhiên 𝑥 - đại diện cho giá trị của quá trình cơ bản tại thời điểm 𝑛 - hoàn toàn được xác định với điều kiện các giá trị của quá trình cơ bản 𝑥 , … , 𝑥 tại các thời điểm trước đó và giá trị của điều khiển 𝑢 , … , 𝑢 tại những thời điểm đó. Giả sử
𝑝 (𝑑𝑥 / 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) (1.1) xác định phân phối có điều kiện của biến 𝑥 với điều kiện 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 . Dễ thấy rằng tập hợp các hàm {𝑝 (./. ), 𝑛 = 0, 1, … } xác định đối tượng điều khiển. Điều kiện cần và đủ để hàm (1.1) đóng vai trị là phân phối của dãy biến {𝑥 , 𝑛 = 0, 1, … } trong (𝑋, 𝒰) là hai điều kiện sau được thỏa mãn:
1. 𝑝 (./. ) là một độ đo trên 𝒰 đối với đối số đầu tiên.
2. 𝑝 (𝐴 /𝑥 , … , 𝑥 ; . ) là đo được theo 𝑥 , … , 𝑥 đối với mọi 𝐴 ∈ 𝒰 và 𝑢 , … , 𝑢 ∈ 𝑈. Những điều kiện này được giả thiết thỏa mãn đối với mọi đối tượng điều khiển đang nghiên cứu.
Nếu cho đối tượng điều khiển {𝑝 (./. )}, ta có thể dùng nó để xây dựng một họ các phân phối trong 𝑋 phụ thuộc vào một điểm của không gian 𝑈 như một tham số. Ta ký hiệu điểm trong 𝑋 𝑣à 𝑈 theo 𝒙 và 𝒖 tương ứng như sau:
𝒙 = { 𝑥 , 𝑥 , … . }; 𝒖 = {𝑢 , 𝑢 , … }.
Cho 𝒰 𝑣à ℬ là các 𝜎 − đại số trong 𝑋 𝑣à 𝑈 được cảm sinh bởi họ mặt trụ, và 𝒰 , ℬ là các 𝜎 − đại số của mặt trụ trong 𝑋 , 𝑈 với cơ sở {0, 1, … 𝑛}. Ta định nghĩa họ các độ đo 𝜇(./𝑢) on 𝒰 bởi hệ thức sau:
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9"><small>8 </small>
Hệ thức (1.2) xác định duy nhất một độ đo trên 𝒰 . Dễ kiểm tra rằng họ các độ đo 𝜇(./𝒖) có tính chất sau: Nếu 𝑉 ∈ 𝒰 thì 𝜇(𝑉/𝒖) chỉ phụ thuộc vào 𝑢 , … , 𝑢 . Tính chất này có thể được cơ đọng hơn nếu ta giả thiết thay thế điều kiện 2 bằng điều kiện sau:
3. 𝑝 (𝐴 /𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) là đo được theo tập các biến đối với 𝜎 − đạ𝑖 𝑠ố 𝒰 × ℬ . Dễ dàng để áp dụng điều kiện này lên đối tượng điều khiển được để có thể sử dụng các điều khiển ngẫu nhiên.
Nếu điều kiện 3 được thỏa mãn thì 𝜇(𝑉/𝒖) là một ℬ − đo được với 𝑉 ∈ 𝒰 và là một ℬ − đo được với 𝑉 ∈ 𝒰 . Giả sử một họ các độ đo 𝜇(𝑉/𝒖) được xác định trên 𝒰 thỏa mãn điều kiện sau:
4. 𝜇(𝑉/𝒖) là một hàm đo được với 𝑉 ∈ 𝒰 . Xét tập 𝐴<small>( )</small> = {𝑥: 𝑥 ∈ 𝐴}. Giả sử 𝜇(𝐴<small>( )</small>/𝒰 /𝒖) là xác suất điều kiện của 𝐴<small>( )</small>đối với 𝜎 − đạ𝑖 𝑠ố 𝒰 được tính trong khơng gian xác suất {𝑋 , 𝒰 , 𝜇(./𝒖)}. Từ 𝐴<small>( )</small> ∈ 𝒰 , ta có :
𝜇(𝐴<sup>( )</sup>/𝒰 /𝒖) = 𝑝 (𝐴/𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) (1.3) với hầu hết 𝑥 trong độ đo 𝜇(./𝒖).
Hàm xuất hiện trên vế phải đó là một hàm 𝒰 − đo được với 𝐴 và 𝑢 , … , 𝑢 cố định. Tuy nhiên, dưới những điều kiện hoàn toàn tổng quát, hàm số trên có thể được xác định khi điều kiện 1 được thỏa mãn. Từ một kết quả đã biết (xem [2]), điều kiện này trong trường hợp đặc biệt có thể được giả định thỏa mãn nếu 𝑋 là một không gian metric đầy đủ tách được và 𝒰 là một 𝜎 − đại số của các tập Borel. Trong trường hợp này ta có thể chọn một biến thể của xác suất điều kiện trong vế phải của (1.3) sao cho điều kiện 3 được thỏa mãn. Trước tiên, ta sẽ thiết lập một bổ đề phụ sau.
Bồ đề 1.1. Cho 𝑋 là một không gian metric đầy đủ tách được. Tồn tại một ánh xạ Borel là đơn ánh 𝑓: 𝑋 → [0,1] sao cho 𝑓(𝐴) là một tập Borel trên [0,1] với mọi 𝐴 ∈ 𝒰.
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10"><small>9 </small>
Nhận xét 1.1. Ta có thể cho tương ứng mọi đối tượng điều khiển nhận giá trị trong một không gian pha metric đầy đủ tách được 𝑋 với đối tượng điều khiển được trong không gian pha [0,1] bằng cách đặt 𝐴 ∈ 𝒰, 𝑥 , … 𝑥
𝑝 (𝑓(𝐴)/𝑓(𝑥 ), … , 𝑓(𝑥 ); 𝑢 , … 𝑢 )
= 𝑝 (𝐴/𝑥 , … , 𝑥 ; 𝑢 , … 𝑢 ). (1.4) Nếu có ít nhất một điểm 𝑡 , 𝑡 , … , 𝑡 không nằm trong 𝑓(𝑋), ta đặt
𝑝 (𝐴/𝑡 , 𝑡 , … , 𝑡 ; 𝑢 , 𝑢 , … , 𝑢 ) = 𝜒 (0).
Giả sử 𝜇̂(𝐴/𝒖) là một đối tượng điều khiển được xây dựng bởi phương pháp của 𝑝 trong [0,1] và 𝑓 là ánh xạ từ 𝑋 vào [0,1]; 𝑓 (𝑥) = (𝑓(𝑥 ), 𝑓(𝑥 ), … ). Khi đó 𝐴 ∈ 𝒰
𝜇̂(𝑓 (𝐴)/𝒖) = 𝜇(𝐴/𝒖).
Do đó, nếu cho 𝜇̂(./𝒖), tồn tại hàm 𝑝 thỏa mãn điều kiện 1 và 3 sao cho 𝜇̂ và 𝑝 được liên hệ bởi công thức (1.2), khi đó các hàm 𝑝 (./. , . ) cũng tồn tại bởi 𝜇(./. ) (được biểu diễn trong định nghĩa của 𝑝 thông qua (1.4)). Bởi vậy, hệ thức (1.2) được thỏa mãn và 𝑝 thỏa mãn điều kiện 1 và 3.
Định lý 1.1. Giả sử (𝑋, 𝒰) là một không gian metric đầy đủ tách được với một 𝜎 − đại số Borel. Nếu họ các độ đo 𝜇(𝑉/𝒖) thỏa mãn điều kiện 4 thì tồn tại một tập các hàm số {𝑝 (𝑑𝑥 / 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ), 𝑛 = 0, 1, … } thỏa mãn điều kiện 1 và 3 sao cho công thức (1.2) là đúng.
Chứng minh.
Dựa vào bổ đề 1.1 và nhận xét 1.1 đủ để chứng minh định lý trong trường hợp 𝑋 là [0,1]. Giả sử 𝒰<small>( )</small> xác định 𝜎 − đại số sinh bởi các đoạn
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11"><small>10 </small>
𝜇(𝐴/𝒰 , 𝒖) = lim<sub>→</sub> 𝜇(𝐴/𝒰<sup>( )</sup> , 𝒖)
với hầu hết 𝑥 trong độ đo 𝜇(𝑑𝑥/𝒖), (𝜇(𝐴/𝔏, 𝒖) biểu diễn phân phối có điều kiện giữa 𝜎 − đại số ℒ đối với độ đo 𝜇(./𝒖). Vì thế ta có hàm phân phối có khi giới hạn tồn tại. Với mọi 𝑧 ∈ [0,1] hàm số 𝐹(𝑧/. ) được xác định trên một tập đo được 𝑆 (𝑧) ⊂ 𝑋 × 𝑈 và đo được trong 𝒰<sub>[ , ]</sub> × 𝔏 đối với 𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 . Hơn nữa, với mọi 𝒖,
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12"><small>11 </small>
𝜁(𝑧)𝑃 (𝑑𝑧)𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 )
= 𝜁(𝑧)𝜇(𝑑𝑧/𝒰 , 𝑢) (1.7) với mọi (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) trong độ đo 𝜇(./𝒖). Vì vậy (1.7) đúng cho mọi hàm bị chặn đo được. Công thức (1.2) được suy ra từ (1.7) và tính chất của kỳ vọng điều kiện.
Do đó, nếu một khơng gian pha là một khơng gian metric đầy đủ tách được với 𝜎 −đại số các tập Borel, ta có 2 định nghĩa tương đương về đối tượng điều khiển. Đầu tiên, nó là một họ các hàm số (1.1) thỏa mãn các điều kiện 1-3. Thứ hai, nó là một họ các độ đo 𝜇(./𝒖) trong (𝑋 , ℬ ) phụ thuộc vào 𝒖 ∈ ℬ như một tham số và thỏa mãn điều kiện sau: Nếu 𝑉 ∈ 𝒰 thì 𝜇(𝑉/𝒖) là một hàm ℬ − đo được của 𝒖. Điều kiện sau là thuận tiện hơn, ngắn hơn và có thể bao quát cả trường hợp quá trình liên tục. Nhận xét này sẽ được sử dụng dưới đây.
Giờ ta tiến hành định nghĩa dãy các điều khiển hay một chiến lược. Giả sử rằng khi chọn một điều khiển tại thời điểm 𝑛, ta biết giá trị của quá trình cơ bản cho tới thời điểm đó và giá trị của điều khiển tại thời điểm trước đó. Giá trị thực của điều khiển 𝑢 tại thời điểm 𝑛 được giả định là ngẫu nhiên.
Cho
là một phân phối có điều kiện của biến 𝑢 đã cho sao cho các giá trị của quá trình cơ bản là 𝑥 , … , 𝑥 và giá trị của các q trình đó trong thời điểm trước là 𝑢 , … , 𝑢 .
Hàm phân phối (1.8) được xác định với 𝑛 = 0, 1, … (trong trường hợp 𝑛 = 0, hàm số là 𝑞 (𝑑𝑢 /𝑥 ) và thỏa mãn các điều kiện dưới đây:
5. 𝑞 (./𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) là độ đo xác suất đối với biến thứ nhất, với mọi 𝑥 ∈ 𝑋 và 𝑢 ∈ 𝑈;
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13"><small>12 </small>
6. Với 𝐵 ∈ ℬ, 𝑞 (𝐵/𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) là một hàm 𝒰 × ℬ − đo được đối với 𝑥 và 𝑢 .
Ta có thể xây dựng một họ các độ đo 𝑣(./ 𝒙) trên (𝑈 , ℬ ) phụ thuộc vào 𝒙 ∈ 𝑋 như một tham số. Giả sử 𝐷 là một mặt trụ trong ℬ có dạng
𝐷 = {𝒖| 𝑢 ∈ 𝐷 , … , 𝑢 ∈ 𝐷 } Khi đó:
𝑣(𝐷/𝒙) = 𝑞 (𝑑𝑢 /𝑥 ) 𝑞 (𝑑𝑢 /𝑥 , 𝑥 ; 𝑢 ) …
𝑞 (𝑑𝑢 /𝑥 , … , 𝑥 ; 𝑢 , … . , 𝑢 ). (1.9) Công thức (1.9) với mỗi 𝒙 xác định một họ các hàm phân phối hữu hạn chiều và do đó tồn tại độ đo duy nhất trên (𝑈 , ℬ ) sao cho (1.8) được thỏa mãn. Họ các độ đo 𝑣(𝐷/𝒙) thỏa mãn điều kiện sau:
7. Nếu 𝑊 ∈ ℬ thì 𝑣(𝑊/𝒙) là một hàm đo được trên 𝒰 đối với 𝒙. Dựa vào định lý 1.1, trong trường hợp 𝑈 là một không gian metric đầy đủ tách được với 𝜎 −đại số các tập Borel thì với mọi họ các độ đo 𝑣(./𝒙) thỏa mãn điều kiện 7, ta có thể xây dựng một họ các hàm số 𝑞 (./. ) thỏa mãn điều kiện 5 và 6 và liên hệ với 𝑣(./. ) bằng hệ thức (1.9). Khi đó họ các độ đo 𝑣(./. ) được gọi là chiến lược (điều khiển).
Nếu cho một đối tượng điều khiển 𝜇(./𝒖) và một điều khiển 𝑣(./𝒙), ta có thể xây dựng một dãy ngẫu nhiên với giá trị nằm trong 𝑋 × 𝑈 (chính xác hơn ta có thể xây dựng một hàm phân phối trong 𝑋 × 𝑈 )
𝑷{𝜉 ∈ 𝐴 /𝜉 , 𝜂 , … , 𝜉 , 𝜂 } = 𝑝 (𝐴 /𝜉 , … , 𝜉 ; 𝜂 , … , 𝜂 ) 𝑷{𝜂 ∈ 𝐵 /𝜉 , 𝜂 , … , 𝜉 , 𝜂 , 𝜉 } = 𝑞 (𝐵 /𝜉 , … , 𝜉 ; 𝜂 , … , 𝜂 )
(1.10) ở đó độ đo 𝑝 (./. ) và 𝑞 (./. ) được xác định trong giới hạn của 𝜇(./. ) và 𝑣(./. ). Phân phối hữu hạn chiều của dãy (𝜉 , 𝜂 ) được xác định bởi đẳng thức:
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">Một dãy (𝜉 , 𝜂 ) trong 𝑋 × 𝑈 thỏa mãn (1.10) được gọi là dãy ngẫu nhiên điều khiển được (quá trình) với đối tượng điều khiển 𝜇(./. ) và điều khiển 𝑣(./. ). Rõ ràng với mỗi đối tượng điều khiển 𝜇 và điều khiển 𝑣 thì tồn tại một quá trình điều khiển được và hàm phân phối của nó là xác định duy nhất bởi một điều khiển và một đối tượng điều khiển. Dãy {𝜉 ; 𝑛 = 0,1, … } được gọi là dãy cơ bản (quá trình điều khiển được) và dãy {𝜂 : 𝑛 = 0, 1, … } được gọi là dãy điều khiển.
Nếu cho một đối tượng điều khiển được và một điều khiển, thì quá trình điều khiển được được thể hiện bằng cách: Chọn 𝜂 từ 𝜉 ; hai biến này xác định trạng thái của quá trình cơ bản 𝜉 tại thời điểm 1 (hàm phân phối tại thời điểm 1); Dựa vào 𝜉 , 𝜂 , 𝜉 ta xây dựng điều khiển 𝜂 tại thời điểm 1. 𝜉 , 𝜂 , 𝜉 , 𝜂 sẽ xác định 𝜉 và tiếp tục quá trình như vậy.
Mỗi dãy (𝜉 , 𝜂 ) với giá trị trong 𝑋 × 𝑈 có thể được xét như một q trình điều khiển được với một đối tượng điều khiển và một điều khiển. Cịn lại có thể được xây dựng dựa vào hàm 𝑝 (./. ) và 𝑞 (./. ) đã được xác định với sự hỗ trợ của xác suất điều kiện trong vế trái của (1.5).
Điều khiển không ngẫu nhiên là một lớp con quan trọng của điều khiển, đó là điều khiển với độ đo 𝑣(./𝒙) suy biến tại một điểm của không gian 𝑈 với mọi 𝒙 ∈ 𝑋. Với mỗi điều khiển không ngẫu nhiên, tồn tại dãy hàm 𝜑 (𝑥 , … , 𝑥 ) với giá trị trong 𝑈 đo được đối với 𝒰 sao cho:
𝑝 (𝐵 /𝑥 , 𝑥 , … , 𝑥 ; 𝑢 , 𝑢 , … 𝑢 ) = 𝜒 (𝜑 (𝑥 , … 𝑥 )) trong đó 𝜒 (. ) là hàm chỉ tiêu của 𝐵.
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15"><small>14 </small>
Rõ ràng lớp những điều khiển không ngẫu nhiên nhỏ hơn thực sự so với lớp những điều khiển nói chung. Trong nhiều trường hợp, ta chỉ cần xét quá trình điều khiển được với điều khiển không ngẫu nhiên là đủ.
Vấn đề cơ bản trong lý thuyết về quá trình điều khiển được là chọn một điều khiển tối ưu (việc chọn này được thực hiện phụ thuộc vào đối tượng điều khiển đã cho). Cho một đối tượng điều khiển 𝜇(./. ) và một lớp chiến lược chấp nhận được ℛ. Hơn nữa, giả thiết xác định một phiến hàm 𝐹(𝒙, 𝒖) trong 𝑋 × 𝑈 là đo được trong 𝒰 × ℬ . Phiến hàm này được gọi là giá của điều khiển. Nó mơ tả sự tiêu hao cần thiết cho sự điều khiển đối tượng đã biết được cho bởi một dãy các điều khiển 𝒖 = (𝑢 , 𝑢 , … ) được chọn và quá trình cơ bản nhận các giá trị trong dãy giá trị 𝒙 = (𝑥 , 𝑥 , … ). Giả sử chọn một chiến lược 𝑣(./. ) ∈ ℛ. Dựa trên đối tượng điều khiển 𝜇(./. ) và chiến lược 𝑣(./. ) ta có thể xây dựng quá trình điều khiển được (𝜉, 𝜂), 𝜉 = (𝜉 , 𝜉 , … . ); 𝜂 = (𝜂 , 𝜂 , … ). Ký hiệu 𝑬 là kỳ vọng lấy theo độ đo tương ứng với (𝜉, 𝜂) trong 𝑋 × 𝑈 với điều khiển 𝑣(./. ) đã chọn. Khi đó, giá trung bình của điều khiển với chiến lược 𝑣(./. ) được cho bởi công thức
𝑆(𝑣) = 𝑬 𝐹(𝜉, 𝜂).
Một bài toán tối ưu tức là bài toán xác định một chiến lược sao cho 𝑆(𝑣) nhỏ nhất, tức là một điều khiển với sự tiêu hao nhỏ nhất. Để giải quyết bài toán này, ta cần xác định giá của điều khiển tối ưu:
𝑆 = inf<sub>∈ℛ</sub>𝑆(𝑣).
Sau đó ta tìm ít nhất một điều khiển 𝑣̅ sao cho 𝑆 = 𝑆(𝑣̅). Trong trường hợp không tồn tại 𝑣̅, ta sẽ quan tâm tới điều khiển 𝑣 sao cho 𝑆(𝑣 ) ≤ 𝑆 + 𝜀. Đó là điều khiển 𝜀 − tối ưu. Điều khiển 0 − tối ưu được gọi là tối ưu.
Vì vậy bài tốn cơ bản của lý thuyết các quá trình điều khiển được được phát biểu như sau: Với một đối tượng điều khiển được 𝜇(./. ) đã cho, giá của điều khiển 𝐹(. , . ) và một lớp chiến lược ℛ, xác định điều khiển tối ưu,
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16"><small>15 </small>
và nếu không tồn tại điều khiển tối ưu, ta xác định một điều khiển 𝜀 − tối ưu với mọi 𝜀 > 0.
Ta giả sử rằng 𝑋 và 𝑈 là các không gian metric đầy đủ tách được. Giờ ta sẽ mô tả lớp ℛ với ràng buộc đối với cả điều khiển tối ưu và điều khiển 𝜀 − tối ưu được lấy trong số các điều khiển không ngẫu nhiên.
Một lớp ℛ được gọi là một lớp điều khiển hạn chế nếu nó chứa mọi điều khiển thoải mãn 2 điều kiện sau:
(1) Các hàm 𝑞(./ 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) được xây dựng theo điều khiển 𝑣(./. ) là đo được đối với 𝒰 × ℬ trong đó 𝒰 ⊂ 𝒰 là một dãy 𝜎 −đại số đơn điệu xác định.
(2) Cho (𝜉 ; 𝜂 ) là một dãy điều khiển được được xây dựng từ đối tượng điều khiển được 𝜇(./. ) và điều khiển 𝑣(./. ), khi đó ℙ{(𝜂 , … , 𝜂 ) ∈ 𝛤 } = 1 với mọi 𝑛, trong đó 𝛤 là một dãy các tập Borel trong 𝑈 .
Định lý 1.2. Nếu ℛ là một lớp điều khiển hạn chế thì với 𝑣 bất kỳ, 𝑣 ∈ ℛ, tồn tại một điều khiển không ngẫu nhiên 𝑣̅ ∈ ℛ sao cho
𝑆(𝑣̅) ≤ 𝑆.
Việc chứng minh định lý trên dựa vào bổ đề sau đây.
Bổ đề 1.2. Cho 𝜇 là một họ các độ đo trên (𝑋, 𝒰), 𝑠 ∈ (𝑆, ℒ) ((𝑆, ℒ) là một khơng gian đo nào đó). Ta ký hiệu ℬ<sub>[ , ]</sub> là 𝜎 −đại số các tập Borel trên [0,1] và m là độ đo Lebesgue trên [0,1]. Nếu 𝜇 (𝐸) là một ℒ− đo được theo 𝑠 với mọi 𝐸 ∈ 𝒰, khi đó tồn tại một hàm số 𝑓(𝑡, 𝑠) trên [0,1] × 𝑆 đo được trong ℬ<sub>[ , ]</sub> × ℒ với các giá trị trong 𝑋 sao cho
𝑚({𝑡: 𝑓(𝑡, 𝑠) ∈ 𝐸}) = 𝜇 (𝐸). với mọi 𝐸 ∈ 𝒰.
Chứng minh.
Trong bổ đề 1.1 với không gian metric đầy đủ tách được bất kỳ, tồn tại một ánh xạ đo được 𝜆(𝑥) từ (𝑋, 𝒰) vào ([0,1], ℬ<sub>[ , ]</sub>). Do đó, khơng mất tính tổng quát, ta giả sử 𝑋 trùng với [0,1]. Đặt
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17"><small>16 </small>
𝜙(𝑠, 𝑥) = 𝜇 ([0, 𝑥]), 𝑥 ∈ [0,1].
Hàm 𝜙(𝑠, 𝑥) là đo được đồng thời đối với các biến, là đơn điệu và liên tục phải tại 𝑥. Với mọi 𝑥 sao cho 𝜙(𝑠, 𝑥) > 𝜙(𝑠, 𝑥 ), 𝑥 > 𝑥 . Ta đặt
𝑓(𝜙(𝑠, 𝑥 ), 𝑠) = 𝑥 .
Như vậy, 𝑓(𝑡, 𝑥) được xác định trên tập xác định của hàm 𝜙(𝑠, 𝑥). Nếu 𝑡 không thuộc tập xác định này, trong trường hợp 𝑡 ∈ [0, 𝜙(𝑠, 0)] thì ta đặt 𝑓(𝑡, 𝑠) = 0; trong trường hợp tồn tại 𝑥 sao cho 𝑡 ∈ [𝜙(𝑥 − 0, 𝑠), 𝜙(𝑥, 𝑠)], ta đặt 𝑓(𝑡, 𝑠) = 𝑥. Hàm 𝑓(𝑡, 𝑠) là đo được đồng thời đối với các biến và đơn điệu đối với 𝑡: là đúng (ở đây 𝑝 được xác định bởi đối tượng điều khiển 𝜇(./. )). Tiếp theo, ta ký hiệu 𝑔 (𝑡, 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) là hàm số có giá trị trong 𝑈 có cùng tính chất đo được sao cho với 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 cố định, đẳng thức
𝑚({𝑡 ∶ 𝑔 (𝑡, 𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) ∈ 𝐵})
= 𝑞 (𝐵/𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) (1.13) là đúng (ở đây 𝑞 (./.) được xây dựng từ điều khiển đã cho 𝑣 ∈ ℛ). Hơn nữa, 𝑔 (𝑡, 𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) có thể được giả định là một hàm 𝒰<small>[ , ]</small>× 𝒰 ×
</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18"><small>17 </small>
ℬ − đo được mà (𝑢 , … , 𝑢 , 𝑔 (𝑡, 𝑥 , … , 𝑢 ) ∈ 𝛤 . Sự tồn tại của các hàm 𝑓 và 𝑔 với các tính chất trên tuân theo bổ đề 1.2.
Cho 𝜁 , 𝜁 , … , 𝜃 , 𝜃 , … là một dãy các biến ngẫu nhiên phụ thuộc và cùng phân phối đều trên [0,1]. Đặt
𝜉 = 𝑓 (𝜁 ), 𝜂 = 𝑔 (𝜃 , 𝜉 )
𝜉 = 𝑓 (𝜁 , 𝜉 , 𝜂 ), 𝜂 = 𝑔 (𝜃 , 𝜉 , 𝜉 , 𝜂 ), …. 𝜉 = 𝑓 (𝜁 , 𝜉 , … , 𝜉 , 𝜂 , … , 𝜂 )
𝜂 = 𝑔 (𝜃 , 𝜉 , … , 𝜉 , 𝜂 , … , 𝜂 ).
Công thức (1.12) và (1.13) suy ra rằng một dãy {(𝜉 , 𝜂 ); 𝑛 = 0, 1, … } tạo thành một quá trình Markov điều khiển được với đối tượng điều khiển 𝜇(./. ) và điều khiển 𝑣(./. ). Ký hiệu 𝑬(./𝜃) là một kỳ vọng có điều kiện đối với một 𝜎 − đại số sinh bởi các biến (𝜃 , 𝜃 , … ). Đặt
𝐹 (𝜃) = 𝑬 (𝐹(𝜉, 𝜂)/𝜃).
Hàm số này là một hàm 𝒰<sub>[ , ]</sub> − đo được của 𝜃 trên [0,1] . Cho 𝑚 là một tích đếm được các độ đo Lebesgue trên [0,1]. Độ đo 𝑚 là xác định trên
Quá trình (𝜉 , 𝜂 ) là một quá trình điều khiển được (với cùng đối tượng 𝜇(./. )) cùng một điều khiển không ngẫu nhiên
</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19"><small>18 </small>
𝑢 = 𝑔 (𝜃 , 𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ).
Để biểu thị 𝑢 qua 𝑥 , … , 𝑥 , ta phải thay các giá trị của 𝑢 cho 𝑘 ≤ 𝑛 − 1. Ký hiệu 𝑣 là một điều khiển không ngẫu nhiên nằm trong ℛ. Hơn nữa
Ta sẽ thiết lập một điều kiện tổng quát mà với nó ln tồn tại một điều khiển tối ưu. Với mục đích này, một vài tính chất của dữ kiện nửa liên tục sẽ được yêu cầu.
Nhắc lại, hàm 𝑓(𝑥) được xác định trên một không gian metric 𝑋 được gọi là nửa liên tục dưới nếu với mọi 𝑥 ∈ 𝑋
<small>→</small> 𝑓(𝑦) ≥ 𝑓(𝑥).
Một hàm nửa liên tục dưới đạt được min của nó trên mọi tập compact. Hơn nữa, nếu 𝑓(𝑥) là một hàm nửa liên tục dưới, thì tập {𝑥: 𝑓(𝑥) ≤ 𝑐} được gọi là đóng với mọi 𝑐.
Cho một dãy hữu hạn các độ đo 𝜇 được xác định trên 𝑋 hội tụ yếu tới độ đo 𝜇. Nghĩa là với bất kỳ hàm 𝜑(𝑥) liên tục bị chặn trên 𝑋 (𝜑 ∈ 𝐶 )
</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">Điều này suy ra tính hợp lý của bổ đề đối với một hàm bị chặn. Trong trường hợp tổng quát, ta dùng dữ kiện rằng hàm [𝑓 ˄ 𝑁] cũng là một hàm nửa liên tục dưới. Do đó, theo chứng minh trên 𝐹(𝒙, 𝒖) xác định trên 𝑋 × 𝑈 được gọi là nửa liên tục dưới nếu với bất kỳ dãy 𝒙 và 𝒖<small>𝒏</small> sao cho 𝒙 → 𝒙 và 𝒖 → 𝒖
</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21"><small>20 </small>
<small>→</small> 𝐹 𝒙 , 𝒖<sup>( )</sup> ≥ 𝐹(𝒙<sup>( )</sup>, 𝒖<sup>( )</sup>).
Định lý 1.3. Cho 𝑈 là một tập compact, 𝑋 là một không gian metric đầy đủ tách được và đối tượng điều khiển 𝜇(./𝒖) thỏa mãn điều kiện sau:
(A) Với mọi 𝑔 ∈ 𝐶 , hàm
𝑔(𝑥)𝑞 (𝑑𝑥|𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) là liên tục đồng thời với các biến.
Nếu giá của điều khiển 𝐹(𝒙, 𝒖) bị chặn dưới và nửa liên tục dưới thì tồn tại điều khiển tối ưu trong lớp tất cả các điều khiển.
Chứng minh.
Cho 𝑣<small>( )</small>(./. ) là một dãy các điều khiển, và (𝜉 , 𝜂 ) là một quá trình điều khiển được với đối tượng 𝜇(./. ) và điều khiển 𝑣<small>( )</small>(./. ).
Giả sử phân phối biên của quá trình 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> , 𝑘 = 0, 1, … hội tụ tới phân phối biên của quá trình 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> , 𝑘 = 0, 1, … . Khi đó, nếu điều kiện (A) được thỏa mãn, thì quá trình giới hạn sẽ là một quá trình điều khiển được với cùng đối tượng 𝜇(./. ). Thật vậy, với bất kỳ 𝑘 và các hàm liên tục 𝑔 (𝑥) ∈ 𝐶
</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22"><small>21 </small>
× 𝛹 𝜉<sup>( )</sup>, … , 𝜉<sup>( )</sup> , 𝜂<sup>( )</sup>, … , 𝜂<sup>( )</sup> .
Ở đây ta sử dụng sự hội tụ đồng thời của các phân phối của 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup>, 𝑖 = 0, 1, … , 𝑘 tới các phân phối của 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup>, 𝑖 = 0, 1, … , 𝑘 và sự liên tục của các hàm 𝑔 , 𝛹 và ∫ 𝑔 (𝑥)𝑝 (𝑑𝑥/ 𝑥 <small>,</small>… , 𝑥 ; 𝑢 , … 𝑢 ). Hơn nữa, với mọi
Chúng ta đã chứng minh rằng 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> , 𝑘 = 0, 1, … là một quá trình điều khiển được với đối tượng 𝜇(./. ). Ta đặt các điều khiển 𝑣
𝑬 𝐹(𝜉, 𝜂) = 𝑬𝐹 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> ≤ inf 𝑬 𝐹(𝜉, 𝜂) + 𝜀 (1.16) khi 𝜀 ↓ 0.
Ta thấy rằng phân phối biên của dãy { 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> , 𝑘 = 0, 1, … } là compact. Theo điều kiện (A), với bất kỳ tập compact 𝐾 , 𝐾 , … , 𝐾 trong 𝑋, họ các phân phối {𝑝 (./ 𝑥 , … , , 𝑥 ; 𝑢 , … , 𝑢 ); 𝑥 ∈ 𝐾 , … , 𝑥 ∈ 𝐾 ; 𝑢 , … , 𝑢 ∈ 𝑈} là compact.
</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23"><small>22 </small>
Thật vậy, cho bất kỳ dãy (𝑥<sup>( )</sup>, … , 𝑥<sup>( )</sup> ; 𝑢<sup>( )</sup>, … , 𝑢<sup>( )</sup> ) bằng cách chọn một dãy con 𝑛 sao cho dãy (𝑥<sup>( )</sup>, … , 𝑥<sup>( )</sup>; 𝑢<sup>( )</sup>, … , 𝑢<sup>( )</sup>) hội tụ tới (𝑥<sup>( )</sup>, … , 𝑥<sup>( )</sup> ; 𝑢<sup>( )</sup>, … , 𝑢<sup>( )</sup>), ta được một dãy con các độ đo
𝑝 (./ 𝑥<sup>( )</sup>, … , 𝑥 ; 𝑢 , … , 𝑢<sup>( )</sup>) hội tụ yếu. Sử dụng điều kiện compact yếu của họ các độ đo, ta kiểm tra lại rằng với bất kỳ một dãy các tập compact 𝐾 , 𝐾 , . . . , 𝐾 và 𝜀 > 0, tồn tại một tập compact 𝐾 ⊂ 𝑋 sao cho
𝑝 (𝐾 / 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) ≥ 1 − 𝜀.
Chọn 𝜀 > 0 và xây dựng tập compact 𝐾 như sau: 𝐾 thỏa mãn 𝑝 (𝐾 ) ≥ 1 − 𝜀/2; sau khi chọn 𝐾 , 𝐾 , … , 𝐾 , ta chọn 𝐾 sao cho
Theo tính compact của 𝑈, suy ra tính compact của phân phối biên của dãy { 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> , 𝑘 = 0, 1, … }. Khơng mất tính tổng qt, ta có thể giả sử phân phối biên của { 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> , 𝑘 = 0, 1, … } hội tụ tới phân phối biên của quá trình điều khiển được { 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> , 𝑘 = 0, 1, … } với đối tượng 𝜇(./. ) và điều khiển 𝑣̅. Khi đó, theo bổ đề 1.3 và bất đẳng thức (1.16), ta có
𝑬 𝐹(𝜉, 𝜂) = 𝑬𝐹 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> ≤ lim<sub>→</sub> 𝑬𝐹 𝜉<sup>( )</sup>, 𝜂<sup>( )</sup> = inf 𝑆(𝑣) □ Hệ quả: Nếu các điều kiện ở định lý 1.2 và 1.3 được thỏa mãn, khi đó tồn tại một điều khiển tối ưu không ngẫu nhiên.
</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24"><small>23 </small>
Nhận xét 1.2. Với các điều kiện của định lý 1.3, tập các độ đo trên 𝑋 × 𝑈 tương ứng với các quá trình điều khiển được (𝜉<sup>( )</sup>, 𝜂<sup>( )</sup>) cùng với một đối tượng là compact.
Giả sử rằng 𝑈 là compact hoàn tồn và 𝑈 là một compact hóa của 𝑈 được lấy bằng cách thêm các điểm rời rạc và hàm âm 𝐹(𝑥, 𝑢) là nửa liên tục dưới trên 𝑋 × 𝑈 và triệt tiêu trên 𝑋 × (𝑈 ) \𝑋 × 𝑈
Giả sử điều kiện (A) dược thỏa mãn cho đối tượng 𝜇(./. ) và với mọi 𝑓 ∈ 𝐶 , hàm
𝑓(𝑥)𝑝 (𝑑𝑥 / 𝑥 , … , 𝑥 ; 𝑢 , … . , 𝑢 )
có thể thác triển liên tục được trên 𝑋 × (𝑈 ) . Điều đó có nghĩa rằng độ đo 𝑝 (./ 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) là liên tục mở rộng được (theo nghĩa hội tụ yếu trên 𝑋 × (𝑈 ) ). Sự liên tục này mở rộng đối tượng 𝜇(./. ) trên 𝑋 × (𝑈 ) . Ta sẽ ký hiệu sự mở rộng này bằng cùng ký hiệu 𝜇(./. ) và giả sử rằng 𝜇(./. ) thỏa mãn điều kiện (A). Theo định lý trên và hệ quả của nó thì tồn tại một q trình tối ưu khơng ngẫu nhiên 𝑢 = 𝜑 (𝑥 , … , 𝑥 ). Do
𝐹(𝒙, 𝒖) = 0 𝑣ớ𝑖 𝒖 ∈ (𝑈 ) \𝑈 𝐹(𝒙, 𝒖) ≤ 0 𝑣ớ𝑖 𝒙 ∈ 𝑋 , 𝒖 ∈ 𝑈 Quá trình tối ưu này có thể được chọn sao cho
𝜑 (𝑥 , 𝑥 , … , 𝑥 ) ∈ 𝑈
với mọi k với xác suất 1 (bằng cách giả sử rằng 𝜑 (𝑥 , … , 𝑥 ) = 𝑢 ∈ 𝑈 với 𝜑 ∉ 𝑈, ta không làm giảm giá trị của 𝑬 𝐹(𝜉, 𝜂)). Kết quả thu được có thể được phát biểu như sau.
Định lý 1.4. Cho 𝑋 là một không gian metric đầy đủ tách được, 𝑈 là compact địa phương và 𝜇(./. ) thỏa mãn điều kiện: với mọi 𝑓 ∈ 𝐶 và 𝑛 ≥ 0, hàm số
𝑓(𝑥)𝑝 (𝑑𝑥/ 𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 )
</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25"><small>24 </small>
là liên tục theo tập các biến và đều đối với 𝑥 , … , 𝑥 tồn tại giới hạn theo 𝑢 , … , 𝑢 , nếu điểm này trong 𝑈 tiến tới một điểm nào đó trong (𝑈 ) \ 𝑈 .
Nếu 𝐹(𝒙, 𝒖) là không dương, nửa liên tục dưới và lim 𝐹(𝒙, 𝒖) = 0 đều với 𝒙, và nếu 𝒖 tiến tới một điểm 𝒖 ∈ (𝑈 ) \(𝑈) , thì tồn tại một điều khiển tối ưu không ngẫu nhiên.
Cho 𝑋 là một không gian metric đầy đủ tách được và 𝑈 là một tập compact. Giả sử điều kiện (A) được thỏa mãn với đối tượng 𝜇(./. ). Ta muốn tìm hiểu làm thế nào để xây dựng được một điều khiển tối ưu hoặc điều khiển 𝜀 − tối ưu. Theo quan điểm trên, các điều khiển này có thể được tìm ra trong các điều khiển khơng ngẫu nhiên.
Đầu tiên, ta giả sử rằng 𝐹(𝒙, 𝒖) = 𝜙(𝑥 , … , 𝑥 ; 𝑢 , … , 𝑢 ) với 𝜙 là một hàm trong 𝑋 × 𝑈 bị chặn dưới và nửa liên tục dưới. Để xây dựng một điều khiển tối ưu trong trường hợp này, ta cần một vài khẳng định bổ trợ sau.
Bổ đề 1.4. Cho 𝑓(𝑥, 𝑢) là một hàm bị chặn dưới và nửa liên tục dưới với 𝑥 ∈ 𝑋, 𝑢 ∈ 𝑈. Khi đó hàm 𝑓(𝑥) = inf 𝑓(𝑥, 𝑢) cũng là nửa liên tục dưới và tồn tại một hàm Borel 𝜑 từ X vào U sao cho
Chứng minh.
Vì 𝑈 là tập compact và hàm 𝑓(𝑥, 𝑢) là nửa liên tục dưới với 𝑢, nên đối với mỗi 𝑥, tồn tại
</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26"><small>25 </small>
= lim
<small>→</small> 𝑓 𝑥 , 𝑢 − 𝜀 ≥ 𝑓(𝑥 , 𝑢 ) − 𝜀 ≥ 𝑓̅(𝑥 ) − 𝜀.
ở đây 𝑛 là một dãy, 𝑢 là hữu hạn điểm trong dãy 𝑢 . Vì 𝜀 > 0 là tùy ý nên điều khẳng định đầu tiên của định lý là đúng. Ta cần chứng minh sự tồn tại của tập Borel thỏa mãn (1.17). Giả sử rằng 𝑓 > 0.
Cho 𝐵<sup>( )</sup>, … , 𝐵<sup>( )</sup> là các tập đóng trong 𝑈 thỏa mãn các điều kiện: 1. 𝐵<sup>( )</sup> = 𝑈
2. lim<sub>→</sub> max 𝑑𝑖𝑎𝑚 𝐵<sup>( )</sup> = 0
với 𝑑𝑖𝑎𝑚(𝐵) là đường kính của tập 𝐵; (3) mỗi tập 𝐵<sup>(</sup> <sup>)</sup> được chứa hoàn toàn trong một và chỉ một tập 𝐵<sup>( )</sup>và hơn nữa, nếu 𝐵<sup>(</sup> <sup>)</sup> ⊂ 𝐵<sup>( )</sup>, thì 𝐵<sup>(</sup> <sup>)</sup> được chứa duy nhất trong 𝐵<sup>( )</sup> ∪ 𝐵<sup>( )</sup>, khi 𝐵<sup>(</sup> <sup>)</sup> ⊂ 𝐵<sup>( )</sup>. Tập
Tập ∆<sup>( , )</sup>= ⋃ ∆<sup>( , )</sup>, ∆<sup>( )</sup>= ⋂ ∆<sup>( , )</sup>. Tất cả các tập vừa rồi đều là tập Borel. Nếu 𝑥 ∈ ∆<sup>( )</sup>, với mỗi m, tồn tại 𝑢 ∈ 𝐵<sup>( )</sup> sao cho
𝑓(𝑥) − 𝑓(𝑥, 𝑢 ) ≤ <sup>1</sup> 𝑚.
</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27"><small>26 </small>
Từ 𝑢 chọn một dãy hội tụ, ta kiểm chứng được tồn tại 𝑢 ∈ 𝐵<sup>( )</sup>sao cho 𝑓(𝑥) = 𝑓(𝑥, 𝑢). Ngược lại, nếu tồn tại 𝑢 ∈ 𝐵<sup>( )</sup> sao cho 𝑓(𝑥) = 𝑓(𝑥, 𝑢) thì 𝑥 ∈ ∆<sup>( , )</sup>với 𝑖 = [𝑚𝑓(𝑥)] với m bất kỳ. Vì vậy
</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">liên tục dưới. Thật vậy, tính nửa liên tục dưới của 𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) được suy ra từ bổ đề 1 nếu như ta có 𝜙 là nửa liên tục dưới.
Để chứng minh rằng 𝜙 là nửa liên tục dưới với điều kiện 𝜙 là nửa liên tục dưới, ta cần sử dụng khẳng định sau.
Bổ đề 1.5. Cho 𝜙(𝑥, 𝑥 ) là một hàm bị chặn dưới và là một nửa liên tục dưới trên 𝑋 × 𝑋 , với 𝑋 và 𝑋 là các không gian metric đầy đủ tách được và 𝜇 là một dãy hữu hạn các độ đo trên 𝑋 hội tụ yếu tới độ đo 𝜇 . Nếu 𝑥<sup>( )</sup> → 𝑥<sup>( )</sup>thì
với 𝜒 là hàm chỉ tiêu của tập 𝐴 . Dễ thấy một dãy các độ đo 𝜇 là hội tụ yếu tới độ đo 𝜇 . Theo bổ đề 1.3
lim<sub>→</sub> 𝜙(𝑥, 𝑥 )𝜇 (𝑑𝑥 × 𝑑𝑥 ) = 𝜙(𝑥, 𝑥 )𝜇 (𝑑𝑥 × 𝑑𝑥 ). Nó chỉ ra rằng
</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">Bây giờ giả sử dãy 𝑥<sup>( )</sup>, 𝑢<sup>( )</sup>, 𝑖 = 0, … , 𝑘 tương ứng hội tụ tới 𝑥<sup>( )</sup> và 𝑢<sup>( )</sup> . Khi đó các độ đo 𝑝 (𝑑𝑥 / 𝑥<sup>( )</sup>, … , 𝑥<sup>( )</sup>, 𝑢<sup>( )</sup>, … , 𝑢<sup>( )</sup>) hội tụ yếu tới độ đo 𝑝 (𝑑𝑥 / 𝑥<sup>( )</sup>, … , 𝑥<sup>( )</sup>, 𝑢<sup>( )</sup>, … , 𝑢<sup>( )</sup>). Bởi vậy, nếu
𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) là nửa liên tục dưới, từ bổ đề 1.5 ta suy ra
Vì vậy 𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) cũng là nửa liên tục dưới. Vì trong hệ thống các hàm (1.18), hàm đầu tiên là nửa liên tục dưới và tính nửa liên tục dưới của một hàm phía trước quy suy ra tính nửa liên tục dưới của hàm phía sau, tất cả các hàm trong hệ thống là nửa liên tục dưới. Bổ đề 1.4 chỉ ra sự tồn tại của các hàm Borel 𝜑 (𝑥 , . . , 𝑥 ; 𝑢 , … , 𝑢 ), 𝑘 = 0, … , 𝑛 sao cho
𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 )
</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30"><small>29 </small>
= 𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ), 𝜑 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) (1.20) Định lý 1.5. Cho các hàm 𝜙 , 𝜙 và số 𝜙 được định nghĩa bởi (1.18) và các hàm 𝜑 bởi (1.20). Ta định nghĩa các hàm liên tiếp
𝜑 (𝑥 ) = 𝜑 (𝑥 ), 𝜑 (𝑥 , 𝑥 ) = 𝜑 𝑥 , 𝑥 , 𝜑 (𝑥 ) , … , 𝜑 (𝑥 , … , 𝑥 ) = 𝜑 (𝑥 , … , 𝑥 ), 𝜑 (𝑥 ), … , 𝜑 (𝑥 , … , 𝑥 ), … Một điều khiển không ngẫu nhiên 𝑣 được cho bởi dãy
{𝑢 = 𝜑 (𝑥 , … , 𝑥 ), 𝑘 = 0, 1, … } là một điều khiển tối ưu và đại lượng 𝜙 là giá điều khiển tối ưu.
Chứng minh.
Cho một điều khiển 𝑣 không ngẫu nhiên được xác định bởi các hàm 𝑢 = 𝛹 (𝑥 , … , 𝑥 ). Ký hiệu {(𝜉 , 𝜂 ), 𝑘 = 0, 1, ...}là dãy điều khiển được
</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">nghĩa như sau. Giả sử tại các thời điểm 0, … , 𝑘, các điều khiển 𝑢 , … , 𝑢 đã chọn và hữu hạn các quá trình cơ bản nhận giá trị 𝑥 , … , 𝑥 . Khi đó 𝜙 trở thành giá tối ưu của điều khiển mở rộng:
𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) = min
<small>∈ℛ</small> 𝐸 (𝜙(𝑥 , . . , 𝑥 , 𝜉 , . . , 𝜉 , 𝑢 , … , 𝑢 , 𝜂 , … , 𝜂 )/𝜉 = 𝑥 ) 𝑖 = 0, . . , 𝑘 với ℛ là tập tất cả các điều khiển sao cho 𝜂 = 𝑢 , 𝑖 = 0, … , 𝑘. Khẳng định này được chứng minh giống như định lý 1.5.
Rõ ràng giá điều khiển tối ưu cho các hàm giá 𝜙 và 𝜙 là như nhau vì một điều khiển tối ưu có thể được xây dựng bằng cách: trước tiên ta sử dụng một điều khiển tối ưu trong 𝑘 bước đầu, sau đó tiếp tục tối ưu điều khiển đó. Cơng thức (1.18) chỉ ra cách tiếp tục tối ưu cho 1 bước (chuyển từ 𝜙 sang
</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32"><small>31 </small>
𝜙 ) và cách mà giá điều khiển tối ưu thay đổi ( chuyển từ 𝜙 sang 𝜙 ) trong trường hợp này.
Nhận xét 1.4. Bằng cách biến đổi ở một mức độ nhỏ của hàm 𝜙, sử dụng phương pháp đã trình bày ở định lý 1.5, ta có thể xây dựng một điều khiển tối ưu trong một lớp các điều khiển với các ràng buộc.
Giả sử rằng tồn tại một dãy các tập đóng 𝛤 ⊂ 𝑋 × 𝑈 sao cho các điều kiện sau được thỏa mãn:
1. Nếu (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) ∈ 𝛤 , khi đó (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) ∈ 𝛤 ;
2. Với 𝑘 bất kỳ, điểm (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) ∈ 𝛤 và 𝑥 , … , 𝑥 ∈ 𝑋, tồn tại các hàm Borel 𝑔 <sub>,</sub> (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 , 𝑥 , … , 𝑥 ) nhận giá trị trong 𝑈 (𝑗 > 𝑘) sao cho
Thật vậy, cho điều khiển này được xác định bởi các hàm 𝑢 = 𝜑 (𝑥 , … , 𝑥 ). Với (𝑥 , … , 𝑥 ; 𝜑(𝑥 ), … , 𝜑 (𝑥 , … , 𝑥 )) ∉ 𝛤 ký hiệu bởi 𝑘 số nguyên nhỏ nhất sao cho
</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">Vì vậy, bằng cách chọn điều khiển 𝑢 = 𝜑 ta không làm tăng giá điều khiển. Tuy nhiên nếu điều khiển 𝑣 ∈ ℛ thì
𝑷 𝐹<small>( )</small>(𝜉, 𝜂) = 𝐹(𝜉, 𝜂) = 1. Do đó điều khiển này là tối ưu trong lớp ℛ.
Xét trường hợp tổng quát của một hàm giá theo các giả thiết của định lý 1.3. Để bắt đầu, ta xét các đối tượng ban đầu cùng với một họ các đối tượng
Đây là một họ các phiến hàm dịch chuyển. Cho 𝐸 <sup>,…, , ,…,</sup> là một kỳ vọng của một dãy ngẫu nhiên xác định bởi đối tượng điều khiển
</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34"><small>33 </small>
Hàm 𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) được gọi là giá tối ưu có điều kiện cung cấp ở 𝑛 bước điều khiển đầu 𝑢 , … , 𝑢 đã chọn và quá trình cơ bản nhận giá trị Định lý 1.5 chỉ ra rằng giá tối ưu cho đối tượng 𝜇(./. ) <sub>,…, , ,…,</sub> cùng với hàm giá của điều khiển trùng với hàm 𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) được Do đó, đối với các hàm 𝐹(𝒙, 𝒖) có dạng được chỉ ra ở trên (chỉ phụ thuộc vào hữu hạn tọa độ), quan hệ sau được thỏa mãn:
𝜙 (𝑥 , … . , 𝑥 , 𝑢 , … , 𝑢 )
= 𝑝 (𝑑𝑥 /𝑥 , … . , 𝑥 , 𝑢 , … , 𝑢 )
× inf 𝜙 (𝑥 , … . , 𝑥 , 𝑢 , … , 𝑢 ) . (1.24)
</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35"><small>34 </small>
Giờ ta thực hiện với các hàm giá phụ thuộc vào vô hạn tọa độ. Sau đây là một vài tính chất của hàm nửa liên tục và hàm liên tục cần sử dụng.
Bổ đề 1.6. Với bất kỳ một hàm nửa liên tục dưới 𝐹(𝑥) bị chặn dưới trong một khơng gian metric đầy đủ tách được 𝑋, ta có thể tìm được một dãy tăng các hàm liên tục bị chặn 𝐹 (𝑥) sao cho 𝐹 (𝑥) ↑ 𝐹(𝑥) với mọi 𝑥 ∈ 𝑋.
Bổ đề 1.7. Cho 𝐹(𝒙, 𝒖) là một hàm liên tục trên 𝑋 × 𝑈 (𝑋 là một không gian metric đầy đủ tách được và 𝑈 là compact). Với bất kỳ dãy compact 𝐾 ⊂ 𝐾, luôn tồn tại các hàm liên tục 𝐹 (𝒙, 𝒖) = 𝛹 (𝑥 , . . . , 𝑥 , 𝑢 , … , 𝑢 ) hội tụ đều tới 𝐹(𝒙, 𝒖) trên tập và 𝑟[(𝒙, 𝒖), 𝒙<small>( )</small>, 𝒖<small>( )</small> ] → 0 khi 𝑛 → ∞. Vì vậy, nhờ tính liên tục thống nhất của hàm 𝐹(𝒙, 𝒖) trên tập compact 𝐾, ta có
<small>(𝒙,𝒖)∈</small> 𝐹(𝒙, 𝒖) − 𝐹(𝒙<small>( )</small>, 𝒖<small>( )</small> = 0.
</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36"><small>35 </small>
Hệ quả. Nếu 𝐹(𝒙, 𝒖) là một hàm nửa liên tục dưới, bị chặn dưới, ta có thể lấy ra được một dãy tăng các hàm liên tục 𝐹 (𝒙, 𝒖) = 𝛹 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) sao cho
𝐹(𝒙, 𝒖) = lim
<small>→</small> 𝐹 (𝒙, 𝒖) (𝒙, 𝒖) ∈ 𝐾.
Bổ đề 1.8. Cho một dãy các hàm liên tục của giá điều khiển 𝐹<small>( )</small>(𝒙, 𝒖) bị chặn đồng thời và đơn điệu tăng tới một hàm giá của điều khiển 𝐹(𝒙, 𝒖) khi m tăng. Cho 𝑆 và 𝑆 tương ứng là các giá điều khiển tối ưu cho các hàm trên.
Tuy nhiên nếu điều khiển 𝑣 được chọn theo cách 𝐸 𝐹<small>( )</small>(𝜉, 𝜂) ≤ 𝑆 + 𝜀, khi đó với mọi 𝑘
<small>→</small> 𝐸 𝐹<sup>( )</sup>(𝜉, 𝜂) ≤ lim
<small>→</small> 𝐸 𝐹<sup>( )</sup>(𝜉, 𝜂) ≤ lim
<small>→</small> 𝑆 + 𝜀.
Định lý 1.3 chỉ ra rằng một dãy cái độ đo tương ứng với (𝜉, 𝜂) trên 𝑋 × 𝑈 dưới sự lựa chọn của các điều khiển 𝑣 là compact yếu, và bất kỳ độ đo định ra giới hạn nào tương ứng với một dãy điều khiển được xây dựng theo cùng một đối tượng và cùng một chiến lược 𝑣. Do đó
𝐸 𝐹<sup>( )</sup>(𝜉, 𝜂) ≤ lim<sub>→</sub> 𝑆 + 𝜀
với 𝑣̅ là một điều khiển (có thể phụ thuộc vào 𝑘). Chọn một lần nữa một điểm giới hạn cho tương ứng các độ đo trong 𝑋 × 𝑈 , ta kiểm tra rằng tồn tại một điều khiển đơn 𝑣̅ (là giống nhau với mọi 𝑘) sao cho
𝐸 𝐹<sup>( )</sup>(𝜉, 𝜂) ≤ lim<sub>→</sub> 𝑆 + 𝜀. Sử dụng định lý Lebesgue ta có được 𝐸 𝐹(𝜉, 𝜂) ≤ lim
<small>→</small> 𝑆 + 𝜀. Giờ ta chỉ cần xét 𝑆 ≤ 𝐸 𝐹(𝜉, 𝜂), 𝜀 > 0 tùy ý.
</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37"><small>36 </small>
Dưới đây ta sẽ dùng khẳng định: tồn tại một điều khiển tối ưu cho một đối tượng 𝜇(./. ) <sub>,…,</sub> với giá điều khiển 𝐹(𝒙, 𝒖) <sub>,…,</sub> đo được phụ thuộc vào 𝑥 , … , 𝑢 . Điều này dựa vào bổ đề sau.
Bổ đề 1.9. Cho S là một không gian đầy tách được, hàm 𝐹(𝒙, 𝒖) bị chặn và nửa liên tục dưới đồng thời với các biến 𝒙, 𝒖 và 𝑠 là một họ các đối tượng 𝜇(./𝑢) sao cho với mọi 𝑛 và 𝑓 ∈ 𝐶
𝑓(𝑥)𝑃 (𝑑𝑥|𝑥 , … . , 𝑥 , 𝑢 , . . , 𝑢 )
là liên tục đối với 𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 , 𝑠. Khi đó tồn tại một điều khiển tối ưu không ngẫu nhiên cho đối tượng 𝜇(./. ) với giá 𝐹(./. ) xác định bởi một dãy các hàm Borel 𝜑 (𝑥 , … , 𝑥 , 𝑠).
Chứng minh.
Xét tập 𝔐 tất cả các độ đo trong 𝑋 × 𝑈 , tương ứng với mỗi dãy điều khiển được cùng đối tượng 𝜇(./. ) , 𝑠 ∈ 𝑆 và một điều khiển tùy ý. Theo nhận xét 1.2, tập này là compact yếu. Nó có thể được metric hóa bằng cách: sự hội tụ yếu của độ đo tương ứng với sự hội tụ trong metric. Trong trường hợp này 𝔐 là compact.
Ký hiệu 𝔐 là tập con của 𝔐 bao gồm các độ đo tương ứng với dãy điều khiển được cùng đối tượng 𝜇(./. ) . Trong quá trình chứng minh định lý
</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">ở đây 𝐸 là kỳ vọng cho dãy với phân phối 𝜃. Hàm 𝔍(𝑠, 𝜃) là nửa liên tục dưới. Điều này dựa vào 𝔐<small>( )</small> là đóng và tính nửa liên tục dưới của hàm 𝐸 𝐹(𝜉, 𝜂) . Rõ ràng
<small>∈𝔐</small>𝔍(𝑠, 𝜃) = 𝑐(𝑠)
trong đó 𝑐(𝑠) là giá điều khiển tối ưu cho đối tượng 𝜇(./. ) và giá điều khiển 𝐹(. , . ) . Theo bổ đề 1.4, tồn tại một hàm Borel 𝜃 sao cho trong đó 𝑃 là phân phối xác suất tương ứng với độ đo 𝜃, khi đó các hàm 𝑞 (𝑑𝑢 /𝜉 , … , 𝜉 , 𝜂 , … , 𝜂 ) là các hàm Borel đối với 𝑠. Sử dụng điều trên, ta có thể xây dựng một điều khiển không ngẫu nhiên sao cho nó là một hàm Borel trong 𝑠.
Định lý 1.6. Cho một đối tượng thỏa mãn các điều kiện của định lý 1.3, hàm giá điều khiển 𝐹(𝒙, 𝒖) bị chặn và nửa liên tục dưới. Khi đó
</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39"><small>38 </small>
I. Các hàm 𝜙 (𝑥 , … , 𝑥 , 𝑢 , … , 𝑢 ) ≥ 𝐹(𝒙, 𝒖) thỏa mãn các điều kiện sau: 1. Bị chặn và nửa liên tục dưới.
2. Với mọi 𝑛 > 0, đẳng thức 1.24 được thỏa mãn. Khi đó điều khiển khơng ngẫu nhiên 𝑣̅: {𝑢 = 𝜑 (𝑥 , … , 𝑥 ), 𝑘 = 0, … } là tối ưu và đại lượng 𝐶 là một tập Borel trên 𝑋 × 𝑈 , 𝜒 là hàm chỉ tiêu của tập này.
Cho 𝑥̅<sup>( )</sup> → 𝑥̅<sup>( )</sup>, 𝑢<sup>( )</sup> → 𝑢<sup>( )</sup>, 𝑖 = 0, 1, … , 𝑛. Hơn nữa, chọn một dãy các điều khiển 𝑣 sao cho với mọi m
</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40"><small>39 </small>
𝜙 𝑥̅<sup>( )</sup>, … , 𝑥̅<sup>( )</sup>, 𝑢<sup>( )</sup>, … , 𝑢<sup>( )</sup> = lim
<small>→</small> 𝐸 <sup>̅</sup><sup>( )</sup><sup>,…, ̅</sup><sup>( )</sup><sup>,</sup> <sup>( )</sup><sup>,…,</sup> <sup>( )</sup>𝐹(𝜉, 𝜂) <sub>̅</sub><small>( ),…, ̅</small><sup>( )</sup><small>,</small> <sup>( )</sup><small>,…,</small> <sup>( )</sup> (1.25) Theo định lý 1.3, với bất kỳ 𝜀 > 0 ta có thể tìm được các tập compact 𝐾 ⊂ 𝑋 sao cho với 𝑥<sup>( )</sup> ∈ 𝐾 , 𝑖 = 0, 1, … , 𝑛
</div>