Tải bản đầy đủ (.pdf) (68 trang)

Nghiên cứu và xây dựng một số thuật toán quy hoạch thực nghiệm tối ưu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (631.88 KB, 68 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

ĐẠI HỌC QUỐC GIA HÀ NỘI
<b>ĐẠI HỌC KHOA HỌC TỰ NHIÊN </b>


<b>Nguyễn Quang Đạt </b>


<b>NGHIÊN CỨU VÀ XÂY DỰNG MỘT SỐ THUẬT TOÁN </b>
<b>QUY HOẠCH THỰC NGHIỆM TỐI ƯU </b>


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

ĐẠI HỌC QUỐC GIA HÀ NỘI



<b>ĐẠI HỌC KHOA HỌC TỰ NHIÊN </b>



<b>NGUYỄN QUANG ĐẠT </b>


<b>NGHIÊN CỨU VÀ XÂY DỰNG MỘT SỐ THUẬT TOÁN </b>
<b>QUY HOẠCH THỰC NGHIỆM TỐI ƯU </b>


<i><b>Chuyên ngành </b></i><b>: Cơ sở toán cho tin học </b>


<i><b>Mã số </b></i> <b>: 60460110 </b>


<b>LUẬN VĂN THẠC SĨ TOÁN HỌC </b>


</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>

<b>TÀI LIỆU THAM KHẢO</b>



<b>I.</b>

<b>Tiếng Anh </b>



1.1. Dette, H. and Haines, L. (1994). “E-optimal designs for linear and
nonlinear models with two parameters”, “<i>Biometrika</i>”


1.2. Dette, H. and Studden, W. J. (1993). “Geometry of E-optimality”, “<i>Ann. </i>


<i>Statist</i>”,


1.3. Elfving, G. (1952), “Optimum allocation in linear regression theory”.
“<i>Ann. Math. Statist</i>”.


1.4. Holger Dett, Viatcheslav B. Melas, Andrey Pepelyshev (2004), “<i>Optimal </i>
<i>Designs for a class of nonlinear regression models</i>”, St. Petersburg State
University, Russia.


1.5. Imhof, L. A. and Studden, W. J. (2001). “E-optimal designs for rational
models”. “<i>Ann.Statist.</i>”


1.6. Viatcheslav B. Melas (2006), “<i>Functional Approach to Optimal </i>
<i>Experimental Design</i>”, Springer Science+Business Media, Inc., USA.


<b>II.</b>

<b>Tiếng Nga </b>



2.1. Ф е д о р о в В. В. (1971), “<i>Теория оптимального эксперимента </i>
<i>(планирование регрессионных экспериментов)</i>”,изд-ва «Наука»,
Москва.


<b>III.</b>

<b>Tiếng Việt</b>



3.1. Lưu Lan Hương (1985), “<i>Ứng dụng phép quy hoạch trong bố trí thí </i>
<i>nghiệm</i>”, luận án tốt nghiệp đại học, ĐH Tổng hợp, Hà Nội.


</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

Mục lục


Mở đầu
Mở đầu



Mở đầu 2


Chương 1:
Chương 1:


Chương 1: Quy hoạch thực nghiệm tối ưu 4


1.1 Tổng quan . . . 4


1.2 Các yêu cầu chung về sự đánh giá . . . 7


1.3 Mơ hình tuyến tính . . . 9


1.3.1 Ví dụ về mơ hình tuyến tính: . . . 16


1.4 Tiêu chuẩn tối ưu . . . 18


1.4.1 Chuẩn D: . . . 18


1.4.2 Chuẩn G: . . . 18


1.4.3 Chuẩn MV: . . . 19


1.4.4 Chuẩn c: . . . 19


1.4.5 Chuẩn E: . . . 20


Chương 2:Chương 2:Chương 2: Lớp mô hình hồi quy phi tuyến. 21
2.1 Thuật tốn tối ưu cho lớp hàm hồi quy phi tuyến . . . 21



2.2 Lớp mơ hình hồi quy phi tuyến dạng phân thức . . . 25


2.2.1 Đánh giá các kết quả đo đạc . . . 25


2.2.2 Phân tích tiệm cận theo mơ hình tối ưu chuẩn E và
chuẩn c . . . 30


2.2.3 Mơ hình hồi quy phi tuyến dạng phân thức hữu tỷ . 35
2.3 Một số mơ hình hồi quy phi tuyến dạng phân thức . . . 41


2.3.1 Mơ hình 1: . . . 41


2.3.2 Mơ hình 2: . . . 48


2.4 Lưu đồ mơ hình thuật toán: . . . 50


Chương 3:Chương 3:Chương 3: Bài toán thực tế 51
3.1 Bài toán 1 . . . 51


3.1.1 Thí nghiệm ban đầu . . . 52


3.1.2 Mơ hình hóa bài tốn . . . 53


3.1.3 Giải bài tốn . . . 54


3.1.4 Tổ chức thêm thí nghiệm lần thứ 2: . . . 56


3.1.5 Mơ hình hóa và giải lần thứ 2 . . . 56



3.2 Bài toán 2 . . . 58


3.2.1 Thí nghiệm ban đầu . . . 59


3.2.2 Mơ hình hóa bài tốn . . . 60


3.2.3 Giải bài toán . . . 61


3.2.4 Tổ chức thêm thí nghiệm lần thứ 2: . . . 63


</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

MỞ ĐẦU


Trước đây, các nhà khoa học, trong khi nghiên cứu, thường làm rất nhiều
thí nghiệm. Họ tiếp tục đùng thống kê để phân tích các kết quả thu được.
Tới thời điểm hiện tại, khoa học kỹ thuật đã phát triển rất mạnh. Những
thí nghiệm cho các chuyên ngành đã trở nên cực kỳ lớn và phức tạp. Sự
phát triển ngày một đi lên của khoa học - công nghệ đã gây ra một sự
gia tăng rất cao của chi phí cho các thí nghiệm. Chúng ta lấy đơn cử một
ví dụ như việc phát triển của vật lý nguyên tử hiện nay đòi hỏi phải xây
dựng một loạt các máy gia tốc không lồ, trị giá nhiều tỷ đô-la.


Các nhà khoa học và các nhà nghiên cứu buộc phải xoay theo một hướng
khác trong khoa học thông kê. Quy hoạch thực nghiệm tối ưu ra đời nhằm
đáp ứng yêu cầu của họ. Quy hoạch thực nghiệm tối ưu đã tối ưu hóa việc
lập kế hoạch tiến hành các thí nghiệm, từ đó có thể thu được nhiều kết
quả có giá trị nhất với một số ít nhất các thí nghiệm..


Đối với vấn đề tối ưu hóa thí nghiệm, hiện nay, trong quy hoạch thực
nghiệm tối ưu có hai xu hướng chính: một là lập kế hoạch tốt nhất cho
các thí nghiệm để tối ưu hóa các kết quả đầu ra, và hai là xây dựng kế


hoạch thực nghiệm tối ưu cho các thí nghiệm xác định mơ hình nghiên cứu.
Trong xu hướng thứ nhất, việc chúng ta cần làm là tính tốn các điều
kiện thí nghiệm, sao cho chúng ta có thể tìm được điều kiện tốt nhất để
khi làm thí nghiệm thì ta thu được kết quả tốí ưu nhất, tức là một kết quả
thu được nào đó của thí nghiệm nhận được phải là tối ưu nhất có thể. Ta
lấy một ví dụ đơn giản trong trường hợp này. Trong ngành hóa học - công
nghệ hiện đại, chúng ta đặt ra yêu cầu là phải nhận được sản phẩm ở mức
lớn nhất. Một phép tính tốn và quy hoạch ở đây là phải tìm ra nhiệt độ
thích hợp, áp xuất thích hợp, tỷ lệ phần trăm các thành phần nguyên liệu,
v.v...


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

có thể thấy rằng ta cần phải xây dựng mơ hình như sau: cần phải tìm ra
một phương trình xác định các mối quan hệ giữa các đại lượng ban đầu
(các chất phản ứng, các yếu tố nhiệt độ, áp suất, thời gian, v.v...) với các
đại lượng của kết quả (ở đây là khối lượng sản phẩm thu được). Và cuối
cùng, chúng ta phải đưa ra được một mơ hình tốn học của thí nghiệm này.
Trong luận văn thạc sỹ này, bài tốn được đặt ra là: chúng ta đã có
trước kết quả của một số thí nghiệm. Nhưng những kết quả của các thí
nghiệm cho trước đó là khơng đủ để tính tốn ra (chứng thực) lý thuyết
mới mà chúng ta cần. Chúng ta phải làm thêm một số thí nghiệm nữa bên
cạnh các thí nghiệm trước. Yêu cầu của bài toán ở đây là hãy xác định kế
hoạch cho việc thực hiện thí nghiệm mới một cách tốt nhất.


Mục tiêu của học viên là nghiên cứu về lý thuyết của quy hoạch thực
nghiệm tối ưu, cùng với đó là áp dụng các lý thuyết vào trong bài toán
thực tế:


1. Tổng quan và thực trạng hiện nay của quy hoạch thực nghiệm tối ưu.
2. Nghiên cứu, chứng minh lý thuyết. Đưa ra cách xây dựng thuật toán.
3. Áp dụng vào bài toán thực tế.



Luận văn bao gồm các mục:


Chương 1: Tổng quan về quy hoạch thực nghiệm tối ưu.
1.1. Lớp mơ hình đơn giản: lớp tuyến tính.


Chương 2: Lớp mơ hình quy hoạch thực nghiệm tối ưu phi tuyến:
2.1. Lớp mơ hình hồi quy phi tuyến dạng phân thức.
2.2. Một số các mơ hình lý thuyết.


Chương 3: Nghiên cứu trên mơ hình thực tế:
3.1. Bài tốn 1.


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

1


CHƯƠNG I:CHƯƠNG I:CHƯƠNG I: QUY HOẠCH THỰC NGHIỆM TỐI ƯU


1.1 Tổng quan


Bây giờ, chúng ta sẽ xem xét các mơ hình tốn học của các vấn đề, thiết
kế các thơng số toán học cho các hiện tượng và làm sáng tỏ chúng. Chúng
ta đầu tiên sẽ đưa ra các cách để tốn học hóa các số liệu trên.


Thơng thường, các kết quả thu được trong thí nghiệm thường được phụ
thuộc vào một hoặc vài yếu tố, mà ở đây, ta gọi chúng là "biến kiểm soát",
hay các "biến đầu vào" (ta sau đây sẽ hầu như chỉ sử dụng tên "biến đầu
vào" trong các mơ hình). Các biến này thay đổi tùy theo các thí nghiệm
của chúng ta. Ví dụ bên trên cho thấy ta có thể thay đổi nhiệt độ, áp suất,
thời gian, phần trăm hóa chất ban đầu, v.v... Mỗi một yếu tố này, ta đại
diện chúng bằng một biến số, ta sẽ được một vector như sau:



x=







x1
x2
...
xk







Ở đây, mỗi biến x1, ..., xk là một biến tương ứng với một yêu tố đầu vào


(nhiệt độ, áp suất, v.v...).


Một khơng gian k chiều ở đây, trong đó có xác định vector x, ta có thể
gọi là một khơng gian các yếu tố ban đầu. Tập hợp các điểm trong khơng
gian này, nơi mà các phép đo có thể được thực hiện (có thể làm thí nghiệm
tại các điểm này) được gọi là "miền kiểm tra", hay là "miền giá trị đầu
vào". Trong tài liệu này, chúng ta gọi miền này là XXX. Việc xác định các
giới hạn trong XXX là một vấn đề quan trọng trong kế hoạch tối ưu hóa của
chúng ta. Một số trường hợp, các giá trị giới hạn này phụ thuộc vào tính
chất của các biến đầu vào. Với ví dụ hóa học trên, ta có thể thấy áp suất


khơng thể là số âm, hay thành phần phần trăm các nguyên liệu ban đầu
luôn nằm trong khoảng 0% tới 100%. Trong một số các trường hợp nhỏ
hơn nữa - thường xảy ra hơn - đó là chúng ta còn cần xem xét các giá trị
của biến đầu vào cịn có các giới hạn khác nữa, ví dụ như nhiệt độ phụ
thuộc vào nguồn nhiệt thí nghiệm cung cấp, nên không thể cao hơn một
giá trị nào đó, v.v... Chúng ta thậm chí cịn có thể phải đưa ra các giới
hạn nhiều hơn nữa.


</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

thực hiện được việc tối ưu hóa thí nghiệm như ta cần. Ta sẽ giả sử rằng,
mối quan hệ này được xác định bởi một hàm số như sau:


E(y/x) =η(x)


trong đó, E(y/x) là giá trị mà ta thu được sau khi hồn thành thí nghiệm.
Vì giá trị thu được phụ thuộc vào các biến đầu vào nên ta để x ở đây, đại
diện cho việc y của x nào. Còn hàm sốη(x) là một hàm phụ thuộc vào các
tham số chưa biết θ1, θ1, ..., θm. Và trong trường hợp tổng quát, ta cũng


không biết được dạng của hàm số η(x) này, và sự phụ thuộc của các tham
số θ1, θ1, ..., θm trong hàm này.


Trong các trường hợp để tìm hiểu các mơ hình tốn học tối ưu mà ta
cần, chúng ta cần thếm một số các thông tin khác nữa. Và ở đây, ta có thể
chia bài tốn tìm mơ hình tối ưu này ra thành ba cấp độ cơ bản theo độ
khó của chúng:


Cấp độ 1:Cấp độ 1:Cấp độ 1: hàm số η(x) = η(x, θ) là một hàm số đã được biết trước.
Chúng ta cần xác định các tham số chưa biết θ:


θ =








θ1
θ2
...
θm







Cấp độ 2:Cấp độ 2:Cấp độ 2: hàm số η(x) là hàm có dạng sau:


η(x) =











η1(x, θ1)


η2(x, θ2)


...
ηv(x, θv)


kích thước của các vector θ1, ..., θv thậm chí có thể khác nhau. Và chúng ta


cần phải xử lý các dữ liệu để xác định các hàmη1(x, θ1), η2(x, θ2), . . . ηv(x, θv).


Sau đó tìm các tham số θ1, θ1, ..., θv chưa biết.


</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>

Việc thiết kế các mơ hình toán học cho trường hợp thứ nhất đã được
giải quyết trên cơ bản vào tầm năm 1955 - 1960. Hiện nay, chúng ta chỉ
còn xem xét và giải quyết các trường hợp đặc biệt gặp phải mà thôi.


Với cấp độ thứ hai, các phương pháp giải quyết đã được đưa ra bắt đầu
từ những năm 1970, cho tới nay vẫn cịn có một số vấn đề cần tiếp tục giải
quyết. Nó cần tới các nhà khoa học chuyên ngành, để họ đưa ra các thông
số dữ liệu và từng các mơ hình nhỏ bên trong một mơ hình lớn hơn. Bài
toán này đưa ra yêu cầu về việc thiết lập các hàm nhỏ bên trong một cách
tối ưu nhất. Điều này gần giống như việc chúng ta phải làm việc với n bài
toán cấp độ một.


</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

1.2 Các yêu cầu chung về sự đánh giá


Bây giờ, chúng ta sẽ nêu ra các yêu cầu của việc toán học hóa này.


Kết quả thu được của các phép đo là khơng giống nhau trong các lần
đo. Chúng có những sự sai biệt nhỏ nào đó, dù được đo tại cùng một địa
điểm và trong các điều kiện như nhau. Ở đây, kết quả thu được như sau:



E(y/x) =η(x, θ) (1.1)
trong đó, y là kết quả của các phép đo thực tế tại điểm x, còn η(x, θ) là
một hàm số mà dạng của nó đã được biết trước. Các tham số


θ =







θ1
θ2
...
θm







là những tham số chưa biết.


Cịn E thì tương ứng với giá trị trung bình.


Giả sử bây giờ ta phân tích các dữ liệu chưa biết của θ, hay là các
giá trị cần biết của η(x, θ) trong một miền xác định XXX0 nào đó. Từ các
kết quả thu được - trong một số các trường hợp có thể là sử dụng một
phương pháp đơn giản là lấy trung bình yist để tránh bị làm trở ngại



trong các phép tính. Nói chung là ta sẽ khơng sử dụng ngay các giá trị
thực sự đo được ở đây cho việc tính tốn này (tức là khơng dùng ngayθist).


Ở đây, như đã nói ở trên, ta sẽ dùng một số tạm gọi là lý tưởng θ, là 1˜
con số khá gần với các giá trị đo được θist. Tức là nó cũng vẫn phụ thuộc


vào những kết quả ta đo đươc, chứ khơng phải là lấy ngẫu nhiên hồn
tồn.


˜


θ = Ψ(y1/x1, ..., yn/xn)


với yi là giá trị thực tế đo được tại điểm xi. Khi đó giá trị θ˜được gọi là


đánh giá tại xi (đánh giá tại điểm).


Các thực nghiệm nhằm tìm ra các thơng số (các giá trị) chưa biết này
ta sẽ gọi chúng là hồi quy. Việc tính tốn và xác định này được gọi là phân
tích hồi quy.


</div>
<span class='text_page_counter'>(11)</span><div class='page_container' data-page=11>

Bắt đầu từ đây, chúng ta sẽ sử dụng khái niệm "Khơng lệch", "Chính
xác" và "Hiệu quả".


Khơng lệchKhơng lệchKhông lệch: đánh giá θ˜được gọi là "không lệch" khi:
E[˜θ] = θist


Chính xácChính xácChính xác: đánh giá θ˜ được gọi là chính xác nếu như giới hạn của nó
khi N tiến tới rất trùng (hoặc rất gần) với giá trị chính xác (hội tụ tới giá


trị chính xác).


lim


N→∞P[(˜θN −θist)


T<sub>(˜</sub><sub>θ</sub>


N −θist) ≥ε] = 0


trong đó N có nghĩa là số mà sau chừng đó phép đo, ta thu được θ. Cịn˜
ε là số dương bất kỳ. Giá trị P[A ≥ ε] là xác xuất mà A≥ ε.


Hiệu quảHiệu quảHiệu quả: đánh giá θ˜không lệch bên trên được gọi là hiệu quả khi mà
bất đẳng thức sau xảy ra:


D(˜θ) ≤D


<sub>≈</sub>


θ




trong đó D(˜θ) là ma trận hiệp biến của đánh giá θ, còn˜ D(θ˜˜) là ma trận
hiệp biến tại bất kỳ đánh giá θ˜˜khác.


Đối với mỗi hàm số η(x, θ) và mỗi giá trị kết quả đo đạc được p(y/x),
ta sẽ có "giá trị tốt nhất" θ.˜



Sự phụ thuộc vào hàm số η(x, θ) vàp(y/x) là không phù hợp trong thực
tế (không tiện lợi). Thậm chí là bất tiện trong từng tình huống đo đạc dữ
liệu tại một điểm. Do vậy sẽ là vẫn có thể chấp nhận được khi ta sử dụng
một con số chưa chắc chính xác (tạm hy sinh tính chính xác của số liệu)
để có thể xây dựng thuật tốn tối ưu mà ta cần. Sau này khi có thuật tốn
cơ bản, ta có thể quay lại với các số liệu thực tế.


Sau đây sẽ là phần phân tích thuật tốn và lập hàm số, mà trong đó
chúng ta chỉ dựa vào những số khơng có trong thực tế, hay nói cách khác
là chúng ta tạm thời chưa dùng tới các giá trị η(x, θ) và p(y/x).


</div>
<span class='text_page_counter'>(12)</span><div class='page_container' data-page=12>

1.3 Mơ hình tuyến tính


Giả sử rằng η(x, θ) là hàm số tuyến tính đối với các biến số. Khi đó:
E(y/x) = η(x, θ) =θTf(x) (1.2)
trong đó:


f(x) =






f1(x)
...
fm(x)







là một hàm số đã biết.


Chúng ta cũng giả định rằng các điểm x1, x2, ..., xn được đo độc lập với


nhau, cho ra các giá trị kết quả là y1, ..., yn với bình phương phương sai là


σ<sub>1</sub>2, ..., σ<sub>n</sub>2.


Như vậy ta có thể thấy rằng các giá trị thực nghiệm có thể được biểu
diễn như sau:


˜


θ = T y (1.3)


trong đó, y là vertor cột chứa các giá trị yi đo đạc được.


y =






y1
...
yn







Cịn T là một ma trận m×n nào đó.


Bây giờ ta cần tìm giá trị (ước đốn) tốt nhất θˆcó thể, tức là gần nhất
với giá trị chính xác θist, được gọi là "chính xác nhất", "hợp lý nhất", với


phương sai là nhỏ nhất trong tập các giá trị ược lượng unbiasedness mà
chúng ta có thể tính ra. Giá trị θˆđó được gọi là ước lượng tuyến tính tốt
nhất (vì các hàm chúng ta đang xét là các hàm tuyến tính).


Nhưng trước khi làm các tính tốn, chúng ta hãy quay lại một chút với
các định lý đã biết của lý thuyết xác xuất.


Định lý 1.3.1Định lý 1.3.1Định lý 1.3.1: Một giá trị của uuu được gọi là giá trị kết hợp của vvv nếu:
u


uu =LLLvvv (1.4)


Khi đó:


(1) Giá trị trung bình của E(uuu) và E(vvv) cũng có thể như thế:


</div>
<span class='text_page_counter'>(13)</span><div class='page_container' data-page=13>

D


DD(uuu) =E[uuu−E(uuu)]×[uuu−E(uuu)]T


DDD(vvv) = E[vvv −E(vvv)]×[vvv −E(vvv)]T
được liên hệ với nhau bởi hệ thức:



D


DD(uuu) =LLLDDD(vvv)LLLT (1.6)
Chứng minh của định lý trên khá dễ dàng, ta có thể tự làm một cách
nhanh chóng.


Định lý 1.3.2:Định lý 1.3.2:Định lý 1.3.2: giá trị tối ưu của thực nghiệm tối ưu tuyến tính (theo
cơng thức (1.2)) đối với biến số θ được tính là:


ˆ


θθθ =MMM−1YYY (1.7)
trong đó ma trận MMM bằng:


M
MM=


n
X


i=1


ωif(xi)fT(xi) (1.8)


Cịn giá trị của YYY được tính bởi cơng thức:
Y


Y
Y =



n
X


i=1


ωiyif(xi) (1.9)


và ω là nghịch đảo của bình phương phương sai
ωi = σ<sub>i</sub>−2


Khi đó, ma trận hiệp biến tại θˆsẽ bằng:
D


DD(ˆθ) =MMM−1 (1.10)
Trong quá trình chứng minh ta nhận được:


E(ˆθ) =MMM−1MMMθist = θist


θist được gọi là ít bị xê dịchít bị xê dịchít bị xê dịch


Ma trận:


M
MM =


n
P
i=1



ωif(xi)fT(xi) =
n
P
i=1


</div>
<span class='text_page_counter'>(14)</span><div class='page_container' data-page=14>

được gọi là ma trận Fisher.


Với việc xây dựng cơng thức tính tối ưu hóa giá trị thực nghiệm bên
trên, ma trận thu được rất thường hay gặp được ở trong lý thuyết thực
nghiệm và cả trong thực nghiệm thực tế. Ta có thể đánh dấu nó thành
dạng "quan trọng" trong các ma trận mà ta sử dụng.


Hệ quả 1.3.3.1:Hệ quả 1.3.3.1:Hệ quả 1.3.3.1: Ma trận thông tin Fisher thỏa mãn tính chất trên là
hồn tồn xác định, và có thể tìm ra được:


Quả thực như vậy, ta có:
MMM =


n
X


i=1


ωif(xi)fT(xi) =F FT


Ta dễ thấy rằng, mỗi ma trận thỏa mãn hệ thức dạng AAT đều là ma
trận tồn tại (xác định).


Khi đánh giá tham số θ, là một giá trị dạng vector, thì nói chung, giá trị
thực nghiệm chính xácθcó thể đặc trưng cho tất cả các phần giá trị của ma


trận hiệp biến DDD(θ). Vì thế cho nên tất cả các giá trị thực nghiệm đối vớiˆ
θ khơng những có thể dùng đối chiếu với các phần tử đường chéo Dαα(ˆθ),


mà chúng ta có thể làm với những nâng cao của nó ở các phương pháp khác.
Ở đây, chúng ta được đưa tới hai phương pháp khác khá phổ biến để
đối chiếu với giá trị thực nghiệm.


1.1.1. Giá trị thực nghiệm θ˜tốt hơn so với giá trị thực nghiệm θ˜˜nếu như:
D


D


D(θ) = D˜˜ DD(θ) +˜ d


ở đây d là một ma trận dương xác định nào đó, hoặc có thể viết ở dạng
bất đẳng thức:


D


DD(θ) > D˜˜ DD(θ)˜


Định nghĩa: "ma trận dương" ở trên là ma trận có tất cả các phần tử
khơng âm, đồng thời trong đó có ít nhất một phần tử dương.


2.


2.2. Giá trị thực nghiệmθ˜tốt hơn so với giá trị thực nghiệm θ˜˜nếu như:
|DDD(θ˜˜)| > |DDD(˜θ)|


</div>
<span class='text_page_counter'>(15)</span><div class='page_container' data-page=15>

Từ đinh lý (1.3.2)đinh lý (1.3.2)đinh lý (1.3.2), ta có thể trực tiếp suy ra rằng, giá trị thực nghiệm


tuyến tính tối ưu tính trên sẽ đúng với từ "tốt nhất", và về cả hai chuẩn E
và c đã cho. Một cách chặt chẽ hơn thì trong thực nghiệm đã chứng minh
rằng nó hồn tồn đúng.


Ở trên ta nói về "hai chuẩn" E và c. Định nghĩa hai chuẩn này ta sẽ
trình bày tại phần 1.41.41.4


Hệ quả 1.3.3.2:Hệ quả 1.3.3.2:Hệ quả 1.3.3.2: Giá trị tuyến tính tối ưu là ma trận hiệp biến nhỏ nhất
có thể giữa những giá trị tuyến tính ít lệch chuẩn θ. Hay là:˜


D


DD(ˆθ) <sub>6</sub> DDD(˜θ)


Nói cách khác, giá trị tuyến tính tối ưu là hiệu quả nhất trong các lớp giá
trị tuyến tính ít lệch chuẩn.


Hệ quả 1.3.3.3:Hệ quả 1.3.3.3:Hệ quả 1.3.3.3: Định thức của ma trận hiệp biến của giá trị tuyến tính
tối ưu (1.7) là nhỏ nhất trong mọi giá trị tuyến tính ít lệch chuẩn.


|DDD(ˆθ)| < |DDD(˜θ)| (1.11)
Kết quả (1.11) được suy ra trực tiếp từ công thức (??). Điều này cũng chỉ
ra thêm hai hệ quả có ích nữa từ định lý (1.3.2)định lý (1.3.2)định lý (1.3.2)


Hệ quả 1.3.3.4:Hệ quả 1.3.3.4:Hệ quả 1.3.3.4: với một tổ hợp tuyến tính tùy ý ttt = CCCθ, ta gọiˆttt = CCCθˆ
là giá trị tuyến tính tối ưu nhất. Khi đó, ma trận giá trị thực nghiệm hiệp
biếnˆttt tương đương với DDD(ˆttt) =CCDCDD(ˆttt)CCCT.


Nếu như ta vẫn gọi˜ttt là một giá trị tuyến tính ít lệch chuẩn bất kỳ đối
với tham sốttt, cịnˆtttlà giá trị tuyến tính tối ưu (cũng đối với tham sốttt) thì:



111... DDDαα(ˆθ) 6DDDαα(˜θ)


222... DDD(ˆθ) <sub>6</sub>DDD(˜θ)
333... |DDD(ˆθ)| < |DDD(˜θ)|


</div>
<span class='text_page_counter'>(16)</span><div class='page_container' data-page=16>

Trong một số trường hợp, các giá trị của ˆttt có thể tính được, trong khi
mà ma trận thông tinˆttt =CCCθˆlà đặc biệt, không tầm thường và khơng thể
tính được.


Tồn tại một số phương pháp để có thể tính được các giá trị này và các
ma trận hiệp biến. Trong rất nhiều những bài toán thực tế, giá trị lớn nhất
thích hợp là sự mở rộng của công thức bên trên.


Cho MMM là một ma trận dương đã xác định nào đó. Khi đó:e
ettt= lim


α→0CCC[MMM+αMMMe]


−1


YYY (1.12a)


D


DD(ˆttt) = lim


α→0CCC[MMM+α
e



M


MM]−1CCCT (1.12b)
Hồn tồn có thể kiểm tra lại rằng, giới hạn tương ứng không phụ thuộc
vào sự lựa chọn MMM.e


Hệ quả 1.3.3.5:Hệ quả 1.3.3.5:Hệ quả 1.3.3.5: giá trị tuyến tính tối ưu, giá trị là đáp án cho η(x, θ) đối
với những điểm khảo sát (đo đạc) tùy ý x, sẽ được tính bằng cơng thức:


ˆ


η(x, θ) = θfT(x)


Sự phân tán (phương sai) của ηˆ(x, θ) thì sẽ được tính bằng công thức:
d(x) =fT(x)DDD(ˆθ)f(x)


Hệ quả (1.3.3.5)Hệ quả (1.3.3.5)Hệ quả (1.3.3.5), theo thực chất, nó là phần đặc biệt của hệ quả (1.3.3.4)hệ quả (1.3.3.4)hệ quả (1.3.3.4)
với CCC = fT(x).


Từ đây trở về sau, chúng ta gọi hàm số d12(x) này là cácCorridor errors.


Thực sự dễ dàng để có thể thấy, thực nghiệm thực tế tại bất kỳ điểm xi


nào cũng dẫn tới một vài các kết quả không phụ thuộc nhau yi1, yi2, ..., yi<sub>ri</sub>


với phương sai (thực ra chúng ta dùng bình phương phương sai) σ<sub>i</sub>−2.
Thực ra thì với những giá trị đo đạc thực tế, những giá trị dùng cho
việc xây dựng giá trị tuyến tính tối ưu, chúng ta khơng cần thiết phải giữ
lại tồn bộ các giá trị thực nghiệm thu được yi<sub>ri</sub> (với i=1..n). Chúng ta



chỉ cần có giá trị trung bình:


yi = <sub>r</sub>1


i


ri


P
r=1


yir


</div>
<span class='text_page_counter'>(17)</span><div class='page_container' data-page=17>

Hệ quả 1.3.3.6:Hệ quả 1.3.3.6:Hệ quả 1.3.3.6: nếu như tại một điểm xi (với i=1,...,n) chúng ta đo đạc


được các giá trị yi1, yi2, ..., yi<sub>ri</sub> thì khi đó cơng thức tính giá trị tối ưu dành


cho θ là:


ˆ


θ =MMM−1YYY
trong đó ma trận MMM là khơng đặc biệt và bằng:


M
MM=


n
X



i=1


ωif(xi)fT(xi) (1.13)


Cịn giá trị của YYY được tính bởi cơng thức:
Y
Y
Y =
n
P
i=1


ωiyif(xi)


và cơng thức của ωi được tính theo:


ωi = riσi−2 =
ri


σ<sub>i</sub>−2


Quả thực, công thức (1.8) và (1.9) ở trong trường hợp này có thể viết theo
cơng thức:


M
MM=


n
P
i=1


ri
P
r=1


σ<sub>i</sub>−2f(xi)fT(xi)


và khi đó thì ta có thể viết lại nó thành:
M


MM=


n
P
i=1


riσi−2f(xi)fT(xi) =
n
P
i=1


ωif(xi)fT(xi)


Tương tự, YYY cũng có như vậy:
Y


YY =


n
P
i=1


ri
P
r=1


σ<sub>i</sub>−2yirf(xi) =


n
P
i=1


riσi−2
ri


P
r=1


r<sub>i</sub>−1yirf(xi) =


n
P
i=1


ωiyif(xi)


So sánh biểu thức trên với biểu thức (1.13) ta sẽ thu được điều cần chứng
minh.


</div>
<span class='text_page_counter'>(18)</span><div class='page_container' data-page=18>

Định lý 1.3.3.4:Định lý 1.3.3.4:Định lý 1.3.3.4: Giá trị tuyến tính tối ưu θˆlà giá trị nhỏ nhất của trọng
số của phương sai.



S


SS(θ) =


n
X


i=1
ωi




yi −fT(xi)θ
2


</div>
<span class='text_page_counter'>(19)</span><div class='page_container' data-page=19>

1.3.1 Ví dụ về mơ hình tuyến tính:


Đầu tiên, ta sẽ xem xét mơ hình tuyến tính đơn giản như sau:
E(y/x) =θ1 +θ2x


và khi tiến hành đo đạc thì kết quả đo lường ở các điểm x1 = −1, x2 = 0
và x3 = +1 có phương sai bằng σ12 = 8, σ22 = 86 và σ


2
3 = 8.
Chúng ta xem xét và đánh giá đối với hai tham số θ1 và θ2.
Khi đó, theo các định lý và bổ đề bên trên thì ta sẽ có:


f(x) =





1
x




và ωi =


1


σ<sub>i</sub>2 (với i = 1,2,3)
Và ta sẽ tính được ma trận hiệp biến như sau:


D(ˆθ) =


" <sub>3</sub>
X


i=1


ωifi(xi)f<sub>i</sub>T(xi)
#−1


=


" <sub>3</sub>
X


i=1



1
σ2<sub>i</sub>




1
xi




(1 xi)
#−1


=


"


1
8




1 −1


−1 1



+ 6
8



1 0
0 0

+ 1
8

1 1
1 1


#−1


=




1 0
0 1<sub>4</sub>


−1
=

1 0
0 4


Như vậy, ta có thể chọn được mơ hình tối ưu θ.ˆ


Chúng ta cũng có thể đánh giá hai giá trị θ1 và θ2 để nhận được θ˜tại
điểm cực tiểu của dạng tồn phương theo cơng thức sau:



S(θ) =


3
X


i=1


yi −(θ1 +θ2x)
2


Chúng ta cũng sẽ tính được ước lượng θ˜củaθ1 và θ2 dựa theo công thức
sau:


˜


</div>
<span class='text_page_counter'>(20)</span><div class='page_container' data-page=20>

với giá trị của TTT được lấy:
T =
<sub>1</sub>
3
1
3
1
3
−1<sub>2</sub> 0 1<sub>3</sub>




Dễ thấy ngay rằng, giá trị θ˜ bên trên là một giá trị khơng lệch. Thực


vậy, ta có:


F = (f(x1) f(x2) f(x3))


=




1 1 1
−1 0 1




và khi đó, ta có:


TFT =


<sub>1</sub>
3
1
3
1
3
−1
2 0
1
3

·



1 −1
1 0
1 1


!


=


1 0 0
0 1 0
0 0 1


!


= I3


thỏa mãn điều kiện về tính khơng lệch.


Khi đó, ta có thể tính được ma trận hiệp biến DDD như sau:


D(˜θ) =TD(yyy)TT =
=
<sub>1</sub>
3
1
3
1
3
−1
2 0


1
2

·


8 0 0
0 8<sub>6</sub> 0
0 0 8


!
·


1
3 −
1
2
1
3 0
1
3
1
2


=
<sub>52</sub>
27 0
0 4



Dễ dàng để có thể thấy được, D(˜θ) > D(ˆθ).


Thay các giá trị của θˆvà θ˜vào phương trình ban đầu của ta thì ta nhận
được hai phương trình sau:


d1(x) = 1 + 4x2 ứng với θˆ
d2(x) =


52
27 + 4x


2


ứng với θ˜
Với x bất kỳ, ta đều có:


</div>
<span class='text_page_counter'>(21)</span><div class='page_container' data-page=21>

1.4 Tiêu chuẩn tối ưu


Chúng tơi gọi mơ hình ξ là khơng duy nhất nếu detM(ξ) = 0. Một
mơ hình như vậy tồn tại bởi giả định (e). Bây giờ, chúng ta sẽ chỉ xem xét
các trường hợp mà trong đó có thể ước lượng tồn bộ các thơng số Θ1, ...,


Θm. Ở đây, mơ hình ở dạng không đặc biệt sẽ được chúng ta được xem xét.


Các phiên bản của định lý Gauss-Markov có giá trị đối với chúng.
Thơng thường, khơng có mơ hình ξˆnhư vậy, và các ma trận:


M−1( ˆξ)−M−1(ξ) (1.15)
là không được xác định một cách rõ ràng, trong đó ξ là một mơ hình tùy


ý. Vì vậy, một số hàm số của ma trận thơng tin, những hàm số có ý nghĩa
thống kê tốt, được sử dụng làm các tiêu chuẩn tối ưu.


Bây giờ, chúng ta sẽ xem xét một số những tiêu chuẩn hay được sử dụng.


1.4.1 Chuẩn D:


Chuẩn D được cho trong công thức sau:
detM(ξ) → sup


ξ∈Ξ


(1.16)
(ở đây, các cực trị được lấy từ tất cả các mơ hình gần đúng).


Nếu sai số được phân bố một cách bình thường thì tiêu chí này ứng
với việc yêu cầu giảm thiểu thể tích của "confidence ellipsoid" với một
confidence level xác định tùy ý nào đó đối với ước lượng.


Định nghĩa: Confidence ellipsoid có dạng:


{θ˜; (˜θ−θˆ)TM−1(˜θ−θˆ) <sub>6</sub> c} (1.17)
trong đó c là một hằng số (chỉ phụ thuộc vào confidence level).


1.4.2 Chuẩn G:


Cho d(x, ξ) = fT(x)M−1(ξ)f(x). Khi đó tối ưu chuẩn G được định
nghĩa bởi công thức:


max



x∈XXX d(x, ξ) →inf<sub>ξ</sub>


</div>
<span class='text_page_counter'>(22)</span><div class='page_container' data-page=22>

d(x, ξ) = σ<sub>N</sub>2V(ˆθTf(x))


với d(x, ξ) là bằng (tới độ chính xác khơng đổi nào đó) của phương sai
của một giá trị, được dự đốn bởi mơ hình tại điểm x. Mơ hình tối ưu
chuẩn G có nghĩa là giá trị nhỏ nhất trong những số lớn nhất (minimax),
hay là sự giảm thiểu ở mức tối đa các dự đoán sai.


1.4.3 Chuẩn MV:


Được định nghĩa trong công thức:


trM−1(ξ) → inf


ξ


(1.19)
Chuẩn MV được dùng để giảm thiểu tổng của các phương sai của mức
tối thiểu của ước lượng Θˆ.


1.4.4 Chuẩn c:


Chúng ta định nghĩa một giá trị sau:
Φc(ξ) =




1cTM−(ξ)c if c ∈ M(ξ)



∞ overwise (1.20)


trong đó c là một vector cho trước (đã biết), còn M− là một nghịch đảo
tổng quát của ma trận M, còn ký hiệu c ∈ M có nghĩa là c là một kết hợp
tuyến tính của các hàng của ma trận M.


Định nghĩa: ma trận nghịch đảo dạng tổng quát (hay suy rộng) của một
ma trận A được định nghĩa là một ma trận thỏa mãn cơng thức:


A= AA−AA


và khi đó nếu một hệ phương trình Ax = y có một nghiệm xˆ thì nghiệm
này sẽ có dạng xˆ = A−y.


Một mơ hình mà ở đó nó giảm thiểu giá trị của Φc(ξ) được gọi là mơ


hình chuẩn c.


</div>
<span class='text_page_counter'>(23)</span><div class='page_container' data-page=23>

1.4.5 Chuẩn E:


Chuẩn E được xem xét với cơng thức:
λmin(M(ξ)) →sup


ξ


trong đó λmin(M) là giá trị riêng nhỏ nhất của ma trận M = M(ξ).


Tối ưu theo chuẩn E là sự làm giảm thiểu nhất những giá trị tối đa
(maximum) của các trục của ellipsoid (1.17). Tiêu chí này được giới thiệu


trong sách của Ehrenf eld (năm 1955).


Chú ý rằng bởi vì:


λmin(M) = min
cT<sub>c</sub><sub>=1</sub>c


T<sub>M c</sub>


</div>
<span class='text_page_counter'>(24)</span><div class='page_container' data-page=24>

2


CHƯƠNG II:


CHƯƠNG II:CHƯƠNG II: LỚP MƠ HÌNH HỒI QUY PHI TUYẾN


2.1 Thuật toán tối ưu cho lớp hàm hồi quy phi tuyến


</div>
<span class='text_page_counter'>(25)</span><div class='page_container' data-page=25>

các yếu tố quyết định của ma trận thông tin Fisher cho các tham số trong
mơ hình. Tuy nhiên thì cũng vẫn có ít nhiều sự chú ý tới các mơ hình hồi
quy tuyến tính tối ưu chuẩn E trong lớp các mơ hình hồi quy tuyến tính,
trong đó họ cố gắng nhiều nhất có thể để làm tối thiểu giá trị riêng của
ma trận thông tin Fisher (xem Dette and Haines (1994) hoặc Dette and
Wong (1999) với việc xử lý một số các trường hợp với các mơ hình 2 tham
số). Bởi vì mơ hình tối ưu địa phương là cơ sở cho tất cả các mơ hình khao
học tiên tiến, vì vậy trong bài viết này, chúng ta sẽ nghiên cứu để thiết kế
nên một mơ hình tối ưu địa phương chuẩn E cho một lớp các mơ hình hồi
quy phi tuyến, được viết trong công thức sau:


Y =



s
X


i=1


aihi(t) +
k
X


i=1


as+iψ(t, bi) +ε (2.1)


Ở đây, ψ là một hàm số đã biết, còn các biến t là biến số biến thiên trong
khoảng I ⊂<sub>R</sub>. ε là một sai số ngẫu nhiên với giá trị trung bình bằng 0 và
phương sai khơng đổi, cịn các giá trị a1, ..., as+k, b1, ..., bk ∈ R là các tham


số chưa biết của mơ hình.


Việc xem xét các loại mơ hình gần đây đã được thúc đẩy trong cơng
trình nghiên cứu của Imhof and Studden (2001), họ đã quan tâm tới mơ
hình hữu tỷ trong cơng thức:


Y =


s
X


i=1



aiti−1 +
k
X


i=1
as+i


t−bi


+ε (2.2)


trong đó t ∈ I, bi 6= bj(i 6= j) và biến bi ∈/ I được cho là đã biết với mọi


i = 1, ..., k. Lưu ý rằng trong mơ hình trên là một mơ hình tuyến tính vì 2
tác giả trên (của nghiên cứu trên) giả định rằng các giá trị b đã được biết.
Những mơ hình kiểu này rất phổ biến, được nhiều người biết tới vì chúng
có tính xấp xỉ khá tốt (xem Petrushev and Popov (1987), phần "một số
tính chất lý thuyết" vàDudzinski and Mykytowycz (1961), hoặc Ratkowsky
(1983), trang 120 có cho một số ứng dụng của mơ hình này). Trong luận
văn này, chúng ta làm ngược lại so với Imhof và Studden (năm 2001), ta
coi không coi rằng các tham số b1, ..., bk trong mơ hình (2.1) là các tham


số đã biết, mà ta coi chúng là các tham số chưa biết, mà chúng chỉ có thể
được ước lượng ra từ các dữ liệu đã có trước đó. Hơn nữa, mơ hình (2.1)
mà chúng ta xem xét ở đây bao gồm nhiều hàm hồi quy khác nữa.


</div>
<span class='text_page_counter'>(26)</span><div class='page_container' data-page=26>

toxicokinetic. Chúng ta có thể xem các thí nghiệm trong các tài liệu của
Becka and Urfer (1996) và Becka, Bolt and Urfer (1993). Ở đây, chúng ta
có tương ứng giữa hàm số ϕ(t, x) với hàm số etx ở trong công thức (2.1).
Ngồi ra thì một lớp phổ biến các cơng thức và hàm logarith cũng hay


được sử dụng là hàm ϕ(t, x) = log(t−x).


Trong cơng trình Imhof and Studden (2001) đã nghiên cứu về mơ hình
tối ưu chuẩn E đối với công thức (2.2) khi s = 1. Ở đây, các tác giả đã coi
rằng các tham số phi tuyến b1, ..., bk là các tham số đã được biết trước từ


các thí nghiệm một cách chính xác, chứ khơng phải là các tham số được
ước lượng một cách không chuẩn xác hoàn toàn. Đặc biệt, các tác giả đã
chứng minh rằng, đối với mơ hình tối ưu chuẩn E, sự ước lượng tập con
các tham số a1, ..., al+1 được cho bởi các điểm Chebyshev là tương ứng
với các hàm số 1,<sub>t</sub><sub>−</sub>1<sub>b</sub>


1, ...,


1


t−bk trong mơ hình phân thức (2.2). Những giá


trị ước lượng của những điểm Chebyshev này là những điểm extremal của
hàm 1 +


k
P
i=1


a∗<sub>i</sub>


x−bi = p


∗<sub>(</sub><sub>x</sub><sub>)</sub> <sub>trong khoảng</sub> <sub>I</sub><sub>, có sai số nhỏ nhất, gần tới 0:</sub>



sup


x∈I


|p∗(x)| = min


a2,...,ak+1


sup


x∈I

1 +
k
P
i=1
ai


x−bi




(2.3)
Tính phổ qt của bài tốn này ở chỗ giải pháp này là do thực tế rằng,
bất kỳ tập con nào của các hàm hồi quy trong mơ hình (2.2), thu được
bằng cách bỏ đi một tính chất, đều là một hệ Chebyshev yếu trong khoảng
I. Bạn có thể xem trong tài liệu của Karlin and Studden (1966) hoặc xem
ở phần sau của luận văn này.



Tuy nhiên, ở một trường hợp khác, khi mà các tham số b1, ..., bk là các


tham số chưa biết, mà ta chỉ có thể ước lượng nó từ các dữ liệu thực tế
đã biết, thì khi đó, các vấn đề về việc xây dựng một mơ hình tối ưu địa
phương cho mơ hình (2.2) là tương đương với việc xây dụng một mô hình
tối ưu trong mơ hình hồi quy tuyến tính sau:


Y =


s
X


i=1


βiti−1 +


2k
X


i=1
<sub>β</sub>


s+2i−1
t−bi


+ βs+2i
(t−bi)2





(2.4)


mà các hàm hồi quy tương ứng không thể đáp ứng tất cả các tính chất
của hệ Chebyshev yếu đã được đề cập tới ở trên. Tuy nhiên, chúng ta sẽ
chứng minh trong nội dung tài liệu này trong trường hợp với k ≥ 2, mà
tại đó, giá trị lớn nhất của maxi6=j|bi 6= bj| là đủ nhỏ, và mơ hình tối ưu


</div>
<span class='text_page_counter'>(27)</span><div class='page_container' data-page=27>

ước lượng tuyến tính kết hợp các tham số vẫn được hỗ trợ trên cấc điểm
Chebyshev. Việc này giúp chúng ta đơn giản hóa đáng kể việc xây dựng
các mơ hình tối ưu địa phương chuẩn E. Hơn nữa, chúng ta cũng có thể
thấy được từ tài liệu này rằng, những kết quả thu được khơng phụ thuộc
vào các mơ hình (2.2) và (2.4) nhưng có thể được thiết lập đối với các mơ
hình tổng qt (2.1) (hoặc các mơ hình tuyến tính tương đương với nó).
Ngồi ra, các kết quả này cũng thể hiện được bằng các con số (các dữ liệu
số) rằng, trong nhiều trường hợp, các mơ hình chuẩn E là tối ưu, được
hỗ trợ trên các điểm Chebyshev, cho tất cả các giá trị có thể chấp nhận
được của tham số b1, ..., bk (với bi 6= bj, i 6= j). Cách tiếp cận vấn đề của


tài liệu này dựa trên một nghiên cứu của các giới hạn của ma trân thơng
tin trong mơ hình (2.1) trong trường hợp tất cả các tham số phi tuyến
trong mơ hình này đều hội tụ tới cùng một giới hạn. Chúng ta cũng sẽ
thấy rằng trong các trường hợp này, các mô hình tối ưu địa phương chuẩn
E và nhiều những mơ hình tối ưu địa phương đối với các ước lượng tuyến
tính trong mơ hình (2.1) sẽ có cùng dạng mơ hình giới hạn. Điều này chỉ
ra rằng, các mơ hình tối ưu chuẩn E trong công thức (2.1) sẽ cho ra các
ước tính chính xác các giá trị của các hệ số, và chúng ta sẽ thấy các minh
họa qua một vài ví dụ cụ thể ở phần sau của tài liệu này.


Chúng ta cũng nên chú ý rằng, các kết quả liên quan tới các mơ hình
tối ưu chuẩn E và c trong mơ hình hồi quy (2.1), dựa trên các xấp xỉ


Chebyshev, sẽ thu được dưới giả định đơn giản hóa rằng bi = x+δri (với


i = 1, ..., k và ri 6= rj), và δ là đủ nhỏ. Rõ ràng, mỗi vector b = (b1, ..., bk)


có thể tiêu biểu cho công thức này, nhưng với giá trị δ đủ nhỏ thì kết quả
chúng ta thu được sẽ phụ thuộc vào hàm cơ bản ban đầu ϕ cùng với chính
bản thân vector b. Trong tài liệu này, chúng ta sẽ đưa ra và xây dựng một
thuật toán đơn giản để có thể tìm được mơ hình tối ưu chuẩn E và c cho
công thức (2.1). Chúng ta sẽ xây dựng các thuật toán dựa trên giả thiết
đơn giản hóa bi = x+ δri (với i = 1, ..., k và ri 6= rj) này để có được các


hướng tốt nhất cho các mơ hình tối ưu. Đồng thời, chúng ta cũng sẽ kiểm
tra tính tối ưu này của các mơ hình tìm được bằng cách sử dụng các định
lý tương đương hoặc các tính chất thay thế tương đương khác.


</div>
<span class='text_page_counter'>(28)</span><div class='page_container' data-page=28>

2.2 Lớp mơ hình hồi quy phi tuyến dạng phân thức


2.2.1 Đánh giá các kết quả đo đạc


Xem xét mơ hình hồi quy khơng tuyến tính (2.1) và định nghĩa:
f(t, b) = (f1(t, b), ..., fm(t, b))


T


= (h1(t), ..., hs(t), ψ(t, b1), ψ0(t, b1), ..., ψ(t, bk), ψ0(t, bk))


T (2.5)


như là vector của m = s+ 2k hàm hồi quy, với những dẫn xuất ra từ hàm
ϕ được lấy từ các liên hệ với biến thứ 2. Khá dễ dàng để có thể đưa ra


ma trận thông tin Fisher cho tham số β = (β1, ..., βm)T trong mơ hình hồi


quy tuyến tính.


Y = βTf(t, b) +ε
= X


i=1..s


βihi(t) +
X


i=1..k


(βs+2i−1ψ(t, bi) +βs+2iψ0(t, bi)) +ε (2.6)


được cho bởi công thức f(t, b)fT(t, b). Theo Kiefer (1974), chúng ta có
thể đo đạc ξ với một lượng giới hạn những hỗ trợ trên khoảng I giống như
với một mô hình. Những điểm support cho chúng ta những vị trí mà tại
đó chúng ta sẽ lấy được những số liệu đo đạc (hay đặt các trạm đo đạc),
cho tới khi các số liệu không cân xứng được cân đối lại cho phù hợp ở tất
cả các điểm đo đạc tại các vị trí đặc biệt. Đối với mơ hình ξ thì ma trận
thơng tin trong mơ hình (2.6) được định nghĩa bởi công thức:


M(ξ, b) =


Z


I



f(t, b)fT(t, b)dξ(t) (2.7)


Một mô hình tối ưu chuẩn E dạng ξ<sub>E</sub>∗ max trong những giá trị nhỏ nhất
một hàm số của ma trận thông tin (xem Silvey (1970) hoặc Pukelsheim
(1993)). Sự phụ thuộc vào tham số b là một thiếu sót mỗi khi ta muốn
bỏ tham số này ra khỏi mơ hình. Giữa những chuẩn tối ưu được đưa ra,
chúng ta sẽ cân nhắc xem xét các chuẩn E và chuẩn c. Một mô hình tối
ưu chuẩn E dạng ξ<sub>E</sub>∗ là lớn nhất trong các giá trị nhỏ nhất của các giá trị
riêng λmin(M(ξ, b)) trên tập tất cả các mơ hình xấp xỉ. Trong khi đó, đối


với một vector cho trước c ∈ <sub>R</sub>m<sub>, một mơ hình tối ưu chuẩn</sub> <sub>c</sub> <sub>sẽ tối thiểu</sub>


hóa các biểu thức cTM−(ξ, b)c, khi các giá trị nhỏ nhất được lấy ra từ tất
cả các công thức tổ hợp tuyến tính cTβ được coi là rất tốt (có ích), trong
đó c ∈ range(M(ξ, b)),∀b. Một trường hợp đặc biệt xuất hiện khi ta lấy
c = ei với ei ∈ Rm (i = 1, ..., m) sẽ là vector đơn vị thứ i. Trong trường


</div>
<span class='text_page_counter'>(29)</span><div class='page_container' data-page=29>

riêng lẻ của hệ số βi


Chú ý rằng ma trận thông tin cho trong cơng thức hồi quy khơng tuyến
tính (2.1) đầu tiên được cho bởi công thức K<sub>a</sub>−1M(ξ, b)K<sub>a</sub>−1, trong đó
Ka ∈ Rm×m là ma trận sau:


Ka = diag







1, ...,1


| {z }
s


,1, 1
a1


...,1, 1
ak


| {z }


2k








(2.8)


Cũng như vậy, công thức mơ hình chuẩn E trong cơng thức hồi quy
khơng tuyến tính (2.1) có giá trị max λmin Ka−1M(ξ, b)Ka−1




, với M(ξ, b)
là ma trận thông tin trong công thức tương đương của cơng thức hồi quy


tuyến tính.


Một bộ các hàm số f1, ..., fm : I → R được gọi là hệ Chebyshev yếu


trong khoảng I nếu tồn tại một số ε∈ {−1; 1} thỏa mãn:


ε·






f1(x1) · · · f1(xm)


... ... ...


fm(x1) · · · fm(xm)


 ≤0 (2.9)


với mọi giá trị x1 < x2 < ... < xm ∈ I.


Nếu bất đẳng thức trên là đúng thì bộ f1, f2, ..., fm được gọi là một hệ


Chebyshev.


Dễ thấy rằng nếu bộf1, f2, ..., fm là một hệ Chebyshev yếu thì tồn tại một


hàm đặc biệt:



m
X


i=1


c∗<sub>i</sub>fi(t) =c∗Tf(t) (2.10)


với các tính chất sau:


(i) |c∗Tf(t)| ≥1,∀i ∈ I.


(ii) Tồn tại m điểm s1 < ... < sm thỏa mãn c∗Tf(si) = (−1)i, i = 1, ..., m


(2.11)
Hàm số c∗Tf(t) được gọi là hàm đa thức Chebyshev và m điểm s1, ..., sm


được gọi là các điểm Chebyshev (ko cần phải đặc biệt). Chúng là đặc biệt
khi mà 1 ∈ span{f1, ..., fm}, m ≥ 1, cịn I là một bao đóng (với biên và


khoảng đóng liền kề), mà trong đó s1 = min


x∈I(x), và sm = maxx∈I (x)


</div>
<span class='text_page_counter'>(30)</span><div class='page_container' data-page=30>

chuẩn E và mơ hình chuẩn c trong mơ hình hồi quy tuyến tính sau


Y = βTf(t) +ε (2.12)
được hỗ trợ với các điểm Chebyshev.


Theo những thảo luận về các hàm số f1, ..., fm phát sinh ra một hệ



Chebyshev trên khoảng I với hàm đa thức Chebyshev c∗Tf(t) và các điểm
Chebyshev s1, ..., sm, ta định nghĩa một ma trận m×m như sau:


F = (fi(sj))
m
i,j=1


và một vector trọng số cho bởi công thức:
w = (w1, ..., wm)T =


J F−1c∗


kc∗<sub>k</sub>2 (2.13)


trong đó ma trận J được định nghĩa bởi:


J = diag{(−1)1,(−1)2, ...,(−1)m}
Khi đó có thể dễ dàng thấy rằng:


c∗


kc∗<sub>k</sub>2 = F J w =


m
X


j=1


f(sj)(−1)jwj ∈ ∂R (2.14)



với R = conv(f(I)S


f(−I)) biểu thị bộ Elfving.


Vì vậy, nếu tất cả các trọng số trong cơng thức (2.13) là các số khơng
âm, thì theo định lý Elfving, ta có:


ξ<sub>c</sub>∗∗ =




s1 · · · sm


wi · · · wm


(2.15)
với chuẩn c∗ lấy trong mơ hình hồi quy (2.12), trong đó c∗ ∈ <sub>R</sub>m <sub>là vector</sub>


hệ số của hàm đa thức Chebyshev được định nghĩa trong phần trước.
Khi đó, kết quả được đưa ra trong mơ hình này thành dạng mơ hình
chuẩn E.


Bổ đề 2.1.1:Bổ đề 2.1.1:Bổ đề 2.1.1: theo những hàm số f1, ..., fm ta phát sinh ra một hệ


</div>
<span class='text_page_counter'>(31)</span><div class='page_container' data-page=31>

trong trường hợp này, mơ hình chuẩn E là đặc biệt (độc nhất).


Bổ đề 2.1.2:Bổ đề 2.1.2:Bổ đề 2.1.2: Từ những hàm số f1, ..., fm ta phát sinh ra một hệ



Cheby-shev trên khoảng I với hàm đa thức Chebyshev c∗Tf(t) và lấy ξ<sub>c</sub>∗∗ biểu thị
một mơ hình c∗-optimal trong mơ hình hồi quy (2.6) được định nghĩa bởi
(2.15). Khi đó c∗ là một vector riêng của ma trận thông tin M(ξ<sub>c</sub>∗∗, b), và
nếu giá trị tương ứng giá trị riêng λ = <sub>k</sub><sub>c</sub>1∗<sub>k</sub>2 là giá trị nhỏ nhất của giá trị


riêng, thì khi đó ξ<sub>c</sub>∗∗ cũng sẽ là một mơ hình hồi quy có dạng (2.12).
Bây giờ chúng ta sẽ thảo luận về các vấn đề của mơ hình chuẩn c trong
mơ hình hồi quy (2.12) đối với một vector c ∈ <sub>R</sub> (không nhất thiết phải
bằng các hệ số c∗ của các hệ số của đa thức Chebyshev). Giả sử rằng các
hàm f1, ..., fm tạo ra một hệ Chebyshev trên khoảng I. Là một ý tưởng


cho mơ hình tối ưu chuẩn c, chúng ta xem xét đánh giá sau:
ξc = ξc(b) =




s1 · · · sm


wi · · · wm


(2.16)
trong đó các điểm trụ là các điểm Chebyshev, và quan trọng là chọn như
thế thì biểu thức:


cTM−1(ξc, b)c


sẽ trở thành nhỏ nhất, và bằng:
ωi =



|eT


i J F−1c|
m


P
j=1


|eT


jJ F−1c|


, i = 1, ..., m (2.17)


trong đó ej = (0, ...,0,1,0, ...,0)T ∈ Rm là vector đơn vị thứ j.


Kết quả sau đây là đặc điểm của mơ hình tối ưu cho việc ước lượng hệ
số riêng.


Bổ đề 2.1.3:Bổ đề 2.1.3:Bổ đề 2.1.3: giả sử rằng các hàm f1, ..., fm tạo ra một bộ Chebyshev


trên khoảng I. Mơ hình ξei xác định bởi công thức (2.16) và (2.17) đối với


vectorc = ej là một chuẩn ej trong mơ hình hồi quy tuyến tính (2.12) nếu


như hệ:


{fi|i = {1, ..., m}, i 6= j}


là một hệ Chebyshev yếu trên khoảng I.



</div>
<span class='text_page_counter'>(32)</span><div class='page_container' data-page=32>

Để thấy rõ điều này, ta có thể cho giá trị k = 3, khi đó hàm số ϕ là
hàm liên tục, vầ khả vi đối với biến thứ 2, và cũng khi đó, các hàm số
f1(·, b), ..., fm(·, b) được định nghĩa trong công thức (2.5) sinh ra một hệ


Chebyshev với bất kỳ tham số b nào.


Định nghĩa một ma trận (m−1)×(m−1) như sau:


Fj(x) := (h1(ti), ..., hs(ti), ϕ(ti, b1), ϕ0(ti, b1), ..., ϕ(ti, bj−1), ϕ0(ti, bj−1),
ϕ(ti, x), ϕ(ti, bj+1)ϕ0(ti, bj+1), ..., ϕ(ti, bk), ϕ0(ti, bk))


với c < t1 < ... < tm−1 < d, bi 6= bj khi i 6= j và x 6= bi.


Chúng ta sẽ chọn một bộ t1, ..., tm sao cho g(x) = detFj(x) 6= 0 (ở đây,


bộ các hàm số f1(·, b), ..., fm(·, b) có dạng một hệ Chebyshev, và bởi vậy,


nó ln ln là có thể) và quan sát g(bi) = 0, i= 1, ..., k, i 6= j. Bởi vì với


k ≥3 và g là hàm liên tục, khả vi, thì sẽ tồn tại hai điểm, ta gọi là x∗ và
x∗∗, thỏa mãn g0(x∗) < 0 còn g0(x∗∗) > 0. Do đó cho nên tồn tại một giá
trị x¯ để cho:


0 = g0(¯x) =det(fv(ti, bx¯))


trong đó v = 1, ..., m; v 6= s+ 2j −1; còn i = 1, ..., m−1.
Tại đây, vector bx¯ được định nghĩa bằng hệ thức:


bx¯ = (b1, ..., bj−1, bx¯, bj+1, ..., bm)



Chú ý là tính chất Chebyshev của các hàm sốf1, ..., fs+2j−2, fs+2j, ..., fm


ngụ ý rằng tất cả các định thức trong công thức (2.9) là cùng dấu. Bởi
thế cho nên điều kiện g0(x∗) < 0 và g0(x∗∗) sẽ cho phép tồn tại một giá trị
˜


x ∈ (x∗,x¯) hoặc x˜ ∈ (¯x, x∗∗) thỏa mãn hệ hàm hồi quy:
{f1(t, bx¯), ..., fs+2j−2(t, bx¯), fs+2j(t, bx¯), ..., fm}


= {(h1(ti), ..., hs(ti), ϕ(ti, b1), ϕ0(ti, b1), ..., ϕ(ti, bj−1), ϕ0(ti, bj−1)
ϕ(ti, x), ϕ(ti, bj+1)ϕ0(ti, bj+1), ..., ϕ(ti, bk), ϕ0(ti, bk)}


không phải là một hệ Chebyshev yếu trong khoảng I.
Cuối cùng thì trong trường hợp k = 2, nếu như lim


|b|→∞ϕ(t, b) → 0, khi


đó nó sẽ được chỉ ra bằng những argument giống nhau, những argument
mà tồn tại sao cho hệ thức:


</div>
<span class='text_page_counter'>(33)</span><div class='page_container' data-page=33>

2.2.2 Phân tích tiệm cận theo mơ hình tối ưu chuẩn E và chuẩnc


Ta sẽ nhắc lại định nghĩa của ma trận thông tin trong công thức (2.7) cho
mơ hình (2.6) với mơ hình cho trong một đoạn I = [c1, d1] và chứa trong
nó các tham số tham số phi tuyến thay đổi (không tuyến tính và thay đổi)
trong khoảng compact: bi ∈ [c2, d2], i = 1, ..., k.


Ta sẽ quan tâm tới các tính chất tiệm cận của mơ hình tối ưu theo
chuẩn E và chuẩn c nếu như:



bi = x+δri, i = 1, ..., k (2.18)


đối với một vài giá trị không đổi x ∈ [c2, d2] và vài giá trị không đổi
r1 < r2 < ... < rk và một giá trị δ xác định thỏa mãn δ → 0. Chú ý là


điều kiện (2.18) ý nói là tồn bộ các tham sốbi hội tụ vềxvới cùng tốc độδ.


Với những xem xét tiệm cân tới, ta sẽ chỉ ra rằng, với giá trị cố định
ε,∆ > 0 thì:


Ωε,∆ ={b ∈ Rk|bi−bj = δ(ri −rj);


i, j = 1, ..., k;δ ≤ε;bi ∈ [c2, d2],min


i6=j |ri−rj| ≥ ∆}


(2.19)


trong đó hàm số:
¯


fi(t, x) = ¯fi(t) =hi(t) i = 1, ..., s


¯


fs+i(t, x) = ¯fs+i(t) = ϕ(i−1)(t, x) i = 1, ...,2k


(2.20)
và tương ứng với vector hồi quy:



¯


f(t, x) = f¯1(t, x), ...,f¯s+2k(t, x)


(2.21)
trong đó đạo hàm của hàm số ϕ(t, x) được lấy ra với mối quan hệ với
argument thứ 2.


Hơn nữa phần phụ thuộc của hàm số f¯i vào tham số x sẽ bị bỏ sót bất


cứ khi nào nếu như nó khơng xuất hiện trong hàm số. Chú ý là với hàm số
ϕ đủ "mượt" thì khi đó khai triển Taylor sẽ cho ta thấy tính chất (2.18):
(ϕ(t, b1), ϕ0(t, b1), ..., ϕ(t, bk))


T


= Q ϕ(t, x), ϕ0(t, x), ..., ϕ2k−1(t, x)T +o(1)
= Qf¯(t, x) +o(1)


với một định nghĩa thích hợp của ma trận Q ∈ R2k×2k.


</div>
<span class='text_page_counter'>(34)</span><div class='page_container' data-page=34>

ϕ ∈ C0,2k−1([c1, d1]×[c2, d2])


và với mỗi điểm cố định x ∈ [c2, d2], hàm số f¯1, ...,f¯s+2k được định nghĩa


bởi (2.20) có dạng là hệ Chebyshev trên khoảng [c1, d1]. Với bất kỳ ∆> 0
nào và với bất kỳ mơ hình nào trên khoảng[c1, d1]với tối thiểu m = s+ 2k
điểm trụ (, luôn tồn tại một số ε > 0 thỏa mãn với tất cả b ∈ Ωε,∆, thì


giá trị lớn nhất của giá trị riêng của ma trận nghịch đảo M−1(ξ, b) (định
nghĩa tại (2.3)) là duy nhất.


Định lý 2.2.2:Định lý 2.2.2:Định lý 2.2.2: giả sử rằng hàm số ϕ : [c1, d1] ×[c2, d2] → R trong mơ


hình (2.1) thỏa mãn:


ϕ ∈ C0,2k−1([c1, d1]×[c2, d2])


và hệ thống hàm số {f1(t, b), ..., fm(t, b)} và {f¯1(t, x), ...,f¯m(t, x)} được


định nghĩa trong (2.5) và (2.20) (riêng từng cái), là hệ Chebyshev trên
khoảng[c1, d1](cho tùy ý nhưng cố định các giá trịb1, ..., bk, x ∈ [c1, d1], bi 6=


bj khi i 6= j). Nếu như ε là một giá trị đủ nhỏ, thì với bất kỳ b ∈ Ωε,∆, mơ
hình ξ<sub>c</sub>∗∗ định nghĩa bởi (2.13) và (2.15) sẽ là mơ hình tối ưu chuẩn E duy
nhất trong mơ hình hồi quy.


Dễ thấy rằng định lý 2.2.2định lý 2.2.2định lý 2.2.2 là một kết quả của bổ đề 2.1.2bổ đề 2.1.2bổ đề 2.1.2 và bổ đề 2.2.1bổ đề 2.2.1bổ đề 2.2.1,
chỉ ra rằng, trong vô số các giá trị riêng lớn nhất của ma trận nghịch đảo
của ma trận thông tin, có vơ hạn các giá trị 1, nếu b ∈ Ωε∗<sub>,</sub><sub>∆</sub> và ε đủ nhỏ.
Chú ý là với b ∈ Ωε,∆, mơ hình tối ưu chuẩn E có thể đạt được chính
xác (rõ ràng) bằng các bổ đề 2.1.1bổ đề 2.1.1bổ đề 2.1.1 và 2.1.22.1.22.1.2. Những điểm trụ là những điểm
extremal của đa thức Chebyshev tương ứng với hàm số trong cơng thức
(2.5), cịn trọng số thì được cho trong công thức (2.13).


Từ lưu ý 2.1.4lưu ý 2.1.4lưu ý 2.1.4, ta có thể hy vọng rằng trong trường hợp chung nhất,
mơ hình tối ưu chuẩn c trong mơ hình hồi quy (2.1) có thể là khơng nhất
thiết cần để hỗ trợ tại điểm Chebyshev. Tuy nhiên, một thứ tương tự như
bổ đề 2.2.1



bổ đề 2.2.1bổ đề 2.2.1 có thể coi là đã cho trước đối với vector c ∈ Rm.


Bổ đề 2.2.3:Bổ đề 2.2.3:Bổ đề 2.2.3: cho ei = (0, ...,0,1,0, ...,0))T là vector đơn vị thứ i của


không gian Rm. Dựa theo bổ đề 2.2.1bổ đề 2.2.1bổ đề 2.2.1, ta định nghĩa một vector γ˜ =
(0, ...,0, γ −1, ..., γ2k) ∈ Rm, sao cho:


γ2i =
Y


j6=i


(ri −rj)−2, γ2i−1 = −γ2i
X


j6=i


2
ri−rj


</div>
<span class='text_page_counter'>(35)</span><div class='page_container' data-page=35>

(i) Nếu c ∈ Rm thỏa mãn cTγ˜ 6= 0, thì với bất kỳ ∆ > 0, bất kỳ ε đủ
nhỏ, bất kỳb ∈ Ωε,∆, mô hình ξc(b) được định nghĩa trong (2.16) và (2.17)


là một tối ưu chuẩn c trong mơ hình hồi quy (2.6).


(ii) Với việccTγ˜ 6= 0, trong trường hợp đặc biệt, thỏa mãn điều kiện: vector
c = es+2j−1 với mọi j = 1, ..., k và vector c = es+2j với mọi j = 1, ..., k, và


thỏa mãn thêm điều kiện:



X


l6=j


1
rj −rl


6


= 0 (2.23)


Chú ý 2.2.4:Chú ý 2.2.4:Chú ý 2.2.4: như đã được chỉ ra ở một dẫn chứng, một vài giải nghĩa của
tập Ωε,∆ là hữu dụng tại đây.


Chú ý là giá trị ∆ ≤ min


i6=j |ri − rj| sinh ra một vài hạn chế nhỏ cho ri


trong công thức (2.18) và ε có thể xem như là một điểm ngưỡng giới hạn,
mỗi khi ta thỏa mãn được δ < ε trong (2.18). Khi đó thì định lý 1.3.2định lý 1.3.2định lý 1.3.2 và
các bổ đề 1.3.3.1, 1.3.3.3bổ đề 1.3.3.1, 1.3.3.3bổ đề 1.3.3.1, 1.3.3.3 sẽ được gắn vào với vector tương ứng b ∈ Ωε,∆.
Điểm cắt này không thể được xác định một cách rõ ràng bởi nó phụ thuộc
một cách phức tạp vào Delta, vào các khoảng [c1, d1], [c2, d2], và vào hàm
số cơ bản được chọn ϕ(t, x) trong mơ hình hồi quy (2.1) ban đầu. Nói
một cách đại khái rằng, kết quả của bổ đề 1.3.3.1, 1.3.3.3bổ đề 1.3.3.1, 1.3.3.3bổ đề 1.3.3.1, 1.3.3.3 và định lý 1.3.2định lý 1.3.2định lý 1.3.2
được giữ đối với mọi vector b trong một khoảng lân cận đủ nhỏ của vector
(x, ..., x) ∈ <sub>R</sub>2k<sub>. Trong ví dụ ở phần sau của bài viết này, bộ</sub> <sub>Ω</sub>


ε,∆ trùng


khớp với tập các giá trị có thể chấp nhận được cho tham số b.


Cũng lưu ý rằng, các giả định về tính compactness của khoảng [c1, d1]
và [c2, d2] chỉ cần thiết cho sự tồn tại của tập Ωε,∆. Nói cách khác, nếu
điều kiện (2.18) được thỏa mãn và giá trị δ là đủ nhỏ thì giá trị lớn nhất
của giá trị riêng của ma trận M−1(ξ, b) sẽ là một vô cùng lớn, mà không
phụ thuộc vào sự lựa chọn hàm số ϕ. Chú ý này cũng áp dụng tương tự
đối với định lý 1.3.2định lý 1.3.2định lý 1.3.2 và bổ đề 1.3.3.3bổ đề 1.3.3.3bổ đề 1.3.3.3.


Kết quả cuối cùng của chúng ta ở phần này, giả định công thức (2.18)
đúng, và với ϕ đủ nhỏ thì mơ hình địa phương của chuẩn E và chuẩn c
đối với vector c trong bổ đề 1.3.3.3bổ đề 1.3.3.3bổ đề 1.3.3.3 và chú ý 1.3.4chú ý 1.3.4chú ý 1.3.4, đã là rất chuẩn xác. Để
có được tính chính xác tuyệt đối, chúng ta giả định rằng các giả thiết của
định lý 1.3.2


định lý 1.3.2định lý 1.3.2 là đúng và xem xét mơ hình sau:
¯


ξc = ¯ξc(x) =


¯


s1 . . . s¯m


¯


ω1 . . . ω¯m



</div>
<span class='text_page_counter'>(36)</span><div class='page_container' data-page=36>

1, ..., m} được định nghĩa trong công thức (2.20).
¯


ωi =


|eT


i F¯−1c|
m


P
j=1


|eT


jF¯−1c|


i = 1, ..., m (2.25)


với F¯ = (fi(¯si))
m


i,j=1 và c ∈ R


m <sub>là một vector cố định.</sub>


Định lý 2.2.5:Định lý 2.2.5:Định lý 2.2.5: Giả sử rằng các điều kiện của định lý 2.2.2định lý 2.2.2định lý 2.2.2 đã được thỏa
mãn, và ta có một hệ {f¯1, ...,f¯m} là một hệ Chebyshev đặc biệt. Khi đó:


(i) Nếu δ → 0 thì mơ hình ξ<sub>c</sub>∗∗(b) được định nghĩa bởi công thức (2.13)


và (2.15) hội tụ yếu đối với mơ hình ξ¯em được định nghĩa bởi cơng thức


(2.24) và (2.25) với c = em.


(ii) Nếu c ∈ <sub>R</sub>m <sub>thỏa mãn</sub> <sub>c</sub>T<sub>γ</sub><sub>˜</sub> <sub>6</sub><sub>= 0</sub> <sub>đối với vector</sub> <sub>˜</sub><sub>γ</sub> <sub>(các thành phần</sub>


của vector thỏa mãn hệ thức (2.22)) và δ → 0, thì khi đó, ta có mơ hình
ξ<sub>c</sub>∗(b) được định nghĩa bởi công thức (2.16) và (2.17) hội tụ yếu đối với mơ
hình ξ¯em.


(iii) Nếu điều kiện cTγ˜ 6= 0, trong trường hợp đặc biệt, thỏa mãn đối
với vector c = es+2j−1 (với mọi j = 1, ..., k) và đối với vector c = es+2j


(với mọi j = 1, ..., k), sẽ thỏa mãn được điều kiện (2.23).


Chú ý 2.2.6:Chú ý 2.2.6:Chú ý 2.2.6: chú ý rằng định lý 2.2.2định lý 2.2.2định lý 2.2.2, các bổ đề 2.2.3bổ đề 2.2.3bổ đề 2.2.3 và 2.2.52.2.52.2.5 vẫn là
những khẳng định đúng đối với mơ hình tối ưu cục bộ (địa phương) trong
dạng mơ hình hồi quy phi tuyến (2.1). Điều này được dựa theo sự cẩn thận
đánh giá những luận chứng (luận cứ) của những kết quả trước đó.


Lấy ví dụ, ở đây tồn tại một bộ Ωε,∆ thỏa mãn, với mọi b ∈ Ωε,∆ thì
giá trị riêng lớn nhất của ma trận nghịch đảo của ma trận thông tin trong
mô hình (2.1) là duy nhất (đơn nhất). Cũng thế, ta có, nếu δ → 0 và hệ
thức (2.18) được thỏa mãn thì mơ hình tối ưu chuẩn ctrong dạng mơ hình
hồi quy phi tuyến sẽ được cho bởi mơ hình ξc¯(b) trong (2.16) và (2.17) với


¯


c = Kac với mỗi γ˜Tc¯6= 0, và tất cả những mơ hình hơi tụ yếu tới mơ hình



tối ưu chuẩn em trong mơ hình hồi quy tuyến tính định nghĩa bởi hàm số


(2.21).


Cuối cùng, chúng ta cần chú ý rằng định lý 2.2.5định lý 2.2.5định lý 2.2.5 và lưu ý 2.2.6lưu ý 2.2.6lưu ý 2.2.6 chỉ ra
cho chúng ta rằng mơ hình tối ưu chuần E là có hiệu quả cao (rất có hiệu
quả) trong việc đánh giá, ước lượng các tham số as+1, b1, ..., as+k, bk trong


</div>
<span class='text_page_counter'>(37)</span><div class='page_container' data-page=37>

một giá trị nhỏ của hiệu |bi −bj| thì mơ hình tối ưu chuẩn E và mơ hình


tối ưu dùng để đánh giá, ước lượng một hệ số riêng bi (với i = 1, ..., k) là


chặt chẽ đối với mơ hình tối ưu cho sự ước lượng tham số bk. Chúng ta sẽ


</div>
<span class='text_page_counter'>(38)</span><div class='page_container' data-page=38>

2.2.3 Mơ hình hồi quy phi tuyến dạng phân thức hữu tỷ


Trong phần này, chúng ta sẽ thảo luận về các mơ hình hữu tỷ (dạng (2.2))
một cách kỹ càng và cẩn thận hơn, với không gian mơ hình là tập compact
hoặc khoảng bán vơ hạn I.


Trong sự tương phản với bài báo của Imhof và Studden (năm 2001), ta
thừa nhận là những tham số phi tuyến b1, ..., bk ∈/ I là không biết trước


đối với người tiến hành thực nghiệm, nhưng có thể được ước lượng ra dựa
theo các dữ liệu đã biết. Một sự áp dụng tiêu biểu của mơ hình này có thể
được tìm thấy ở bài báo của Dudzinski và Mykytowcz (năm 1961). Khi đó
mơ hình này được sử dụng để miêu tả các quan hệ giữa khối lượng của
con mắt của thỏ châu Âu với tuổi của chúng.


Với các ký hiệu từ các phần bên trên, ta có:



f(t) = f(t, b) = (f1(t), ..., fm(t))
T


trong đó:


fi(t) =ti−1, i = 1, ..., s


fs+2i−1(t) =fs+2i−1(t, b) =


1
t−bi


fs+2i(t) =fs+2i(t, b) =


1
(t−bi)2


, i = 1, ..., k


(2.26)


và mơ hình hồi quy tuyến tính tương đương được cho bởi công thức (2.4).
Sự tương ứng của mô hình giới hạn được xác định rõ bởi hàm số hồi quy


¯


f(t) = ¯f(t, b) = f¯1(t), ...,f¯m(t)



, trong đó:
¯


fi(t) =ti−1


¯


fi+s(t, x) =


1


(t−x)i i = 1, ..., s


(2.27)


Một vài những tính chất của hàm số được định nghĩa bởi cơng thức
(2.26) và (2.27) sẽ được thảo luận trong bổ đề sau.


Bổ đề 2.3.1:Bổ đề 2.3.1:Bổ đề 2.3.1: ta định nghĩa B = {b = (b1, ..., bk)T ∈ Rm|bi ∈/ I;bi 6= bj}.


Khi đó những mệnh đề sau là các khẳng định đúng:


(i) Nếu I là một khoảng hữu hạn hoặc I ⊂ [0,∞) và b ∈ B, thì khi đó
hệ {f1(t, b), ..., fm(t, b)} được định nghĩa trong công thức (2.26) là một hệ


</div>
<span class='text_page_counter'>(39)</span><div class='page_container' data-page=39>

được định nghĩa trong công thức (2.27) sẽ là một hệ Chebyshev trên khoảng
I.


(ii) Cho rằng b ∈ B và một trong các điều kiện sau đây được thỏa mãn:
(a) I ⊂ [0,∞)



(b) s = 1 hoặc s = 0


Với bất kỳ một sốj ∈ {1, ..., k}, hệ hàm hồi quy{fi(t, b)|i = 1, ..., m;i 6=


s+ 2j} là một hệ Chebyshev trên khoảng I.


(iii) Nếu I là một khoảng hữu hạn hoặc I ⊂ [0,∞), và k ≥ 2, cùng với
j ∈ {1, ..., k}, thì khi đó sẽ tồn tại một tập không rỗng Wi ∈ B thỏa mãn:


với mọi b ∈ Wj, thì hệ hàm số {fi(t, b)|i = 1, ..., m;i 6= s+ 2j−1} không


phải là một hệ Chebyshev trên khoảng I.


Trong trường hợp k = 1 thì chũng ta sẽ giải quyết rõ ràng nó trong ví
dụ ở phía sau. Chú ý là ở phần thứ 3 của bổ đề trên thì ta thấy rằngk ≥ 2,
và như vậy thì điều kiện chính của định lý 2 trong bài báo của Imhof và
Studden (năm 2001) đã khơng được thỏa mãn trong tổng qt đối với mơ
hình hồi quy tuyến tính với hàm số được cho trong công thức (2.26). Các
tác giả đã thừa nhận là mọi tập con của {f1, ..., fm}gồm có m−1 hàm số


là những hệ Chebyshev yếu trên các khoảng I. Bởi vì những vấn đề của
mơ hình trên là tương đương với các vấn đề của mơ hình (2.2) (khi mà
các tham số phi tuyến là không biết trước và chúng ta chỉ có các đánh
giá ước lượng), nó dẫn theo một điều rằng, trong các trường hợp thơng
thường thì chúng ta khơng thể trơng mong việc tìm ra các mơ hình tối ưu
địa phương chuẩn E cho các mơ hình hàm hữu tỷ có thể hỗ trọ cho các
diểm Chebyshev. Nhưng nói chung dù thế nào đi chăng nữa thì mơ hình
hồi quy tuyến tính (2.4) là trường hợp đắc biệt của mơ hình chung (2.6)
với ϕ(t, b) = (t−b)−1 và tất cả các kết quả của mục 1.3 trong chương 1chương 1chương 1


đều có thể dùng được ở đây (thích hợp). Trong trường hợp đặc biệt, chúng
ta có thể thu được kết quả là mơ hình tối ưu chuẩn E và mơ hình tối ưu
cho các đánh giá ước lượng những hệ số riêng as+1, b1, ..., as+k, bk sẽ là các


điểm trụ tại các điểm Chebyshev nếu các tham số phi tuyến b1, ..., bk là


đủ gần nhau (xem định lý 2.2.2định lý 2.2.2định lý 2.2.2, bổ đề 2.2.3bổ đề 2.2.3bổ đề 2.2.3 và chú ý 2.2.6)chú ý 2.2.6)chú ý 2.2.6).


</div>
<span class='text_page_counter'>(40)</span><div class='page_container' data-page=40>

là để giới thiệu hàm số:


ψ(t, b) =






ψ1(t,˜b)
...
ψm(t,˜b)






với:


ψi(t,˜b) = ti−1, i = 1, ..., s


ψs+i(t,˜b) =



1


t−˜b, i = 1, ...,2k


(2.28)


trong đó, ˜b = (˜b1, ...,˜b2k)T là vector xác định với ˜bi 6= ˜bj khi i 6= j.


Chúng ta sử dụng các ký hiệu sau:
L(∆) =




Is 0


0 Gk(∆)


∈ <sub>R</sub>m×m
Gk(∆) =




G(∆)
. . .
G(∆)


 ∈ R
2k×2k



G(∆) =



1 0
−1

1



∈ <sub>R</sub>2×2


ở đây, Is là ma trận đơn vị. Và cũng khá dễ dàng để có được:


f(t, b) = L(∆)ψm(t,˜b∆) +o(1) (2.29)
trong đó


˜
b∆ =







b1
b1 + ∆


...


bk


bk + ∆





.


Với một vector T đã xác định và có thứ tự:


T =


t1
...
tm


 ∈ R
m


t1 < ... < tm, ti ∈ I


ta định nghĩa ma trận sau:


</div>
<span class='text_page_counter'>(41)</span><div class='page_container' data-page=41>

và ma trận:


ψ(T,˜b) = (ψi(tj,˜b))m<sub>i,j</sub><sub>=1</sub>



Từ (2.29) ta thu được:


detF(T, b) = lim


∆→0


1


∆kψ(T,˜b∆)


=


Q
16i<j6m


(tj −ti)
Q
16i<j6k


(bi −bj)4
k
Q
i=1
m
Q
j=1


(tj −bi)2



(2.30)


trong đó, đồng nhất thức cuối cùng sẽ có ma trận ψi(tj,˜b) là ma trận


Cauchy-Vandermonde, bao gồm:


detψ(T,˜b) =


Q
16i<j6m


(ti −tj)
Q
1<sub>6</sub>i<j<sub>6</sub>2k


(˜bi −˜bj)
k
Q
i=1
m
Q
j=1


(tj −˜bi)


Bây giờ, với mỗi b ∈ B, vế phải không bị triệt tiêu, và là một vế khơng
phụ thuộc vào T. Do đó, hệ {fi(t, b)|i = 1, ..., m} là một hệ Chebyshev


trên khoảng I.



Chúng ta chúng minh hệ {f¯i(t, b)|i = 1, ..., m} hoàn toàn tương tự.


Định lý 2.3.2:Định lý 2.3.2:Định lý 2.3.2:


(i) Nếu s = 1, thì điểm Chebyshev s1 = s1(b), ..., sm = sm(b) đối với


hệ các hàm hồi quy trong (2.4) trên đoạn [-1,1] sẽ được cho bởi các giá trị
zero của các đa thức:


1−t2
4k
X


i=0


diU−2k+s+i−2(t)


với Uj(x) là đa thức Chebyshev thứ j của dạng 2 (xem Szego - 1975),


U−1(x) = 0, U−n(x) = −Un−2(x) và các thừa số d0, ..., d4k là hệ số của đa


thức:


4k
X


i=0


diti =
k


Y


i=1


(t−τi)4


trong đó


</div>
<span class='text_page_counter'>(42)</span><div class='page_container' data-page=42>

(ii) Cho ΩE ⊂ B là tập tất cả các giá trịb sao cho: mơ hình tối ưu chuẩn


E đối với công thức (2.4) sẽ được cho bởi cơng thức (2.15) và (2.13). Khi
đó ΩE ⊂ B 6= φ.


Lưu ý 2.3.3:Lưu ý 2.3.3:Lưu ý 2.3.3:


(a) Điểm Chebyshev cho hệ (2.26) trên một khoảng hữu hạn tùy ý
I ⊂ <sub>R</sub> có thể thu được bằng cách rescaling điểm lên trên khoảng [-1;1].
Trong trường hợp s = 0 và I = [0,∞) sẽ được thảo luận nhiều hơn trong
các ví dụ phía sau.


(b) Theo như định lý 2.2.2định lý 2.2.2định lý 2.2.2 thì tập ΩE được định nghĩa trong phần 2


của định lý 2.3.2định lý 2.3.2định lý 2.3.2 bao gồm tập Ωε,∆ (định nghĩa trong công thức (2.19))
đối với một giá trị ε đủ nhỏ. Nói cách khác, nếu như những tham số phi
tuyến b1, ..., bk là đủ gần nhau, thì mơ hình tối ưu chuẩn E sẽ là trụ tại


điểm Chebyshev với trọng số cho ở cơng thức (2.13). Hơn nữa, chúng ta
có thể chứng minh trong các ví dụ bên dưới, trong đó có rất nhiều trường
hợp tập ΩE trùng khớp với toàn bộ tập B.



(c) Trong mẫu có sẵn thì điểm Chebyshev có thể được tính tốn bằng
số (bằng giá trị số) với thuật toán Remez (xem Studden and Tsay - 1976,
hoặc DeVore and Lorentz - 1993). Trong một số trường hợp các điểm này
có thể được tìm ra một cách chính xác.


Lưu ý 2.3.4:Lưu ý 2.3.4:Lưu ý 2.3.4: Chúng ta chú ý rằng những kết quả giống nhau (tương tự)
sẽ là chắc chắn đối với mơ hình tối ưu chuẩn c trên mơ hình hồi quy hữu
tỷ (2.4). Lấy ví dụ, giả sử rằng một trong các khẳng định của định lý 2.3.2định lý 2.3.2định lý 2.3.2
là chắc chắn (đúng) và chúng ta thì khá là hứng thú trong việc tìm các
đánh giá ước lượng một tổ hợp tuyến tính cTβ của các tham số trong mơ
hình hữu tỷ (2.4). Ta thu được từ bổ đề 2.2.3bổ đề 2.2.3bổ đề 2.2.3 rằng: nếu c ∈ Rm thỏa mãn
cT˜γ 6= 0, khi đó đối vớiεđủ nhỏ và với mọib ∈ Ωε,∆ thì mơ hìnhξc(b)được


định nghĩa trong (2.16) và (2.17) là một tối ưu chuẩn c. Trong trường hợp
đặc biệt, điều này là đúng đối với c = es+2j−1 (với i = 1, ..., k) và vector
c = es+2j nếu như chỉ số j thỏa mãn điều kiện (2.23). Chú ý rằng điều


này có thể có được từ phần 3 của bổ đề 2.3.1bổ đề 2.3.1bổ đề 2.3.1 trong trường hợp k ≥ 2, khi
đó tồn tại một giá trị b ∈ B thỏa mãn: mơ hình chuẩn es+2j khơng nhất


</div>
<span class='text_page_counter'>(43)</span><div class='page_container' data-page=43>

ξ<sub>c</sub>∗(b) được định nghĩa trong (2.15) và (2.16).
ξ<sub>c</sub>∗∗(b) = ¯ξem(x), ξ




c(b) = ¯ξem(x)


trong đó mơ hình ξ¯em(x) được định nghĩa trong (2.24) và (2.25) và là tối


ưu chuẩn em trong mơ hình bị giới hạn với hàm hồi quy (2.27).



Định lý 2.3.5:Định lý 2.3.5:Định lý 2.3.5: cho ϕ ∈ C0,2k−1 và ξ là một mơ hình tùy ý sao cho ma
trận M(ξ, b) khơng phải là ma trận đặc biệt. Khi đó, nếu công thức (2.18)
được thỏa mãn, và với một giá trị δ đủ nhỏ thì ma trận M(ξ, b) là khả
nghịch. Và nếu δ →0 thì ta có:


M−1(ξ, b) = δ−4k+4T(δ) M


(1)


(ξ) M(2)(ξ)F
FTM(2)T(ξ) γγTh+o(1)


!


T(δ)+o(1) (2.31)


trong đó, ma trận T(δ) ∈ <sub>R</sub>m×m<sub>,</sub> <sub>M</sub>(1)<sub>(</sub><sub>ξ</sub><sub>)</sub> <sub>∈</sub>


Rs×s, cịn M


(2)


(ξ) ∈ <sub>R</sub>s×2k<sub>.</sub>


Và vector γ = (γ1, ..., γ2k)T đươc cho như sau:


γ2i =
Y



i6=j


(ri−rj)−2, γ2i−1 = −γ2i
X


i6=j


2
ri −rj


, i = 1, ..., k


Còn h ∈ <sub>R</sub> là một số thực được cho bởi công thức:
h = [(2k−1)!]2e<sub>m</sub>TM−1(ξ, x)em


Ma trận F ∈ <sub>R</sub>2k×2k <sub>được xác định với công thức:</sub>


F =






0 · · · 0 γ1


0!
... ... ...
0 · · · 0 γ2k


(2k−1)!






và cuối cùng là với định nghĩa ma trận M(3)(ξ) ∈ <sub>R</sub>2k×2k <sub>như sau:</sub>


T(δ) =





δ


2k−2<sub>, ..., δ</sub>2k−2


| {z }


s


, 1


δ,1, ...,
1
δ,1


| {z }


2k








M(1)(ξ) M(2)(ξ)
M(2)T(ξ) M(3)(ξ)


!


</div>
<span class='text_page_counter'>(44)</span><div class='page_container' data-page=44>

2.3 Một số mơ hình hồi quy phi tuyến dạng phân thức


2.3.1 Mơ hình 1:


Ta cùng xem xét một ví dụ về một mơ hình phân thức:


Y = a


t−b +ε, t∈ [0,∞) (2.32)
với b < 0 (ở đây, chúng ta có k = 1, s = 0 và I = [0,∞). Mơ hình tương
ứng trong lớp hàm hồi quy tuyến tính sẽ được cho ở dạng sau:


Y = βTf(t, b) = β1
t−b +


β2


(t−b)2 (2.33)
Trong trường hợp này thì theo phần đầu của bổ đề 2.3.1bổ đề 2.3.1bổ đề 2.3.1, hệ hàm hồi quy
{ 1



t−b,


1


(t−b)2} = {f1(t), f2(t)} là một hệ Chebyshev trên khoảng [0,∞) khi


mà b < 0. Hơn nữa, dễ thấy rằng mỗi tập con của (gồm có của một phương
trình) là một hệ Chebyshev trên khoảng [0,∞). Chúng ta sẽ tính tốn các
điểm Chebyshev ngay sau đây.


Xét phương trình sau:


g(t) = β1


t−b +
β2


(t−b)2


Để dễ dàng hơn cho tính tốn, ta đặt β1 = ρ, β2 = ρκ. Và khi đó, ρ và κ
cũng vẫn sẽ thỏa mãn các điều kiện sau đây:


g(t) ≥ 1 ∀t ∈ [0,∞)
g(si) = (−1)i, i = 1,2.


Theo các tính chất đã có về các điểm Chebyshev, ta có s1 = 0. Bây giờ,
ta sẽ tính s2.


Bởi vì g0(t) = 0 nên ta có:



⇔ 0 = ρ


<sub>−</sub>


1
(s2 −b)2


+ −2κ
(s2 −b)3




⇔ 0 = −(s2 −b)−2κ
(s2 −b)3


⇔ κ = b−s2


2


(2.34)


Ngồi ra, ta cịn có g(si) = (−1)i nên ta có g(s1) = −g(s2). Từ đó ta
có thêm phương trình sau:


ρ




1
s −b +



κ
(s −b)2




= −ρ




1
s −b +


κ
(s −b)2




</div>
<span class='text_page_counter'>(45)</span><div class='page_container' data-page=45>

Mà ta đã có s1 = 0, κ= b−<sub>2</sub>s2, nên khi thay vào, ta được:


⇔ 1


−b +


b−s2


2b2 = −


1
s2 −b



− b−s2


2(s2 −b)2
⇔−2b+b−s2


2b2 =


−2(s2 −b)−b+s2


2(s2 −b)2


⇔ − b+s2


2b2 =


b−s2


2(s2 −b)2


= −1
2(s2 −b)
⇔(b+s2)(s2 −b) =b2


⇔s2 =




2|b| = −√2b



Sử dụng lại công thức g(si) = (−1)i ⇒ g(s1) = g(0) = −1, ta sẽ thu
được:


ρ = √−2


2−1b (2.36)


Ở đây, chúng ta đã xác định được đa thức Chebyshev.


Bây giờ, chúng ta sẽ xem xét và xử lý mô hình ξ<sub>c</sub>∗(b) được định nghĩa
bởi cơng thức dưới đây:


ξ<sub>c</sub>∗ = ξ<sub>c</sub>∗(b) =




s1 · · · sm


w1 · · · wm


với m=2 (2.37)
như là một ví dụ tiêu biểu cho mơ hình tối ưu chuẩn c đối với mơ hình
(2.33).


Khi đó, ma trận F của chúng ta sẽ được tính bởi công thức sau:
F = (fi(sj))2i,j=1 =


1



|b|


1
(√2+1)|b|


1


b2


1
(√2+1)2<sub>b</sub>2


!


thay các giá trị của si vào, ta dễ dàng có thể tính được giá trị:


F =


−1


b


−1
(√2+1)b


1


b2


1


(√2+1)2<sub>b</sub>2


!


Và khi đó:


detF =−1
b ·


1


(√2 + 1)2<sub>b</sub>2 −


1
b2 ·


−1
(√2 + 1)b
=


</div>
<span class='text_page_counter'>(46)</span><div class='page_container' data-page=46>

Thì ta sẽ có:


F−1 =




F11 F12
F21 F22





với các giá trị:


F11 =



2
b3<sub>(2</sub>√<sub>2 + 3)</sub>


!−1


· 1


(√2 + 1)2<sub>b</sub>2 =
b

2
F21 =



2
b3<sub>(2</sub>√<sub>2 + 3)</sub>


!−1


−1


(√2 + 1)2<sub>b</sub>2 =


−b2<sub>(</sub>√<sub>2 + 2)</sub>



2
F12 =



2
b3<sub>(2</sub>√<sub>2 + 3)</sub>


!−1


· 1
b2 =


b(3√2 + 4)
2
F22 =



2
b3<sub>(2</sub>√<sub>2 + 3)</sub>


!−1


· −1
b =


−b2<sub>(3</sub>√<sub>2 + 4)</sub>


2
hay ma trận F−1 sẽ bằng:



F−1 =


b




2


−b2<sub>(</sub>√<sub>2+2)</sub>


2


b(3√2+4)
2


−b2(3√2+4)
2


!


Khi đó, với một vector c =




c1
c2





thì ta sẽ có:


F−1c = 1<sub>2</sub>




b(√2c1 −(2 +


2)c2b)
b(4 + 3√2)(−c1 +c2b)






ξ<sub>c</sub>∗(b) =




0 √2|b|
w1 w2




Ở đây ta sử dụng cơng thức wi từ phía bên trên:


w1 =


|eT<sub>i</sub> J F−1c|


2


P
j=1


|eT


</div>
<span class='text_page_counter'>(47)</span><div class='page_container' data-page=47>

Thay các giá trị vào, ta được:


w1 =








(1 0)·




−1 0


0 1




· 1<sub>2</sub>





b(√2c1 −(2 +


2)c2b)
b(4 + 3√2)(−c1 +c2b)


<sub></sub>









(1 0) ·




−1 0


0 1




· 1
2





b(√2c1 −(2 +


2)c2b)
b(4 + 3√2)(−c1 +c2b)







+






(1 0)·




−1 0


0 1





· 1
2




b(√2c1 −(2 +


2)c2b)
b(4 + 3√2)(−c1 + c2b)







= |(−


2c1 + (2 +


2)c2b)|
| − √2c1 + (2 +




2)c2b|+ (4 + 3



2)| −c1 +c2b|
w2 =1−w1


(2.38)
Ta có thể thấy rằng mơ hình này là một thiết kế tối ưu chuẩn c trong
mơ hình hồi quy (2.33) khi mà:


c2


c1 ∈/


h
1


b,


1
(1+√2)b


i


Trong các trường hợp cịn lại thì mơ hình tối ưu chuẩn clà một mơ hình
một điểm trụ, và điểm trụ là t= b− c1


c2.


Đặc biệt, theo Bổ đề 2.1.3Bổ đề 2.1.3Bổ đề 2.1.3, thì mơ hình tối ưu chuẩn e1 và chuẩn e2 đối
với việc ước lượng các giá trị của các hệ số β1 và β2 trong mơ hình (2.33)
sẽ có trọng số như sau (ta thay lần lượt các vector đơn vị e1 và e2 vào
c =





c1
c2




trong công thức (2.38)):
Với ξ<sub>e</sub>∗<sub>1</sub>(b) thì ta có:


w1 =


|(−√2·1 + (2 +√2)b·0)|


| −√2·1 + (2 +√2)b·0|+ (4 + 3√2)| −1 + 0·b|
=1


4(2−


2)
w2 =1−w1


=1
4(2 +



2)
hay ta có thể viết:



ξ<sub>e</sub>∗<sub>1</sub> =




0 −√2b
1


4(2−


2) 1<sub>4</sub>(2 +√2)


</div>
<span class='text_page_counter'>(48)</span><div class='page_container' data-page=48>

Cịn với ξ<sub>e</sub>∗<sub>2</sub> thì ta nhận được qua cơng thức sau:
w1 =


|(−√2·0 + (2 +√2)b·1)|


| −√2·0 + (2 +√2)b·1|+ (4 + 3√2)| −0 +b·1|
=1− √1


2
w2 =1−w1


=√1
2
hay ta có thể viết:


ξ<sub>e</sub>∗<sub>2</sub> =





0 −√2b
1− √1


2
1




2


Đây là các tối ưu chuẩn e1 và e2 tương ứng với các điểm s1 = 0 và
s2 = −



2b.


Khi đó, ta thu được: một mơ hình tối ưu chuẩn E trong mơ hình hồi
quy (2.33) sẽ được cho bởi mơ hình chuẩn c∗ ứng với vector Chebyshev:


c∗ =




2(1 +√2)b
(1 +√2)2b2





Khi đó, thay giá trị của c∗ vào công thức (2.38), ta thu được:


w1 =







2·2(1 +√2)b) + (2 +√2)b·(1 +√2)2b2






2·2(1 +√2)b) + (2 +√2)b·(1 +√2)2<sub>b</sub>2


+ (4 + 3




2)−(2(1 +




2)b) +b·(1 +√2)2<sub>b</sub>2



=1
2


(2−√2)(6 −4√2 +b2)
b2 <sub>+ 12</sub><sub>−</sub><sub>8</sub>√<sub>2</sub>
w2 =1−w1


=1
2




2(2√2−2 +b2)
b2 <sub>+ 12</sub><sub>−</sub><sub>8</sub>√<sub>2</sub>
hay có thể viết:


ξ<sub>E</sub>∗ = 0 −



2b
1


2


(2−√2)(6−4√2+b2<sub>)</sub>


b2<sub>+12</sub><sub>−</sub><sub>8</sub>√<sub>2</sub>


1
2





2(2√2−2+b2<sub>)</sub>


b2<sub>+12</sub><sub>−</sub><sub>8</sub>√<sub>2</sub>


</div>
<span class='text_page_counter'>(49)</span><div class='page_container' data-page=49>

Ngồi ra, chúng ta cũng có thể thu được mơ hình tối ưu chuẩn E khi
sử dụng phương pháp đồ thị, được thiết kế đặc biệt cho mơ hình hai tham
số.


Tính đúng đắn của mơ hình chuẩn E ξ∗<sub>E</sub>(b) trong khoảng [-2,5;-1]. Nét liền là eff<sub>1</sub>(ξ∗(b)), còn
nét gạch là eff<sub>2</sub>(ξ∗(b))


Ở đây, với các giá trị w1 và w2 bên trên, ta có thể tính được ma trận
thơng tin theo cơng thức:


M(ξ, b) =


Z


f(t, b)fT(t, b)ξ(dt)
= Xf(t, b)fT(t, b)wi


Khi đó, ta nhận được ma trận thông tin như sau (dù phép tính khá là
phức tạp và dài dịng):


M(ξ<sub>E</sub>∗(b), b) =








(√2−1)(b2<sub>+6</sub>√<sub>2</sub><sub>−</sub><sub>8)</sub>


b2<sub>(</sub><sub>b</sub>2<sub>+12</sub><sub>−</sub><sub>8</sub>√<sub>2)</sub>


2(3−√2)(b2<sub>+</sub>√<sub>2</sub><sub>−</sub><sub>1)</sub>


b3<sub>(</sub><sub>b</sub>2<sub>+12</sub><sub>−</sub><sub>8</sub>√<sub>2)</sub>


2(3−√2)(b2<sub>+</sub>√<sub>2</sub><sub>−</sub><sub>1)</sub>


b3<sub>(</sub><sub>b</sub>2<sub>+12</sub><sub>−</sub><sub>8</sub>√<sub>2)</sub>


(8√2−11)(7b2<sub>+16</sub>√<sub>2</sub><sub>−</sub><sub>20)</sub>


7b4<sub>(</sub><sub>b</sub>2<sub>+12</sub><sub>−</sub><sub>8</sub>√<sub>2)</sub>






 (2.39)


Khi đó, ta nhận được giá trị riêng nhỏ nhất của ma trận này là:
λmin(M(ξE∗(b), b)) =


17−2√2



b2<sub>(</sub><sub>b</sub>2 <sub>+ 12</sub><sub>−</sub><sub>8</sub>√<sub>2)</sub> =


</div>
<span class='text_page_counter'>(50)</span><div class='page_container' data-page=50>

Bây giờ chúng ta có thể so sánh kết quả trên chúng ta tìm được với ước
lượng β1 và β2 theo cách sau:


effi(ξ) =


eT<sub>i</sub> M−1(ξ, b)ei


eT<sub>i</sub> M−1<sub>(</sub><sub>ξ</sub>∗


ei, b)ei


!−1


với i = 1,2


Ta sẽ nhận được các kết quả sau:
eff<sub>1</sub>(ξ<sub>E</sub>∗(b)) =28(b


4<sub>(5</sub>√<sub>2</sub><sub>−</sub><sub>7) +</sub><sub>b</sub>2<sub>(34</sub>√<sub>2</sub><sub>−</sub><sub>48) + 396</sub><sub>−</sub><sub>280</sub>√<sub>2)</sub>


(8√2−11)(b2 <sub>−</sub><sub>8</sub>√<sub>2 + 12)(7</sub><sub>b</sub>2 <sub>+ 16</sub>√<sub>2</sub><sub>−</sub><sub>20)</sub>
eff2(ξE∗(b)) =


b4(√2−1) + (6√2−8)b2 + 68−48√2
(√2−1)(b2 <sub>−</sub><sub>8</sub>√<sub>2 + 12)(</sub><sub>b</sub>2 <sub>+ 6</sub>√<sub>2</sub><sub>−</sub><sub>8)</sub>


(2.40)



Ở đây, ta đưa ra con số trực quan hơn như sau:
0,9061 ≈ 4(5




2−7)


8√2−11 = blim→∞eff1(ξ


E(b))
6 eff1(ξE∗(b))


6 eff<sub>1</sub>(ξ<sub>E</sub>∗(−1)) ≈ 0,9595
0,9805 ≈ 59−41



2)


(√2−11)(13−8√2)(9−6√2) = eff2(ξ




E(−1))
6 eff2(ξE∗(b))
6 lim


b→∞eff1(ξ



</div>
<span class='text_page_counter'>(51)</span><div class='page_container' data-page=51>

2.3.2 Mơ hình 2:


Chúng ta tiếp tục cùng xem xét một mơ hình tối ưu dạng phân thức tiếp
theo dưới đây:


Y = a1 +
a2


t−b +ε, với t∈ [−1; 1] (2.41)
trong đó |b| > 1. Nó sẽ tương ứng với mơ hình hồi quy tuyến tính sau đây:


Y = β1 +
β2
t−b +


β3


(t−b)2 +ε, với t ∈ [−1; 1] (2.42)
Chúng ta dễ dàng tính được các điểm Chebyshev như ví dụ phần mơ
hình tuyến tính, để nhận được kết quả như sau:


s1 = −1
s2 =


1
b
s3 = 1


Và ta cũng sẽ tính được kết quả sau (giống ví dụ phần mơ hình tuyến


tính):


ξ<sub>E</sub>∗ =




−1 1<sub>b</sub> 1


w1 w2 w3


trong đó, các giá trị w1, w2 và w3 như sau:


w1 =
b+ 1


2 ·


2b7 −2b6 + 2b5 + 2b4 −4b3 −2b2 +b+ 2
4b8 <sub>−</sub><sub>4</sub><sub>b</sub>4 <sub>−</sub><sub>4</sub><sub>b</sub>2 <sub>+ 5</sub>


w2 =


(b2 −1)(2b6 + 2b4 −3
4b8 <sub>−</sub><sub>4</sub><sub>b</sub>4 <sub>−</sub><sub>4</sub><sub>b</sub>2 <sub>+ 5</sub>
w3 =


b−1
2 ·



2b7 + 2b6 + 2b5 −2b4 −4b3 + 2b2 +b−2
4b8 <sub>−</sub><sub>4</sub><sub>b</sub>4 <sub>−</sub><sub>4</sub><sub>b</sub>2 <sub>+ 5</sub>


Chúng ta tính được các hệ số của đa thức Chebyshev và nhận được kết
quả:


c∗ =






2b2 −1
4b(b2 −1)
2(b2 −1)2






</div>
<span class='text_page_counter'>(52)</span><div class='page_container' data-page=52>

ξ<sub>e</sub>∗<sub>1</sub> = −1


1


b 1


b(1+b)
2(2b2<sub>−</sub><sub>1)</sub>


b2−1


2b2<sub>−</sub><sub>1</sub>


b(b−1)
2(2b2<sub>−</sub><sub>1)</sub>


!


ξ<sub>e</sub>∗<sub>2</sub> =




−1 1<sub>b</sub> 1


1


8 ·(2 +
1


b


1
2


1


8 ·(2−
1


b



ξ<sub>e</sub>∗<sub>3</sub> =




−1 1<sub>b</sub> 1
−1


4
1
2


1
4




Ta dễ thấy rằng, khi |b| → ∞ thì cả ba ước lượng trên đều tiến tới giá
trị của ξ<sub>e</sub>∗<sub>3</sub>, là ước lượng tương ứng với β3.


Để so sánh, ta có các giá trị effi(ξE∗, b) với i = 1,2,3 được vẽ trên hình


như sau đây:


Tính đúng đắn của các ước lượng ξ∗(b) vớib∈[2; 4]. Nét liền là eff<sub>1</sub>(ξ∗(b)), nét gạch là
eff<sub>2</sub>(ξ∗(b)), nét chấm là eff<sub>3</sub>(ξ∗(b))


</div>
<span class='text_page_counter'>(53)</span><div class='page_container' data-page=53>

2.4 Lưu đồ mơ hình thuật tốn:


Các bước tính tốn có thể được thực hiện như sau (khi mơ hình đưa


đầu tiên không thỏa mãn yêu cầu):




-1. Nhập vào vector x và σ2.


2. Tính ma trận MMM theo cơng thức (1.8).


3. Tính ma trận hiệp biến DDD(θ) theo cơng thức (1.10).ˆ


</div>
<span class='text_page_counter'>(54)</span><div class='page_container' data-page=54>

3


CHƯƠNG III:CHƯƠNG III:CHƯƠNG III: Bài toán thực tế


3.1 Bài tốn 1


Cá rơ biển (Pristolepis fasciata) là lồi cá ni có giá trị cao.


Cá giống thường được ni trong các trại cá giống. Trong quá trình sinh
trưởng của cá, chúng ta cần thay đổi một số tác nhân từ môi trường để
giúp cá phát triển tốt hơn. Trong thí nghiệm sau đây, chúng ta sẽ thay
đổi chỉ số oxy của môi trường nước nhằm giúp cá con phát triển tốt nhất,
nhưng cũng đồng thời giảm tối đa chi phí mua oxy.


Ở đây, chúng ta cần phải tìm hiểu về lượng oxy mà cá con tiêu hao
trong quá trình sinh trưởng.


</div>
<span class='text_page_counter'>(55)</span><div class='page_container' data-page=55>

3.1.1 Thí nghiệm ban đầu


Dựa trên kinh nghiệm thực nghiệm trong quá khứ, chúng ta có thể xác


định được cá rơ biển cũng có lượng tiêu hao oxy theo quá trình sinh trưởng
là một đường cong dạng hyperbola (bậc của mẫu số là 1).


Ngoài ra, chúng ta khơng biết được thêm các thơng số khác.


Vì vậy, khi làm các thí nghiệm ban đầu (chưa có giá trị nào để ước
lượng) thì cách làm thí nghiệm cơ bản nhất là làm một số lượng nhỏ các
thí nghiệm, và dàn đều các thí nghiệm này ra. Ở đây, chúng ta thí nghiệm
theo thời gian cách quãng bằng nhau.


Ngày tuổi 10 20 30
Oxy tiêu hao 1.42 0.47 0.26


Sai số 0.18 0.07 0.01


</div>
<span class='text_page_counter'>(56)</span><div class='page_container' data-page=56>

3.1.2 Mơ hình hóa bài toán


Các giá trị đầu vào là số ngày tuổi. Khi đó, ta có:
x =


x1
x2
x3


!


=
10
20


30


!


và các phương sai:


σ2 =






σ<sub>1</sub>2
σ<sub>2</sub>2
σ<sub>3</sub>2




 =


0,0324
0,0049
0,0001


!


Áp dụng công thức cho hàm dạng phân thức hữu tỷ, ta có hàm cần xác
định:


y = a



x+b +ε


</div>
<span class='text_page_counter'>(57)</span><div class='page_container' data-page=57>

3.1.3 Giải bài tốn


Theo cách giải thơng thường với các thơng số đã có, ta có thể tính được
hàm số của sự phụ thuộc giữa lượng oxy tiêu hoa và số ngày tuổi của cá.


y = f1(x) =


0.845


x−0,432 −0,069 (3.1)
Từ kết quả thu được, ta có thể so sánh với thực nghiệm thực tế.


So sánh giữa cơng thức tính tốn được và thí nghiệm thực tế.


Ta nhận thấy hàm số tìm được không thực tế trong khoảng thời gian 0
ngày tuổi tới 10 ngày tuổi.


</div>
<span class='text_page_counter'>(58)</span><div class='page_container' data-page=58>

Bây giờ ta sẽ tìm bằng các phân tích tốn học để biết, tiếp theo ta nên
thí nghiệm tại đâu là tốt nhất.


Dựa trên các thơng số trên, ta có thể đưa ra cách tính cho bài tốn tối
ưu như sau:


y = a


x−b + ε (3.2)



trong đó, phương sai là:


σ2 =






σ<sub>1</sub>2
σ<sub>2</sub>2
σ<sub>3</sub>2




 =


0,0324
0,0049
0,0001


!


Sử dụng MathCad, ta tính được ma trận hiệp biến theo cơng thức, ta
được:


D =




0,028 −9,275.10−4


−9,275.10−4 3,119.10−5




</div>
<span class='text_page_counter'>(59)</span><div class='page_container' data-page=59>

3.1.4 Tổ chức thêm thí nghiệm lần thứ 2:


Ta sẽ làm thêm thí nghiệm tại thời điểm 1 ngày tuổi của cá.


Kết quả thu được ở bảng sau:
Ngày tuổi 1 10 20 30
Oxy tiêu hao 2.64 1.42 0.47 0.26


Sai số 0.04 0.18 0.07 0.01


-3.1.5 Mơ hình hóa và giải lần thứ 2


Một lần nữa chúng ta lại mơ hình hóa bài tốn với các thông số mới. Các
giá trị đầu vào là của vectơ x, tương ứng với số ngày tuổi của cá: Các giá
trị đầu vào là số ngày tuổi. Khi đó, ta có:


x =







x1
x2


x3
x4





 =







1
10
20
30







Bằng bảng kết quả thí nghiệm trên, ta có thể tìm được cơng thức mới
thể hiện sự phụ thuộc của lượng oxy tiêu hao theo ngày tuổi của cá:


y = f2(x) =


67,115



x+ 16,563 −1,181 (3.3)


So sánh giữa công thức tính tốn được và thí nghiệm thực tế.


</div>
<span class='text_page_counter'>(60)</span><div class='page_container' data-page=60>

So sánh giữa công thức (3.3) với công thức (3.1):


Chúng ta làm thêm 1 thí nghiệm để kiểm chứng kết quả tính tốn được.
Thí nghiệm được làm vào thời điểm cá con được 5 ngày tuổi.


Ngày tuổi 1 5 10 20 30


Thực tế 2,64 2,25 1,42 0,47 0,26
Mơ hình (3.1) -2,614 12,357 1,419 0,470 0,260
Mơ hình (3.3) 2,640 1,932 1,346 0,655 0,260


</div>
<span class='text_page_counter'>(61)</span><div class='page_container' data-page=61>

3.2 Bài toán 2


Cũng với lồi cá rơ biển (pristolepis fasciata) như của bài tốn 1.


Ở đây, chúng ta cần phải tìm hiểu về ngưỡng oxy mà tại đó có thể gây
chết cá con trong q trình sinh trưởng. Ngưỡng gây chết được tính khi
có 50% số cá con chết.


</div>
<span class='text_page_counter'>(62)</span><div class='page_container' data-page=62>

3.2.1 Thí nghiệm ban đầu


Vẫn dựa trên kinh nghiệm thực tế, chúng ta cũng có thể xác định được cá
rơ biển có ngưỡng oxy theo quá trình sinh trưởng là một đường cong dạng
hyperbola (bậc của mẫu số là 1).


Vì vậy, cũng như bài tốn thứ nhất, khi làm các thí nghiệm ban đầu


(chưa có giá trị nào để ước lượng) thì cách làm thí nghiệm cơ bản nhất là
làm một số lượng nhỏ các thí nghiệm, và dàn đều các thí nghiệm này ra.
Ở đây, chúng ta thí nghiệm theo thời gian cách quãng bằng nhau.


Ngày tuổi 10 20 30
Ngưỡng oxy 0.69 0.64 0.54


Sai số 0.02 0.02 0.11


</div>
<span class='text_page_counter'>(63)</span><div class='page_container' data-page=63>

3.2.2 Mô hình hóa bài tốn


Các giá trị đầu vào là số ngày tuổi. Khi đó, ta có:
x =


x1
x2
x3


!


=
10
20
30


!


Hàm cần xác định có dạng sau:
y = a



x+b +ε


</div>
<span class='text_page_counter'>(64)</span><div class='page_container' data-page=64>

3.2.3 Giải bài tốn


Theo cách giải thơng thường với các thơng số đã có, ta có thể tính được
hàm số của dự phụ thuộc giữa ngưỡng oxy và số ngày tuổi của cá.


y = f3(x) =


0.845


x−0,432 −0,069 (3.4)
Từ kết quả thu được, ta có thể so sánh với thực nghiệm thực tế.


So sánh giữa cơng thức tính tốn được và thí nghiệm thực tế.


</div>
<span class='text_page_counter'>(65)</span><div class='page_container' data-page=65>

Bây giờ ta sẽ tìm bằng các phân tích tốn học để biết, tiếp theo ta nên
thí nghiệm tại đâu là tốt nhất.


Dựa trên các thơng số trên, ta có thể đưa ra cách tính cho bài toán tối
ưu như sau:


y = a


x−b + ε (3.5)


trong đó, phương sai là:


σ2 =







σ<sub>1</sub>2
σ<sub>2</sub>2
σ<sub>3</sub>2




 =





0,0004
0,0004
0,0121







Ta tính được ma trận hiệp biến theo công thức (2.3), ta được:
D =





1,888.10−3 −0,023
−0,023 0,306




</div>
<span class='text_page_counter'>(66)</span><div class='page_container' data-page=66>

3.2.4 Tổ chức thêm thí nghiệm lần thứ 2:


Ta sẽ làm thêm thí nghiệm tại thời điểm 1 ngày tuổi của cá.


Kết quả thu được ở bảng sau:
Ngày tuổi 1 10 20 30
Oxy tiêu hao 0,80 0,69 0,64 0,54


Sai số 0,02 0,02 0,02 0,11


-3.2.5 Mơ hình hóa và giải lần thứ 2


Một lần nữa chúng ta lại mơ hình hóa bài tốn với các thơng số mới. Các
giá trị đầu vào là của vectơ x, tương ứng với số ngày tuổi của cá: Các giá
trị đầu vào là số ngày tuổi. Khi đó, ta có:


x =








x1
x2
x3
x4





 =







1
10
20
30







Bằng bảng kết quả thí nghiệm trên, ta có thể tìm được công thức mới
thể hiện sự phụ thuộc của lượng oxy tiêu hao theo ngày tuổi của cá:


y = f4(x) =



3,561


x+ 12,154 + 0,529 (3.6)


So sánh giữa cơng thức tính tốn được và thí nghiệm thực tế.


</div>
<span class='text_page_counter'>(67)</span><div class='page_container' data-page=67>

So sánh giữa công thức (3.6) với công thức (3.4):


Chúng ta làm thêm 1 thí nghiệm để kiểm chứng kết quả tính tốn được.
Thí nghiệm được làm vào thời điểm cá con được 5 ngày tuổi.


Ngày tuổi 1 5 10 20 30


Thực tế 0,80 0,74 0,69 0,64 0,54
Mơ hình (3.4) 0,806 0,755 0,700 0,610 0,540
Mơ hình (3.6) 0,800 0,737 0,690 0,640 0,613


</div>
<span class='text_page_counter'>(68)</span><div class='page_container' data-page=68>

KẾT LUẬN


Trong luận văn này, học viên đã đạt được những kết quả sau:


1. Nêu tổng quan và tính thời sự của quy hoạch thực nghiệm tối ưu.
2. Chứng minh lý thuyết. Xây dựng thuật toán.


3. Áp dụng vào bài tốn thực tế.


Hướng phát triển:


Luận văn có thể phát triển tiếp tục với các dạng hàm phức tạp hơn (như
dạng hàm mũ, v.v. . . ).



Trong thí nghiệm độc tố trên chuột của Becka and U rf er (1996), các
tác giả đã sử dụng hàm số dạng a1eb1t +a2eb2t.


</div>

<!--links-->

×