Tải bản đầy đủ (.pdf) (75 trang)

Thiết kế mặt đáp ứng 3 mức với tính chất hiệu ứng bậc hai trực giao

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.31 MB, 75 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Phạm Đình Tùng

THIẾT KẾ MẶT ĐÁP ỨNG 3-MỨC VỚI
TÍNH CHẤT HIỆU ỨNG BẬC HAI TRỰC GIAO

LUẬN ÁN TIẾN SĨ TOÁN HỌC

Hà Nội - 2016


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Phạm Đình Tùng

THIẾT KẾ MẶT ĐÁP ỨNG 3-MỨC VỚI
TÍNH CHẤT HIỆU ỨNG BẬC HAI TRỰC GIAO

Chuyên ngành: Lý thuyết xác suất và Thống kê Toán học
Mã số: 62 46 01 06

LUẬN ÁN TIẾN SĨ TOÁN HỌC

Người hướng dẫn khoa học:
TS. NGUYỄN KỲ NAM
GS.TS. NGUYỄN HỮU DƯ

Hà Nội - 2016




Lời cam đoan
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số
liệu, kết quả trình bày trong luận án là trung thực và chưa từng được ai công bố
trong bất kỳ công trình nào khác.
Nghiên cứu sinh

Phạm Đình Tùng

1


Lời cảm ơn
Luận án này được thực hiện và hoàn thành dưới sự hướng dẫn khoa học của
TS. Nguyễn Kỳ Nam và GS.TS. Nguyễn Hữu Dư, hai người thầy vô cùng mẫu
mực, đã tận tình giúp đỡ tôi trên con đường khoa học. Hai thầy đã dìu dắt tôi
trên con đường toán học, đưa tôi bước vào một lĩnh vực toán học đầy thú vị,
luôn tạo ra những thử thách giúp tôi tự học hỏi, tìm tòi và sáng tạo, đó là những
gì tôi may mắn được tiếp nhận từ hai người thầy đáng kính của mình. Tôi xin
bày tỏ lòng biết ơn sâu sắc đến hai thầy.
Trong quá trình học tập nghiên cứu để hoàn thành luận án, tôi đã nhận được
rất nhiều sự giúp đỡ quý báu của các thầy cô trong Bộ môn Xác suất Thống kê
và trong Khoa Toán-Cơ-Tin học, Trường Đại học Khoa học Tự Nhiên-ĐHQG
Hà Nội. Tôi xin trân trọng sự giúp đỡ của các thầy cô.
Tôi muốn bày tỏ sự cảm ơn chân thành đến Ban Giám hiệu, Ban Chủ nhiệm
Khoa Toán-Cơ-Tin học, Phòng sau đại học và các phòng ban chức năng của
Trường Đại học Khoa học Tự Nhiên-ĐHQG Hà Nội đã tạo điều kiện thuận lợi
cho tôi học tập và nghiên cứu.
Tôi cũng xin bày tỏ lòng biết ơn đến gia đình và toàn thể bạn bè đã luôn

khuyến khích, động viên để tôi vững bước trên con đường toán học mình đã
chọn.

2


Mục lục
Trang
Lời cam đoan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

Lời cảm ơn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

Thuật ngữ Anh Việt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

Danh mục các ký hiệu và chữ viết tắt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8

Danh mục các bảng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

Danh mục các hình vẽ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


11

Mở đầu

.............................................................

12

Chương 1. Giới thiệu phương pháp bề mặt đáp ứng . . . . . . . . . . . . . . . . . . . . . . . . . .

17

1.1. Thiết kế thí nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

1.2. Phương pháp bề mặt đáp ứng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

1.2.1. Mô hình bề mặt đáp ứng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

1.2.2. Tối ưu bề mặt đáp ứng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

1.2.3. Thiết kế thí nghiệm phù hợp mô hình bề mặt đáp ứng . . . . . . .


23

1.3. Thí nghiệm sinh tổng hợp enzym Lipase . . . . . . . . . . . . . . . . . . . . . . . .

26

Chương 2. Thiết kế Box-Behnken nhỏ với nhóm trực giao . . . . . . . . . . . . . . . . . . . . .

32

2.1. Thiết kế Box-Behnken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

2.2. Thiết kế nhóm không đầy đủ với cỡ nhóm khác nhau . . . . . . . . . . . . .

34

2.3. Phương pháp xây dựng thiết kế Box-Behnken nhỏ . . . . . . . . . . . . . . .

36

2.4. Thiết kế Box-Behnken nhỏ mới với các nhóm trực giao . . . . . . . . . . .

38

2.5. Chia nhóm trực giao của các thiết kế bậc hai dựa trên IBD . . . . . . . .

40


2.6. Kết luận chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41

3


Chương 3. Thiết kế ước lượng tương đương SPLIT-PLOT . . . . . . . . . . . . . . . . . . . .

42

3.1. Thiết kế SPLIT-PLOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

3.2. Mô hình bề mặt đáp ứng cho thiết kế SPLIT-PLOT tổng quát . . . . .

45

3.3. Cấu trúc mong muốn của ma trận thông tin của SPD . . . . . . . . . . . . .

46

3.4. Thuật toán SPLIT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

3.5. Kết quả và đánh giá. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50


3.5.1. Các ví dụ minh chứng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

3.5.2. Kết quả tính toán . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

3.6. Kết luận chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

57

Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

Danh mục công trình khoa học của tác giả liên quan đến luận án

......

62

Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63

Phụ lục

73


.............................................................

4


Thuật ngữ anh việt
Augmented-Pair Design

Thiết kế tăng cặp

Balanced Incomplete Block Design

Thiết kế nhóm không đầy đủ và cân bằng

Block

Nhóm

Block Effect

Hiệu ứng nhóm

Blocking Factor

Nhân tố chia nhóm

Box-Behnken Design

Thiết kế Box-Behnken


Box-Plot

Đồ thị hộp ria mèo

Balanced Lattice

Lưới cân bằng

Center Point/Run

Điểm tâm

Central Composite Design

Thiết kế tổng hợp trung tâm

Concurrence Matrix

Ma trận lặp lại

Coordinate-exchange Algorithm

Thuật toán đổi tọa độ

Contour Plot

Đồ thị đường vòng

Cyclic


Tuần hoàn

Design Matrix

Ma trận thiết kế

D-optimal

D-tối ưu

D-efficient

D-hiệu quả

Easy-to-Change Factor

Nhân tố dễ thay đổi mức giá trị

Effect

Hiệu ứng

Equivalent-Estimation Split- Plot Design Thiết kế ước lượng tương đương SPLIT-PLOT
Expanded Design Matrix

Ma trận thiết kế mở rộng

Experimental Region


Miền thí nghiệm

Factor

Nhân tố

Factorial Design

Thiết kế nhân tố.

Fractional Factorial Design

Thiết kế một phần nhân tố

First-order Model

Mô hình đa thức bậc một

First-order Orthogonal Design

Thiết kế bậc một trực giao

Generalized Least Square Method

Phương pháp bình phương tối thiểu tổng quát

Hard-to-Change Factor

Nhân tố khó thay đổi mức giá trị


5


Incomplete Block Design

Thiết kế nhóm không đầy đủ

Interaction Effect

Hiệu ứng tương tác

Interchange Algorithm

Thuật toán hoán đổi

Intrablock

Trong nhóm

Main/First-order Effect

Hiệu ứng chính hoặc hiệu ứng bậc một

Least Square Method

Phương pháp bình phương tối thiểu

Level

Mức giá trị


Orthogonal Quadratic Effect Property

Tính chất hiệu ứng bậc hai trực giao

Orthogonal Block

Nhóm trực giao

Partial Balanced Incomplete Block Design Thiết kế nhóm không đầy đủ và bán cân bằng
Placket-Burman Design

Thiết kế Placket-Burman

Point-exchange Algorithm

Thuật toán hoán đổi điểm

Quadratic Effect

Hiệu ứng bậc hai

Qualitative

Định tính

Quantitative

Định lượng


Randomization

Ngẫu nhiên hóa

Regression Technique

Kỹ thuật hồi quy

Regular Graph Design

Thiết kế đồ thị chính quy

Replicate Set

Nhóm lặp lại

Replication

Lặp lại các phép thử

Resolvable

Tách được

Response

Biến đáp ứng

Response Function


Hàm đáp ứng

Resovable Incomplete Block Design

Thiết kế nhóm không đầy đủ tách được

Response Surface Design

Thiết kế bề mặt đáp ứng

Response Surface Model

Mô hình bề mặt đáp ứng

Response Surface Methodology

Phương pháp bề mặt đáp ứng

Rotatability

Tính xoay quanh

Robust

Tính vững

Run

Phép thử của thí nghiệm


Runs

Số phép thử của thí nghiệm

6


Screening Design

Thiết kế sàng lọc

Second-order Design

Thiết kế bậc hai

Second-order Split-Plot Design Thiết kế SPLIT-PLOT bậc hai
Second-order Model

Mô hình đa thức bậc hai

Small Composite Design

Thiết kế tổng hợp nhỏ

Stationary Point

Điểm dừng

Surface Plot


Đồ thị bề mặt

Subset Design

Thiết kế tập con

Supplementary Set Design

Thiết kế tập phần phụ

Split-Plot Design

Thiết kế SPLIT-PLOT

Sub-Plot

Ô nhỏ

Try

Lần thử

Trial and Error

Thử và sai

Whole-Plot

Ô lớn


White Noise

Nhiễu trắng

7


Danh mục các ký hiệu và
chữ viết tắt
APD

Thiết kế tăng cặp.

BBD

Thiết kế Box-Behnken.

BIBD

Thiết kế nhóm không đầy đủ và cân bằng.

CCD

Thiết kế tổng hợp trung tâm.

EE-SPD Thiết kế ước lượng tương đương SPLIT-PLOT.
ETC

Dễ thay đổi mức giá trị.


FD

Thiết kế nhân tố đầy đủ.

FFD

Thiết kế một phần nhân tố đầy đủ

GLS

Bình phương tối thiểu tổng quát

HTC

Khó thay đổi mức giá trị.

IBD

Thiết kế nhóm không đầy đủ.

OLS

Bình phương tối thiểu thông thường

PBD

Thiết kế Placket-Burman.

PBIBD


Thiết kế nhóm không đầy đủ và bán cân bằng

RGD

Thiết kế đồ thị chính quy

RSD

Thiết kế bề mặt đáp ứng

RSM

Phương pháp bề mặt đáp ứng

SCD

Thiết kế trung tâm nhỏ.

SBBD

Thiết kế Box-Behnken nhỏ

SPD

Thiết kế SPLIT-PLOT.

8


Danh mục các bảng

Chương 1.

1.1
1.2
1.3
1.4
1.5
1.6

Các thiết kế thí nghiệm cho mô hình đa thức bậc một. . . . . . . . .
Các thiết kế thí nghiệm cho bốn nhân tố 3-mức trong mô hình
đa thức bậc hai. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Các nhân tố trong thí nghiệm sinh tổng hợp Lipase . . . . . . . . .
Mã hóa các mức giá trị của ba nhân tố ảnh hưởng chính đến Lipase
Kết quả thực hiện thí nghiệm bằng CCD . . . . . . . . . . . . . . .
Phân tích ANOVA cho mô hình đa thức bậc hai . . . . . . . . . . .

. 23
. 25
. 27
. 27
. 28
. 29

Chương 2.

2.1
2.2

Các chỉ số của SBBD. . . . . . . . . . . . . . . . . . . . . . . . . . . 39

Số phép thử thí nghiệm của các thiết kế chia nhóm trực giaoa . . . . 39
Chương 3.

3.1
3.2
3.3
3.4
3.5
3.6

Hai EE-SPD cho một nhân tố WP và hai nhân tố SP trong các ô
lớn cỡ năm† . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Các bước thuật toán SPLIT tạo ra EE-SPD cho trường hợp 25†(một
nhân tố WP và hai nhân tố SP trong năm ô lớn cỡ ba) . . . . . . . .
Ba SPD cho thí nghiệm độ chịu lực của ống gốm: EE-SPD* dựa
trên CCD, EE-SPD* tạo bởi SPLIT và SPD D-tối ưu† . . . . . . . .
Thiết kế EE-SPD của JG và EE-SPD* của SPLIT cho trường
hợp 48 (một nhân tố WP và ba nhân tố SP)† . . . . . . . . . . . . .
Thiết kế EE-SPD của JG và SPLIT cho trường hợp 94 (hai nhân
tố WP và hai nhân tố SP trong 10 ô lớn cỡ ba)† . . . . . . . . . . .
Thiết kế EE-SPD của JG và EE-SPD* của SPLIT cho trường
hợp 109 (hai nhân tố WP và ba nhân tố SP trong tám ô lớn cỡ sáu)†

9

. 44
. 51
. 52
. 53
. 55

. 56


3.7

Các chỉ số Deff của các thiết kế EE-SPD của JG và SPLIT cho
25 trường hợp trong đó SPLIT cho kết quả tốt hơn. . . . . . . . . . . 58

10


Danh mục các hình vẽ
Chương 1.

1.1
1.2
1.3

Quá trình thực hiện thí nghiệm liên tiếp . . . . . . . . . . . . . . . . . 18
Bề mặt đáp ứng biểu diễn lượng Lipase theo ba nhân tố cắt tại
điểm dừng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Đồ thị đường vòng biểu diễn lượng Lipase theo ba nhân tố cắt
tại điểm dừng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Chương 3.

3.1

Đồ thị hộp ria mèo cho tỷ số tương đối giữa mức độ D−hiệu quả
của thiết kế từ SPLIT và JG . . . . . . . . . . . . . . . . . . . . . . . 54


11


Mở đầu
Thiết kế thí nghiệm (Experimental Design) được sử dụng rộng rãi bởi các nhà

phân tích với mục đích kiểm soát các nhân tố quan trọng trong việc mô tả hoặc
giải thích kết quả đầu ra của thí nghiệm. Nó ra đời từ năm 1930 bắt nguồn từ
những nghiên cứu của nhà thống kê R. A. Fisher tại trung tâm thí nghiệm nông
học Rothamsted, Vương Quốc Anh. Những đóng góp quý báu của ông cùng với
F. Yates và D. J. Finney là đã đưa ra nhiều bài toán trong nông nghiệp và sinh
học. Những thập kỷ tiếp theo, gắn liền với sự phát triển của công nghiệp, G. E.
P. Box và đồng nghiệp đã phát triển các kỹ thuật trước đó để phù hợp với các bài
toán trong công nghệ hóa học. Trong những năm gần đây chứng kiến sự phát
triển mạnh mẽ việc sử dụng các thiết kế thí nghiệm trong công nghiệp, nông
nghiệp, kinh tế (marketing, dịch vụ tài chính) và khoa học trong cuộc sống.
Chính sự cần thiết của thiết kế thí nghiệm là động lực nghiên cứu cho các nhà
khoa học xây dựng nhiều loại thiết kế với các tiêu chí cụ thể. Nhiều gói phần
mềm máy tính được đưa ra cho người làm thí nghiệm chọn lựa theo các tiêu chí
của bài toán thực tế.
Phương pháp bề mặt đáp ứng (Response Surface Methodology hoặc RSM)
nghiên cứu sự phụ thuộc của biến đầu ra hay biến đáp ứng (response) y vào các
giá trị x1 , · · · , xm của m nhân tố (factor) đầu vào trong thí nghiệm dưới dạng
y = f (x1 , · · · , xm ) + ε . Hàm hồi quy biểu diễn mối quan hệ này là chưa biết và
được xấp xỉ bởi hàm đa thức trong khai triển Taylor trên miền được giới hạn hay
còn gọi là miền thí nghiệm (experimental region).
Nếu sử dụng hàm đa thức bậc một để xấp xỉ ta nhận được mô hình đa thức bậc
một (first-order model)
m


y = β0 + ∑ βi xi + ε.

(1)

i=1

Trong trường hợp sử dụng hàm đa thức bậc hai, mô hình đa thức bậc hai
12


(second-order model) được biểu diễn dưới dạng
m

m

m−1

y = β0 + ∑ βii xi2 + ∑ βi xi +
i=1

i=1

m

∑ ∑

βi j xi x j + ε,

(2)


i=1 j=i+1

trong (1) và (2) ε là nhiễu trắng, βi , i = 1, · · · , m là các hiệu ứng chính hoặc hiệu
ứng bậc một (main effect hoặc first-order effect) đánh giá ảnh hưởng của các
nhân tố, βii , i = 1, · · · , m là các hiệu ứng bậc hai (quadratic effect) chỉ ra sự ảnh
hưởng của bình phương nhân tố và βi j , i = 1, · · · , m − 1, j = i + 1, · · · , m là các
hiệu ứng tương tác (interaction effect) chỉ ra ảnh hưởng giữa nhân tố thứ i và thứ
j.
Trong mô hình bề mặt đáp ứng, các giá trị của biến đầu ra y được quan sát
thông qua việc thực hiện n phép thử (run) trên các mức giá trị (level) của các nhân
tố dưới dạng ma trận gồm n hàng và m cột, trong đó mỗi hàng tương ứng với
một phép thử là một tổ hợp các mức giá trị của m nhân tố. Nếu m nhân tố trong
thí nghiệm được thực hiện ở 2-mức giá trị thì 2 mức giá trị này thường được mã
hóa dưới dạng −1 và 1 và nếu m nhân tố có 3-mức giá trị thì nó thường được mã
hóa dưới dạng −1, 0 và 1. Khi đó n phép thử được thiết kế dưới dạng ma trận thiết
kế (design matrix) D cỡ n × m gồm các hàng (xu1 , xu2 , · · · , xum ), u = 1, ..., n. Ma
trận thiết kế mở rộng (expanded design matrix) X của mô hình đa thức bậc hai với
2 , x , ··· , x , x x , ··· , x
n hàng và p = 21 (m + 1)(m + 2) cột (1, x12 , · · · , xm
m
1
1 2
m−1 xm )
nhận được từ D dùng để ước lượng p hệ số của mô hình bằng phương pháp bình
phương tối thiểu thông thường (ordinary least square hoặc OLS) hoặc phương pháp
bình phương tối thiểu tổng quát (generalized least square hoặc GLS).
Các thiết kế cho mô hình bề mặt đáp ứng hay còn gọi là thiết kế bề mặt đáp
ứng (response surface design hoặc RSD) phải thỏa mãn một trong các tiêu chí
sau (xem mục 7.1 Meyer & Montgomery [32]):
1. Đưa ra phân bố hợp lý về các biến đáp ứng trong miền quan tâm (region of

interest) và phù hợp với mô hình.
2. Các phép thử thí nghiệm có thể chia nhóm được.
3. Đưa ra ước lượng sai số, ước lượng chính xác hệ số của mô hình và mô tả
tốt sự thay đổi của phương sai dự báo var(y(
ˆ x)) trong miền thí nghiệm.
4. Thiết kế có tính vững (robust) đối với các giá trị ngoại biên hoặc giá trị bị
13


mất.
5. Thiết kế không yêu cầu quá nhiều phép thử thí nghiệm và nhiều mức giá trị
cho các nhân tố.
6. Đảm bảo tính toán đơn giản, dễ giải thích mô hình.
Tuy nhiên, để tìm ra thiết kế thỏa mãn đồng thời tất các tiêu chí trên là không
thể, ví dụ tiêu chí 1 và 5 không thể cùng đạt được do 1 cần thêm càng nhiều phép
thử càng tốt. Vì vậy, mỗi bài toán tìm thiết kế thí nghiệm chỉ tập trung vào một
số tiêu chí nhất định. Ví dụ ở tiêu chí 3, người ta thường xem xét các thiết kế
dựa trên các tiêu chuẩn D−tối ưu (cực đại định thức của ma trận thông tin trong
var(y(
ˆ x))), G−tối ưu (cực tiểu giá trị lớn nhất của phương sai dự báo), A−tối ưu
(cực tiểu vết của ma trận nghịch đảo của ma trận thông tin) và I−tối ưu (cực tiểu
trung bình phương sai dự báo).
Dưới đây là các thiết kế thông dụng đáp ứng một số tiêu chí trên bao gồm:
(i) Các thiết kế cho các nhân tố với 2-mức giá trị phổ biến là: thiết kế nhân tố
(Factorial Design hoặc FD) 2m , thiết kế một phần nhân tố (Fractional Factorial
Design hoặc FFD) 2m−k và thiết kế Placket-Burman (Placket-Burman Design
hoặc PBD).
(ii) Các thiết kế cho các nhân tố với 3-mức giá trị phổ biến là: Thiết kế tổng
hợp trung tâm (Central Composite Design hoặc CCD), thiết kế tổng hợp nhỏ
(Small Composite Design hoặc SCD), thiết kế Box-Behnken (Box-Behnken

Design hoặc BBD), thiết kế tăng cặp (Augmented-Pair Design hoặc APD).
(iii) Thiết kế SPLIT-PLOT (Split-Plot Design hoặc SPD) là thiết kế khi xuất hiện
các nhân tố khó thay đổi giá trị (Hard-to-Change hoặc HTC factor) và nhân tố
dễ dàng thay đổi giá trị (Easy-to-Change hoặc ETC factor) do điều kiện kinh
tế và thời gian.
Trong thời gian gần đây, các hướng nghiên cứu về thiết kế bề mặt đáp ứng
tập trung chủ yếu theo các hướng sau:
(i) Giảm số phép thử thí nghiệm mà vẫn không làm thay đổi nhiều về D−hiệu
quả (D−efficience) và các tính chất khác. Các kết quả này được công bố
trong Draper & Lin [15], Morris [30], Nguyen & Borkowski [36], Nguyen
& Lin [37], Dey [13] và Nguyen & Dey [35].
14


(ii) Phát triển, tìm kiếm các thiết kế SPLIT-PLOT D−hiệu quả cho các thí
nghiệm có nhân tố HTC và ETC. Các kết quả này được công bố trong
Vinning et al. [49], Parker et al. [43, 44], Macharia & Goos [31], Jones &
Goos [25] và Mylonal et al. [34].
(iii) Phát triển các thiết kế sàng lọc xác định (definitive screening design) cho
mô hình bề mặt đáp ứng chỉ gồm các hiệu ứng chính và hiệu ứng bậc hai.
Các kết quả mới được công bố trong Jones & Nachtsheim [27], Stylianou
[46], Xiao et al. [51] và Nguyen & Stylianou [40].
Theo hai hướng nghiên cứu đầu tiên, nội dung chính của luận án là nghiên
cứu bài toán tìm thiết kế bề mặt đáp ứng 3-mức tối ưu theo các tiêu chí 2, 3, 5
và 6. Các thiết kế sẽ có (i) tính chất hiệu ứng bậc hai trực giao, (ii) chia nhóm
được và tối ưu theo chỉ số Deff . Trong bài toán này chúng tôi xét các nhân tố với
3-mức giá trị vì nó là số mức bé nhất phù hợp với mô hình đa thức bậc hai và
sẽ làm số phép thử thí nghiệm giảm so với trường hợp thí nghiệm nhiều hơn 3
mức. Tiêu chuẩn D−tối ưu được sử dụng trong luận án cũng rất phổ biến trong
các công trình nghiên cứu về thiết kế thí nghiệm vì nó dễ dàng tính hơn các tiêu

chuẩn khác như I−tối ưu, A−tối ưu, ... Ngoài ra, một thiết kế là D−tối ưu thì
cũng gần tối ưu theo một số tiêu chuẩn khác (xem Wong [50] và Cornell [11]).
Kết quả chính của luận án là:
(i) Thiết lập các thiết kế mặt đáp 3-mức có tính chất hiệu ứng trực giao cải tiến
các thiết kế cổ điển Box-Behnken bằng cách sử dụng các thiết kế nhóm không
đầy đủ (incomplete block design hoặc IBD). Các thiết kế Box-Behnken mới
vẫn giữ nguyên các tính chất của thiết kế Box-Behnken cổ điển. Hơn thế
nữa các thiết kế mới này có số phép thử của thí nghiệm (runs) ít hơn BBD và
có thể chia nhóm trực giao.
(ii) Một thuật toán để xây dựng các SPD có tính chất ước lượng tương đương
và tính chất hiệu ứng bậc hai trực giao. Với thuật toán này, các thiết kế mới
cải tiến một số lượng lớn các thiết kế cũ theo tiêu chuẩn chỉ số Deff , các mức
giá trị nguyên và tính chất hiệu ứng bậc hai trực giao.
Các thiết kế mới của chúng tôi đóng góp vào tập hợp các thiết kế cho các người
làm thí nghiệm giải quyết các bài toán thực tế.
Ngoài phần mở đầu, kết luận, danh mục công trình và tài liệu tham khảo,
luận án bao gồm 3 chương
15


• Chương 1: Trình bày một số kiến thức về thiết kế thí nghiệm và tập trung

giới thiệu phương pháp bề mặt đáp ứng gồm mô hình bề mặt đáp ứng, thiết
kế D-tối ưu (D-optimal) và một số thiết kế bề mặt đáp ứng phù hợp với mô
hình.
• Chương 2: Trình bày về thiết kế Box-Behnken và xây dựng thiết kế mới dạng

Box-Behnken từ thiết kế nhóm không đầy đủ có số phép thử thí nghiệm ít
hơn mà vẫn giữ nguyên các tính chất của thiết kế Box-Behnken.
• Chương 3: Trình bày về thiết kế SPLIT-PLOT và thiết kế ước lượng tương


đương SPLIT-PLOT (Equivalent-Estimation Split-Plot Design hoặc EE-SPD).

Các SPD mới được xây dựng bằng thuật toán SPLIT có tính chất ước lượng
tương đương, hiệu ứng bậc hai trực giao và D-hiệu quả (D-efficient).
Luận án có sử dụng các mô đun IBD, CIBD và CUT trong phần mềm Gendex của TS. Nguyễn Kỳ Nam ( và lập
trình tính toán theo ngôn ngữ Java.
Hà Nội, năm 2016
Nghiên cứu sinh

Phạm Đình Tùng

16


Chương 1

Giới thiệu phương pháp bề
mặt đáp ứng
Trong chương này, chúng tôi trình bày khái niệm về thiết kế thí nghiệm, và
tập trung giới thiệu về phương pháp bề mặt đáp ứng trong thiết kế thí nghiệm.
Chúng tôi đưa ra mô hình, tiêu chuẩn D-tối ưu và các thiết kế phù hợp với mô
hình. Các kiến thức này được tham khảo trong cuốn sách [32] và một số bài báo
khác.

1.1

Thiết kế thí nghiệm

Thí nghiệm (Experiment) gồm một phép thử hoặc một tập hợp các phép thử.


Các thí nghiệm được thực hiện trong các ngành công nghiệp, nông nghiệp để
khai thác hoặc nhận thêm thông tin về hệ thống hoặc quá trình sản xuất. Nhà
thống kê Fisher là người đặt nền móng cho thí nghiệm qua những nghiên cứu
của mình trong những năm đầu 1920. Ông nhận ra sự thiếu sót trong cách thực
hiện thí nghiệm thường cản trở việc phân tích dữ liệu từ quá trình sản xuất nông
nghiệp. Bằng sự kết hợp giữa khoa học nghiên cứu trên nhiều lĩnh vực, ông đề
xuất ba nguyên lý cơ bản của việc thiết lập thí nghiệm đó là (i) ngẫu nhiên hóa
(randomization), (ii) lặp lại nhiều lần (replication) và (iii) chia nhóm (blocking).
Các thiết kế thí nghiệm có vai trò quan trọng trong việc thu thập dữ liệu từ hệ
thống hoặc quá trình sản xuất trước khi phân tích thống kê dữ liệu. Thiết kế thí
nghiệm cần đảm bảo các yêu cầu sau: (i) phát hiện được ảnh hưởng của các nhân
17


tố trong quá trình, (ii) phù hợp với mô hình, (iii) bảo đảm giá trị dự báo đầu ra
gần với giá trị thực, (iv) tối thiểu số phép thử của thí nghiệm, (v) đơn giản và dễ
tính toán, (vi) giải thích các biến động trong mô hình một cách dễ dàng.
Những năm đầu 1930, thiết kế thí nghiệm trong công nghiệp đã bắt đầu
được khai thác nhờ sự phát triển của RSM do Box & Wilson [9] đưa ra. Các
tác giả này đã chỉ ra sự khác biệt của thiết kế thí nghiệm trong công nghiệp so
với nông nghiệp là các biến đầu ra của quá trình hay biến đáp ứng có thể quan
sát ngay và người làm thí nghiệm có thể thu được thông tin quan trọng từ nhóm
nhỏ các phép thử để thực hiện các thí nghiệm tiếp theo. Họ tổng kết lại thiết
kế thí nghiệm gồm bốn bước: (i) phỏng đoán, (ii) thiết kế, (iii) thí nghiệm và
(iv) phân tích. Đầu tiên, một ý tưởng hoặc một phỏng đoán được thành lập liên
quan đến một số nhân tố và đầu ra của một số quá trình sản xuất. Sau đó, người
làm thí nghiệm tiến hành chọn thiết kế cho phù hợp với thí nghiệm và thực hiện.
Các dữ liệu và kết quả sẽ được phân tích bằng các kỹ thuật hồi quy (regression
technique), đưa ra điều kiện tối ưu hay ý tưởng mới về quá trình. Quá trình trên

được thực hiện liên tiếp như Hình 1.1.

Hình 1.1: Quá trình thực hiện thí nghiệm liên tiếp
Trong giai đoạn đầu của thí nghiệm, người làm thí nghiệm cần xác định các
nhân tố quan trọng ảnh hưởng chính đến kết quả đầu ra. Khi đó, các nhân tố
thường được thiết lập ở hai mức thấp nhất và cao nhất của miền giá trị và được
mã hóa là ±1. Các thiết kế áp dụng trong giai đoạn này thường gọi là các thiết kế
sàng lọc (screening design). Sau khi tìm được các nhân tố chính ảnh hưởng đến
biến đáp ứng trong thí nghiệm, họ sẽ thiết kế các thí nghiệm để phù hợp và phân
tích mô hình biểu diễn mối quan hệ giữa biến đáp ứng và các nhân tố. Trong
giai đoạn tiếp theo, các nhân tố thường được thiết kế ở ba mức trở lên để phát
18


hiện được các tính chất tốt trong mô hình. Điều này đặt ra cho các nhà thống kê
một nhiệm vụ quan trọng là tìm các thiết kế tốt cho ta dễ dàng tính toán, có độ
chính xác cao trong ước lượng hệ số mô hình và nâng cao sự mô tả về hệ số của
mô hình bởi vì những thí nghiệm không tốt sẽ cho chúng ta rất ít thông tin về
mô hình và sự biến động trong đó.
Một cách tổng quát, thiết kế thí nghiệm là hệ thống cấu trúc các phép thử
được thực hiện trên các nhân tố đầu vào để xác định kết quả ở các biến đầu ra,
trong đó mỗi phép thử là một tổ hợp các giá trị của nhân tố. Các nhân tố trong
thí nghiệm là điều kiện trong quá trình thực hiện thí nghiệm có ảnh hưởng đến
kết quả đầu ra và được thiết lập ở các mức tương ứng với miền giá trị. Giá trị
của nhân tố có thể là định lượng (quantitative) hoặc định tính (qualitative), có thể
là ETC hoặc HTC. Thông thường, với các nhân tố định lượng, mức giá trị thiết
lập trong mỗi phép thử thường là các cận của miền giá trị hoặc các điểm nằm
trong miền giá trị phụ thuộc vào kinh nghiệm của việc thực hiện các quá trình
sản xuất. Các mức giá trị thiết lập cho thí nghiệm của mỗi nhân tố thường được
mã hóa để đồng nhất thang đo, nghĩa là không còn đơn vị của mỗi biến. Cụ thể,

nếu nhân tố định tính có hai mức thì thường được mã hóa thành −1 và 1, còn
nhân tố định lượng có thể được mã hóa thành −1, 0 và 1. Kết quả đầu ra của
thí nghiệm được gọi là biến đáp ứng (là biến phụ thuộc trong mô hình hồi quy).
Các sai số thường gặp trong thí nghiệm tạo ra bởi thiết bị sản xuất, thiết bị kiểm
định, người thực hiện và các yếu tố ngẫu nhiên do một số nhân tố không tham
gia vào mô hình được gọi chung là sai số thí nghiệm và thường được giả thiết là
nhiễu trắng (white noise).

1.2

Phương pháp bề mặt đáp ứng

Phương pháp bề mặt đáp ứng là tập hợp các kỹ thuật được thực hiện để tìm
giá trị tốt nhất của biến đáp ứng. Nếu giá trị tốt nhất hoặc các giá trị của biến
đáp ứng đã biết đến, thì phương pháp này cho ta hiểu biết sâu hơn về hệ thống
chung của biến đáp ứng. Các kỹ thuật này gồm thiết kế thí nghiệm và phân tích
các dữ liệu của thí nghiệm bằng kỹ thuật hồi quy được đưa ra trong bài báo
của Box & Wilson [9] năm 1951. Bài báo này có ảnh hưởng sâu sắc đến ứng
dụng các thiết kế thí nghiệm trong công nghiệp và gợi ra nhiều ý tưởng nghiên
cứu trong lĩnh vực này. Nhiều công trình kết quả nghiên cứu về phương pháp
bề mặt đáp ứng đã được viết thành sách Box & Draper [7] năm 1987, Khuri &
Cornell [28] năm 1996 và Myers & Montgomery [32] năm 2002. Ở Việt Nam,
19


phương pháp bề mặt đáp ứng đã được sử dụng trong nhiều công trình nghiên
cứu thực tế được công bố trên các tạp chí sinh học, tạp chí khoa học công nghệ
như Bui & Nguyen [1], Huynh et al. [2] và Le et al. [3].

1.2.1


Mô hình bề mặt đáp ứng

Trong thực tế, biến đáp ứng phụ thuộc vào giá trị của các nhân tố dưới dạng
y = f (x1 , x2 , · · · , xm ) + ε,

(1.1)

trong đó hàm đáp ứng f chưa biết và sai số ε là sai số thí nghiệm được giả sử có
phân bố chuẩn với trung bình 0 và phương sai σ 2 . Khi đó,
E(y) = f (x1 , x2 , · · · , xm ).

Trong phương pháp bề mặt đáp ứng, hàm f được xấp xỉ bởi các đa thức bậc
thấp. Khi đó, mô hình (1.1) được gọi là mô hình bề mặt đáp ứng và các thiết kế
cho mô hình là thiết kế bề mặt đáp ứng.
Nếu xấp xỉ hàm đáp ứng bằng đa thức bậc một thì
m

y = β0 + ∑ βi xi + ε,

(1.2)

i=1

được gọi là mô hình đa thức bậc một, trong đó các hệ số βi , i = 1, 2, · · · , m được
gọi là hiệu ứng bậc một hoặc hiệu ứng chính. Mô hình đa thức bậc một thường
được dùng trong bài toán hồi quy tuyến tính hoặc bài toán sàng lọc các nhân tố
ảnh hưởng chính đến biến đáp ứng.
Nếu hàm đáp ứng được xấp xỉ bởi đa thức bậc hai thì mô hình
m


m

m−1

y = β0 + ∑ βii xi2 + ∑ βi xi +
i=1

i=1

m

∑ ∑

βi j xi x j + ε.

(1.3)

i=1 j=i+1

được gọi là mô hình đa thức bậc hai, trong đó các hệ số βii , i = 1, · · · , m là các
hiệu ứng bậc hai và βi j , i = 1, · · · , m, j = 2, · · · , m, i < j là các hiệu ứng tương
tác giữa nhân tố thứ i và thứ j. Các thiết kế phù hợp với mô hình đa thức bậc hai
20


được gọi là thiết kế bậc hai.
Mô hình đa thức bậc hai rất linh hoạt và thường xuyên dùng trong việc xấp
xỉ bề mặt đáp ứng. Các hiệu ứng chính βi đo mức độ ảnh hưởng của m nhân
tố thông qua biến xi trong mô hình, các hiệu ứng tương tác βi j đo mức độ ảnh

hưởng của nhân tố thứ i với nhân tố thứ j thông qua xi x j và bề mặt cong xuất
hiện (tức là có biến xi2 trong mô hình) khi có ảnh hưởng của hiệu ứng bậc hai βii
của nhân tố thứ i. Ước lượng các hệ số trong mô hình được tính toán đơn giản
theo phương pháp bình phương tối thiểu.
Thực hiện thí nghiệm dưới dạng ma trận thiết kế


x11 · · · x1m 


x21 · · · x2m 


D=
..
.. 
 ...
.
. 




xn1 · · · xnm

và quan sát các giá trị biến đáp ứng yu , u = 1, · · · , n theo mỗi phép thử
(xu1 , · · · , xum ) ta nhận được hệ phương trình sau
m

m


m−1

2
yu = β0 + ∑ βii xui
+ ∑ βi xui +
i=1

i=1

m

∑ ∑

βi j xui xu j + εu .

(1.4)

i=1 j=i+1

Mô hình (1.4) được viết lại dưới dạng ma trận như sau:
Y = Xβ + ,

(1.5)

trong đó Y = [y1 , · · · , yn ] , = [ε1 , · · · , εn ] và


2
x11


2
x1m

···
x11 · · · x1m x11 x12 x12 x13
1

1 x2 · · · x2 x21 · · · x2m x21 x22 x22 x23

21
2m
X=
..
..
.. ..
..
..
..
 ... ...
.
.
. .
.
.
.


2
2

1 xn1
· · · xnm
xn1 · · · xnm xn1 xn2 xn2 xn3

là ma trận thiết kế mở rộng của mô hình.
21


· · ·

· · ·

.. 
.


···


Vecto hệ số
β = [β0 , β11 , · · · , βmm , β1 , · · · , βm , β12 , · · · , βm−1m ]

được ước lượng bằng phương pháp bình phương tối thiểu
βˆ = (X X)−1 X Y,

có ma trận hiệp phương sai
cov(βˆ ) = σ 2 (X X)−1 .

Đại lượng


ˆ x))
Nvar(Y(
σ2

được gọi là phương sai dự báo của mô hình tại điểm
ˆ x) = xβˆ và
x = (x1 , · · · , xm ) , trong đó Y(
ˆ x)) = x (X X)−1 xσ 2 ,
var(Y(

với x = [1, x12 , · · · , xm2 , x1 , · · · , xm , x1 x2 , x2 x3 , · · · , xm−1 xm ] .

1.2.2

Tối ưu bề mặt đáp ứng

Với mô hình đa thức bậc hai được kiểm định phù hợp với mối quan hệ giữa
biến đáp ứng và các nhân tố, ta nhận được dự báo biến đáp ứng
m

m

yˆ = βˆ0 + ∑ βˆi xi + ∑ βˆii xi2 +
i=1

i=1

m−1

m


∑ ∑

i=1 j=i+1

βˆi j xi x j
(1.6)

= βˆ0 + x b + x Bˆ x,

trong đó x = (x1 , · · · , xm ) , b = (βˆ1 , · · · , βˆm ) và ma trận đối xứng Bˆ cỡ m × m có
phần tử đường chéo là βˆii và các phần tử ở vị trí (i, j) là βˆi j /2.
Đạo hàm yˆ theo vecto x = (x1 , · · · , xm ) và giải nghiệm của ∂∂xyˆ = 0 ta nhận
được điểm dừng của bề mặt đáp ứng (xem mục 6.3 trong [32])

xs = − Bb.
2

22

(1.7)


Nếu ma trận Bˆ có tất cả các giá trị riêng đều âm thì điểm dừng là điểm cực
đại của bề mặt đáp ứng. Nếu Bˆ có tất cả các giá trị riêng dương thì điểm dừng là
điểm cực tiểu của bề mặt đáp ứng. Trong trường hợp giá trị riêng của Bˆ có một
số âm và một số dương thì điểm dừng được gọi là điểm yên ngựa.

1.2.3


Thiết kế thí nghiệm phù hợp mô hình bề mặt đáp ứng

Việc lựa chọn các thiết kế thí nghiệm phù hợp và phân tích mô hình bề mặt
đáp ứng là công việc không thể thiếu trong RSM. Trong mục này, chúng tôi liệt
kê các thiết kế phổ biến phù hợp với mô hình bậc một, bậc hai, các thiết kế bậc
hai có thể chia nhóm trực giao và các thiết kế D−tối ưu.
1.2.3.1

Thiết kế phù hợp mô hình đa thức bậc một

Các thiết kế phù hợp với mô hình đa thức bậc một thường được sử dụng là
các thiết kế 2-mức giá trị cho các nhân tố làm cực tiểu phương sai của các hệ
số hồi quy βˆi . Đây là các thiết kế có ma trận X X dạng đường chéo, trong đó ma
trận thiết kế mở rộng X gồm các hàng (1, xu1 , · · · , xum ) với u = 1, · · · , n. Khi đó,
các thiết kế được gọi là thiết kế bậc một trực giao (first-order orthogonal design).
Chúng bao gồm thiết kế nhân tố 2m hoặc thiết kế một phần nhân tố 2m−k và thiết
kế Placket-Burman. Ví dụ về các thiết kế này được liệt kê trong Bảng 1.1 cho
các nhân tố với mức giá trị được mã hóa.
Bảng 1.1: Các thiết kế thí nghiệm cho mô hình đa thức bậc một.
(a) 23 FD

x1
-1
-1
-1
-1
1
1
1
1


x2
-1
-1
1
1
-1
-1
1
1

x3
-1
1
-1
1
-1
1
-1
1

(b) 24−1 FFD

x1
-1
-1
-1
-1
1
1

1
1

x2 x3
-1 -1
-1 1
1 -1
1 1
-1 1
-1 1
1 1
1 1

(c) PBD

x4
-1
1
1
-1
-1
-1
1
1

23

x1
1
-1

-1
1
-1
1
1
-1

x2
1
1
-1
-1
1
-1
1
-1

x3
1
1
1
-1
-1
1
-1
-1

x4
-1
1

1
1
-1
-1
1
-1

x5
1
-1
1
1
1
-1
-1
-1

x6
-1
1
-1
1
1
1
-1
-1

x7
-1
-1

1
-1
1
1
1
-1


×