GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
MỤC LỤC
MỤC LỤC 1
I. TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM
QUAN [1] [3] 3
1. Sơ lược về đánh giá cảm quan 3
2. Phép thử phân biệt 3
II. TỔNG QUAN VỀ PHƯƠNG PHÁP THỐNG KÊ BAYESIAN 5
[2] [9] [10] [11] 5
1.Nguồn gốc 5
2. Nội dung 5
3. Ý nghóa 8
4. Ứng dụng 8
III. CÁCH XỬ LÝ SỐ LIỆU THƯỜNG DÙNG TRONG PHÉP THỬ
PHÂN BIỆT [1] [2] [4] 8
1. Nguyên tắc chung 8
Hình III.1.1: Minh họa các đường cong phân phối của giả thiết H0 và H theo
nguyên tắc xử lý số liệu trong phép thử phân biệt 10
2. Các phương pháp xử lý số liệu trong phép thử phân biệt 10
Nếu giả thiết H0 đúng (Hai sản phẩm không khác nhau về tính chất cảm quan),
gọi xác suất người thử trả lời đúng trong mỗi phép thử là p. Ta có trong phép
thử: 12
2.2.2. Ý nghóa 13
2.3.1. Nội dung 13
2.3.2. Ý nghóa 14
3. Nhận xét 14
IV. CÁCH XỬ LÝ SỐ LIỆU TRONG PHÉP THỬ PHÂN BIỆT BẰNG
PHƯƠNG PHÁP THỐNG KÊ BAYESIAN [6] 15
1. Phương pháp xử lý số liệu theo thống kê Bayesian 15
Khác với các phương pháp nêu trên xem xác suất đưa ra câu trả lời đúng của
người thử hay tỉ lệ trả lời đúng (ký hiệu p) là hằng số chưa biết, thống kê
Bayesian xem tham số p chưa biết là biến ngẫu nhiên tuân theo phân phối beta
(Beta distribution) 15
1.2.1. Xác đònh phân phối tiên nghiệm của tham số tỉ lệ p 16
1.2.2. Xác đònh phân phối hậu nghiệm của tham số tỉ lệ p 17
1.2.4. Kiểm đònh giả thiết giả thiết chính H: (pH) theo dữ kiện thực tế D: (n,x)
bằng phương pháp thống kê Bayesian 18
2. Các ví dụ 19
Hình IV.2.1: Đường cong phân phối beta tiên nghiệm và hậu nghiệm 20
Hình IV.2.2: Đường cong phân phối beta tiên nghiệm và hậu nghiệm 22
Kiểm đònh giả thiết chính H(pH = 0,6) theo dữ kiện thực tế D(n, x): 22
2.3.1. Tham số p có thông tin tiên nghiệm 23
Hình IV.2.3: Đường cong phân phối beta tiên nghiệm và hậu nghiệm 24
Kiểm đònh các giả thiết H theo dữ kiện thực tế D(n, x): 24
2.3.2. Tham số p ban đầu tuân theo phân phối đều 25
Kiểm đònh giả thiết chính H(pH = 0,6) theo dữ kiện thực tế D(n, x): 26
SVTH: Nguyễn Ngọc Bảo Trân Trang 1
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
2.3.3. Khảo sát ảnh hưởng của kích thước mẫu và thông tin tiên nghiệm đến
kết quả sau cùng 26
3. Các yếu tố ảnh hưởng đến kết quả của phương pháp kiểm đònh Bayesian. 29
4. So sánh kết quả thí nghiệm giữa phương pháp kiểm đònh giả thiết thống kê
cổ điển với phương pháp thống kê Bayesian 30
V. SO SÁNH PHƯƠNG PHÁP THỐNG KÊ BAYESIAN VỚI PHƯƠNG PHÁP
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ CỔ ĐIỂN 31
VI. KẾT LUẬN 32
PHỤ LỤC 33
TÀI LIỆU THAM KHẢO 36
SVTH: Nguyễn Ngọc Bảo Trân Trang 2
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
I. TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM
QUAN [1] [3]
1. Sơ lược về đánh giá cảm quan
1.1. Đònh nghóa
“Đánh giá cảm quan là phương pháp khoa học được sử dụng để gợi lên, đo đạc,
phân tích và giải thích cảm giác đối với các sản phẩm vốn được nhận biết thông qua các
giác quan: thò giác, khứu giác, xúc giác, vò giác và thính giác.”
(Stone & Sidel – ASTM)
1.2. Các phương pháp đánh giá cảm quan
Nhìn chung, tất cả các phương pháp đều dựa trên phép xử lý thống kê các thông tin
thu thập được từ người thử. Mỗi phép thử là tập hợp các đánh giá riêng lẻ của mỗi người
tham gia, được sắp xếp theo một phương thức đã đònh trước phù hợp với các phép toán
thống kê.
Phép thử phân biệt: Tìm hiểu xem các sản phẩm giống hay khác nhau.
Phép thử mô tả: Tìm hiểu xem cường độ của các tính chất cảm quan là bao nhiêu.
Phép thử thò hiếu: Tìm hiểu xem các sản phẩm có được ưa thích không, loại sản
phẩm nào hay tính chất cảm quan nào được ưa thích nhất.
1.3. Các nguyên tắc cơ bản trong đánh giá cảm quan
Sự vô danh của các mẫu đánh giá: Người thử không bò ảnh hưởng bởi bất kì thông
tin nào của sản phẩm ngoại trừ tính chất cảm quan.
Sự độc lập của các câu trả lời: Ý kiến của những người thử là độc lập với nhau.
Kiểm soát điều kiện thí nghiệm: Các điều kiện thí nghiệm khác nhau sẽ cho các kết
quả thí nghiệm khác nhau. Các thí nghiệm cảm quan phải luôn được thực hiện
trong phòng thí nghiệm cảm quan, không thực hiện trong phân xưởng sản xuất hay
nhà máy.
1.4. Vai trò của đánh giá cảm quan
Đánh giá cảm quan cho phép giải quyết những bận tâm của nhà sản xuất thực
phẩm trong các quá trình kiểm tra nguyên liệu, quá trình sản xuất, đánh giá ảnh hưởng
của các yếu tố công nghệ và kỹ thuật đến sản phẩm cuối cùng, cũng như xác đònh mối
quan hệ giữa bao bì và chất lượng, xác đònh thời gian sống của sản phẩm và cuối cùng là
phát triển sản phẩm mới.
2. Phép thử phân biệt
2.1. Mục đích
Tìm hiểu xem liệu nhóm người thử có thực sự nhận ra sự sai khác giữa các sản
phẩm không hay đó chỉ là những câu trả lời được ra một cách ngẫu nhiên.
2.2. Các phép thử phân biệt
2.2.1. Phép thử A – nonA và phép thử hai – ba (Duo – Trio)
SVTH: Nguyễn Ngọc Bảo Trân Trang 3
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Mục đích: Xác đònh liệu một sản phẩm có giống với một mẫu chuẩn hay không.
Phép thử này rất thích hợp trong tình huống muốn kiểm tra xem sản phẩm làm ra
có giống với một sản phẩm đang bán trên thò trường hay không.
Nguyên tắc:
• A - nonA:
Đầu tiên người thử học cách nhận biết mẫu kiểm chứng A. Tiếp theo người thử sẽ
lần lượt thử một dãy các mẫu được mã hóa bao gồm cả mẫu A và notA, sau đó người thử
phải xác đònh mẫu nào là A và notA.
Trình bày mẫu: Cân bằng trật tự trình bày mẫu trên cả nhóm người thử, số mẫu A
và notA được người thử đánh giá là bằng nhau.
• Hai - ba (Duo - Trio):
Đầu tiên người thử học cách nhận biết mẫu kiểm chứng R. Tiếp theo người thử sẽ
lần lượt thử hai mẫu khác và được cho biết một trong hai mẫu đó giống với mẫu R, người
thử phải tìm ra mẫu giống với mẫu R.
Trình bày mẫu: 4 tổ hợp R(A)AB, R(A)BA, R(B)AB, R(B)BA, số lần xuất hiện của
mỗi tổ hợp là như nhau cho cả nhóm người thử.
2.2.2. Phép thử giống – khác và phép thử tam giác
Mục đích: Xác đònh sự khác nhau giữa hai sản phẩm mà không cần biết bản chất
của sự khác nhau đó. Phép thử này được sử dụng trong trường hợp sự khác nhau
giữa hai sản phẩm là tương đối nhỏ.
Nguyên tắc:
• Giống - khác:
Có hai mẫu thử được giới thiệu, người thử phải xác đònh hai mẫu này giống hay
khác nhau.
Trình bày mẫu: 4 tổ hợp AA, BB, AB, BA, số lần xuất hiện của mỗi tổ hợp là như
nhau cho cả nhóm người thử.
• Tam giác:
Có ba mẫu thử được giới thiệu, hai mẫu là giống nhau (được chuẩn bò từ một loại
sản phẩm), mẫu thứ ba được giả đònh là khác hai mẫu còn lại và được chuẩn bò từ một loại
sản phẩm khác, người thử phải xác đònh mẫu không lặp lại trong số ba mẫu thử (mẫu khác
với hai mẫu còn lại).
Trình bày mẫu: 6 tổ hợp AAB, ABA, ABB, BAB, BBA, BAA, số lần xuất hiện của
mỗi tổ hợp là như nhau cho cả nhóm người thử.
2.2.3. Phép thử 2-AFC (cặp đôi) và 3-AFC
Mục đích: Xác đònh sự khác nhau giữa hai sản phẩm về một tính chất cảm quan
xác đònh.
Nguyên tắc:
• 2-AFC (cặp đôi):
Có hai mẫu thử được giới thiệu, người thử phải xác đònh mẫu nào có cường độ cảm
giác về một chỉ tiêu cụ thể lớn hơn hoặc bé hơn mẫu còn lại.
SVTH: Nguyễn Ngọc Bảo Trân Trang 4
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Trình bày mẫu: 2 tổ hợp AB, BA, số lần xuất hiện của mỗi tổ hợp là như nhau cho
cả nhóm người thử.
• 3-AFC:
Có ba mẫu thử được giới thiệu, người thử phải xác đònh mẫu nào có cường độ cảm
giác về một chỉ tiêu cụ thể lớn hơn hoặc bé hơn hai mẫu còn lại.
Trình bày mẫu: hai nhóm (AAB, ABA, BAA) và (ABB, BAB, BBA), trong phép
thử này chỉ có một trong hai nhóm (mỗi nhóm gồm 3 tổ hợp của hai mẫu) được giới thiệu,
số lần xuất hiện của mỗi tổ hợp là như nhau cho cả nhóm người thử.
2.3. Nhóm người đánh giá cảm quan (người thử)
• Thường là người tiêu dùng bình thường đã qua sử dụng sản phẩm.
• Số lượng: Thường nhiều hơn 50 người.
2.4. Ứng dụng
Giúp cho việc giải quyết các vấn đề:
• Liệu có thể thay đổi nguyên liệu hoặc một bộ phận trong dây chuyền sản xuất
mà không dẫn tới thay đổi tính chất cảm quan có thể nhận thấy ở sản phẩm.
• Ảnh hưởng của bao bì đến mùi vò sản phẩm.
• Tuổi thọ của sản phẩm là bao lâu, sản phẩm có bò biến đổi chất lượng trong
quá trình bảo quản.
• Bắt chước sản phẩm cạnh tranh.
• Đánh giá và quyết đònh lựa chọn một phương thức công nghệ mới.
• Đònh hướng cho các phép thử cảm quan và thò hiếu.
• Tuyển chọn và huấn luyện hội đồng cho đánh giá cảm quan.
II. TỔNG QUAN VỀ PHƯƠNG PHÁP THỐNG KÊ BAYESIAN
[2] [9] [10] [11]
1.Nguồn gốc
Phương pháp thống kê Bayesian còn gọi là Lý thuyết Bayes (Bayes’s Theory) hay
Suy luận Bayes (Bayesian Inference) được đặt theo tên của nhà toán học Anh Reverend
Thomas Bayes (1702 – 1761). Người bạn của ông, Richard Price, đã chỉnh sửa và giới
thiệu công trình năm 1763 sau khi Bayes mất với tựa đề “An Essay towards solving a
Problem in the Doctrine of Chances”. Sau đó, Pierre - Simon Laplace đã mở rộng kết quả
trong bài luận năm 1774.
Nội dung cơ bản nhất của phương pháp thống kê Bayesian là Đònh lý Bayes
(Bayes’s Theorem).
2. Nội dung
2.1. Các khái niệm cơ bản
Mỗi kết quả của “phép thử” (test) gọi là “sự kiện” (survival).
Sự kiện được chia thành các loại sau:
SVTH: Nguyễn Ngọc Bảo Trân Trang 5
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
• Sự kiện trống (sự kiện không thể có): là sự kiện không bao giờ xảy ra khi thực
hiện phép thử, ký hiệu là Φ.
• Sự kiện chắc chắn: là sự kiện luôn xảy ra khi thực hiện phép thử, ký hiệu là Ω.
• Sự kiện ngẫu nhiên: là sự kiện có thể xảy ra hoặc không xảy ra tùy thuộc vào
từng phép thử.
Hai sự kiện A và B gọi là “xung khắc” nếu A.B = Φ.
Các sự kiện A
1
, A
2
, … , A
n
gọi là “đôi một xung khắc” nếu hai sự kiện khác nhau
bất kỳ trong đó đều xung khắc, tức là: A
i
.A
j
= Φ với mọi i ≠ j.
Các sự kiện A
1
, A
2
, … , A
n
gọi là “một nhóm đầy đủ các sự kiện” nếu chúng đôi
một xung khắc và ít nhất một trong chúng chắc chắn xảy ra, tức là:
A
i
.A
j
= Φ với mọi i ≠ j và A
1
+ A
2
+ … + A
n
= Ω.
Hai sự kiện A và B gọi là “độc lập” nếu xác suất (probability) của sự kiện này
không phụ thuộc vào sự xảy ra hay không xảy ra của sự kiện kia.
2.2. Đònh lý Bayes
Cho hai sự kiện ngẫu nhiên A và B. Ta gọi xác suất của sự kiện A khi sự kiện B đã
xảy ra là “xác suất của A với điều kiện B” hay “xác suất của A nếu có B”, ký hiệu là
P(A/B). Đại lượng này được gọi “xác suất có điều kiện” (conditional probability) hay “xác
suất hậu nghiệm” (posterier probability) vì nó được rút ra từ giá trò cho trước của B.
Theo đònh lí Bayes, xác suất xảy ra A khi biết B sẽ phụ thuộc vào 3 yếu tố:
• Xác suất xảy ra A của riêng nó, không quan tâm đến B, ký hiệu là P(A) và đọc
là “xác suất của A”. Đây được gọi là “xác suất biên duyên” hay “xác suất tiên
nghiệm” (prior probability), nó là “tiên nghiệm” theo nghóa rằng nó không
quan tâm đến bất kỳ thông tin nào về B.
• Xác suất xảy ra B của riêng nó, không quan tâm đến A. Kí hiệu là P(B) và đọc
là “xác suất của B”.
• Xác suất xảy ra B khi biết A đã xảy ra. Kí hiệu là P(B/A) và đọc là “xác suất
của B nếu có A”. Đại lượng này cũng được gọi “xác suất có điều kiện”
(conditional probability) hay “xác suất hậu nghiệm” (posterier probability) vì
nó được rút ra từ giá trò được cho của A.
Từ đó ta thu được các công thức sau đây:
• Công thức xác suất có điều kiện:
)(
)(
)/(
BP
ABP
BAP =
(CT II.2.1)
Với P(AB) = P(A/B).P(B) = P(B/A).P(A) (CT II.2.2)
• Công thức xác suất đầy đủ:
Cho A
1
, A
2
, … , A
n
là một nhóm đầy đủ các sự kiện. Với mọi sự kiện B ta có:
P(B) = P(A
1
).P(B/A
1
) + P(A
2
).P(B/A
2
) + … + P(A
n
).P(B/A
n
)(CT II.2.3)
• Công thức Bayes:
Dạng đơn giản:
)(
)()./(
)/(
BP
APABP
BAP =
(CT II.2.4)
Dạng tổng quát: Với mỗi k (k = 1 đến n), ta có:
SVTH: Nguyễn Ngọc Bảo Trân Trang 6
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
∑
=
==
n
i
ii
kkkk
k
ABPAP
APABP
BP
APABP
BAP
1
)/().(
)()./(
)(
)()./(
)/(
(CT II.2.5)
Tương tự, trong thực tế ta có thể đặt:
• H: Giả thiết (hypothesis) được suy luận và cần được kiểm chứng trong thực tế.
• D hay E: Dữ kiện (data) hay bằng chứng (evidence) thu được bằng cách thực
hiện phép thử, dùng để kiểm đònh giả thiết H.
• P(H) được gọi là “xác suất tiên nghiệm” (prior probability) của H.
• P(D/H) hay P(E/H) được gọi là “xác suất có điều kiện” (conditional
probability) của việc quan sát thấy dữ kiện D hay bằng chứng E nếu biết rằng
giả thiết H là đúng.
• P(D) hay P(E) được gọi là “xác suất của D hay E”: xác suất của việc chứng
kiến dữ kiện mới D hay bằng chứng mới E dưới tất cả các giả thiết loại trừ
nhau đôi một (một nhóm đầy đủ các giả thiết).
• P(H/D) hay P(H/E) được gọi là “xác suất hậu nghiệm” (posterior probability)
của H nếu biết D hay E.
Từ đó ta cũng thu được các công thức:
• Công thức Bayes nhằm điều chỉnh xác suất của giả thiết theo các dữ kiện hay
bằng chứng mới:
)/().()/().(
)()/(
)(
)()/(
)/(
notHDPnotHPHDPHP
HPHDP
DP
HPHDP
DHP
+
==
(CT II.2.6)
• Với 2 dữ kiện “độc lập” D
1
và D
2
(xác suất của dữ kiện này không phụ thuộc
vào sự xảy ra hay không xảy ra của dữ kiện kia), ta có thể áp dụng suy luận
Bayes lặp đi lặp lại. Ta dùng dữ kiện thứ nhất để tính một xác suất hậu nghiệm
ban đầu, rồi dùng xác suất hậu nghiệm đó làm xác suất tiên nghiệm để tính
một xác suất hậu nghiệm thứ hai theo dữ kiện thứ hai.
Tính độc lập của dữ kiện thể hiện qua:
P(D
1
, D
2
) = P(D
1
).P(D
2
)
P(D
1
, D
2
/H) = P(D
1
/H).P(D
2
/H)
P(D
1
, D
2
/notH) = P(D
1
/notH).P(D
2
/notH)
Đònh lý Bayes được sử dụng lặp đi lặp lại hàm ý rằng:
)().(
)()/()./(
),/(
21
21
21
DPDP
HPHDPHDP
DDHP =
Ví dụ:
Tỉ lệ người nghiện thuốc lá ở một vùng là 30%. Tỉ lệ người bò viêm họng trong số
những người nghiện là 60%, còn tỉ lệ người bò viêm họng trong số những người không
nghiện là 40%.
Lấy ngẫu nhiên một người thấy rằng người ấy bò viêm họng. Tính xác suất người
ấy ngiện thuốc.
Giải:
Gọi H: sự kiện nghiện thuốc và notH: sự kiện không nghiện thuốc.
D: sự kiện viêm họng.
SVTH: Nguyễn Ngọc Bảo Trân Trang 7
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Ta có: P(H) = 0,3; P(notH) = 0,7; P(DH) = 0,6; P(DnotH) = 0,4
Suy ra xác suất người viêm họng bò nghiện thuốc: (CT II.2.6)
39130
40706030
3060
,
,,,,
,,
)/().()/().(
)()/(
)/( =
×+×
×
=
+
=
notHDPnotHPHDPHP
HPHDP
DHP
3. Ý nghóa
Suy luận Bayes sử dụng một ước lượng bằng số về mức độ tin tưởng vào một giả
thiết trước khi quan sát được dữ kiện hay bằng chứng, và tính toán một ước lượng bằng số
về mức độ tin tưởng vào giả thiết đó sau khi đã quan sát được bằng chứng.
Trong phương pháp thống kê Bayes, việc thu thập các dữ kiện hay bằng chứng có
thể nhất quán hoặc không nhất quán với một giả thiết nào đó. Trong quá trình thu thập và
tích lũy bằng chứng, mức độ tin tưởng vào một giả thiết thay đổi. Khi có đủ bằng chứng,
mức độ tin tưởng này thường trở nên rất cao hoặc rất thấp. Do đó, theo lý thuyết, đây có
thể được coi là một cơ sở logic thích hợp cho việc chọn lọc giữa các giả thiết mâu thuẫn
nhau: các giả thiết với mức độ tin tưởng rất cao nên được chấp nhận là đúng, các giả thiết
với độ tin tưởng rất thấp nên bò coi là sai và loại bỏ. Các nhà thống kê Bayes lập luận
rằng ngay cả khi người ta có các xác suất chủ quan tiên nghiệm rất khác nhau, bằng chứng
mới từ các quan sát lặp đi lặp lại sẽ có xu hướng đưa các xác suất hậu nghiệm của họ lại
gần nhau hơn.
Trong công thức Bayes, tỉ số P(D/H) / P(D) đại diện cho ảnh hưởng của dữ kiện
hay bằng chứng đối với mức độ tin tưởng vào giả thiết. Nếu rất có khả năng quan sát được
bằng chứng khi giả thiết đang xét là đúng, thì tỉ số này sẽ có giá trò lớn. Khi nhân “xác
suất tiên nghiệm” của giả thiết với tỉ số này, ta được một xác suất hậu nghiệm lớn của giả
thiết khi có bằng chứng. Nhờ đó, trong suy luận Bayes, đònh lý Bayes đo được mức độ mà
dữ kiện hay bằng chứng mới sẽ làm thay đổi sự tin tưởng vào một giả thiết.
4. Ứng dụng
Phương pháp thống kê Bayesian được ứng dụng rộng rãi trong nhiều lónh vực khác
nhau như:
• Trong quản lý dựa án, trong xây dựng: Dự báo, đánh giá rủi ro về tiến độ, kinh
phí, chất lượng, tai nạn lao động…
• Trong y học: Kiểm tra hiệu quả của thuốc và ảnh hưởng của nó trên các đối
tượng khác nhau, dự đoán tỉ lệ người mắc một loại bệnh nào đó, …
• Trong đánh giá cảm quan.
v.v…
III. CÁCH XỬ LÝ SỐ LIỆU THƯỜNG DÙNG TRONG PHÉP THỬ
PHÂN BIỆT [1] [2] [4]
1. Nguyên tắc chung
Nguyên tắc xử lý số liệu trong phép thử phân biệt thường được tiến hành theo các
bước sau:
• Đề ra giả thiết chính H: “Hai sản phẩm khác nhau về tính chất cảm quan”.
SVTH: Nguyễn Ngọc Bảo Trân Trang 8
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
(Giả thiết mà chúng ta tin là sự thật và muốn chứng minh bằng dữ kiện)
• Từ giả thiết chính đề ra giả thiết đảo H
0
: “Hai sản phẩm không khác nhau về
tính chất cảm quan”.
• Chọn mức xác suất (probability level) hay mức ý nghóa (significance level) α
(thường là một phía) cho sai lầm loại 1 (bác bỏ H
0
, công nhận H trong khi H
0
đúng). Chọn rủi ro beta β (beta risk) hoặc độ tin cậy / lực kiểm đònh (power) 1 –
β cho sai lầm loại 2 (công nhận H
0
, bác bỏ H trong khi H
0
sai) nếu cần (hai sản
phẩm được dự đoán là không khác nhau về tính chất cảm quan).
• Chọn độ lớn của hiệu ứng d – sự khác biệt giữa H và H
0
mà chúng ta muốn phát
hiện (ví dụ như chênh lệch về tỉ lệ trả lời đúng).
• Chọn kích thước mẫu n theo α, β, d để đảm bảo xác suất tối đa cho phép mắc
sai lầm loại 1 là α và xác suất tối đa cho phép mắc sai lầm loại 2 là β. Hoặc
cũng có thể chọn mẫu theo điều kiện cơ sở vật chất cho phép để tiến hành thí
nghiệm, khi đó phải tính lại d theo α, β, n đã chọn, hoặc tính lại β theo α, d, n
đã chọn nếu cần.
• Tiến hành thu thập dữ kiện D: Làm thí nghiệm để đánh giá sự giống hay khác
nhau về tính chất cảm quan của hai sản phẩm.
• Phân tích dữ kiện: Sử dụng các phương pháp thống kê để tính toán xác suất xảy
ra D khi H
0
là sự thật. Nói theo ngôn ngữ toán xác suất, đây là bước tính toán trò
số P(DH
0
) hay các đại lượng đại diện cho trò số này.
• Ứng với mức ý nghóa α cho trước, kết quả thu được chia thành hai trường hợp:
P(DH
0
) < α: Nếu giả thiết đảo H
0
đúng thì dữ kiện D xem như không xảy
ra (xác suất xảy ra D nếu H
0
đúng là rất thấp). Nhưng thực tế dữ kiện D đã
xảy ra, nên ta loại bỏ giả thiết đảo H
0
, công nhận giả thiết chính H, nghóa là
công nhận sự khác nhau về tính chất cảm quan của hai sản phẩm “có ý
nghóa thống kê” (significant).
P(DH
0
) ≥ α: Nếu giả thiết đảo H
0
đúng thì dữ kiện D vẫn có khả năng xảy
ra. Ta chưa có đủ bằng chứng để bác bỏ giả thiết đảo H
0
cũng như công
nhận giả thiết chính H, nghóa là chưa thể kết luận hai sản phẩm khác hay
giống nhau về tính chất cảm quan. Để kết luận hai sản phẩm giống nhau, ta
phải đánh giá độ rủi ro β hay lực kiểm đònh (power) 1 - β như đã nêu trên.
Theo Hình III.1.1, ta có:
• µ
0
và µ lần lượt là trò trung bình của giả thiết đảo H
0
và giả thiết chính H.
• d = µ – µ
0
là độ lớn của hiệu ứng, trong một số trường hợp đây là chênh lệch tỉ
lệ trả lời đúng mà ta có thể phát hiện ứng với α, β và n đã biết.
Ta thấy:
• Nếu số người hay tỉ lệ trả lời đúng nhỏ hơn giá trò điểm dừng thì xác suất phạm
sai lầm loại 1 sẽ tăng lên khi đưa ra quyết đònh là có sự phân biệt (loại bỏ H
0
),
nhưng xác suất phạm sai lầm loại 2 giảm khi quyết đònh là không có sự phân
biệt (chấp nhận H
0
).
• Nếu số người hay tỉ lệ trả lời đúng lớn hơn giá trò điểm dừng thì xác suất phạm
sai lầm loại 1 sẽ giảm khi loại bỏ H
0
, nhưng xác suất phạm sai lầm loại 2 sẽ
tăng lên khi chấp nhận H
0
.
SVTH: Nguyễn Ngọc Bảo Trân Trang 9
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Do đó:
• Nếu số người hay tỉ lệ trả lời đúng nhỏ hơn giá trò điểm dừng thì ta chấp nhận
giả thiết H
0
và rủi ro β sẽ nhỏ hơn giá trò đã chọn ban đầu.
• Nếu số người hay tỉ lệ trả lời đúng lớn hơn giá trò điểm dừng thì ta loại bỏ giả
thiết H
0
và rủi ro α sẽ nhỏ hơn giá trò đã chọn ban đầu.
d
Điểm dừng
Miền loại bỏ HoMiền chấp nhận Ho
β
α
µ
µ
o
Hình III.1.1: Minh họa các đường cong phân phối của giả thiết H
0
và H theo nguyên tắc xử
lý số liệu trong phép thử phân biệt
Mối quan hệ giữa α, β, d và n:
• Ứng với d và n không đổi, khi vò trí điểm dừng dòch sang trái thì α tăng, β giảm
và ngược lại.
• Ứng với d không đổi, khi n tăng thì α, β sẽ giảm, độ lệch chuẩn của các phân
phối cũng giảm, các phân phối trở nên cao và hẹp hơn, khoảng tin cậy chung
quanh các trò trung bình cũng co lại nên độ chính xác của phép kiểm đònh tăng.
• Trong nhiều trường hợp, các thí nghiệm được thực hiện chỉ với mối quan tâm
ban đầu là α và kích thước mẫu n. Khi đó, giữa β và d có quan hệ đơn điệu, ta
có thể quan sát sau khi thực hiện thí nghiệm để biết có thể kỳ vọng mức độ tin
cậy 1 – β là bao nhiêu ứng với các độ lớn khác nhau của hiệu ứng.
2. Các phương pháp xử lý số liệu trong phép thử phân biệt
2.1. Kiểm đònh Khi - bình phương
χ
2
2.1.1. Nội dung
Ta có χ
2
quan sát:
∑
−
=
T
TO
qs
2
2
)(
χ
(CT III.2.1)
Với O: Tần số quan sát
T: Tần số lý thuyết tính được với giả thiết H
0
là đúng (hai sản phẩm không
khác nhau về tính chất cảm quan)
SVTH: Nguyễn Ngọc Bảo Trân Trang 10
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Ứng với bậc tự do và mức ý nghóa α cho trước, ta có Khi - bình phương lý thuyết
χ
2
lt
. Kết quả thu được chia thành hai trường hợp:
• χ
2
qs
> χ
2
lt
(ứng với P(DH
0
) < α): Ta kết luận hai sản phẩm khác nhau về tính
chất cảm quan.
• χ
2
qs
≤ χ
2
lt
(ứng với P(DH
0
) ≥ α): Ta chưa thể kết luận hai sản phẩm khác nhau
về tính chất cảm quan.
Ví dụ: Tiến hành thí nghiệm cảm quan với phép thử phân biệt A - nonA để kiểm
đònh sự khác nhau về tính chất cảm quan của sản phẩm mới nonA với sản phẩm đã
có trên thò trường A. Xét trường hợp thí nghiệm không lặp, thực hiện 100 phép thử
cho 100 người thử, ta thu được bảng kết quả sau:
Bảng III.2.1: Số câu trả lời thực tế của người thử
Sản phẩm
Trả lời
Tổng
A nonA
A
33 18 50
nonA
22 27 50
Tổng
55 45 100
Trong tổng số 100 câu trả lời có 60 câu trả lời đúng. Liệu có thể kết luận hai sản
phẩm A và nonA khác nhau về tính chất cảm quan không?
Xử lý kết quả bằng kiểm đònh
χ
2
(CT III.2.1):
Ta có các tần số quan sát là số câu trả lời của người thử ứng với từng trường
hợp: O
1
= 33; O
2
= 18; O
3
= 22; O
4
= 27.
Tần số lý thuyết được tính theo công thức:
T = (Tổng hàng × Tổng cột)/Tổng chung (CT III.2.2)
Suy ra: T
1
= 27,5; T
2
= 22,5; T
3
= 27,5; T
4
= 22,5
Vậy:
4
522
52227
522
52218
527
52722
527
52733
22222
2
=
−
+
−
+
−
+
−
=
−
=
∑
,
),(
,
),(
,
),(
,
),()(
T
TO
qs
χ
Ứng với mức ý nghóa α = 0,05 và btd = (số hàng – 1)×(số cột – 1) = 1, ta có:
χ
2
lt
= 3,84 ⇒ χ
2
qs
> χ
2
lt
⇔ 4 > 3,84
Kết luận: Hai sản phẩm khác nhau về tính chất cảm quan.
Bảng II.2.2: Số câu trả lời thực tế và lý thuyết của người thử
Sản phẩm
Trả lời
Tổng
A nonA
Thực tế Lý thuyết Thực tế Lý thuyết
A
33 27,5 18 22,5 50
nonA
22 27,5 27 22,5 50
Tổng
55 45 100
SVTH: Nguyễn Ngọc Bảo Trân Trang 11
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
2.1.2. Ý nghóa:
Kiểm đònh χ
2
thực chất là kiểm đònh tính độc lập của hai đại lượng ngẫu nhiên:
• Loại sản phẩm X = {A, nonA}
• Câu trả lời của người thử Y = {A, nonA}
Khi này, giả thiết H
0
: “Hai sản phẩm không khác nhau về tính chất cảm quan” sẽ
tương đương với “X và Y độc lập”. Bởi vì khi X và Y độc lập thì câu trả lời của
người thử sẽ là ngẫu nhiên và không phụ thuộc vào sản phẩm là A hay nonA, nói
cách khác người thử không phân biệt được sự khác nhau về tính chất cảm quan của
hai sản phẩm.
Ứng với bậc tự do btd =1 và mức ý nghóa α cho trước, kết quả thu được ứng với hai
trường hợp:
• χ
2
qs
> χ
2
lt
: Ta bác bỏ giả thiết H
0
, nói cách khác X và Y phụ thuộc vào nhau,
nghóa là người thử phân biệt được sự khác nhau giữa hai sản phẩm. Ta kết luận
hai sản phẩm khác nhau về tính chất cảm quan.
• χ
2
qs
≤ χ
2
lt
: Câu trả lời của người thử có thể chỉ do ngẫu nhiên, ta chưa có đủ
bằng chứng để công nhận sự phụ thuộc của X và Y cũng như bác bỏ giả thiết
H
0
. Ta chưa thể kết luận hai sản phẩm khác nhau về tính chất cảm quan.
2.2. Kiểm đònh nhò phân (binomial test)
2.2.1. Nội dung
Nếu giả thiết H
0
đúng (Hai sản phẩm không khác nhau về tính chất cảm quan), gọi
xác suất người thử trả lời đúng trong mỗi phép thử là p. Ta có trong phép thử:
• A - nonA, hai - ba, giống - khác, 2-AFC: p = 1/2 = 0,5.
• Tam giác, 3-AFC: p = 1/3.
Đặt X là đại lượng ngẫu nhiên đặt trưng cho số câu trả lời đúng của người thử, ta
có:
• Xác suất để có k câu trả lời đúng trong n câu trả lời: (Công thức Bernoulli)
P(X = k) = P(n, k, p) =
knkk
n
ppC
−
− )(1
, k = 0 đến n (CT III.2.3)
• Suy ra xác suất có từ k đến n câu trả lời đúng trong n câu trả lời:
P(X
≥
k) =
∑∑
−
=
−
=
−
−−=−
1
0
111
k
i
inii
n
n
ki
inii
n
ppCppC )()(
(CT III.2.4)
Ứng với mức ý nghóa α cho trước, kết quả thu được chia thành hai trường hợp:
• P(X ≥ k) < α (ứng với P(DH
0
) < α): Ta kết luận hai sản phẩm khác nhau về
tính chất cảm quan.
• P(X ≥ k) ≥ α (ứng với P(DH
0
) ≥ α): Ta chưa thể kết luận hai sản phẩm khác
nhau về tính chất cảm quan.
Ví dụ: Ta xét lại Ví dụ ở phần II.2.1 với n = 100; k = 60; p = 0,5.
Xử lý kết quả bằng kiểm đònh nhò phân (CT III.2.4):
Xác suất để có từ 60 câu trả lời đúng trở lên trong 100 câu trả lời:
P(X ≥ 60) =
∑∑
=
−
=
−
−−=−
59
0
100
100
100
60
100
100
50150150150
i
iii
i
iii
CC ),(,),(,
= 0,0284
SVTH: Nguyễn Ngọc Bảo Trân Trang 12
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Ta có thể tính P(X ≥ 60) bằng các phần mềm như Microsoft Excel, R, … (được
trình bày trong phần Phụ lục).
Ứng với mức ý nghóa α = 0,05, ta có P(X ≥ 60) < α ⇔ 0,0284 < 0,05.
Kết luận: Hai sản phẩm khác nhau về tính chất cảm quan.
2.2.2. Ý nghóa
Kiểm đònh nhò phân thực chất là kiểm đònh tính ngẫu nhiên trong các câu trả lời
của người thử. Khi này, giả thiết H
0
: “Hai sản phẩm không khác nhau về tính chất
cảm quan” sẽ tương đương với “Người thử không nhận biết được sự khác nhau giữa
hai sản phẩm”, nghóa là câu trả lời người thử đưa ra là ngẫu nhiên với xác suất p.
Ví dụ trong phép thử A - nonA, người thử phải chọn một trong hai câu trả lời A và
nonA nên xác suất trả lời đúng trong mỗi lần thử sẽ là 0,5.
Ứng với mức ý nghóa α, kết quả thu được chia thành hai trường hợp:
• P(X ≥ k) < α: Nếu H
0
đúng, nghóa là nếu câu trả lời của người thử chỉ là ngẫu
nhiên, thì xác suất có từ k câu trả lời đúng trở lên trong n câu trả lời là rất thấp.
Ta bác bỏ giả thiết H
0
, nói cách khác câu trả lời của người thử không phải do
ngẫu nhiên. Ta kết luận hai sản phẩm khác nhau về tính chất cảm quan.
• P(X ≥ k) ≥ α: Câu trả lời của người thử có thể chỉ do ngẫu nhiên. Ta chưa thể
bác bỏ giả thiết H
0
, cũng như chưa thể kết luận hai sản phẩm khác nhau về tính
chất cảm quan.
2.3. Kiểm đònh Z về tỉ lệ theo phân phối chuẩn (normal distribution)
2.3.1. Nội dung
Nếu giả thiết H
0
đúng (Hai sản phẩm không khác nhau về tính chất cảm quan), ta
có:
npq
npX
Z
50,−−
=
(CT III.2.5)
Với X: Đại lượng ngẫu nhiên đặt trưng cho số câu trả lời đúng của người thử
n: Tổng số câu trả lời
p: xác suất trả lời đúng ngẫu nhiên (phần III.2.2.1)
q = 1 – p
0,5: Hệ số hiệu chỉnh liên tục
So sánh Z với Z
α
là giá trò tra trong Bảng xác suất tích lũy của phân phối chuẩn
chuẩn tắc (standard normal distribution) ứng với mức ý nghóa α. Kết quả thu được
chia thành hai trường hợp:
• Z > Z
α
(ứng với P(DH
0
) < α): Ta kết luận hai sản phẩm khác nhau về tính chất
cảm quan.
• Z ≤ Z
α
(ứng với P(DH
0
) ≥ α): Ta chưa thể kết luận hai sản phẩm khác nhau về
tính chất cảm quan.
Ví dụ: Ta xét lại Ví dụ ở phần II.2.1 với n = 100; X = 60; p = 0,5.
Xử lý kết quả bằng kiểm đònh Z (CT III.2.5):
Ta có:
91
5050100
505010060
,
,,
,,
=
××
−×−
=Z
Ứng với mức ý nghóa một phía α = 0,05, ta có Z > Z
α
⇔ 1,9 > 1,645.
SVTH: Nguyễn Ngọc Bảo Trân Trang 13
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Kết luận: Hai sản phẩm khác nhau về tính chất cảm quan.
2.3.2. Ý nghóa
Kiểm đònh Z về tỉ lệ theo phân phối chuẩn nhò phân thực chất là kiểm đònh tính
ngẫu nhiên trong các câu trả lời của người thử tương tự như kiểm đònh nhò phân.
3. Nhận xét
Việc sử dụng các kiểm đònh thống kê nêu trên để xử lý số liệu trong phép thử phân
biệt khá đơn giản và tiện lợi. Tuy nhiên chúng cũng có những mặt hạn chế nhất đònh.
Về mục đích:
Mục đích của các kiểm đònh thống kê trên là so sánh “xác suất dữ kiện D xảy ra
nếu giả thiết đảo H
0
là sự thật” với mức ý nghóa α cho trước. Vậy giá trò P(DH
0
) không
trực tiếp cho ta biết về sự tồn tại của giả thiết chính H, nó chỉ gián tiếp cung cấp bằng
chứng để chúng ta bác bỏ giả thiết đảo H
0
và chấp nhận giả thiết chính H mà thôi. Nói
cách khác, giá trò P(DH
0
) ước tính mức độ khả dó của dữ kiện chứ không cho ta biết mức
độ khả dó của giả thiết. Điều này đã dẫn đến những bất tiện trong việc xử lý kết quả của
phép thử phân biệt:
• Trường hợp giả thiết chính H được công nhận, ta vẫn không ước lượng được cụ
thể xác suất tồn tại của giả thiết chính là bao nhiêu.
• Trường hợp chưa có đủ bằng chứng bác bỏ giả thiết đảo H
0
và công nhận giả
thiết chính H, ta cũng không biết xác suất tồn tại của giả thiết nào chiếm ưu thế
hơn.
• Phương pháp này cũng gây khó khăn cho các nhà nghiên cứu và sản xuất khi
họ muốn kiểm đònh tính tương tự giữa các sản phẩm, nghóa là kỳ vọng các mẫu
thử giống nhau thay vì khác nhau về tính chất cảm quan (giả thiết chính H thay
đổi). Bởi vì theo cách lập luận ở phần III.1, nếu ta thay giả thiết đảo H
0
bằng
giả thiết H: “Hai sản phẩm không khác nhau về tính chất cảm quan” thì khi thu
được kết quả có P(DH) ≥ α, ta sẽ không có đủ bằng chứng để công nhận giả
thiết H cũng như kết luận về tính tương tự giữa hai sản phẩm nếu không xét
đến rủi ro β.
Đây chính là khiếm khuyết quan trọng của các phương pháp trên. Trong khoa học
thực nghiệm, điều mà nhà nghiên cứu muốn biết là với dữ kiện mà họ có được, xác suất
của giả thiết chính là bao nhiêu, chứ họ không muốn biết nếu giả thiết đảo là sự thật thì
xác suất của dữ kiện là bao nhiêu. Nói cách khác, nhà nghiên cứu muốn biết P(HD) chứ
không muốn biết P(DH
0
) hay P(DH).
Về các điều kiện ràng buộc:
• Khả năng đưa ra câu trả lời đúng của mỗi người thử là như nhau và bằng:
p
c
= p
d
+ (1 – p
d
)p
0
(Jian Bi, 2001) (CT III.3.1)
Với p
c
: xác suất trả lời đúng của mỗi người thử
p
d
: tỉ lệ những người thật sự phân biệt được hai sản phẩm (discriminator
hay detector) trong tổng số người thử
p
0
: xác suất trả lời đúng ngẫu nhiên (phần III.2.2.1)
SVTH: Nguyễn Ngọc Bảo Trân Trang 14
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Tuy nhiên, điều kiện này mâu thuẫn với thực tế vì khả năng trả lời đúng của
mỗi người thử thay đổi theo năng lực, kinh nghiệm cá nhân, điều kiện thí nghiệm
cũng như độ khó của phép thử. Ta không thể quy toàn bộ người thử về hai nhóm
người: “những người phân biệt” thật sự nhìn thấy sự khác biệt nên đưa ra câu trả
lời đúng với xác suất bằng 1, và “những người không phân biệt” chỉ đoán để trả lời
với xác suất trả lời đúng ngẫu nhiên p
0
.
• Các câu trả lời phải độc lập với nhau: Trong trường hợp phải thực hiện các thí
nghiệm lặp (do điều kiện thời gian, chi phí, … không cho phép tiến hành với quá
nhiều người thử), ta không dám chắc thu được các đánh giá hoàn toàn độc lập,
vì kết quả của câu trả lời sau có thể phụ thuộc vào câu trả lời trước đó đối với
từng người thử.
IV. CÁCH XỬ LÝ SỐ LIỆU TRONG PHÉP THỬ PHÂN BIỆT BẰNG
PHƯƠNG PHÁP THỐNG KÊ BAYESIAN [6]
1. Phương pháp xử lý số liệu theo thống kê Bayesian
Khác với các phương pháp nêu trên xem xác suất đưa ra câu trả lời đúng của người
thử hay tỉ lệ trả lời đúng (ký hiệu p) là hằng số chưa biết, thống kê Bayesian xem tham số
p chưa biết là biến ngẫu nhiên tuân theo phân phối beta (Beta distribution).
Phân phối beta được sử dụng vì tính linh hoạt và đa dụng của nó. Nó có thể bao
gồm nhiều loại phân phối khác nhau, từ phân phối đều (uniform distribution) đến phân
phối hình chữ U (U-shaped), hình chuông (bell-shaped), phân phối đối xứng (symetric
distribution) cũng như không đối xứng (nonsymetric distribution).
1.1. Sơ lược về phân phối beta
Gọi X là đại lượng ngẫu nhiên liên tục nhận giá trò x ∈ [0; 1].
Theo phân phối beta, ta có:
• Các tham số của phân phối beta: a > 0 và b > 0
• Hàm mật độ xác suất: (probability density function)
11
11
1
1
−−
−−
−
ΓΓ
+Γ
=
−
=
ba
ba
xx
ba
ba
baB
xx
baxf )(
)()(
)(
),(
)(
),,(
(CT IV.1.1)
Với Γ: hàm gamma và B: hàm beta
• Hàm phân phối tích lũy: (cumulative distribution function)
),(
),(
),(
),(
)(
),,( baI
baB
baB
baB
dttt
baxF
x
x
x
ba
==
−
=
∫
−−
0
11
1
(CT IV.1.2)
• Trung bình (mean) và kỳ vọng:
ba
a
XE
+
== )(
µ
(CT IV.1.3)
• Phương sai: (variance)
)(
)()(
)(
µγµσ
−=
+++
== 1
1
2
2
baba
ab
XD
(CT IV.1.4)
Với
1
1
++
=
ba
γ
(CT IV.1.5)
SVTH: Nguyễn Ngọc Bảo Trân Trang 15
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Hình IV.1.1: Các dạng đường cong phân phối beta
1.2. Các bước thực hiện
1.2.1. Xác đònh phân phối tiên nghiệm của tham số tỉ lệ p
Các đại lượng của phân phối tiên nghiệm đối với tham số p:
• Trung bình (kỳ vọng) tiên nghiệm
µ
.
• Phương sai tiên nghiệm
σ
2
(hay độ lệch chuẩn tiên nghiệm
σ
).
Các đại lượng này được xác đònh dựa trên các thông tin tiên nghiệm (prior
information hay prior knowledge) tức là những hiểu biết hay kinh nghiệm trong việc đánh
giá các tính chất cảm quan của sản phẩm thu được từ những nghiên cứu đi trước.
Nếu ta không có bất kỳ thông tin nào về sự giống – khác nhau của hai sản phẩm
thì ta xác đònh các đại lượng trên theo phân phối đều (uniform distribution) nghóa là a = b
= 1.
Áp dụng phân phối beta cho tham số p:
• Xem p là đại lượng ngẫu nhiên liên tục nhận giá trò [0; 1], dựa trên kỳ vọng và
phương sai tiên nghiệm, ta tính được các tham số tiên nghiệm (hypo-parameter)
a và b như sau:
−
−
= 1
1
2
σ
µµ
µ
)(
a
(CT IV.1.8)
và
−
−
−= 1
1
1
2
σ
µµ
µ
)(
)(b
(CT IV.1.9)
• Trường hợp p tuân theo phân phối đều, khi đó xác suất P(p = p
i
) là như nhau với
p
i
∈ [0; 1]. Ta có:
Các tham số: a = b = 1.
SVTH: Nguyễn Ngọc Bảo Trân Trang 16
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Trung bình: µ = 0,5 và phương sai: σ
2
= 1/12 = 0,0833 (CT IV.1.4)
1.2.2. Xác đònh phân phối hậu nghiệm của tham số tỉ lệ p
Phân phối hậu nghiệm đối với tỉ lệ p chính là sự tổng hợp của thông tin tiên
nghiệm và dữ kiện quan sát trong thực tế.
Giả sử thực hiện phép thử phân biệt trong thực tế thu được n câu trả lời trong đó có
x câu trả lời đúng.
Ta có:
• Các tham số hậu nghiệm a
*
và b
*
:
a
*
= a + x (CT IV.1.10)
và b
*
= n – x + b (CT IV.1.11)
• Trung bình hậu nghiệm:
µ
*
ban
ax
++
+
=
(CT IV.1.12)
• Phương sai hậu nghiệm:
σ
2*
=
γ
*
µ
*
(1 –
µ
*
) (CT IV.1.13)
Với
γ
*
1
1
1
1
++
=
+++
=
∗∗
ba
ban
(CT IV.1.14)
1.2.3. Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm – Xác đònh
khoảng tin cậy của tỉ lệ p ứng với mức ý nghóa
α
cho trước
Dựng đường cong phân phối beta:
Ta có thể dựng các đường cong phân phối beta tiên nghiệm và hậu nghiệm cũng
như tính toán giá trò các hàm mật độ f(p), hàm xác suất tích lũy F(p), hàm đònh bậc p[F(p)]
bằng cách sử dụng phần mềm thống kê R. Các đoạn code phục vụ cho quá trình tính toán
sẽ được trình bày trong phần Phụ lục.
Đường cong phân phối hậu nghiệm có độ nhọn cao hơn ứng với phương sai nhỏ hơn
phân phối tiên nghiệm (σ
2*
< σ
2
), điều đó có nghóa là mức độ chắc chắn đối với tham số p
của phân phối hậu nghiệm cao hơn phân phối tiên nghiệm.
Xác đònh khoảng tin cậy của p:
• Tính gần đúng: (Jian Bi, 2001)
Ứng với mức ý nghóa α cho trước, khoảng tin cậy hai phía (p
1
; p
2
) của p theo phân
phối hậu nghiệm được xác đònh như sau:
(
)
∗∗∗∗
×+×−=
22
21
σµσµ
αα
ZZpp ;);(
(CT IV.1.15)
Trong đó Z
α
là giá trò tra trong Bảng xác suất tích lũy của phân phối chuẩn chuẩn
tắc (standard normal distribution) [5] thỏa
2
1
α
α
−
=Φ )(Z
với:
Hàm tích phân Laplace:
∫
−
=Φ
u
x
dxeu
0
2
2
2
1
/
)(
π
và Hàm xác suất tích lũy: F(u) = Φ(u) + 0,5
• Dùng phần mềm thống kê R:
Ứng với mức ý nghóa α cho trước, ta dùng phần mềm thống kê R để tính hàm đònh
bậc p[F(p)], từ đó xác đònh được khoảng tin cậy hai phía (p
1
; p
2
) của p theo phân phối hậu
nghiệm dựa trên các điều kiện sau:
SVTH: Nguyễn Ngọc Bảo Trân Trang 17
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
p
1
là giá trò của p ứng với hàm xác suất tích lũy F
*
(p) =
α
/2
p
2
là giá trò của p ứng với hàm xác suất tích lũy F
*
(p) = 1 – (
α
/2)
1.2.4. Kiểm đònh giả thiết giả thiết chính H: (p
H
) theo dữ kiện thực tế D: (n,x) bằng
phương pháp thống kê Bayesian
Một cách tổng quát, từ đường cong phân phối beta hậu nghiệm, ta có thể tính các
xác suất ứng với giá trò p
H
bất kỳ:
P(p < p
H
) = F(p
H
) và P(p > p
H
) = 1 – F(p
H
)
Với hàm xác suất tích lũy F(p
H
) được tính bằng phần mềm thống kê R.
Khi đó, giá trò p
H
để kiểm đònh giả thiết chính H được chọn dựa trên:
• Mục đích của nhà sản xuất hay nghiên cứu: Mong muốn các sản phẩm là giống
hay khác nhau tùy theo chiến lược kinh doanh đối với người tiêu dùng. Một
cách gần đúng, có thể ước tính p
H
= p
c
theo tỉ lệ người phân biệt cho phép dựa
trên CT III.3.1 (tỉ lệ p
d
cao nếu kỳ vọng hai sản phẩm khác nhau và thấp nếu kỳ
vọng hai sản phẩm giống nhau).
• Nếu ta chỉ muốn xét xem hai sản phẩm giống hay khác nhau về tính chất cảm
quan mà không kỳ vọng p
H
đạt một giá trò nào đó thì thường chọn p
H
= p ngẫu
nhiên theo phần III.2.2.1.
Từ đó, ta có:
• Xác suất của giả thiết chính H:
P(H) = p
H
ứng với P(notH) = 1 – p
H
hoặc P(H) = 1 – p
H
ứng với P(notH) = p
H
• Xác suất của giả thiết chính H theo dữ kiện thực tế:
P(HD) = P(p < p
H
) = F(p
H
) ứng với P(notHD) = P(p > p
H
) = 1 – F(p
H
)
hoặc P(HD) = P(p > p
H
) = 1 – F(p
H
) ứng với P(notHD) = P(p < p
H
) = F(p
H
)
Theo (Carlin và Louis, 2000), ta có thể dùng thừa số (hệ số) Bayes (Bayes’ factor),
ký hiệu B, để đi đến kết luận về giả thiết chính H. Theo CT II.2.6, ta có:
)/().()/().(
)/()(
)(
)/()(
)/(
notHDPnotHPHDPHP
HDPHP
DP
HDPHP
DHP
+
==
)(/)(
)/(/)/(
)/(
)/(
)/()(
)/()(
)/(
)/(
21
21
2
1
22
11
2
1
HPHP
DHPDHP
HDP
HDP
B
HDPHP
HDPHP
DHP
DHP
==⇔=⇔
Suy ra
)(/)(
)/(/)/(
)/(
)/(
notHPHP
DnotHPDHP
notHDP
HDP
B ==
(CT IV.1.16)
• Nếu 2lnB ∈ [2,2; 6] ứng với B ∈ [3; 20,09]: Ta nói giả thiết H có bằng chứng
xác thực / rõ ràng (positive evidence).
• Nếu 2lnB > 6 ứng với B > 20,09: Ta nói giả thiết H có bằng chứng chắc chắn /
thuyết phục (strong evidence).
SVTH: Nguyễn Ngọc Bảo Trân Trang 18
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
2. Các ví dụ
2.1. Ví dụ 1
Xét Ví dụ ở phần II.2.1: Thực hiện phép thử phân biệt A - nonA thu được n = 100
câu trả lời trong đó có x = 60 câu trả lời đúng. Ta sẽ kiểm đònh sự giống/khác nhau của hai
sản phẩm theo phương pháp thống kê Bayesian.
Gọi p ∈ [0; 1] là đại lượng ngẫu nhiên đặc trưng cho xác suất đưa ra câu trả lời
đúng của người thử hay tỉ lệ trả lời đúng. Ta tiến hành các bước sau:
Xác đònh phân phối tiên nghiệm:
Do ta không có bất kỳ thông tin tiên nghiệm nào về hai sản phẩm, tức là không
biết hai sản phẩm có xu hướng giống hay khác nhau, nên ta xem tham số tỉ lệ p tuân theo
phân phối đều. Ta có:
• Các tham số: a = b =1
• Trung bình tiên nghiệm: µ = 0,5
• Phương sai tiên nghiệm: σ
2
= 1/12 = 0,0833
⇒ Độ lệch chuẩn σ = 0,2887.
Xác đònh phân phối hậu nghiệm:
• Các tham số:
a
*
= a + x = 1 + 60 = 61 (CT IV.1.10)
b
*
= n – x + b = 100 – 60 + 1 = 41 (CT IV.1.11)
• Suy ra:
Trung bình:
µ
*
59800
11100
160
,
=
++
+
=
++
+
=
ban
ax
(CT IV.1.12)
Phương sai:
σ
2*
=
γ
*
µ
*
(1 -
µ
*
) (CT IV.1.13)
00230103339259800159800
111100
1
3
,,),(, ≈×=−××
+++
=
−
⇒ Độ lệch chuẩn σ
*
= 0,0483
Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm
(dùng phần mềm R)
Xác đònh khoảng tin cậy (p
1
, p
2
) của phân phối hậu nghiệm: Chọn α = 0,05
• Theo (Jian Bi, 2001):
(
)
∗∗∗∗
×+×−=
22
21
σµσµ
αα
ZZpp ;);(
(CT IV.1.15)
Với µ
*
= 0,5980; Z
α
= 1,96 và σ
2*
= 2,333910
-3
⇒ (p
1
; p
2
) = (0,5034; 0,6927)
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,5034; 0,6927),
nghóa là 95% tỉ lệ trả lời đúng nằm trong khoảng (0,5034; 0,6927).
• Hoặc dùng phần mềm thống kê R, ta xác đònh được:
p
1
= 0,5017 ứng với xác suất tích lũy F(p
1
) = 0,025.
p
2
= 0,6907 ứng với xác suất tích lũy F(p
2
) = 0,975.
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,5017; 0,6907),
nghóa là 95% tỉ lệ trả lời đúng nằm trong khoảng (0,5017; 0,6907).
SVTH: Nguyễn Ngọc Bảo Trân Trang 19
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Hình IV.2.1: Đường cong phân phối beta tiên nghiệm và hậu nghiệm
Kiểm đònh giả thiết chính H(p
H
= 0,5) theo dữ kiện thực tế D(n, x):
• Nếu ta kỳ vọng vào giả thiết H: “Hai sản phẩm là khác nhau” nghóa là kỳ vọng
p > 0,5 thì ta có:
Xác suất của giả thiết H:
P(H) = 1 – p
H
= 0,5 ứng với P(notH) = p
H
= 0,5
Xác suất của giả thiết H theo dữ kiện thực tế D: “Có 60 câu trả lời đúng
trong 100 câu trả lời”: (dùng phần mềm R)
P(HD) = P(p > 0,5) = 1 – F(0,5) = 1 – 0,0230 = 0,9770
Ứng với P(notHD) = P(p < 0,5) = F(0,5) = 0,0230
Vậy xác suất để tỉ lệ trả lời đúng p > 0,5 là 97,70% hay xác suất hai sản
phẩm khác nhau là 97,70%.
Theo (Carlin và Louis, 2000), ta có:
)(/)(
)/(/)/(
)/(
)/(
notHPHP
DnotHPDHP
notHDP
HDP
B ==
(CT IV.1.16)
4842
5050
0230097700
,
,/,
,/,
==
⇒ 2lnB = 7,5 > 6
Ta nói giả thiết H có bằng chứng chắc chắn / thuyết phục (strong evidence).
Kết luận: Ta chấp nhận giả thiết H: “Hai sản phẩm khác nhau” ứng với P(p >
0,5) = 97,70% và 2lnB = 7,5.
• Ngược lại, nếu ta kỳ vọng vào giả thiết H: “Hai sản phẩm giống nhau” tức là
kỳ vọng p < 0,5 thì ta có:
P(H) = p
H
= 0,5 ứng với P(notH) = 1 – p
H
= 0,5
SVTH: Nguyễn Ngọc Bảo Trân Trang 20
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
P(HD) = P(p < 0,5) = F(0,5) = 0,0230
Ứng với P(notHD) = P(p > 0,5) = 1 – F(0,5) = 0,9770
Vậy xác suất để tỉ lệ trả lời đúng p < 0,5 là 2,30% hay xác suất hai sản
phẩm khác nhau là 2,30%.
Ta cũng có
02350
5050
9770002300
,
,/,
,/,
==B
⇒ 2lnB = -7,5 < 2,2
Kết luận: Ta bác bỏ giả thiết H: “Hai sản phẩm giống nhau” do P(p < 0,5) =
2,30% và 2lnB = -7,5.
2. 2. Ví dụ 2
Một nhà sản xuất chocolate muốn giảm lượng đường trong sản phẩm mà không bò
người tiêu dùng phát hiện. Họ đã thực hiện phép thử 2-AFC cho hai sản phẩm chocolate A
và B khác nhau về độ ngọt (A ngọt hơn B, B là sản phẩm mới có lượng đường thấp hơn)
và thu được 150 câu trả lời trong đó có 81 câu trả lời đúng (cho rằng A ngọt hơn B). Kỳ
vọng của nhà sản xuất đối với kết quả thí nghiệm là không có quá 20% người thử thật sự
phát hiện ra sự khác biệt. Vậy kỳ vọng của nhà sản xuất có phù hợp với kết quả thí
nghiệm không?
Ta sẽ xử lý kết quả phép thử theo phương pháp thống kê Bayesian.
Xác đònh phân phối tiên nghiệm:
Giả sử đây là lần làm thí nghiệm đầu tiên, nhà sản xuất không biết xác suất người
thử chọn A ngọt hơn B là bao nhiêu, nói cách khác ta không có thông tin tiên nghiệm về
hai sản phẩm, nên ta xem tham số tỉ lệ p tuân theo phân phối đều. Ta có:
• Các tham số: a = b =1
• Trung bình tiên nghiệm: µ = 0,5
• Phương sai tiên nghiệm: σ
2
= 1/12 = 0,0833
⇒ Độ lệch chuẩn σ = 0,2887.
Xác đònh phân phối hậu nghiệm: Biết n = 150 và x = 81
• Các tham số: a
*
= 82 và b
*
= 70
• Trung bình µ
*
= 0,5395
Phương sai σ
2*
= 1,6238.10
-3
≈ 0,0016 ⇒ Độ lệch chuẩn σ
*
= 0,0403
Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm: (phần mềm R)
Xác đònh khoảng tin cậy (p
1
, p
2
) của phân phối hậu nghiệm: Chọn α = 0,05
• Theo (Jian Bi, 2001): (p
1
, p
2
) = (0,4605; 0,6185)
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,4605; 0,6185),
nghóa là 95% tỉ lệ trả lời đúng nằm trong khoảng (0,4605; 0,6185).
• Dùng phần mềm thống kê R: (p
1
, p
2
) = (0,4601; 0,6178)
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,4601; 0,6178),
nghóa là 95% tỉ lệ trả lời đúng nằm trong khoảng (0,4601; 0,6178).
SVTH: Nguyễn Ngọc Bảo Trân Trang 21
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Hình IV.2.2: Đường cong phân phối beta tiên nghiệm và hậu nghiệm
Kiểm đònh giả thiết chính H(p
H
= 0,6) theo dữ kiện thực tế D(n, x):
Giá trò p
H
= 0,6 được tính dựa vào:
Tỉ lệ người phân biệt p
d
= 0,2
Xác suất trả lời đúng ngẫu nhiên p
0
= 0,5 (phần III.2.2.1)
Suy ra tỉ lệ trả lời đúng ước lượng p
H
= p
c
= p
d
+ (1 – p
d
)p
0
= 0,6 (CT III.3.1)
Ta có giả thiết H: “Tỉ lệ trả lời đúng p < 0,6” (ứng với tỉ lệ người phân biệt p
d
<
0,2) và dữ kiện D: “Có 81 câu trả lời đúng trong 150 câu trả lời”.
Suy ra:
• Các xác suất: P(H) = p
H
= 0,6 và P(HD) = P(p < 0,6) = F(0,6) = 0,9339
Vậy xác suất để tỉ lệ trả lời đúng p < 0,6 là 93,39% hay xác suất không có quá
20% người thử thực sự nhận thấy sự khác biệt là 93,39%.
• Theo (Carlin và Louis, 2000), ta có:
429
60160
93390193390
,
),/(,
),/(,
=
−
−
=B
⇒ 2,2 < 2lnB = 4,5 < 6
Ta nói giả thiết H có bằng chứng xác thực / rõ ràng (positive evidence).
Kết luận: Ta chấp nhận giả thiết H: “Tỉ lệ người phân biệt p
d
< 0,2” do P(p < 0,6)
= 93,39% và 2lnB = 4,5; nghóa là kỳ vọng của nhà sản xuất phù hợp với kết quả thí
nghiệm.
SVTH: Nguyễn Ngọc Bảo Trân Trang 22
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
2.3. Ví dụ 3 (Jian Bi, 2001)
Giả sử có 50 người tham gia phép thử phân biệt 2-AFC không đònh hướng
(nondirectional 2-AFC method) cho hai sản phẩm A và B, trong đó có 35 người chọn sản
phẩm A.
Gọi p ∈ [0; 1] là đại lượng ngẫu nhiên đặc trưng cho xác suất hay tỉ lệ chọn sản
phẩm A của người thử. Ta sẽ dùng phương pháp thống kê Bayesian để xử lý kết quả của
phép thử trên trong các trường hợp sau:
- Có thông tin tiên nghiệm: trung bình µ = 0,6 và phương sai σ
2
= 0,01.
- Không có thông tin tiên nghiệm, xem p tuân theo phân phối đều với a = b =1.
- Khảo sát ảnh hưởng của kích thước mẫu và thông tin tiên nghiệm đến đến kết quả
sau cùng của thí nghiệm.
2.3.1. Tham số p có thông tin tiên nghiệm
Xác đònh phân phối tiên nghiệm:
• Trung bình tiên nghiệm: Theo kinh nghiệm tiên nghiệm (prior experience), tỉ lệ
chọn sản phẩm A khoảng µ = 0,6.
• Phương sai tiên nghiệm: Theo tác giả, rất có khả năng tỉ lệ p nằm trong khoảng
0,5 đến 0,7, và thật đáng ngạc nhiên nếu p > 0,8 bởi vì có đến hai độ lệch
chuẩn (standard deviation) từ trò trung bình 0,6 đến 0,8. Do đó, phương sai sẽ có
giá trò khoảng σ
2
= 0,01 (nghóa là độ lệch chuẩn σ = 0,1).
• Suy ra các tham số:
8131
010
60160
601
1
2
,
,
),(,
,
)(
=
−
−
=
−
−
=
σ
µµ
µ
a
(CT IV.1.8)
291
010
60160
6011
1
1
2
,
,
),(,
),(
)(
)(
=
−
−
−=
−
−
−=
σ
µµ
µ
b
(CT IV.1.9)
Xác đònh phân phối hậu nghiệm: Biết n = 50 và x = 35
• Các tham số: a
*
= 48,8 và b
*
= 24,2
• Trung bình µ
*
= 0,6685
Phương sai σ
2*
= 2,9947.10
-3
≈ 0,0030 ⇒ Độ lệch chuẩn σ
*
= 0,0547
Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm: (phần mềm R)
Xác đònh khoảng tin cậy (p
1
, p
2
) của phân phối hậu nghiệm: Chọn α = 0,05
• Theo (Jian Bi, 2001): (p
1
, p
2
) = (0,5612; 0,7758)
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,5612; 0,7758),
nghóa là 95% tỉ lệ chọn sản phẩm A nằm trong khoảng (0,5612; 0,7758).
• Dùng phần mềm thống kê R: (p
1
, p
2
) = (0,5572; 0,7710)
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,5572; 0,7710),
nghóa là 95% tỉ lệ chọn sản phẩm A nằm trong khoảng (0,5572; 0,7710).
SVTH: Nguyễn Ngọc Bảo Trân Trang 23
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Hình IV.2.3: Đường cong phân phối beta tiên nghiệm và hậu nghiệm
Kiểm đònh các giả thiết H theo dữ kiện thực tế D(n, x):
Ta có dữ kiện D: “Có 35 người chọn sản phẩm A trong tổng số 50 người thử”.
- Giả thiết H
1
(p
H
= 0,5): “Tỉ lệ chọn sản phẩm A: p > 0,5”. Suy ra:
• Các xác suất: P(H) = 1 – p
H
= 0,5 và P(HD) = P(p > 0,5) = 1 – F(0,5) = 0,9983
Vậy xác suất để tỉ lệ chọn sản phẩm A: p > 0,6 là 99,83%.
• Theo (Carlin và Louis, 2000), ta có:
24587
5050
99830199830
,
,/,
),/(,
=
−
=B
⇒ 2lnB = 12,75 > 6
Ta nói giả thiết H
1
có bằng chứng chắc chắn / thuyết phục (strong evidence).
Kết luận: Ta chấp nhận giả thiết H
1
: “Tỉ lệ chọn sản phẩm A lớn hơn 0,5” do P(p
> 0,6) = 99,83% và 2lnB = 12,75; nghóa là hai sản phẩm A và B khác nhau.
Ta cũng thấy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là(0,5572;
0,7710) không bao gồm p = 0,5, nên nếu không kiểm đònh giả thiết H
1
thì ta cũng có thể
kết luận: “Với khoảng tin cậy 95% thì hai sản phẩm khác nhau”.
- Giả thiết H
2
(p
H
= 0,6): “Tỉ lệ chọn sản phẩm A: p > 0,6”. Suy ra:
• Các xác suất: P(H) = 1 – p
H
= 0,4 và P(HD) = P(p > 0,6) = 1 – F(0,6) = 0,8910
Vậy xác suất để tỉ lệ chọn sản phẩm A: p > 0,6 là 89,10%.
• Theo (Carlin và Louis, 2000), ta có:
2612
6040
89100189100
,
,/,
),/(,
=
−
=B
⇒ 2,2 < 2lnB = 5,01 < 6
Ta nói giả thiết H
2
có bằng chứng xác thực / rõ ràng (positive evidence).
SVTH: Nguyễn Ngọc Bảo Trân Trang 24
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Kết luận: Ta chấp nhận giả thiết H
2
: “Tỉ lệ chọn sản phẩm A lớn hơn 0,6” do P(p
> 0,6) = 89,10% và 2lnB = 5,01.
Ta cũng thấy dữ kiện thực tế D(n, x) = D(50 ; 35) đã làm thay đổi mức độ tin tưởng
vào khả năng tồn tại của thông tin tiên nghiệm ban đầu với µ = 0,6 và σ = 0,1.
- Kiểm đònh tính tương tự theo giới hạn tương tự d’ của mô hình Thurstone ([5], trang
117 – 129):
• Theo (Ennis, 1993), ta có d’ = 1 ứng với tỉ lệ trả lời đúng p = 0,76 và d’ = 0,5
ứng với p = 0,64.
Khi d’ = 1 (p
H
= 0,76) ta có giả thiết H
1
: “Tỉ lệ chọn sản phẩm A (trả lời đúng)
nhỏ hơn 0,76”.
Suy ra: P(H) = 0,76 và P(HD) = P(p < 0,76) = F(0,76) = 0,9581.
Vậy xác suất để tỉ lệ trả lời đúng p > 0,76 là 95,81%.
Kết luận: Với giới hạn tương tự d’ = 1, ta kết luận hai sản phẩm giống nhau
với xác suất 95,81%.
• Khi d’ = 0,5 (p
H
= 0,64) ta có giả thiết H
2
: “Tỉ lệ chọn sản phẩm A (trả lời
đúng) nhỏ hơn 0,64”.
Suy ra: P(H) = 0,64 và P(HD) = P(p < 0,64) = F(0,64) = 0,2958.
Vậy xác suất để tỉ lệ trả lời đúng p > 0,64 là 29,58%.
Kết luận: Với giới hạn tương tự d’ = 0,5, ta chưa thể kết luận hai sản phẩm
giống nhau do xác suất để tỉ lệ p < 0,64 thấp, chỉ có 29,58%.
Từ đó, ta thấy việc đưa ra kết luận về tính tương tự của hai sản phẩm phụ thuộc
vào việc chọn giới hạn tương tự của nhà sản xuất hay nghiên cứu. Tùy đối tượng tiêu dùng
mà chọn giới hạn tương tự d’ phù hợp, ta thấy d’ nhỏ đối với người tiêu dùng chặt chẽ và
lớn đối với người tiêu dùng dễ dãi.
2.3.2. Tham số p ban đầu tuân theo phân phối đều
Xác đònh phân phối tiên nghiệm:
• Các tham số: a = b =1
• Trung bình tiên nghiệm: µ = 0,5
• Phương sai tiên nghiệm: σ
2
= 1/12 = 0,0833
⇒ Độ lệch chuẩn σ = 0,2887.
Xác đònh phân phối hậu nghiệm: Biết n = 50 và x = 35
• Các tham số: a
*
= 36 và b
*
= 16
• Trung bình µ
*
= 0,6923
Phương sai σ
2*
= 4,0192.10
-3
≈ 0,0040 ⇒ Độ lệch chuẩn σ
*
= 0,0634
Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm: (phần mềm R)
Xác đònh khoảng tin cậy (p
1
, p
2
) của phân phối hậu nghiệm: Chọn α = 0,05
• Theo (Jian Bi, 2001): (p
1
, p
2
) = (0,5681; 0,8166)
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,5681; 0,8166),
nghóa là 95% tỉ lệ trả lời đúng nằm trong khoảng (0,5681; 0,8166).
• Dùng phần mềm thống kê R: (p
1
, p
2
) = (0,5617; 0,8089)
SVTH: Nguyễn Ngọc Bảo Trân Trang 25