Tải bản đầy đủ (.pdf) (45 trang)

Bài giảng THIẾT KẾ VÀ PHÂN TÍCH THÍ NGHIỆM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (382.5 KB, 45 trang )

0

TRƯỜNG ðẠI HỌC NHA TRANG
KHOA CHẾ BIẾN










Bài giảng


THIẾT KẾ VÀ PHÂN TÍCH THÍ NGHIỆM
(Lưu hành nội bộ)

Người biên soạn:
ðặng Thị Thu Hương
























Nha Trang, tháng 4 năm 2010
1

Tài liệu học
1. Bài giảng Thiết kế và phân tích thí nghiệm – ðặng Thị Thu Hương
2. ðặng Văn Giáp. Phân tích dữ liệu khoa học bằng chương trình MS- Excel. NXB giáo dục-
1997.
5. Tài liệu tham khảo:
I. TIẾNG VIỆT
1. Nguyễn Cảnh. Quy hoạch thực nghiệm.Trường ñại học bách khoa Tp HCM 2004.
2. Nguyễn Cảnh- Nguyễn ðình Soa. Tối ưu hoá thực nghiệm trong hoá học và kỹ
thuật hoá học.Tài liệu dịch- Trường ñại học kỹ thuật Tp Hồ Chí minh 1994.
3. Phạm Hiếu Hiền. Phương pháp bố trí thí nghiệm và xử lý số liệu. NXB nông
nghiệp - Tp Hồ Chí Minh 2001.
4. Phạm Văn Lang- Bạch Quốc Khang. Cơ sở lý thuyết quy hoạch thực nghiệm và
ứng dụng trong kỹ thuật nông nghiệp .NXB nông nghiệp Hà Nội- 1998.

5. Chu Văn Mẫn – ðào Hữu Hồ. Thống kê sinh học. NXB khoa học và kỹ thuật – 2001.
II. TIẾNG ANH
1. W. Michael Kelly and Robert A. Donnelly Jr.2009. The humongous book of statistic
problems
2. D. Brynn Hibbert and J. Justin Gooding 2006. Data Analysis for Chemistry
3. John A. Bower 2009. Statistical Methods for Food Science










2

CHƯƠNG 1. THU THẬP VÀ TRÌNH BÀY SỐ LIỆU
1.1.Tổng thể và mẫu
1.1.1.Tổng thể (population, ñám ñông )
Là toàn bộ tập hợp các phần tử ñồng nhất theo một dấu hiệu nghiên cứu ñịnh tính
hoặc ñịnh lượng nào ñó (là tập hợp các ñối tượng có chung một tính chất nào ñó mà
chúng ta ñang quan tâm). Số lượng các phần tử của tổng thể ñược gọi là kích thước của
tổng thể, ký hiệu N.
Dấu hiệu ñịnh lượng: là những dấu hiệu quan sát cho những giá trị bằng số.
Dấu hiệu ñịnh tính: là những dấu hiệu quan sát cho những tính chất.
1.1.2 Mẫu (sample)
Từ tổng thể N phần tử chọn ra một tập hợp con n phần tử và chỉ tập trung nghiên
cứu n phần tử ñó ñể rút ra những kết luận về tổng thể thì tập hợp con ñó ñược gọi là

mẫu. Số phần tử của mẫu ñược gọi là kích thước mẫu, ký hiệu n. Các thí nghiệm ñược
tiến hành trên mẫu, kết quả thu ñược qua xử lý thống kê ñể suy rộng ra cho cả tổng thể.
Lý do ñể chúng ta tiến hành nghiên cứu trên mẫu chứ không phải trên tổng thể là do:
- Quy mô của tập hợp quá lớn, việc nghiên cứu toàn bộ sẽ ñòi hỏi nhiều chi phí vật chất và
thời gian.
- Quy mô của tập hợp quá lớn vì vậy có thể xảy ra trường hợp tính trùng hoặc bỏ sót
các phần tử của nó.
- Quy mô nghiên cứu lớn nhưng trình ñộ tổ chức nghiên cứu lại hạn chế dẫn ñến sai
sót trong quá trình thu thập thông tin ban ñầu, do ñó hạn chế ñộ chính xác của kết quả
phân tích.
- Nếu các phần tử của tập hợp bị phá huỷ trong quá trình nghiên cứu thì phương pháp
nghiên cứu toàn bộ trở thành vô nghĩa.
Do ñó phương pháp nghiên cứu toàn bộ thường chỉ áp dụng ñối với tập hợp các
phần tử có quy mô nhỏ, còn chủ yếu là áp dụng phương pháp nghiên cứu không toàn
bộ ñặc biệt là phương pháp chọn mẫu.
Phương pháp nghiên cứu chọn mẫu: Là phương pháp chọn ra một tập hợp các phần
tử từ tổng thể nghiên cứu, phân tích các tổng thể này và dựa vào ñó mà mà suy ra các
kết luận về tập hợp cần nghiên cứu. Nếu mẫu ñược chọn ra một cách ngẫu nhiên và xử
3

lý bằng phương pháp xác suất thì các kết luận sẽ thu ñược một cách nhanh chóng, ñỡ
tốn kém mà vẫn bảo ñảm ñộ chính xác cần thiết.
Do ñặc ñiểm là mẫu có kích thước hữu hạn n<<N nên những kết luận ñược suy
ra từ mẫu cho tổng thể sẽ có một sai số (gọi là sai số do chọn mẫu). Thường có hai
nguyên nhân dẫn ñến sai số do chọn mẫu:
- Kích thước mẫu quá nhỏ so với tổng thể.
- Phương pháp chọn mẫu không khách quan
⇒ Do vậy chúng ta phải có phương pháp chọn mẫu phù hợp và kích thước mẫu phải
ñủ lớn ñể ñạt ñược ñộ tin cậy.
Các phương pháp chọn mẫu:

- Chọn mẫu ngẫu nhiên ñơn giản
- Chọn mẫu ngẫu nhiên phân tầng
- Chọn mẫu ngẫu nhiên hệ thống
- Chọn mẫu cụm
Thông tin ñầu tiên và nhiều khi cũng là thông tin duy nhất mà chúng ta dựa vào
ñể nghiên cứu, phân tích chính là các kết quả quan sát có ñược vì vậy các kết quả này
phải ñảm bảo tính chính xác, tính ngẫu nhiên của nó, phải là các ñại diện một cách
trung thực cho hiện tượng hoặc cho ñại lượng mà chúng ta ñang nghiên cứu.
Xuất phát từ thông tin sai lệch thì các kết luận nhận ñược sẽ phản ánh không
ñúng hiện tượng nghiên cứu thậm trí còn làm cho ta nghi ngờ ngay cả tính hiệu quả của
phương pháp chúng ta sử dụng. Do vậy trước tiên ta quan tâm ñến việc thu thập thông
tin ban ñầu.
Việc thu thập thông tin phải ñảm bảo các yêu cầu sau
- Các quan sát ñộc lập hay phép thử ñộc lập: các quan sát (phép thử) ñược tiến hành
một cách ñộc lập với nhau, kết quả của phép thử (quan sát) này không phụ thuộc vào
kết quả của phép thử (quan sát) khác và cũng không ảnh hưởng ñến khả năng xảy ra
kết quả của phép thử (quan sát) khác.
- Các phép thử lặp: các phép thử ñược tiến hành trong các ñiều kiện hoàn toàn như nhau.


4

1.2. Thu thập số liệu
Là quá trình cân, ñong, ño, ñếm trên các mẫu ñược chọn. Trong quá trình thu thập
số liệu thường gặp các loại sai số sau:
* Sai số thô: Là sai số phát sinh khi phạm các ñiều kiện cơ bản của việc thu thập số
liệu do sự bất cẩn của người làm công tác thu thập số liệu hoặc sử dụng sai phương
pháp lấy số liệu do chọn mẫu không ñúng phương pháp. Loại sai số này không ñược
chấp nhận trong thống kê, vì vậy phải ñựơc loại bỏ.
* Sai số hệ thống: Loại sai số này không ñổi trong một loạt ño và thay ñổi theo một quy luật

nhất ñịnh. Sai số này phát sinh là do phương pháp hoặc do dụng cụ thu thập số liệu. Trong
thống kê có thể chấp nhận loại sai số này nhưng phải ñược hiệu chỉnh trước khi tính toán
thống kê
* Sai số ngẫu nhiên: Là những sai số của phép ño còn lại sau khi ñã loại bỏ sai số hệ
thống và sai số thô. ðây là những sai số bắt buộc có trong quá trình thu thập số liệu mà
con người không hạn chế ñược nó, chính vì vậy mà nó ñược chấp nhận trong thống kê.
1.3.Trình bày số liệu
Sau khi ñiều tra thống kê chúng ta thu thập ñược hàng loạt thông tin (gọi là dữ
liệu ban ñầu hay dữ liệu thô, gốc). Tuỳ theo mục ñích nghiên cứu mà có cách xử lý số
liệu gốc khác nhau.
ðể những thông tin này có tác dụng cần sắp xếp chúng theo trật tự nhất ñịnh
(theo kiểu có ý nghĩa).Việc sắp xếp này giúp cho chúng ta có một sự ñánh giá chung về
phân phối dữ liệu, sơ bộ phát hiện ra các ñặc ñiểm của mẫu nghiên cứu làm cơ sở cho
việc ñưa ra những quyết ñịnh ñúng ñắn.
Các cách trình bày số liệu gốc
1.3.1.Trình bày số liệu dưới dạng các bảng mô tả
• Bảng mô tả ñặc tính ñịnh tính
• Bảng mô tả ñặc tính ñịnh lượng
1.3.2. Trình bày số liệu thống kê bằng biểu ñồ.
Biểu ñồ là một hình ảnh cho phép thấy toàn bộ số liệu, những nét ñặc trưng của
tập hợp mẫu, những sự kiện ñáng chú ý, gợi cho người nghiên cứu những ñiều cần so
sánh, những ñiểm cực trị của số liệu, thấy mối quan hệ giữa các hiện tượng. Nó cho
5

phép phát hiện nhanh các biến thiên bất thường hoặc một sự gián ñoạn ñột ngột ở chiều
hướng tiến triển của sự kiện.
Khi trình bày số liệu bằng biểu ñồ phải theo nguyên tắc:
- Biểu ñồ phải rõ ràng, không rườm rà, bỏ qua chi tiết không cần thiết
- Những chỉ dẫn trên biểu ñồ phải ñược hiểu dễ dàng
- Chú ý ñơn vị ño của biểu ñồ, cách phân biệt các thành phần khác nhau của biểu

ñồ bằng màu sắc, ký tự.
Có hai loại biểu diễn: biểu ñồ và ñồ thị
Biểu ñồ: biểu ñồ hình chữ nhật, biểu ñồ hình quạt và biểu ñồ ñường gấp khúc
ðồ thị có thể là tuyến tính (ñường bậc 1) hoặc phi tuyến (parabol, quả chuông …)

CHƯƠNG II. MÔ TẢ DỮ LIỆU THỐNG KÊ
(Descriptive Statistics)
ðể có thể cô ñọng và nhanh chóng nắm bắt ñược những thông tin quan trọng
chứa ñựng trong mẫu, người ta ñưa ra một vài chỉ số gọi là chỉ số ñăc trưng (giá trị ñặc
trưng hay ñại lượng thống kê tóm lược ).
2.1. ðộ tập trung
Các số ñặc trưng cho chúng ta là một hình ảnh về vị trí trung tâm của mẫu tức
là về xu thế các số liệu trong mẫu tụ tập xung quanh các con số nào ñó. Thường quan
tâm ñến các số ñặc trưng sau: trung bình mẫu, trung vị, mode.
2.1.1.Trung bình mẫu (sample mean)
• Trung bình cộng
+ Số liệu mẫu ñược cho dưới dạng rời rạc (số liệu gốc)

=
=
n
i
i
X
n
X
1
1

++ Số liệu mẫu ñược cho dưới dạng bảng phân bố thực nghiệm thu gọn. X nhận m giá trị

khác nhau
i
i
Xf
n
X

=
1
i=1
÷
m
+++ Số liệu ñược trình bày dưới dạng bảng phân bố ghép lớp với k lớp.
6


i
i
Xf
n
X

=
1
i = 1 ÷k X
i
: trung ñiểm của lớp thứ i
• Trung bình nhân
n
n

i
n
n
i
xxxG
x
1
1
21









==

=

• Trung bình bình phương
2
1
1
2
/













=

=
nxX
n
i
ibp

2.1.2 . Trung vị (median )
Có nghĩa là trung bình về vị trí: là giá trị nằm ở chính giữa, chia các số liệu mẫu
thành hai phần ký hiệu m
e
+ Số liệu mẫu gồm n giá trị rời rạc ñược sắp xếp theo thứ tự tăng dần.
n: lẻ
2
1+
=
ne
xm


n: chẵn
2
1
22
+
+
=
nn
e
xx
m

++ Số liệu mẫu ñược cho dưới dạng bảng phân bố thực nghiệm thu gọn. X nhận m giá trị
khác nhau
X
i
ñược gọi là số trung vị sao cho i là chỉ số bé nhất ñể f
1
+f
2
+… +f
i
≥ n/2
+++ Số liệu ñược trình bày dưới dạng bảng phân bố ghép lớp với k lớp.
- Khoảng trung vị
- Số trung vị
• Tìm khoảng trung vị
Giả sử ta có k khoảng với các ñiểm chia là: a
0
<a

1
<a
2
……< a
k
C
1
= (a
0
,a
1
); C
2
(a
1
,a
2
)
C
k
(a
k-1
,a
k
). Khoảng C
i
có tần số là f
i
(
ki ,1=

);
nf
k
i
i
=

=1
Khi ñó khoảng C
i
ñược gọi là
khoảng trung vị nếu i là chỉ số bé nhất ñể f
1
+f
2
+… +f
i
≥ n/2
Số trung vị là số mà tại ñó ñường thẳng x = m
e
chia ñôi diện tích của tổ chức ñồ tần số.
Số trung vị luôn luôn nằm trong khoảng trung vị
• Tìm số trung vị
7

e
e
e
m
m

me
f
S
n
hxm
1
min
2


∗+=

x
me min
: cận dưới của khoảng chứa trung vị.
h: bề rộng khoảng
n: kích thước mẫu

=
i
fn

S
me -1
: tổng tần số của các lớp ñứng trước lớp (khoảng ) chứa trung vị.
f
me
: tần số của lớp (khoảng) chứa trung vị
2.1.3 .Mode
- Số liệu mẫu ñược cho dưới dạng bảng phân bố thực nghiệm thu gọn. X nhận m giá trị

khác nhau. x
i
ñược gọi là mode sao cho tương ứng với x
i
có tần số f
i
lớn nhất.

- Số liệu ñược trình bày dưới dạng bảng phân bố ghép lớp với k lớp.
+ Tìm khoảng mode
+ Tìm số mode
C
i
ñược gọi là khoảng mode sao cho tương ứng với C
i
có tần số f
i
lớn nhất
Số mode
( ) ( )
1010
1
0
00
0
min0
+−

−+−


∗+=
MMMM
MM
m
ffff
ff
hxM
o

x
M0min
: cận dưới của khoảng chứa mode (khoảng có tần số f
i
lớn nhất).
h: bề rộng khoảng
f
M0
:tần số của khoảng chứa mode
f
Mo-1
: tần số của khoảng trước khoảng chứa mode.
f
M0+1
: tần số của khoảng sau khoảng chứa mode
ðây là một chỉ tiêu thường ñược chú ý trong các bài toán về kinh tế.
2.2. ðộ phân tán
Là các số ñặc trưng cho chúng ta một hình ảnh về mức ñộ phân tán của các số
liệu, ñộ biến ñộng của các số liệu.Thường quan tâm tới: biên ñộ (khoảng biến thiên),
ñộ lệch tuyệt ñối trung bình, phương sai, ñộ lệch chuẩn.
2.2.1.Khoảng biến thiên (range)

R= x
max
- x
min

8

Khi khoảng biến thiên càng nhỏ thì giá trị trung bình ñại diện càng tốt.
2.2.2. ðộ lệch tuyệt ñối trung bình (Mean Abrolate Deviation)
+ Số liệu mẫu gồm n giá trị rời rạc ñược sắp xếp theo thứ tự tăng dần.

=
−=
n
i
i
xx
n
d
1
1

++ Số liệu mẫu ñược cho dưới dạng bảng phân bố thực nghiệm thu gọn. X nhận m giá trị
khác nhau.
i
m
i
i
fxx
n

d

=
−=
1
1
i=1
÷
m

+++ Số liệu ñược trình bày dưới dạng bảng phân bố ghép lớp với k lớp.
i
k
i
i
fxx
n
d

=
−=
1
1
i = 1 ÷k x
i
: trung ñiểm của lớp thứ i
d > 0 , d càng nhỏ thì dữ liệu càng ñồng ñều.
2.2.3. Phương sai (Variance)
- Tổng thể (σ
2

)
( )
2
1
2
1

=
−=
N
i
i
x
N
µσ

- Mẫu (

2
S
)
)
+ Số liệu mẫu gồm n giá trị rời rạc ñược sắp xếp theo thứ tự tăng dần.
( )
2
1
2
1
1
ˆ


=


=
n
i
i
xx
n
S

++ Số liệu mẫu ñược cho dưới dạng bảng phân bố thực nghiệm. X nhận m giá trị khác nhau

( )
i
m
i
i
fxx
n
S
2
1
2
1
1
ˆ

=



=
i=1
÷
m

+++ Số liệu ñược trình bày dưới dạng bảng phân bố ghép lớp với k lớp.

( )
i
k
i
i
fxx
n
S
2
1
2
1
1
ˆ

=


=
i = 1 ÷k X
i

:trung ñiểm của lớp thứ i
2.2.4. ðộ lệch chuẩn (Standard deviation)
2
σσ
=
( ñối với tổng thể)
2
ˆ
ss =
)
(ñối với mẫu)

9

CHƯƠNG III.
ƯỚC LƯỢNG CÁC THAM SỐ ðẶC TRƯNG CỦA TỔNG THỂ

3.1. Một số khái niệm có liên quan ñến lý thuyết xác suất
Xác suất (Probability) là một giá trị bằng số, nó diễn tả mức ñộ không chắc
chắn khi xem xét sự xuất hiện của một biến cố nào ñó.
Phép thử (trial) hay là thí nghiệm ngẫu nhiên: Việc thực hiện một nhóm các
ñiều kiện cơ bản ñể quan sát một hiện tượng nào ñó có thể xảy ra hay không ñược gọi
là thực hiện một phép thử hay một thí nghiệm ngẫu nhiên.
Biến cố (event) :Hiện tượng có thể xảy ra trong kết quả của phép thử ñó ñược
gọi là biến cố.
Ví dụ: kết quả sấp
gieo ñồng xu: (event)
(trial) ngửa
Biến cố sơ cấp (elementary event): Là biến cố không thể phân chia ñược nữa.
Không gian mẫu (sample space): Là tập hợp các biến cố sơ cấp.

Tập hợp các biến cố sơ cấp trong không gian mẫu theo qui ñịnh riêng của chúng ta gọi
là event set (những biến cố có cùng tính chất).Ví dụ: {1,2,3,4,5,6… }
Số biến cố trong không gian mẫu gọi là kích thước của không gian mẫu (size of sample space).
Một biến cố chỉ có thể xảy ra khi một phép thử gắn liền với nó ñược thực hiện. Thực tế
có các loại các biến cố sau.
- Biến cố chắc chắn (certain event): Là biến cố nhất ñịnh xảy ra khi thực hiện một phép thử.
- Biến cố không thể (impossible event): Là biến cố nhất ñịnh không xảy ra trong một phép thử
- Biến cố ngẫu nhiên (random event): Là biến cố có thể xảy ra hoặc không xảy ra khi thực
hiện một phép thử.
3.1.1 Các ñịnh nghĩa cơ bản về xác suất.
3.1.1.1. ðịnh nghĩa xác suất theo quan ñiểm cổ ñiển
n
m
A =)Pr(
với n là số trường hợp cùng khả năng. m là số trường hợp thuận lợi ñể biến cố A xảy ra
Ví dụ: có mười sản phẩm trong ñó có 3 phế phẩm. Lấy ngẫu nhiên một sản phẩm. Tính
xác suất ñể sản phẩm lấy ñược là phế phẩm
10

G ọi A là biến cố sản phẩm lấy ñược là phế phẩm.
10
3
)Pr( =A

3.1.1.2 ðịnh nghĩa xác suất theo quan ñiểm thống kê
Tần suất: tần suất xuất hiện của biến cố A là tỷ lệ giữa số phép thử trong ñó biến
cố A xảy ra và tổng số phép thử ñược thực hiện.
n
n
f

A
A
=
khi ñó người ta ñịnh nghĩa
An
fA
∞→
= lim)Pr(

3.1.1.3.Các tính chất
)A(Pr -1 Pr(A)
0 event) impossible (Pr
1event)certain (Pr
1)Pr(0
=
=
=


A

Thường có hai loại xác suất:
- Xác suất khách quan (objective probability) dựa vào kinh nghiệm,sự hiểu biết về phép thử
- Xác suất chủ quan (subjective probability) không thể ñánh giá bằng khách quan, buộc
lòng phải dựa vào chủ quan
3.1.2. Các quy tắc tính xác suất
3.1.2.1. Quy tắc cộng (Addition Law)
- Biến cố xung khắc: Hai biến có A và B gọi là xung khắc với nhau nếu chúng không
bao giờ xảy ra ñồng thời.
- Hợp của hai biến cố (union of events): Là biến cố xảy ra nếu có ít nhất một trong

hai biến cố A,B xảy ra. Ký hiệu: A+B, A or B, A U B .
(
)
(
)
(
)
BPAPBAP +=∪
(Nếu A và B xung khắc ). Nếu A và B không xung khắc thì
A*B biến cố cả A và B ñồng thời xảy ra.
3.1.2.2. Quy tắc nhân (Multiplication Law)
- Biến cố ñôc lập (independent events): A và B là hai biến cố ñộc lập nhau nếu việc
xảy ra hoặc không xảy ra của biến cố này không ảnh hưởng tới xác suất của biến cố
kia. Trường hợp ngược lại thì người ta gọi là biến cố phụ thuộc (dependent events)
Ký hiệu: A*B, A and B, Khi A và B ñộc lập thì P (A and B) = P(A)* P(B)
(
)
(
)
(
)
(
)
BAPBPAPBAP *−+=∪
11

- Xác suất có ñiều kiện (conditional probability): Xác suất của biến cố A ñược tính
với giả thiết biến cố B ñã xảy ra ñược gọi là xác suất có ñiều kiện của biến cố A với
ñiều kiện B. Ký hiệu: P (A/B)
Quy tắc nhân tổng quát: A và B là 2 biến cố bất kỳ

P(A*B) = P(A)*P(B/A), A và B ñộc lập: P(B/A) = P (B)
3.1.3. Biến ngẫu nhiên và quy luật phân phối xác suất
(random variable and probability distribution).
3.1.3.1. ðịnh nghĩa và phân loại
Biến ngẫu nhiên là ñại lượng mà trong kết quả của phép thử nó thay ñổi và thay
ñổi với một xác suất xác ñịnh.
Có hai loại biến ngẫu nhiên (BNN):
- Biến ngẫu nhiên rời rạc: Biến ngẫu nhiên gọi là rời rạc nếu các giá trị mà nó có thể
nhận lập nên một tập hợp hữu hạn hoặc ñếm ñược (nói cách khác là ta có thể liệt kê
ñược tất cả các giá trị có thể có của nó).
- Biến ngẫu nhiên liên tục: Biến ngẫu nhiên gọi là liên tục nếu các giá trị mà nó có thể
nhận lấp ñầy một hay nhiều khoảng của trục số thậm trí lấp ñầy toàn bộ trục số.
Vd: Xét phép thử gieo xúc sắc. Gọi X: là số chấm xuất hiện trên mặt xúc sắc, X là
BNN rời rạc. Y: thời gian hoạt ñông của một bóng ñèn, Y là BNN liên tục.
3.1.3.2. Quy luật phân phối xác suất
@
1
. BNN rời rạc
a. Bảng phân phối xác suất
Bảng cho biết sự tương ứng giữa các giá trị có thể có của biến ngẫu nhiên và các
xác suất tương ứng của nó gọi là bảng phân phối xác suất.
X x
1
x
2
…… x
n
Pr(X) P
1
P

2
…. p
n

ni
xxpp
ii
,1
)(
=
=
=

ðiều kiện của bảng phân phối xác suất
1,,0 =∀≥

ii
pip

b. Các giá trị ñặc trưng của BNN rời rạc.
12

+ Kỳ vọng (expected value): chính là giá trị trung bình khi


n

(
)
(

)

∗=
ii
xpxXE

+ Phương sai (variance):
(
)
(
)
[
]
(
)
ii
xpxExX ∗−==

2
2
var
σ

+ ðộ lệch chuẩn (standard deviation)
2
σσ
=
ñộ lệch chuẩn của tổng thể
Ý nghĩa của:
Kỳ vọng: chính là giá trị mong ñợi, nó gần bằng trung bình số học của các giá trị quan

sát của BNN khi số phép thử gần ñến vô cùng. Nó phản ánh giá trị trung tâm của phân
phối xác suất của BNN.
Phương sai: phản ánh mức ñộ phân tán của các giá trị của BNN xung quanh giá trị
trung tâm của nó là kỳ vọng toán. Trong thực tế phương sai ñặc trưng cho mức ñộ
phân tán của các chi tiết gia công hay sai số của thiết bị (trong kỹ thuật) mức ñộ rủi ro
của các quyết ñịnh trong quản lý kinh doanh).
ðộ lệch chuẩn: ðơn vị ño của phương sai bằng bình phương ñơn vị ño của BNN. Vì
vậy khi cần phải ñánh giá mức ñộ phân tán của BNN theo ñơn vị ño của nó người ta
thường tính ñộ lệch chuẩn chứ không phải là phương sai vì ñộ lệch chuẩn có cùng ñơn
vị ño với BNN cần nghiên cứu.
@
@@
@
2
22
2
. Biến ngẫu nhiên liên tục
a. Hàm mật ñộ xác suất
ðối với biến ngẫu nhiên liên tục, xác suất ñể nó nhận một giá trị cụ thể nào ñó
luôn luôn bằng 0. Có nghĩa là với mọi a, P (X = a) = 0
Do vậy mà với biến ngẫu nhiên liên tục người ta chỉ quan tâm tới xác suất ñể nó
nhận giá trị trong một khoảng nào ñó. Xác suất này ñược quyết ñịnh bởi một hàm gọi
là hàm mật ñộ xác suất.
ðể ñặc trưng cho quy luật phân phối xác suất của biến ngẫu nhiên liên tục người
ta dùng hàm mật ñộ xác suất.
ðịnh nghĩa: Hàm mật ñộ xác suất của biến ngẫu nhiên liên tục X ký hiệu là f(x) là ñạo
hàm bậc nhất của hàm phân bố xác suất của biến ngẫu nhiên ñó.
13

(

)
(
)
( )
( )
[ ]
( )
dxxfbXaPba
dxxfx
xf
xFxf
b
a


=〈〈〈∀
=∀


=

∞−
,
1,
0

P(a<X<b) chính là diện tích hình thang cong giới hạn bởi ñồ thị hàm số y=f(x) và hai
ñường thẳng x=a, x=b.
( ) ( )
( ) ( )

2
2
2
*)(
*
σσ
µσ
µ
=
−==
==



∞−

∞−
dxxfxXVar
dxxfxXE


b. Hàm phân bố xác suất
Nếu như bảng phân bố xác suất ñặc trưng cho quy luật phân phối xác suất của biến
ngẫu nhiên rời rạc và hàm mật ñộ xác suất ñặc trưng cho quy luật phân phối xác suất
của biến ngẫu nhiên liên tục thì hàm phân bố xác suất ñược dùng cho cả biến ngẫu
nhiên rời rạc và liên tục.
ðịnh nghĩa:
Hàm phân bố xác suất của biến ngẫu nhiên X ký hiệu là F(x) là xác suất ñể biến
ngẫu nhiên X nhận giá trị nhỏ hơn x với x là một số thực bất kỳ.
(

)
(
)
( )


=

=
xx
i
i
PxF
xXPxF

Thực chất hàm phân bố xác suất là hàm xác suất tích lũy.
Tính chất của hàm phân phối
14

( ) ( ) ( )
( ) ( )
( ) ( )
( )
dxxfxF
FxF
FxF
aFbFbXaP
xF
x
x

x

∞−
−∞→
∞→
=
=∞−=
=∞=
−=<≤


)(
0,0lim
1,1lim
1)(0

Hàm phân bố xác suất phản ánh mức ñộ tập trung xác suất ở về phía bên trái
một số thực x nào ñó. X là biến ngẫu nhiên liên tục thì hàm phân bố xác suất của nó
liên tục và khả vi tại mọi ñiểm của X. ðồ thị của nó là một ñường cong liên tục.
X là biến ngẫu nhiên rời rạc thì ñồ thị hàm phân bố xác suất của nó có dạng bậc
thang với số ñiểm gián ñoạn bằng số giá trị có thể có của X.
Trong thống kê có nhiều hàm xác suất thường dùng, mỗi hàm là một công thức
toán với một vài thông số ñặc trưng. Ta gọi mỗi công thức ñó là một mô hình xác
suất. Người ta sử dụng các mô hình ñó ñể suy diễn các kết quả thí nghiệm. Người
dùng thống kê như một công cụ không nhất thiết phải nhớ công thức mà chỉ cần
biết ñiều kiện nào thì sử dụng mô hình nào là phù hợp.
• Một số phân phối thường gặp và ứng dụng trong thực tế
@
1
Phân bố nhị thức (binominal distribution)

Xét quá trình Bernoully:
Mỗi thí nghiệm ngẫu nhiên ñược xem là một phép thử và quá trình này là
một loạt các phép thử, ñối với mỗi phép thử kết quả của nó là một trong hai biến cố sơ
cấp bù nhau thành công và không thành công A hoặc không A . Xác suất ñể cho biến
cố thành công xảy ra là một hằng số ñối với mọi phép thử. P(A)=const. Các biến cố thành
công trong các phép thử là ñộc lập với nhau.
Gọi X là số lần biến cố A xuất hiện trong lược ñồ Bernoully thì X có phân phối
nhị thức với hai tham số n, p. Ký hiệu
15


(
)
( )
( ) ( )
(
]
( ) ( ) ( )
[ ] [ ]
( ) ( )
( )
ppn
pnXEpnbX
KXPKXP
KXPXPXPKXP
nkppCKXPP
nX
pnbX
kn
kk

nk
−∗∗=
∗==≈
<−=≥
=++=+==≤
=−∗∗===
=


1
,,
1
10
,0,1
2,1
,
2
σ
µ

Mode: nếu (n*p - q) không nguyên:
qpnMqpn +∗≤≤−∗
0

nếu (n*p - q) nguyên: Mod= (n*p - q) và (n*p - q + 1), p = 1- q

@
2
.Mô hình phân bố chuẩn (normal distribution)
ðây là mô hình quan trong nhất trong thống kê, thường áp dụng với biến số liên tục.

ðịnh nghĩa: Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng (-∞, +∞) gọi là có phân
phối chuẩn với các tham số µ,σ
2

ký hiệu X∼N(µ,σ
2
) nếu hàm mật ñộ của nó có dạng
( )
( )
2
2
2
*
2
1
σ
µ
πσ

=
x
exf

µ,σ là 2 tham số quan trọng trong phân phối chuẩn. µ: giá trị trung bình của tổng thể σ:
ñộ lệch chuẩn của tổng thể
(
)
( )
2
σ

µ
=
=
XVar
XE

Khi µ tăng thì ñồ thị dịch chuyển sang phải và ngược lại σ tăng thì ñồ thị thấp xuống
và phình ra, σ giảm thì ñồ thị cao lên và nhọn.
Khi ñó
( )
( )

∞−


=
x
x
dxexF
2
2
2
*
2
1
σ
µ
πσ

@

3
.Mô hình phân bố chuẩn hóa (Normal Standard distribution)
ðịnh nghĩa: Biến ngẫu nhiên Z nhận các giá trị trong khoảng (-∞, +∞) ñược gọi là có
phân phối chuẩn hóa X∼N(0,1) nếu hàm mật ñộ xác suất của nó có dạng
( )
2
2
*
2
1
z
ez
π
ϕ
=

Lúc này mọi hàm X∼N(µ,σ
2
) ñều ñược ñưa về N(0,1) bằng cách ñặt
σ
µ

=
X
Z

16

khi ñó
(

)
[
]
zZPz ≤=Φ
. Ta có thể tính xác suất liên quan ñến X bằng cách ñưa nó về
một biến cố liên quan tới Z rồi tra bảng:
[ ]







Φ=







〈=










=〈
σ
µ
σ
µ
σ
µ
σ
µ
aa
ZP
ax
PaXP

Người ta ñã lập bảng tính sẵn các giá trị của hàm Φ(z) Trường hợp z < 0: có thể tra
bảng hoặc dùng công thức Φ(-z) = 1- Φ(z). Tra Φ(z) dùng bảng Laplace
Tính
[ ]







Φ−








Φ=







〈〈

=〈〈
σ
µ
σ
µ
σ
µ
σ
µ
abb
Z
a
PbXaP

+ Phân vị mức α

αα
α (0<α
αα
α<1) của phân bố chuẩn hóa Z ký hiệu z
α
αα
α
là một số thỏa mãn ñẳng thức
[
]
[ ]
( )
( )
α
α
α
α
α
α
α
α
−=Φ
=Φ−
=≤−
=

1
1
1
z

z
zZP
zZP

@
4
Hàm phân bố Student (T)
ðịnh nghĩa: ðại lượng ngẫu nhiên T ñược gọi là có phân bố Student với n bậc tự do (n
là một số nguyên dương cho trước ) nếu hàm mật ñộ của nó có dạng

( )
2
1
2
1
2
2
1
+







+







Γ⋅






+
Γ
=
n
n
x
n
n
n
xf
π

s
X
t
µ

=

Phân vị mức α

αα
α (0 <α
αα
α<1) của phân bố Student T ký hiệu t
α
αα
α
là một số thỏa mãn
ñẳng thức
[
]
α
α
=

tTP

@
5
Hàm phân bố Khi bình phương (χ
χχ
χ
2
)
ðịnh nghĩa: ðại lượng ngẫu nhiên χ
χχ
χ
2
ñược gọi là có phân bố Khi bình phương với n
bậc tự do (n là một số nguyên dương cho trước ) nếu hàm mật ñộ của nó có dạng

x

0
x>0

=
=
n
i
i
X
1
22
χ

Phân vị mức
α
αα
α (0 <α
αα
α<1) của phân bố Khi bình phương ký hiệu (χ
χχ
χ
α
αα
α
2
) là một số
thỏa mãn ñẳng thức
[

]
αχχ
α
=〉
2
P

( )












Γ
=
−1
2
22
2
2
1
0
nx

xe
n
xf
n
17

@
6
Hàm phân bố Fisher (F)
ðịnh nghĩa: ðại lượng ngẫu nhiên F ñược gọi là có phân bố Fisher với (n
1
,n
2
)bậc tự
do nếu hàm mật ñộ của nó có dạng
x≤0

x>0

2
22
1
1
22
2
2
1
21
2
2

2
1
21
2
1
21


22
2
n
YY
n
XXX
F
nn
nn
nn
C
n
n
nn
+
++
=







Γ






Γ







+
Γ
=



Phân vị mức α
αα
α (0 <α
αα
α<1) của phân bố Fisher ký hiệu f
α
αα
α

là một số thỏa mãn ñẳng
thức
[
]
α
α
=〉 fFP

3.2. Ước lượng các tham số ñặc trưng của tổng thể
Ước lượng là dựa vào các ñặc trưng trên mẫu ñể dự ñoán giá trị cho các ñặc
trưng của tổng thể.
Nếu gọi θ

là ñặc trưng trên mẫu và θ là ñặc trưng của tổng thể thì
- θ

chính là ước lượng ñiểm cho ñặc trưng θ
- còn θ

± ε chính là khoảng ước lượng cho ñặc trưng θ
3.2.1. Ước lượng giá trị trung bình của tổng thể
• Phương sai σ
σσ
σ
2
ñã biết
n
zX
σ
µ

α
∗±=
2

• Phương sai σ
σσ
σ
2
chưa biết, n≥
≥≥
≥ 30
Trong nhiều bài toán thực tế ta không biết phương sai của tập hợp chính, nếu kích
thước mẫu n>30 thì ta có thể xấp xỉ σ bởi
S
)
.
n
S
zX
)
∗±=
2
α
µ



( )
( )
( )






+

=
+

2
12
2
2
21
1
0
nn
n
xnn
x
C
xf
18

• Phương sai σ
σσ
σ
2
chưa biết, n<30

Giả sử khi nghiên cứu trên mẫu về một ñặc tính nào ñó, từ kết quả của mẫu tính
ñược giá trị trung bình, và ñộ lệch chuẩn. Tức là từ n →
X
,
S
)
muốn biết ñược trị số
trung bình của tổng thể (µ) có hai trường hợp
- Ước lượng ñiểm:
X
chính là ước lượng ñiểm cho µ
- Ước lượng khoảng cho µ là
X
± ε, với
n
S
t
)
∗=
2
α
ε

3.2.2. Ước lượng phương sai cho tổng thể
Giả sử khi nghiên cứu trên mẫu về một ñặc tính nào ñó, từ kết quả của mẫu tính
ñược giá trị trung bình, và ñộ lệch chuẩn. Tức là từ mẫu có kích thước n →
X
,
S
)

,
2
S
)
muốn biết ñược phương sai của tổng thể (σ
2
) có hai trường hợp
- Ước lượng ñiểm:
2
S
)
chính là ước lượng ñiểm cho σ
2

- Ước lượng khoảng cho σ
2
là:

• ðã biết kỳ vọng toán µ
µµ
µ của biến ngẫu nhiên gốc X
( ) ( )
2
1
2
2
2
2
22
αα

χ
σ
χ
−nn
SnSn
)
ππ
)

• Chưa biết kỳ vọng toán µ
µµ
µ của biến ngẫu nhiên gốc X

(
)
( )
(
)
( )
2
11
2
2
2
1
2
22
11
αα
χ

σ
χ
−−−
−−
nn
SnSn
)
ππ
)


3.2.3. Ước lượng tỷ lệ cho tổng thể
Trong một mẫu thực nghiệm có n cá thể, trong ñó có m cá thể có ñặc tính C.Tần
suất của C trong mẫu thực nghiệm sẽ là f = m/n. Từ tần suất thực nghiệm này suy ñoán
tỷ lệ ñặc tính C của tổng thể. Tỷ lệ ñó ñược ký hiệu là p.
- Ước lượng ñiểm cho p chính là f
- Ước lượng khoảng cho p sẽ là
(
)
n
ff
zf
−∗
±
1
2
α

3.2.4. Xác ñịnh kích thước mẫu
Trong thực tế việc xác ñịnh chính xác n là cần thiết trong quá trình thiết kế thí

nghiệm hoặc lập kế hoạch nghiên cứu thực ñịa. Nếu n lớn hơn yêu cầu sẽ gây lãng phí
19

thời gian và kinh phí, còn nếu n quá nhỏ thì các kết luận chưa ñủ tin cậy. ðể xác ñịnh n
cần thiết ta xác ñịnh trong 2 trường hợp sau ñây
• Xác ñịnh kích thước mẫu ñể ước lượng cho trung bình µ
µµ
µ
Muốn có ước lượng µ với sai số không quá ε cho trước với ñộ tin cậy (1-α)
* Nếu biết σ
σσ
σ thì:
2
2










ε
σ
α
z
n


* Nếu chưa biết σ
σσ
σ: thì lấy sơ bộ một mẫu kích thước m >30 rồi tính
X
,
S
)
: khi ñó n
ñược xác ñịnh từ công thức:
2
2










ε
α
zs
n
)
với ñiều kiện vế phải không nhỏ hơn 30
• Xác ñịnh kích thước mẫu ñể ước lượng cho tỷ lệ p:
2
2

2









ε
α
z
n

3.2.5. Phương pháp xác ñịnh số liệu bất thường (khử sai số thô)
* Khi ñã biết σ
σσ
σ: Tính
n
n
Xx
z
1+


=

σ
Sau ñó tra Φ(z). Cho trước mức ý nghĩa α khá bé.

- Nếu Φ(z) >1-α/2: Thì x
*
là số liệu bất thường
- Nếu Φ(z) ≤ 1-α/2: Thì x
*
không phải là số liệu bất thường
• Khi chưa biết σ
σσ
σ:
- Sắp xếp số liệu từ bé ñến lớn
- Gọi x
*
là số liệu bất thường, tính
X
,
S
)
(không kể x
*
)
Tính
S
Xx
t
)

=

Sau ñó tra t (n-1, α/2) cho trước mức ý nghĩa α khá bé.
- Nếu t >t

α/2
: thì x
*
là số liệu bất thường (phải loại bỏ)
- Nếu t ≤ t
α/2
: Thì x
*
không phải là số liệu bất thường

CHƯƠNG IV. KIỂM ðỊNH GIẢ THUYẾT THỐNG KÊ
(hypothesis testing)
Khi sử dụng phương pháp ñiều tra chọn mẫu, ñôi khi người ta phải ñặt những bài toán so sánh
ñể ñưa ra kết luận chính xác về nội dung hoặc bản chất của hiện tượng nghiên cứu.
20

Trong nghiên cứu khoa học, nhiều vấn ñề ñược giải quyết nhờ ñưa ra một số giả
thuyết, sau ñó kiểm ñịnh các giả thuyết ấy bằng thực nghiệm.
4.1. Một số khái niệm
4.1.1. Giả thuyết thống kê
Là giả thuyết về phân phối xác suất của BNN, về các tham số ñặc trưng của
BNN hoặc tính ñộc lập của các BNN.
Vd: - Tuổi thọ trung bình của hai loại bóng ñèn A và B là như nhau.
- Phương pháp ñiều trị A chữa khỏi 90% bệnh nhân.
4.1.2. Kiểm ñịnh thống kê.
Là một quy tắc hoặc một thủ tục quyết ñịnh dẫn tới việc bác bỏ hoặc chấp nhận
giả thuyết ñã nêu. Thực tế là sự so sánh một số chỉ tiêu thống kê ñược gọi là tiêu chuẩn
kiểm ñịnh ñược tính theo số liệu thực nghiệm với các chỉ tiêu ấy ñược nêu ra theo giả
thuyết.
Thường giả thuyết ñược ñưa ra kiểm ñịnh là giả thuyết không H

0
(thuật ngữ của
Fisher). Là giả thuyết mà nếu ta bác bỏ là một cách sai lầm thì sẽ chịu một hậu quả
nghiêm trọng, nói một cách ñơn giản giả thuyết không H
0
là giả thuyết mà ta nghi ngờ
và muốn bác bỏ.
Các bước kiểm ñịnh:
1.Xây dựng cấu trúc của giả thuyết (The structure of a hypothesis test)
Gồm 2 giả thuyết bù nhau có nghĩa: nếu không là giả thuyết này thì sẽ là giả thuyết kia.
• Giả thuyết không H
0
(Null hypothesis)
• Giả thuyết ñối H
a
(Alternative hypothesis)
Việc ñặt giả thiết H
0
là tuỳ ý nhưng thông thường người ta ñặt giả thuyết không
là giả thuyết mà nếu ta bác bỏ nó 1 cách sai lầm ta sẽ chịu 1 hậu quả nghiêm trọng.
Khi ñặt ra 2 giả thuyết như vậy sẽ có 2 sự lựa chọn
• Chấp nhận H
0
(accept H
0
) tương ứng với reject H
a

• Bác bỏ H
0

(reject H
0
) tương ứng với accept H
a

Tuy nhiên mới chỉ ñặt ra giả thiết thôi, ta chưa biết ñược giả thiết nào ñúng, vì vậy
cần phải tiến hành các bước tiếp theo.
2.Chọn thống kê kiểm ñịnh (Test statistic).
21

3. Quy tắc kiểm ñịnh (quyết ñịnh)
ðể quyết ñịnh xem giả thuyết nào ñúng, ta phải dựa vào bảng quyết ñịnh
Hành ñộng (acts) Biến cố
(events)
Accept H
0
Reject H
0

H
0
true Correct decision
Type I error xác suất mắc sai lầm là
α

H
0
false
Type II error xác suất mắc sai lầm là
β


Correct decision

Nhìn vào bảng quyết ñịnh ta thấy có 2 quyết ñịnh ñúng ñó là
• Chấp nhận H
0
khi H
0
ñúng và Bác bỏ H
0
khi H
0
sai
2 sai lầm:
• Bác bỏ H
0
khi H
0
ñúng và Chấp nhận H
0
khi H
0
sai
Tìm kiếm xác suất mắc sai lầm (finding the error probabilities)
α = P[type I error] = P[reject H
0
/H
0
true]
β = P[type II error] = P[accept H

0
/H
0
false]
Ta luôn mong cả 2 loại sai lầm ñạt cực tiểu nhưng khi cỡ mẫu n cố ñịnh thì
mong muốn trên không thể thực hiện ñược do ñó thông thường cho trước giới hạn trên
của xác suất phạm sai lầm loại I, ký hiệu
α
,
α
thường nhỏ (
α
= 0.1; 0.05; 0.01) khi ñó
ta sẽ ñi tìm miền sao cho
β
ñạt cực tiểu.
α
: mức ý nghĩa tiêu chuẩn
Trong thực tế người ta thường cho phép ñược mắc sai lầm loại I ở mức xác suất
α

nào ñó ( tuỳ theo tầm quan trọng của sai lầm loại I) sau ñó cực tiểu hoá sai lầm loại II.
ðể chọn ñúng ta làm như sau: Mặc dù cả hai sai lầm trên ñều không mong
muốn nhưng bác bỏ H
0
khi

H
0
ñúng là sai lầm nghiêm trọng hơn cả. Do ñó xác suất

mắc sai lầm
α
ñược coi là mức ý nghĩa (significanse level). Tuỳ theo bài toán cụ thể

nếu mức ñộ nghiêm trọng càng lớn thì

chọn
α
càng nhỏ.
Như vậy khi ta ra quyết ñịnh bác bỏ Ho, mặc dù Ho ñúng thì ta ñã mắc một sai
lầm với xác suất
α
, còn khi ta chấp nhận Ho mặc dù Ho sai ta cũng mắc một sai lầm
với xác suất
β
.
Giá trị
α
,
β
phụ thuộc vào việc ta chọn quy ñịnh. Tuỳ thuộc vào quá trình
nghiên cứu mà chúng ta cần giảm nguy cơ mắc loại sai lầm nào.
22

Muốn giảm
α
thì tăng
X
nhưng
β

tăng. Do ñó muốn giảm cả hai sai lầm thì ta
sẽ tăng kích thước mẫu ( tăng n). Bởi vì dạng của ñường cong phân phối liên quan tới
ñộ lệch chuẩn của tổng thể. Khi n tăng thì
σ
giảm

ñường cong nhọn
→α
,
β
giảm.
Thường ta chọn
α
còn
β
có thể giảm bằng cách tăng n.
4.2. Bài toán kiểm ñịnh
Có các dạng bài toán kiểm ñịnh như sau:
- Kiểm ñịnh giá trị trung bình của tổng thể
- Kiểm ñịnh phương sai của tổng thể
- Kiểm ñịnh tỷ lệ cho tổng thể
4.2.1. Kiểm ñịnh giá trị trung bình
X là ñại lựơng ngẫu nhiên có phân bố chuẩn. Một mẫu kích thước n là một tập
hợp gồm n giá trị x
1
,x
2
…x
n
thu ñược từ n quan sát ñộc lập về X. Ta muốn kiểm ñịnh

giả thiết về µ của tổng thể.
* Phương sai σ
σσ
σ
2
ñã biết
Bài toán kiểm ñịnh một phía Các bước
kiểm ñịnh
Bài toán
kiểm ñịnh 2 phía
Kiểm ñịnh phía trên Kiểm ñịnh phía dưới
Bước 1:
Công thức hóa
giả thuyết

H
0:
µ = µ
0
H
a
: µ ≠ µ
0

H
0:
µ = µ
0
H
a

: µ > µ
0

H
0:
µ = µ
0
H
a
: µ < µ
0

Bước 2:
Chọn thống kê
kiểm ñịnh

(
)
σ
µ
nX
Z
∗−
=
0


(
)
σ

µ
nX
Z
∗−
=
0


(
)
σ
µ
nX
Z
∗−
=
0

Bước 3:
Xác ñịnh miền
chấp nhận hay
bác bỏ H
0

- Z
α/2
≤ Z ≤ Z
α/2

Chấp nhận H

0
Z < -Z
α/2
hoặc Z > Z
α/2
Bác bỏ H
0

Z ≤ Z
α
:
Chấp nhận H
0


Z > Z
α
: Bác bỏ H
0

Z ≥ -Z
α
:
Chấp nhận H
0
Z < -Z
α
: Bác bỏH
0


Bước 4:
So sánh, ra
quyết ñịnh bác
bỏ hay chấp
nhận H
0

Bước 5: K
ết luận


* Phương sai σ
σσ
σ
2
chưa biết, n≥
≥≥
≥30
Bài toán kiểm ñịnh một phía Các bước
kiểm ñịnh
Bài toán
kiểm ñịnh 2 phía
Kiểm ñịnh phía trên Kiểm ñịnh phía dưới
23

Bước 1:
Công thức hóa
giả thuyết

H

0:
µ = µ
0
H
a
: µ ≠ µ
0

H
0:
µ = µ
0
H
a
: µ > µ
0

H
0:
µ = µ
0
H
a
: µ < µ
0

Bước 2:
Chọn thống kê
kiểm ñịnh


(
)
S
nX
Z
ˆ
0
∗−
=
µ


(
)
S
nX
Z
ˆ
0
∗−
=
µ


(
)
S
nX
Z
ˆ

0
∗−
=
µ

Bước 3:
Xác
ñị
nh mi

n
ch

p nh

n hay
bác b

H
0

- Z
α/2
≤ Z ≤ Z
α/2

Chấp nhận H
0
Z < -Z
α/2

ho

c Z > Z
α/2
Bác bỏ H
0

Z ≤ Z
α
:
Ch

p nh

n H
0


Z > Z
α
: Bác bỏ H
0

Z ≥ - Z
α
:
Chấp nhận H
0
Z < -Z
α

: Bác bỏH
0

Bước 4:
So sánh, ra quy
ế
t
ñị
nh bác b

hay
ch

p nh

n H
0

Bước 5: K
ế
t lu

n


* Phương sai σ
σσ
σ
2
chưa biết, n < 30

Bài toán ki

m
ñị
nh m

t phía Các b
ướ
c
ki

m
ñị
nh
Bài toán
ki

m
ñị
nh 2 phía
Ki

m
ñị
nh phía trên Ki

m
ñị
nh phía d
ướ

i
Bước 1:
Công th

c hóa
gi

thuy
ế
t

H
0:
µ = µ
0
H
a
: µ ≠ µ
0

H
0:
µ = µ
0
H
a
: µ > µ
0

H

0:
µ = µ
0
H
a
: µ < µ
0

Bước 2:
Ch

n th

ng kê
ki

m
ñị
nh
(
)
S
nX
t
ˆ
0
∗−
=
µ


(
)
S
nX
t
ˆ
0
∗−
=
µ


(
)
S
nX
t
ˆ
0
∗−
=
µ

Bước 3:
Xác
ñị
nh mi

n
ch


p nh

n hay
bác b

H
0

- t
α/2
≤ t ≤ t
α/2

Ch

p nh

n H
0
t < -t
α/2
ho

c t > t
α/2

Bác b

H

0


t ≤ t
α
:
Ch

p nh

n H
0

t > t
α
:
Bác b

H
0


t ≥ - t
α
:
Ch

p nh

n H

0
t < - t
α
:
Bác b

H
0

Bước 4:
So sánh, ra quy
ế
t
ñị
nh bác b

hay
ch

p nh

n H
0

Bước 5: K
ế
t lu

n



4.2.2. Kiểm ñịnh về giá trị của xác suất
Tiến hành phép thử ngẫu nhiên G n lần một cách ñộc lập và quan sát thấy biến cố A xuất
hiện k lần. Tần suất xuất hiện của A là f= k/n cho ta một hình ảnh xấp xỉ của p.
Ta muốn kiểm ñịnh giả thiết p = p
0
với p
0
là một số ñã cho.
Bài toán ki

m
ñị
nh m

t phía Các b
ướ
c
ki

m
ñị
nh
Bài toán
ki

m
ñị
nh 2 phía
Ki


m
ñị
nh phía trên Ki

m
ñị
nh phía d
ướ
i
24

Bước 1:
Công thức hóa
giả thuyết

H
0:
p = p
0
H
a
: p ≠ p
0

H
0:
p = p
0
H

a
: p > p
0

H
0:
p = p
0
H
a
: p < p
0

Bước 2:
Chọn thống kê
kiểm ñịnh
Nếu np
0
≥ 5, n(1-p
0
) ≥ 5
thì dùng thống kê:
(
)
( )
00
0
1 pp
npf
Z

−∗
∗−
=

Nếu np
0
≥ 5, n(1-p
0
) ≥ 5
thì dùng thống kê:
(
)
( )
00
0
1 pp
npf
Z
−∗
∗−
=

Nếu np
0
≥ 5, n(1-p
0
) ≥ 5
thì dùng thống kê:
(
)

( )
00
0
1 pp
npf
Z
−∗
∗−
=

Bước 3:
Xác
ñị
nh mi

n
ch

p nh

n hay
bác b

H
0

- Z
α/2
≤ Z ≤ Z
α/2


Ch

p nh

n H
0
Z < -Z
α/2
ho

c Z> Z
α/2
Bác b

H
0


Z ≤ Z
α
:
Ch

p nh

n H
0



Z > Z
α
:
Bác b

H
0


Z ≥ - Z
α
:
Chấp nhận H
0
Z< - Z
α
:
Bác b

H
0

Bước 4:


Bước 5:



4.2.3. Kiểm ñịnh về phương sai

Bài toán ki

m
ñị
nh m

t phía Các b
ướ
c
ki

m
ñị
nh
Bài toán
ki

m
ñị
nh 2 phía
Ki

m
ñị
nh phía trên Ki

m
ñị
nh phía d
ướ

i
Bước 1:
Công th

c hóa
gi

thuy
ế
t

H
0:
σ
2
= σ
2
0
H
a
: σ
2
≠ σ
2
0

H
0:
σ
2

= σ
2
0

H
a
: σ
2
> σ
2
0

H
0:
σ
2
= σ
2
0

H
a
: σ
2
< σ
2
0

Bước 2:
Ch


n th

ng kê
ki

m
ñị
nh
(
)
2
0
2
1
σ
χ
Sn
)
∗−
=

(
)
2
0
2
1
σ
χ

Sn
)
∗−
=

(
)
2
0
2
1
σ
χ
Sn
)
∗−
=

Bước 3:
Xác
ñị
nh mi

n
ch

p nh

n hay
bác b


H
0

- χ
2
α/2
≤ χ ≤ χ
2
α/2

Ch

p nh

n H
0
χ < -χ
2
α/2
ho

c χ> χ
2
α/2
Bác b

H
0


χ ≤ χ
2
α
:
Chấp nhận H
0

χ> χ
2
α
:
Bác b

H
0


χ ≥ - χ
2
α

Chấp nhận H
0
χ< - χ
2
α
:
Bác b

H

0

Bước 4:


Bước 5:



4.3. Bài toán so sánh
4.3.1. So sánh hai giá trị trung bình
X và Y là hai ñại lượng ngẫu nhiên có phân bố chuẩn X ∼ N(µ
1
, σ
1
2
), Y ∼ N(µ
2

2
2
).
Chúng ta muốn so sánh µ
1
, µ
2
dựa trên hai mẫu ñộc lập quan sát của X và Y.
• Phương sai σ
σσ
σ

1
2
, σ
σσ
σ
2
2
ñã biết
Bài toán ki

m
ñị
nh m

t phía Các b
ướ
c
ki

m
ñị
nh
Bài toán
ki

m
ñị
nh 2 phía
Ki


m
ñị
nh phía trên Ki

m
ñị
nh phía d
ướ
i
Bước 1:
Công th

c hóa
gi

thuy
ế
t

H
0:
µ
1
= µ
2
H
a
: µ
1



µ
2



H
0:
µ
1
= µ
2
H
a
: µ
1

>
µ
2

H
0:
µ
1
= µ
2
H
a
: µ

1

<
µ
2

×