Tải bản đầy đủ (.docx) (29 trang)

Lý thuyết xác suất thống kê toán

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (255.8 KB, 29 trang )

TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
KHOA QUẢN TRỊ NHÂN LỰC
--------------

BÀI THẢO LUẬN
LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN
Đề tài :
1.Với độ tin cậy 95% ước lượng thời gian tự học
trung bình một ngày của sinh viên trường ĐH
Thương Mại.
2.Với mức ý nghĩa 5% kiểm định giả thuyết cho
rằng thời gian tự học trung bình một ngày của sinh
viên ĐH Thương Mại là thấp hơn 2 giờ?
Nhóm : 10
Lớp : 1999AMAT0111
Giáo viên hướng dẫn: Nguyễn Thị Hiên
Hà Nội, 11/2019


Lời mở đầu
Ngày nay thống kê được sử dụng rộng rãi hơn nhiều so với xuất phát điểm.
Đầu tiên là phục vụ cho chính quyền hay chính phủ mà cịn có các tổ chức và các
cá nhân sử dụng thống kê để phân tích dữ liệu và đưa ra các quyết định.
Thống kê là một trong những công cụ quản lí vĩ mơ quan trọng, cung cấp
các thơng tin thống kê trung thực, khách quan, chính xác, đầy đủ, kịp thời trong
việc đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách, xây dựng kế
hoạch nhằm phát triển kinh tế - xã hội và đáp ứng nhu cầu thông tin thống kê của
các tổ chức, cá nhân.
Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là
một bộ phận quan trọng của thống kê tốn. Nó là phương tiện giúp ta giải quyết
những bài tốn nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong


tổng thể.
Trong quá trình học đại học, bài thảo luận về phần thống kê sẽ giúp chúng ta
phần nào áp dụng những công thức vào thực tiễn và từ đó đưa ra những kết luận
khách quan mà những con số muốn nói đến. Cụ thể hơn đó là cơng việc nghiên cứu
về “ thời gian tự học một ngày của sinh viên ĐH Thương Mại” được thực hiện bởi
các thành viên nhóm 10
Trang Tử đã có câu nói rằng: “ Đời sống có hạn mà sự học thì vơ hạn”. Xã
hội khơng ngừng thay đổi đồng nghĩa với việc chúng ta phải tiếp thu tinh hoa của
nhân loại từng giây từng phút. Nhưng một ngày chỉ có 24h, ngồi việc học trên
giảng đường mà chúng ta còn phải dành cho bản thân thời gian để tự học. Khối
lượng kiến thức khổng lồ, thầy cô chỉ là những người định hướng cho sinh viên,
điều đó đã càng chứng tỏ được tầm quan trọng của việc tự học. Tự học giúp chúng
ta không chỉ hiểu và hiểu sâu bài giảng hơn mà khi tự học ta còn rèn được tính tự
giác,học hỏi được tri thức mới từ những tri thức mà ta học.
Thấy được tầm quan trọng của tự học, nhóm chúng em đã quyết định chọn
đề tài về ước lượng thời gian tự học trung bình một ngày của sinh viên trường ĐH
Thương Mại và mong muốn đưa ra cái nhìn tổng quát về thời gian tự học trung
bình thơng qua số liệu thực tế mà nhóm chúng em thu thập và khảo sát được từ bạn
sinh viên trong trường khóa 53, 54, 55



PHẦN I: CƠ SỞ LÍ THUYẾT
1. Ước lượng

Giả sử cần nghiên cứu dấu hiệu X trên một đám đông nào đó. Một trong
những mục tiêu cơ bản của việc nghiên cứu là xác định các tham số đặc trưng của
X như trung bình của đám đơng μ = E(X), phương sai của đám đông Var(X) = ơ2 .
Những tham số này thường chưa biết vì chúng ta khơng chủ trương điều tra cả đám
đông. Chúng ta sẽ đi ước lượng các tham số nói trên.

Xét một ĐLNN X , ký hiệu chung cho các tham số của đám đông cần ước
lượng là θ. Có hai phương pháp ước lượng θ là ước lượng điểm và ước lượng bằng
khoảng tin cậy.
1.1.

Ước lượng điểm

Trong thực tế ta thường dùng khái niệm ước lượng điểm như khi nói: “ước
lượng cho lạm phát là 6,5%”; “ước lượng mức tăng trưởng kinh tế là 8%”, nghĩa là
chỉ dùng một con số duy nhất để ước lượng.
Ước lượng điểm trong thống kê tốn là tìm ra một giá trị, tính tốn trên mẫu,
do đó tùy thuộc mẫu mà kết quả sẽ có thể khác nhau.
Bước 1 : Lấy mẫu ngẫu nhiên : W= (X1,X2,…,Xn) với n khá lớn
Xây dựng thống kê : f(X1,X2,…,Xn) phù hợp với tham số θ
( Trong đó: θ là một hằng số còn là một ĐLNN ).
Bước 2 : Lấy mẫu cụ thể w = (x1,x2,…,xn) tính tốn được giá trị cụ thể của thống
kê f(x1,x2,…,xn)
Bước 3 : Lấy θ = làm ước lượng điểm cho tham số θ
được gọi là ước lượng điểm của θ
Cùng với 1 mẫu ngẫu nhiên có thể xây dựng nhiều thống kê θ* khác nhau để
ước lượng tham số θ. Vì vậy, ta cần lựa chọn thống kê tốt nhất để ước lượng cho
tham số θ dựa vào các tiêu chuẩn sau:
a. Ước lượng không chệch


Thống kê được gọi là ước lượng không chệch của θ nếu:
E() = θ
Ngược lại nếu E() ≠ θ thì ta nói là ước lượng chệch của θ
Ta có : là ước lượng không chệch của
là ước lượng không chệch của

Nếu là ước lượng chệch của θ thỏa mãn điều kiện:

Thì được gọi là ước lượng tiệm cận khơng chệch của θ
b. Ước lượng vững

Thống kê được gọi là ước lượng vững của θ nếu với mọi ta có :

Theo định lí Trebusep
Theo định lí Bernoulli thì tần suất mẫu f là ước lượng vững của tỉ lệ đám
đông p
Nếu là ước lượng khơng chệch của θ và

Thì là ước lượng vững của θ
c. Ước lượng hiệu quả

Thống kê được gọi là ước lượng hiệu quả của θ của ĐLNN gốc X, nếu nó là
ước lượng khơng chệch và có phương sai nhỏ nhất so với mọi ước lượng không
chệch khác được xây dựng trên cùng 1 mẫu
Ta có : là ước lượng hiệu quả của
Tần suất mẫu f là ước lượng hiệu quả của tỉ lệ đám đông p
Đương nhiên, nếu và là hai ước lượng không chệch của θ mà
lượng tốt hơn.

thì sẽ ước


1.2.
Ước lượng bằng khoảng tin cậy
1.2.1. Khái niệm


Phương pháp ước lượng điểm nói trên tuy có ưu điểm là đơn giản, nhưng
cũng có nhược điểm rất lớn là khơng cho biết sai số cũng như không chỉ ra
được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Đặc biệt khi kích thước
mẫu nhỏ, ước lượng điểm tìm được có thể sai lệch rất hiều so với tham số cần
ước lượng, nói một cách khác sai số của ước lượng có thể rất lớn. Phương pháp
ước lượng bằng khoảng tin cậy khắc phục được những nhược điểm này.
Giả sử cần ước lượng tham số θ của ĐLNN X trên 1 đám đông
Bước 1 : Ta lấy mẫu ngẫu nhiên : W= (X1,X2,…,Xn)
Xây dựng thống kê G= f(X1,X2,…,Xn, θ) sao cho quy luật phân phối của G
hoàn toàn xác định.
Bước 2 : Với xác suất ( thường 0,9 0,99) cho trước, xác định , thỏa mãn . Từ
đó xác định các phân vị và :

Thay G, biến đổi tương đương ta có :

Ngun lí xác suất lớn :
Nếu 1 biến cố có xác suất khá lớn thì trong 1 lần thực hiện phép thử ta coi
biến cố đó chắc chắn xảy ra :


Theo nguyên lý xác suất lớn : Khoảng ( được gọi là khoảng tin cậy của .
Xác suất gọi là độ tin cậy
gọi là độ dài của khoảng tin cậy
Bước 3 : Với mẫu cụ thể w = (x1,x2,…,xn)
 Tính tốn và kết luận khoảng tin cậy
 Chú ý :


Xác suất mắc sai lầm trong ước lượng khoảng là
Khi G có phân phối N(0,1) hoặc phân phối STUDENT nếu chọn ta có

khoảng tin cậy ngắn nhất và đó là khoảng tin cậy đối xứng.
- Để ước lượng giá trị tối thiểu cho ta chọn :
 Đây là khoảng tin cậy phải
- Để ước lượng giá trị tối đa cho ta chọn :
 Đây là khoảng tin cậy trái
1.2.2. Ước lượng kỳ vọng toán của ĐLNN
Bài toán : Xét ĐLNN X có E(X) , Var(X) với chưa biết
Ta xét bài toán này trong 3 trường hợp sau :
 Trường hợp 1 : , với đã biết
 Trường hợp 2 : Chưa biết quy luật phân phối của X, n 30
 Trường hợp 3 : , với chưa biết, n 30
1.2.2.1.
Xét trường hợp 1 : , với đã biết
Bước 1 : Vì nên
Xây dựng thống kê :
Bước 2 : Đưa ra khoảng tin cậy
a. Khoảng tin cậy đối xứng ( )
Với độ tin cậy ta có :
-

Thay U ta có :

P(
Đặt gọi là sai số của ước lượng
 P(
 Khoảng tin cậy đối xứng của là (

Bước 3 : Tính tốn và kết luận
Với mẫu cụ thể ta có khoảng tin cậy cụ thể của :
 Chú ý :

1. Nếu bài toán cho (1)  P(
2. Nếu bài toán cho khoảng tin cậy của ( hoặc )


3. Từ công thức ta có thể gặp các bài tốn sau :
Bài tốn 1 : Cho n, . Tìm
Bài tốn 2: Cho n, . Tìm


=
Bài tốn 3 : Cho . Tìm n
b. Khoảng tin cậy phải (. Ước lượng

Với độ tin cậy ta tìm được phân vị sao cho :

Khoảng tin cậy phải của là :
c. Khoảng tin cậy trái . Ước lượng

Với độ tin cậy ta tìm được phân vị sao cho :

Khoảng tin cậy trái của là :
1.2.2.2.

Xét trường hợp 2 : Chưa biết QLPP của X,

Bước 1 : Vì nên
Xây dựng thống kê :
Bước 2,3 làm tương tự như trường hợp 1
• Chú ý : Nếu chưa biết, vì nên ta lấy
1.2.2.3.

Xét trường hợp 3 : với chưa biết ,

Bước 1 : Vì
Xây dựng thống kê :
Bước 2 : Đưa ra khoảng tin cậy
Khoảng tin
cậy
Đối xứng
Phải (
Trái

Xác suất

Khoảng tin cậy của


1.2.3. Ước lượng tỷ lệ đám đơng

Bài tốn : Xét đám đơng có tỷ lệ phần tử mang dấu hiệu A là p trong đó p chưa
biết, cần ước lượng.
Chọn mẫu kích thước n khá lớn. Ta có tần suất mẫu :
Bước 1 : Vì n khá lớn nên
Xây dựng thống kê :
Bước 2 : Đưa ra khoảng tin cậy
Khoảng tin
cậy
Đối xứng
Phải (
Trái



Xác suất

Khoảng tin cậy của

Chú ý :

1. Khoảng tin cậy đối xứng dùng để ước lượng và tính được .
2. Khoảng tin cậy phải dùng để ước lượng
3. Khoảng tin cậy
1.2.4. Ước lượng phương sai của ĐLNN phân phối chuẩn
Bài tốn: Xét ĐLNN X phân phối chuẩn có E(X)= µ và Var(X)= trong đó
chưa biết, cần ước lượng:
B1: Vì X N(), XDTK:

B2: Đưa ra khoảng tin cậy
a. Khoảng tin cậy hai phía của

Với độ tin cậy ta tìm được phân vị sao cho


)=
( < < )=
Khoảng tin cậy hai phía của (
b. Khoảng tin cậy phải của ƯL

Với độ tin cậy ta tìm được phân vị sao cho:
)=
=
Khoảng tin cậy phải của :

( )
c. Khoảng tin cậy trái của ƯL

Với độ tin cậy ta tìm được phân vị sao cho:
)=
=
Khoảng tin cậy trái của
( 0;


2. Kiểm định giả thuyết thống kê
2.1.
Khái niệm chung
2.1.1. Giả thuyết thống kê

Như ta đã biết, vì khơng điều tra cả đám đông nên ta không biết dạng phân
phối xác suất của dấu hiệu cần nghiên cứu X trên đám đơng hoặc có thể biết dạng
phân phối xác suất của X nhưng chưa biết số đặc trưng Ɵ nào đó của nó. Ta có thể
đưa ra những nhận xét khác nhau về các yếu tố chưa biết, đó là các giả thuyết
thống kê.
Khi nghiên cứu hai hay nhiều ĐLNN thể hiện trên cùng một đám đông hoặc
trên những đám đông khác nhau, ta có thể đưa ra các nhận xét: các ĐLNN độc lập
hay phụ thuộc hoặc các tham số của chúng có bằng nhau hay khơng, đó cũng là các
giả thuyết thống kê. Một cách ngắn gọn ta có thể đưa ra định nghĩa:
Định nghĩa: Giả thuyết về dạng phân phối xác suất của ĐLNN, về các tham
số đặc trưng của ĐLNN hoặc về tính độc lập của các ĐLNN được gọi là giả thuyết
thống kê, kí hiệu là H0.
Giả thuyết H0 được đưa ra kiểm định gọi là giả thuyết gốc, đó là giả thuyết ta
đang nghi ngờ. Một giả thuyết trái với giả thuyết gốc được gọi là đối thuyết, kí
hiệu là H1. Ta quy ước khi đã chọn cặp giả thuyết H0 và H1 thì việc bác bỏ H0 tức là

chấp nhận H1 và ngược lại. H0 và H1 lập thành một cặp giả thuyết thống kê.
Công việc tiến hành theo một quy tắc hay một thủ tục nào đó để từ một mẫu
cụ thể được lấy ra từ đám đông cho phép ta đi đến quyết định: chấp nhận hay bác
bỏ một giả thuyết thống kê được gọi là kiểm định giả thuyết thống kê.
Nguyên lí xác suất nhỏ: “ Một biến cố có xác suất khá bé thì trong thực hành
ta có thể coi nó khơng xảy ra trong một lần thực hiện phép thử ”.
2.1.2. Thủ tục kiểm định giả thuyết thống kê

Để kiểm định một giả thuyết thống kê H0 với đối thiết H1 ta tiến hành như
sau:
B1: - Xây dựng cặp giả thuyết H0 /H1
- Xây dựng Tiêu chuẩn kiểm định (XDTCKĐ)
Lấy mẫu ngẫu nhiên W=(X1,X2,…,Xn)
XDTK: G = f(X1,X2,…,Xn,θ0); (θ0 là tham số liên quan H0) .


Sao cho nếu H0 đúng thì QLPPXS của G hồn toàn xác định.
G được gọi là Tiêu chuẩn kiểm định.
B2: Tìm miền bác bỏ Wα
Do QLPPXS của G hồn tồn xác định nên với xác suất α khá bé cho trước
(thường (0.005; 0.1)) ta tìm được miền Wα.
P(G ϵ Wα/H0)= α
Theo NLXS nhỏ, vì α khá bé nên nếu H0 đúng ta có thể coi
biến cố (G ϵ Wα) khơng xảy ra trong một lần lấy mẫu cụ thể.
Wα: Miền bác bỏ;

α : mức ý nghĩa.

B3: Lấy mẫu cụ thể, tính, kết luận theo Quy tắc kiểm định
• Lấy một mẫu cụ thể w = (x1,x2,…,xn) ta tính được:

gtn = f(x1,x2,…,xn,θ0) (gtn: g thực nghiệm)
+ Nếu gtn ϵ Wα tức biến cố (G ϵ Wα) xảy ra → GT H0 tỏ ra khơng đúng → Ta
có cơ sở bác bỏ H0, chấp nhận H1.
+ Nếu gtn ɇ Wα tức biến cố (G ϵ Wα) không xảy ra → GT H0 tỏ ra hợp lý →
Chưa có cơ sở bác bỏ H0.
• Quy tắc kiểm định.
+ Nếu gtn ϵ Wα: Bác bỏ H0, chấp nhận H1.
+ Nếu gtn ɇ Wα: Chưa có cơ sở bác bỏ H0.
2.1.3. Các loại sai lầm khi kiểm định

• Sai lầm loại 1: là sai lầm bác bỏ H0 khi H0 đúng.
Xác suất mắc phải sai lầm loại 1:
P(G ϵ Wα/H0) = α


• Sai lầm loại 2: là sai lầm chấp nhận H0 khi H0 sai.
Xác suất mắc phải sai lầm loại 2:
P(G ɇ Wα /H1) = β.
Sai lầm loại một và sai lầm loại hai có quan hệ mật thiết với nhau: khi kích
thước mẫu xác định, nếu giảm α thì β tăng và ngược lại. Do đó khơng thể lấy α bé
tùy ý được.
Tuy nhiên với một TCKĐ xác định, một kích thước mẫu cho trước và mức ý
nghĩa α xác định ta có thể tìm được miền Wα sao cho xác xuất mắc sai lầm loại hai
β bé nhất ( tức là lực kiểm định lớn nhất). Những miền bác bỏ mà ta sử dụng sau
này đều làm cực tiểu sai lầm loại hai trong những điều kiện nói trên.
• Chú ý: Với cùng một mẫu kích thước n thì khơng thể cùng một lúc giảm xác
suất mắc hai loại sai lầm.
2.2.
Kiểm định giả thuyết về tham số của ĐLNN
2.2.1. Kiểm định giả thuyết về kì vọng tốn của ĐLNN


Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên một đám đơng. Kí hiệu
E(X) = μ, Var(X) = ơ2, trong đó μ chưa biết . Từ một cơ sở nào đó người ta tìm
được μ = μ0, nhưng nghi ngờ về điều này. Với mức ý nghĩa α cho trước ta cần kiểm
định giả thuyết H0: μ = μ0 .
Từ đám đông cho ta lấy mẫu: W = (X1, X2,…,Xn) và tính được các đặc trưng
mẫu:

1 n
X = ∑ Xi
n i =1

1 n
S' =
( X i − X )2

n − 1 i =1
2



Xét các trường hợp sau:
2.2.1.1.

ĐLNN X trên đám đơng có phân phối chuẩn với

Vì X có phân phối chuẩn nên:
(XDTCKĐ):

σ2

X ~ N (µ , )
n

σ2

đã biết

. Xây dựng tiêu chuẩn kiểm định


U=

X − µ0
σ
n

Nếu H0 đúng thì

U ~ N(0,1)

Xét những bài tốn cụ thể sau:

H 0: : µ = µ 0
H : µ ≠ µ0
Bài tốn 1: {

Với

α


Ta có:

P( U > u α ) = α


cho trước ta có thể tìm được



Wα = u tn : u tn > u α 
2 


2

2

sao cho:

. Trong đó:
u tn =

x − µ0
σ
n

H 0 : µ = µ0
Bài tốn 2: {
Với


α

H1 : µ > µ0

cho trước, ta có thể tìm được

Từ đó ta có miền bác bỏ:

Wα = { u tn > uα }

H 0 : µ = µ0
Bài tốn 3: {

H1 : µ < µ0



sao cho:

P (U > uα ) = α


Với

α

cho trước ta có thể tìm được

Ta có miền bác bỏ:




sao cho:

P( U < −uα ) = α

Wα = { u tn > −uα }

*Phương pháp P-giá trị(P-value)
1. Công thức tìm P-giá trị

H 0: : µ = µ 0
H : µ ≠ µ0
a) Đối với bài toán: {

2 P(U > u tn )
Ta có P-giá trị =

u tn =

x − µ0
σ
n

Trong đó U~N(0;1) và

b) Đối với bài tốn: {

Ta có P-giá trị =


P (U > u tn )

c) Đối với bài tốn: {

Ta có P-giá trị =

H 0 : µ = µ0
H1 : µ > µ0

H 0 : µ = µ0
H1 : µ < µ0

P(U < u tn )

2. Kết luận sau khi tìm được P-giá trị
a) Cách thứ nhất:

- Nếu P-giá trị ≤ 0,05: Chưa có cơ sở để bác bỏ H0.


- Nếu 0,01 ≤ P-giá trị < 0,05: Có cơ sở để bác bỏ H0.
- Nếu P-giá trị < 0,01: Có cơ sở chắc chắn để bác bỏ H0.
b) Cách thứ hai: Quy định trước mức ý nghĩa

α

α

. Tính P-giá trị rồi so sánh với


:

- Nếu P-giá trị <
- Nếu P-giá trị ≥

α
α

thì bác bỏ H0.
thì chưa có cơ sở để bác bỏ H0.

* Chú ý: Các cơng thức tìm P-giá trị trên cịn được dùng cho các bài tốn kiểm
định giả thuyết thống kê khác, trong đó có dùng tiêu chuẩn kiểm định U.

σ

2.2.1.2. ĐLNN X trên đám đông có phối chuẩn với
T=

chưa biết:

X − µ0
S'
n

XDTCKĐ:

Vì X có phân phối chuẩn, nếu H0 đúng thì T~T(n-1)

H 0: : µ = µ 0

H : µ ≠ µ0
 Bài tốn 1: {

Với mức ý nghĩa

α

t α( n −1)
cho trước ta có thể tìm được

P ( T > t α( n −1) ) = α
2

Từ đó ta có miền bác bỏ:

2

sao cho:




Wα = t tn : t tn > t α( n −1) 
2



 Bài toán 2: {

t tn =


x − µ0
s'
n

trong đó:

H 0 : µ = µ0
H1 : µ > µ0

Với mức ý nghĩa

α

cho trước ta có thể tìm được

tα( n −1)

sao cho:

P (T > tα(n −1) ) = α
Từ đó ta có miền bác bỏ:

Wα = {t tn : t tn > tα( n−1) }

 Bài toán 3: {

H 0 : µ = µ0
H1 : µ < µ0


Với mức ý nghĩa

α

cho trước ta có thể tìm được

P (T < −tα(n −1) ) = α
Từ đó ta có miền bác bỏ:

Wα = {t tn : t tn < −tα( n−1) }
* Cơng thức P-giá trị(P-value):

H 0: : µ = µ 0
H : µ ≠ µ0
 Bài tốn 1: {

tα( n −1)

sao cho:


t tn =

2 P (T > t tn )
Ta có P-giá trị =

 Bài tốn 2: {

n
. Trong đó T~T(n-1) và


H 0 : µ = µ0
H1 : µ > µ0

Ta có P-giá trị =

 Bài tốn 3: {

x − µ0
s'

P (T > t tn )

H 0 : µ = µ0
H1 : µ < µ0

Ta có P-giá trị =

P (T < t tn )

* Chú ý: + Các cơng thức tìm P-giá trị trên cịn được dùng cho các bài tốn kiểm
định giả thuyết thống kê khác, trong đó có dùng tiêu chuẩn kiểm định T.
Sau khi tìm được P-giá trị, việc kết luận được tiến hành như trong mục
II.1.1.

σ2

+ Khi ĐLNN có phân phối chuẩn, mặc dù
chưa biết, nhưng nếu kích
thước mẫu n > 30 người ta thường dùng chuẩn U như trong mục II.1.1. Đến khi

tìm utn ta lấy

σ ≈ s'

.

2.2.1.3. Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu
n>30.

Với n>30 thì

µ ,σ 2
X ≅ N(
)
n

. Ta vẫn dùng tiêu chuẩn kiểm định:


U=

X − µ0
σ
n

Khi đó giả thuyết H0 đúng thì U sẽ xấp xỉ phân phối chuẩn N(0;1) . Phần còn lại
tiến hành như mục II.1.1. ta cũng cần nhớ rằng: nếu
có thể lấy

σ ≈ s'


σ

2

chưa biết, nhứng n>30 ta

.

2.2.2. Kiểm định giả thuyết về tỷ lệ của đám đơng
Bài tốn: Xét đám đơng có tỷ lệ phần tư mang dấu hiệu A
là p(p chính là xác suất để rút ngẫu nhiên được phần tử mang dấu hiệu A từ đám
đông).
Từ cơ sở nào đó người ta đặt giả thuyết H0: p=p0. Chọn từ đám đông. Nghi ngờ GT
trên với mức ý nghĩa α ta kiểm định 1 trong 3 bài toán sau:
Bài toán 1:
Bài toán 2:
Bài toán 3:

f =
B1: Chọn mẫu kích thước n khá lớn. Ta có tần suất mẫu

f ~ N ( p,
Vì n khá lớn nên

U=
XDTCTK:
B2:

pq

)
n

f − p0
p0 q0
n

. Nếu H0 đúng U~N(0;1)

nA
n


H0

P(G ∈ Wα / H 0 ) = α

Miền bác bỏ

p 2 ≠ p 02

P[( U < uα / 2 ) = α

Wα = {u tn : u tn > uα / 2

p 2 > p 02

P(U > uα ) = α

Wα = {u tn : u tn > uα }


p 2 < p 02

P(U < −uα ) = α

Wα = {u tn : u tn < −uα }

H1

p 2 = p 02

B3: Tính và kết luận theo Quy tắc kiểm định
 Với mẫu cụ thể tính:

u tn =

f − p0
p0 q0
n

 Kết luận theo quy tắc kiểm định.
+ Nếu utn
+ Nếu utn

∈ Wα

∉ Wα

:Bác bỏ H0, chấp nhận H1.
:Chưa có cơ sở bác bỏ H0.


2.2.3. Kiểm định giả thuyết về phương sai của ĐLNN phân phối
Bài toán: Xét ĐLNN X phân phối chuẩn với E(X)=μ,
Var(X)=σ2, σ2 chưa biết.


H 0 : σ 2 = σ 02

Từ cơ sở nào đó người ta đặt giả thuyết
mức ý nghĩa α ta kiểm định 1 trong 3 bài toán sau:

. Nghi ngờ GT trên với

H0 :σ = σ 0
 Bài toán 1:{

H1 : σ ≠ σ 0
H0 :σ = σ 0

 Bài toán 2 :{

H1 : σ > σ 0

H0 :σ = σ 0
 Bài toán 3:{

H1 : σ < σ 0
( n − 1) S 2
χ =
σ 02

2

B1: Vì X~N(μ;

σ2

), XDTCKĐ:

. Nếu H0 đúng

χ 2 ~ χ 2 ( n −1)

B2: Tóm tắt trong bảng sau:
H0

σ =σ
2

H1

P(G ∈ Wα / H 0 ) = α

σ 2 ≠ σ 02

P[( χ < χ 1−α / 2

2 ( n −1)

+ ( χ 2 > χα / 2


2
0

σ 2 > σ 02

P( χ 2 > χ 1−α

2 ( n −1)

Wα = {χ tn2 : χ 2 < χ 1−α / 2

)

2 ( n −1)

Miền bác bỏ

)] = α
Hoặc

) =α

2 ( n −1)

χ 2 > χ α / 2 2( n −1) }

{

Wα = χ tn2 : χ tn2 > χ α


2 ( n −1)

}


σ 2 < σ 02

P( χ 2 < χ 1−α

2 ( n −1)

) =α

B3: Tính và kết luận theo quy tắc kiểm định
• Với mẫu cụ thể tính

(n − 1) s ' 2
x =
σ 02
2
tn

• Kết luận theo quy tắc kiểm định.

+ Nếu

+ Nếu

xtn ∈ Wα
xtn ∉ Wα


: Bác bỏ H0, chấp nhận H1.

: Chưa có cơ sở bác bỏ H0.

{

Wα = χ tn2 : χ tn2 < χ α

2 ( n −1)

}


PHẦN II: ÁP DỤNG VÀO BÀI TẬP NHĨM
Bài tốn: Phỏng vấn 200 sinh viên trường Đại học Thương Mại về thời gian tự học
một ngày ta được bảng số liệu sau:
Thời gian tự học
xi
Số sinh viên

Từ 0.5- Từ
1h
1.5h
47

73

1h- Từ 1.5- Từ
2- Từ 2.52h

2.5h
3h
26

33

21

ni

a. Với độ tin cậy 95% hãy ước lượng thời gian tự học trung bình một ngày của sinh
viên trường Đại học Thương Mại.
b. Với mức ý nghĩa 5% kiểm định giả thuyết cho rằng thời gian tự học trung bình
một ngày của sinh viên trường Đại học Thương Mại là thấp hơn 2 giờ.

Bài làm

a) Với độ tin cậy 95% hãy ước lượng thời gian tự học trung bình một ngày của

sinh viên trường Đại học Thương Mại.
Gọi X là thời gian tự học của sinh viên Đại học Thương Mại trong 1ngày.
X

là thời gian tự học trung bình của sinh viên Đại học Thương Mại trong
1ngày trên mẫu.
µ

là thời gian tự học trung bình của sinh viên Đại học Thương Mại trong
1ngày trên đám đơng.
Ta có bảng sau:



xi.ni

xi2.ni

47

35,25

26,4375

1,25

73

91,25

114,0625

1,75

26

45,5

79,625

2,25


33

74,25

167,0625

2,75

21

57,75

158,8125

Tổng

200

304

546

Thời gian tự học

Số sinh viên

xi

ni


0,75

Ta có:

1 k
1
x = .∑ ni .xi =
.304 = 152
n i =1
200

1 k
1

2
( s ' ) =  ∑ ni . x i − n ( x ) 2  =
(
546 − 200.1,522 ) ≈ 0,42171
n  i =1
 199
2



=> s’ 0,6494
Do ta chưa biết quy luật phân phối của X,

Vì n>30 nên ta lấy:

σ ≈ s'

U=

Xây dựng thống kê:
Với độ tin cậy

γ = 1−α

=>

σ

chưa biết

σ2
X ~ N (µ , )
σ = 0,6499
n

X −µ

σ/ n

ta có:

,

~ N (0;1)


P(−uα / 2 < U < uα / 2 ) = γ

Thay U ta có:

P (−uα / 2 <

P ( −u α / 2 .
<=>

ε = uα / 2 .
Đặt

σ
n

=>

σ/ n

σ
σ
< µ < X + uα / 2 .
)=γ
n
n

P( X − ε < µ < X + ε ) = γ

=> Khoảng tin cậy đối xứng của
Lại có:

µ




γ = 1 − α = 0.95 = >α = 0.05

uα / 2 = U 0.025 = 1,96
= >ε = 1,96.

0,6494
200

< uα / 2 ) = γ

σ
σ
< X − µ < uα / 2 .
)=γ
n
n

P ( X − uα / 2 .
<=>

X −µ

≈ 0.09

Trên mẫu cụ thể:
µ
1,52-0,09 < < 1,61

µ
<=> 1,43 < < 4,61

(X − ε; X + ε )


×