TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
KHOA THƯƠNG MẠI ĐIỆN TỬ
BÀI THẢO LUẬN
LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN
Đề bài:
1.Ước lượng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường ĐH TM.
2. Hiện nay, tỷ lệ sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng
tháng đến 1,4triệu là 60%. Hãy kiểm tra lại khẳng định trên.
(α = 0,05;
95,0
=
γ
)
Nhóm : 7
Lớp : Lớp 1028AMAT0111
GVHD : Thầy Đức Minh
Hà Nội, 2010
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
LỜI NÓI ĐẦU
Lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là những bộ
phận quan trọng của thống kê toán. Nó là phương tiện giúp ta giải quyết
những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu
trong tổng thể.
Để ước lượng kì vọng toán của ĐLNN X, người ta giả sử trên một đám đông
có E(X)= µ và Var(X) . Trong đó µ chưa biết, cần ước lượng . Từ đám
đông ta lấy ra kích thước mẫu n: . Từ mẫu này ta tìm
được trung bình mẫu
X
và phương sai mẫu điều chỉnh
2
S
′
. Dựa vào những
đặc trưng mẫu này ta sẽ xây dựng thống kê G thích hợp.Với vấn đề 2 của đề
tài thảo luận, đó là “ước lượng mức chi tiêu trung bình hàng tháng của sinh
viên ngoại tỉnh trường ĐH Thương Mại”, nhóm chúng tôi đã xác định dùng
phương pháp ước lượng µ khi chưa biết quy luật phân phối của ĐLNN , kích
thước mẫu n đủ lớn.
Kiểm định giả thuyết thống kê về tỉ lệ của đám đông, thông thường ta thường
giả sử dấu hiệu X cần nghiên cứu trên đám đông có E(X) µ, Var(X) ,
trong đó µ chưa biết. từ một cơ sở nào đó người ta tìm được p=po , nhưng
nghi ngờ về điều này. Với mức ý nghĩa cho trước ta cần kiểm định giả
thuyết : p=po . Từ đám đông lấy ra mẫu: và tính được các đặc trưng mẫu:
, . Lấy một mẫu cụ thể
. Từ mẫu này ta tính được , rồi so sánh với để bác
bỏ hay không bác bỏ , chấp nhận hay không chấp nhận .Đó là phương
pháp làm của nhóm tôi trong phần 2 của vấn đề thảo luận: “Hiện nay, tỷ lệ
sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng tháng đến 1,4triệu
là 60%. Hãy kiểm tra lại khẳng định trên.”
Lớp 1028AMAT0111 Trang 2 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Bài thảo luận này được xây dựng dựa trên cơ sở của: giáo trình Lý thuyết xác
suất và thống kê toán của trường Đại học Thương Mại, giáo trình Lý thuyết
xác suất và thống kê toán của trường Đại học Kinh Tế Quốc Dân cùng với các
kiến thức đã tiếp thu được từ các bài giảng của giảng viên bộ môn trường Đại
học Thương Mại.
Do thời gian, điều kiện và khả năng có hạn, bài thảo luận nhóm chúng tôi
không tránh khỏi những khiếm khuyết. Chúng tôi rất mong nhận được sự cảm
thông, chia sẻ và góp ý từ phía các giảng viên, các bạn sinh viên và những ai
quan tâm để bài thảo luận nhóm được hoàn thiện hơn!
Tập thể nhóm 7!
Phần I: CƠ SỞ LÝ THUYẾT
I.Ước lượng kỳ vọng toán của ĐLNN
Giả sử một đám đông ĐLNN có
µ
=)(XE
và . Trong đó
µ
chưa
biết, cần ước lượng. Từ đám đông ta lấy ra mẫu kích thước n:
. Từ đám đông ta lấy mẫu này ta tìm được trung bình
mẫu và phương sai mẫu điều chỉnh . Dựa vào những đặc trưng mẫu này
ta sẽ xây dựng thống kê G thích hợp. Có 3 trường hợp cần xét là:
Trường hợp 1: ĐLNN X phân phối theo quy luật chuẩn, đã biết.
Trường hợp 2: ĐLNN gốc X phân phối theo quy luật chuẩn, phương sai
chưa biết.
Trường hợp 3: Chưa biết quy luật phân phối xác suất của X trên đám đông,
nhưng kích thước mẫu n>30.
Theo yêu cầu thảo luận sau đây chúng ta sẽ đi xét trường hợp 3.
Lớp 1028AMAT0111 Trang 3 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Vì là ngẫu nhiên và n khá lớn, theo định lý giới hạn trung
tâm thì có phân phối xấp xỉ chuẩn: nên:
U =
n
X
σ
µ
−
≅
N(0,1) (1)
(U có phân phối chuẩn xấp xỉ chuẩn hóa)
Khi đó ta có thể tìm được phân vị sao cho:
(2)
Thay biểu thức U ở (1) vào (2)và biến đổi ta được:
α
σ
µ
α
−≈<− 1)(
2
u
n
XP
(3)
⇔
(4)
Trong đó: (5)
Từ (4) ta có độ tin cậy của ước lượng là
α
−
1
Khoảng tin cậy đối xứng của là:
(6)
Độ dài của khoảng tin cậy là 2 .
Sai số của ước lượng là , được tính bằng công thức (5).
Từ đó ta có sai số của ước lượng bằng một nửa độ dài của khoảng tin cậy. Vì
vậy nếu biết khoảng tin cậy đối xứng (a, b) thì sai số được tính theo công
thức:
Lớp 1028AMAT0111 Trang 4 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
2
ab
−
=
ε
(7)
Ở đây ta có 3 bài toán cần giải quyết:
Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy
α
−
1
, cần tìm sai số hoặc
khoảng tin cậy.
Nếu biết độ tin cậy
α
−
1
ta tìm được
2
α
, tra bảng ta tìm được
2
α
u
từ đó ta
tính được theo công thức (5) và cuối cùng nếu cần, ta có thể tìm được
khoảng tin cậy (6) của μ
• Chú ý :
Khoảng tin cậy (6) là khoảng tin cậy ngẫu nhiên, trong khi là một số xác
định. Đối với mẫu ngẫu nhiên W=(X
1
,X
2
,…,X
n
), vì độ tin cậy
α
−
1
khá gần
1 nên theo nguyên lý xác suất lớn có thể coi biến cố
( )
εµε
+<<− XX
sẽ xảy
ra trong một lần thực hiện phép thử. Nói một cách chính xác, với xác suất
α
−
1
khoảng tin cậy ngẫu nhiên (6) sẽ chụp đúng
( )
µ
=
XE
.
Trong một lần lấy mẫu ta được mẫu cụ thể w=(x
1
,x
2
,…,x
n
). Từ mẫu cụ thể
này ta tìm được một giá trị cụ thể
x
của ĐLNN trung bình mẫu. Khi đó với
độ tin cậy
α
−
1
, ta tìm được một khoảng tin cậy cụ thể của là
Bài toán 2: Biết kích thước mẫu n và sai số cần tìm độ tin cậy (nếu biết
khoảng tin cậy đối xứng (a, b) thì ta có thể tính được sai số theo công thức
(7)).
Từ (5) ta tìm được
σ
ε
α
n
u
=
2
, tra bảng tìm được
2
α
từ đó tìm được độ tin cậy
α
−
1
Bài toán 3: Biết độ tin cậy
α
−
1
, biết sai số cần tìm kích thước mẫu n.
Lớp 1028AMAT0111 Trang 5 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Do ta chưa biết quy luật phân phối xác suất của X, kích thước mẫu cũng chưa
biết(đang cần tìm) nên ta phải giả thiết
X
có phân phối chuẩn.(nếu
σ
chưa
biết, vì n> 30 nên ta có thể lấy
σ
s
′
≈
)
2
2
2
2
ε
σ
ε
u
n
=
hoặc
ε
ε
2
2
2
us
n
′
=
Đó chính là kích thước mẫu tối thiểu cần tìm.
• Chú ý: Từ biểu thức trên ta thấy:
Nếu giữ nguyên kích thước mẫu n và giảm sai số thì u
2
α
cũng giảm, có
nghĩa là giảm độ tin cậy. Ngược lại nếu giữ kích thước mẫu n không đổi và
tăng độ tin cậy
α
−
1
thì sẽ làm tăng u
2
α
dẫn đến sai số cũng tăng theo.
Tương tự như vậy nếu giữ nguyên sai số đồng thời giảm kích thước mẫu n
thì u
2
α
cũng giảm, tức là độ tin cậy giảm. Nếu giữ nguyên độ tin cậy
α
−
1
và
tăng kích thước mẫu n thì sai số giảm.
Ví dụ: Theo dõi 36 công nhân cùng sản xuất ra một loại sản phẩm và thu
được bảng số liệu thống kê về thời gian cần thiết (đơn vị là phút)sản xuất ra
sản phẩm như sau:
Thời gian sản xuất một sản phẩm 9 10 11 12
Số công nhân 3 9 20 4
Với độ tin cậy 99% hãy ước lượng thời gian trung bình cần thiết để sản xuất
ra một loại sản phẩm.
Giải
Gọi X là thời gian sản xuất ra 1 loại sản phẩm
là thời gian trunh bình sản xuất ra 1 loại sản phẩm trên mẫu
là thời gian trung bình sản xuất ra 1 loại sản phẩm trên đám đông
Lớp 1028AMAT0111 Trang 6 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Ta có n=36>30 nên có phân phối xấp xỉ chuẩn
Do đó
)1,0(N
n
X
U ≅
−
=
σ
µ
Vì
σ
chưa biết, n=100 khá lớn nên ta lấy
s
′
≈
σ
được: U=
Tìm được thõa mãn
(1)
Ta có :
36
3851
1
==
∑
=
n
i
ii
xn
n
X
( )
786,0618,0
1
1
1
2
2'
=⇒=−
−
=
∑
=
SXXn
n
S
n
i
ii
Thay tìm được khoảng tin cậy:
( )
αεµε
−≈+<<− 1XXP
Ta có
Kết luận: Với độ tin cậy là 99% thì thời gian trung bình cần thiết để
sản xuất ra một loại sản phẩm là (10,3564; 11,0324).
II.Kiểm định giả thuyết về tỷ lệ đám đông
Lớp 1028AMAT0111 Trang 7 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Xét một đám đông kích thước N, trong đó có M phần tử mang dấu hiệu A.
Khi đó là tỷ lệ phần tử mang dấu hiệu A trên đám đông. Từ
một cơ sở nào đó người ta tìm được p = p
0
nhưng nghi ngờ về điều này. Với
mức ý nghĩa α ta cần kiểm định giả thuyết Ho: p= p
0
.
Để kiểm định giả thuyết trên, từ đám đông ta lấy ra một mẫu kích thước n.
Gọi f là tỷ lệ phần tử mang dấu hiệu A trên mẫu. Theo quy luật phân phối xác
suất của tần suất mẫu, khi n khá lớn thì
),(
n
pq
pNf
≅
. Ta xây dựng tiêu chuẩn
kiểm định:
n
pf
U
qp
00
0
−
=
, trong đó
00
1 pq
−=
.
Nếu Ho đúng thì
)1,0(NU
≅
Vì α khá bé, theo nguyên lý xác suất nhỏ và tùy thuộc vào từng đối thuyết H1
ta có miền bác bỏ Wα như sau:
Loại giả
thuyết
H
0
H
1
Xác suất W
α
2 phía
α
α
=>
)(
2/
uUP
}:{
2
αα
UUUW
tntn
>=
Phải
α
α
=> )( uUP
}:{
ααα
UUUW
tn
>=
Trái
α
α
=−< )( uUP
}:{
ααα
UUUW
n
t
−<=
• Trường hợp 1:
≠
=
o
pp
o
pp
H
H
:
:
1
0
Với mức ý nghĩa
α
cho trước ta tìm được
2/
α
U
sao cho
α
α
=> )(
2
uUP
.
Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
}:{
2
α
α
UUUW
tntn
>=
Ví dụ : Ở một địa phương tỷ lệ mắc bệnh gan đã được xác định nhiều lần là
34%. Sau một đợt điều trị bằng một loại thuốc, người ta kiểm tra lại 120
Lớp 1028AMAT0111 Trang 8 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
người thấy 24 người còn mắc bệnh gan. Hỏi với mức ý nghĩa 5% tỷ lệ người
mắc bệnh gan ở địa phương đó có thay đổi không?
Giải :
Gọi f là tỷ lệ người mắc bệnh gan trên mẫu
p là tỷ lệ người mắc bệnh gan trên đám đông
Vì n=120 khá lớn nên
),(
n
pq
pNf
≅
.
Với mức ý nghĩa α= 0,05 cần kiểm định:
≠
==
0
1
0
0
:
)34,0(:
ppH
ppH
XDTCKD:
n
qp
pf
U
00
0
−
=
Nếu H
0
đúng thì
)1,0(NU
≅
.
Với α cho trước ta xác định được
2/
α
U
sao cho:
α
α
=>
)(
2/
uUP
.
Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
}:{ 2/
αα
UUUW tnnt
>=
Ta có
2/
α
U
=
025,0
U
=1,96
Theo đề bài:
α
W
tn
Uf
∈
−
==⇒==
237,3
120
66,0.34,0
34,02,0
2,0
120
24
⇒
Bác bỏ H
0
Vậy với mức ý nghĩa 5% thì tỷ lệ người mắc bệnh gan ở địa phương đó có
thay đổi.
* Trường hợp 2:
>
=
0
1
0
0
:
:
ppH
ppH
Với mức ý nghĩa
α
cho trước ta tìm được
2/
α
U
sao cho
α
α
=> )( uUP
. Lập
luận như trong trường hợp 1 ta thu được miền bác bỏ
}:{
ααα
UUUW
n
t
>=
Ví dụ :
Lớp 1028AMAT0111 Trang 9 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Ngày 15/ 01/ 2002 tác giả của một bài báo viết: Ở Việt Nam có tới 90% các
doanh nghiệp chưa quan tâm tới thương mại điện tử. Có ý kiến cho rằng tỉ lệ
trên thấp hơn so với thực tế. Để kiểm tra lại, người ta điều tra 120 doanh
nghiệp thấy có 115 doanh nghiệp chưa quan tâm tới lĩnh vực này. Với mức ý
nghĩa 0,05 hãy cho nhận định về vấn đề trên.
Giải:
Gọi X là số doanh nghiệp chưa quan tâm tới thương mại điện tử
f là tỉ lệ doanh nghiệp chưa quan tâm tới thương mại điện tử trên mẫu
p là tỉ lệ doanh nghiệp chưa quan tâm tới thương mại điện tử trên đám
đông.
Vì n=120 khá lớn nên
),(
n
pq
pNf
≅
.
Với mức ý nghĩa α= 0,05 cần kiểm định:
>
==
01
00
:
)90,0(:
ppH
ppH
XDTCKD:
n
qp
pf
U
00
0
−
=
Nếu H
0
đúng thì
)1,0(NU
≅
.
Với α cho trước ta xác định được
α
U
sao cho:
α
α
=>
)( uUP
.
Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
}:{
αα
UUUW
tntn
>=
Ta có
65,1
05,0
==
UU
α
Theo đề bài :
α
WUf tn
∈
=
−
=⇒== 1288,2
120
10,0.90,0
90,09583,0
9583,0
120
115
⇒
Bác bỏ H
0
.
Vậy với mức ý nghĩa 0,05 thì ta nói rằng tỉ lệ các doanh nghiệp chưa
quan tâm tới thương mại điện tử lớn hơn 90%
* Trường hợp 3:
<
=
0
1
0
0
:
:
ppH
ppH
Lớp 1028AMAT0111 Trang 10 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Với α cho trước ta xác định được
α
U
sao cho:
α
α
=−< )( uUP
.
Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
}:{
αα
UUUW
tntn
−<=
Ví dụ: Điều tra 300 học sinh trung học ở Hà Nội thấy có 66 em bị cận thị. Với
mức ý nghĩa 1% có thể nói rằng tỉ lệ học sinh trung học ở Hà Nội bị cận thị
nhỏ hơn 25% hay không?
Giải:
Gọi X là số học sinh trung học ở Hà Nội bị cận thị
f là tỉ lệ học sinh bị cận thị trên mẫu
p là tỉ lệ học sinh bị cận thị trên đám đông
Vì n=300 khá lớn nên
),(
n
pq
pNf
≅
Với mức ý nghĩa α= 0,01 cần kiểm định:
<
==
0
1
0
0
:
)25,0(:
ppH
ppH
XDTCKD:
n
qp
pf
U
00
0
−
=
Nếu H
0
đúng thì
)1,0(NU
≅
.
Với α cho trước ta xác định được
α
U
sao cho:
α
α
=−< )( uUP
.
Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
}:{
αα
UUUW
tntn
−<=
Ta có
33,2
01,0
==
UU
α
Theo đề bài
α
WUf tn
∉
−=
−
=⇒== 2,1
300
25,0.75,0
25,022,0
22,0
300
66
⇒
Chưa có cơ sở bác bỏ H
0
Vậy với mức ý nghĩa 0,01 ta có thể nói rằng tỉ lệ học sinh trung học bị cận
nhỏ hơn 25%
Lớp 1028AMAT0111 Trang 11 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Phần II: BÀI TẬP
Đề bài:
1.Ước lượng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường ĐH TM.
2. Hiện nay, tỷ lệ sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng
tháng đến 1,4triệu là 60%. Hãy kiểm tra lại khẳng định trên.
(α = 0,05;
95,0
=
γ
)
Bảng phân phối thực nghiệm
Mức chi tiêu
(triệu VNĐ)
1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,5
Số SV
2
13 11 21 29 20 19 15 2 16 3
Kích thước mẫu n=150
Giải quyết bài toán:
1. Ước lượng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường Đại
học Thương mại.
Gọi:
X
là mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh
trường ĐHTM trên mẫu.
μ là mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh
trường ĐHTM trên đám đông.
Vì n = 100 > 30 nên
X
có phân phối xấp xỉ chuẩn:
Do đó
)1,0(N
n
X
U ≅
−
=
σ
µ
Với độ tin cậy
γ
ta có thể tìm được phân vị u
2
α
sao cho:
(
( )
γα
α
=−≈<
1
2
uUP
Thay biểu thức của U vào công thức trên ta và biến đổi ta có:
Lớp 1028AMAT0111 Trang 12 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
γ
σ
µ
α
=<− )(
2
u
n
XP
⇔
γεµε
=+<<−
)( XXP
Trong đó
2
α
σ
ε
u
n
=
Khoảng tin cậy:
( )
εµε
+<<−
XX
Vì
σ
chưa biết, kích thước mẫu lớn nên ta lấy
's
≈
σ
ta có
35,56318604,28.
1
1
''
1
2
2
==−
−
==
∑
=
n
i
ii
xnxn
n
ss
35,5
≈⇒
σ
Với
γ
=0,95
⇒
α
= 0,05
⇒
2
α
=0,025
⇒
u
0,025
=1,96
Thay vào khoảng tin cậy ta được
5141,196,1.
150
35,5
584,1
150
2
=−=−
α
σ
uX
6539,196,1.
150
35,5
584,1
150
2
=+=+
α
σ
uX
Vậy mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường
ĐHTM nằmvtrong khoảng (1,5141; 1,6539)
(đơn vị: triệu VNĐ)
2. Hiện nay, tỷ lệ sinh viên ngoại tỉnh của trường Thương mại chi tiêu
hàng tháng đến 1,4triệu là 60%. Hãy kiểm tra lại khẳng định trên.
Tóm tắt:
n = 150, n
A
= 47 (từ bảng số liệu)
p
0
= 60% = 0,6
α = 0,05
Lớp 1028AMAT0111 Trang 13 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Kiểm định giả thuyết:
Gọi f là tỷ lệ sinh viên trường ĐHTM chi tiêu hàng tháng đến 1,4 triệu trên
mẫu
p là tỷ lệ sinh viên trường ĐHTM chi tiêu hàng tháng đến 1,4 triệu trên
đám đông
Vì n = 100 là khá lớn nên f có phân phối xấp xỉ chuẩn:
Với mức ý nghĩa =0,05 ta cần kiểm định giả thuyết:
Xây dựng tiêu chuẩn thống kê: =
n
qp
pf
00
0
−
Nếu đúng thì ta tìm được phân vị chuẩn sao cho:
Vì khá bé nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ:
Trong đó
Ta có
Vậy miền bác bỏ:
Lớp 1028AMAT0111 Trang 14 / 15
Thảo luận Lý thuyết xác suất thống kê toán
Nhóm 7
Kết luận: Vậy với mức ý nghĩa ta có cơ sở bác bỏ giả thuyết H
0
Tức là “Tỷ lệ sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng
tháng đến 1,4 triệu khác 60%”.
Lớp 1028AMAT0111 Trang 15 / 15