Tải bản đầy đủ (.docx) (13 trang)

Ước lượng tỷ lệ sinh viên Đại học Thương mại sử dụng xe bus đến trường

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (130.38 KB, 13 trang )

Thảo luận Xác suất thống kê toán – Nhóm 1

LỜI NÓI ĐẦU

Lớp 1670AMAT0111

Trong đời sống thực tế có rất nhiều biến cố xảy ra, và con ng ười
không thể nào lường trước hết được. Vì vậy thường có nh ững giả
thuyết ước lượng hay những kiểm định mang tính định tính kết quả
đúng sai về các trường hợp xảy ra của các biến cố. Chính vì lý do đó,
việc nghiên cứu ước lượng các tham số của đại lượng ngẫu nhiên và
kiểm định giả thuyết thống kê là rất cần thiết.
Lý thuyết ước lượng, lý thuy ết kiểm định các giả thuy ết thống kê
là những bộ phận quan trọng của thống kê toán. Nó là ph ương tiện
giúp ta giải quyết những bài toán nhìn từ góc độ khác nhau liên quan
đến dấu hiệu cần nghiên cứu trong tổng thể.


Để ước lượng tỷ lệ của đại lượng ngẫu nhiên (ĐLNN) X, người ta
giả sử cần nghiên cứu một đám đông kích thước N có M phần tử



mang dấu hiệu A.
Khi đó P(A) = p = là tỉ lệ các phần tử mang dấu hiệu trên đám
đông. Vì không điều tra cả đám đông nên thường chưa biết p.



Từ đám đông lấy mẫu kích thước n, điều tra trên mẫu này thấy có
nA phần tử mang dấu hiệu A. Khi đó tần suất xuất hiện dấu hiệu A





trên mẫu là f = .
Ta đi ước lượng p thông qua f.
Khi n khá lớn ta có: (trong đó q = 1 – p)
f N(p; ) → U =

≃ N(0;1)

Với vấn đề 5 của đề thảo luận, đó là “Ước lượng tỷ lệ sinh viên
Đại học Thương mại sử dụng xe bus đến trường”, nhóm chúng tôi
đã xác định dùng phương pháp ước lượng p khi p chưa biết, n lớn.
• Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN, thông
thường ta thường giả sử dấu hiệu X cần nghiên cứu trên đám đông
có E(X) = μ, Var(X) = σ2 với μ chưa biết. Từ một cơ sở nào đó người
Page 1 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
ta tìm được μ = μ0, nhưng nghi ngờ về điều này. Với mức ý nghĩa α





cho trước ta cần kiểm định giả thuyết : μ = μ0.
Để kiểm định giả thuyết nêu trên, từ đám đông ta lấy ra một m ẫu
có kích thước n: W = (X1, X2,….Xn).

Từ mẫu này ta tính được = và S’2 = - )2
Lấy một mẫu cụ thể w = (x1, x2,…..xn) từ mẫu này ta tính được với

để bác bỏ hay không bác bỏ , chấp nhận hay không chấp nhận .
Đó là phương pháp chung khi giải quyết vấn đề 7 của nhóm chúng
tôi: “Kiểm định giả thuyết chiều cao trung bình của sinh viên
nam Thương mại cao hơn chiều cao trung bình của nam thanh
niên Việt Nam”. Cụ thể nhóm 1 sẽ áp dụng lý thuyết kiểm định
trong trường hợp ĐLNN X chưa biết quy luật phân phối và kích
thước mẫu n>30.
Bài thảo luận này được xây dựng dựa trên cơ sở của: “Giáo trình Lý
thuyết xác suất và thống kê toán của Trường Đại học Thương mại ”
cùng các kiến thức đã tiếp thu được từ các bài giảng của giáo viên
trường Đại học Thương Mại.
Do thời gian, khả năng và điều kiện có hạn, bài thảo luận nhóm của
chúng tôi không thể tránh khỏi những khiếm khuyết. Chúng tôi rất
mong nhận được sự cảm thông, chia sẻ và góp ý t ừ phía gi ảng viên và
các bạn sinh viên để bài hoàn chỉnh hơn !
Tập thể nhóm 1!

Phần I: Cơ sở lý thuyết

1.

Ước lượng tỷ lệ:

Để ước lượng tỷ lệ của đại lượng ngẫu nhiên (ĐLNN) X, người ta
giả sử cần nghiên cứu một đám đông kích th ước N có M phần t ử mang
dấu hiệu A. Khi đó P(A) = p = là tỉ lệ các phần tử mang dấu hiệu trên
đám đông. Vì không điều tra cả đám đông nên th ường ch ưa bi ết p.

Page 2 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
Từ đám đông lấy mẫu kích thước n, điều tra trên m ẫu này th ấy có
nA phần tử mang dấu hiệu A. Khi đó tần suất xuất hiện dấu hiệu A
trên mẫu là f = . Ta đi ước lượng p thông qua f.
Khi n khá lớn ta có: (trong đó q = 1 – p)
f N(p; ) → U = ≃ N(0;1)
1.1.
Khoảng tin cậy đối xứng (lấy = = /2)
+ Với độ tin cậy 1 - cho trước ta tìm được phân vị chuẩn , sao cho:
P( < ) ≈ 1 Thay biểu thức U vào ta có:
Biến đổi tương đương ta được:

P(< ) ≈
P(f –

Trong đó
là sai số của ước lượng.
+ Khi p chưa biết, n lớn để tính sai số ta thay p xấp xỉ bằng ước l ượng
hiệu quả nhất của nó là f : p 1 – f. Khi đó
Độ tin cậy của ước lượng là 1 –
Khoảng tin cậy đối xứng của p là:
Độ dài khoảng tin cậy là 2
Ví dụ: Điều tra ngẫu nhiên 100 sinh viên của một trường đại h ọc
thấy có 13 sinh viên có hoàn cảnh khó khăn về kinh tế. V ới độ tin c ậy
90% hãy ước lượng số sinh viên có hoàn cảnh khó khăn về kinh tế
của toàn trường. Biết toàn trường có tất cả 10000 sinh viên.

Giải:
Gọi f là tỉ lệ sinh viên có hoàn cảnh khó khăn về kinh tế trên m ẫu .
p là tỉ lệ sinh viên có hoàn cảnh khó khăn về kinh tế trên đám
đông.
Vì n=100 khá lớn nên f có phân phối xấp xỉ chuẩn:

Xác định sao cho:
Page 3 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
Trong đó:
Vì p chưa biết, n khá lớn nên ta lấy p q
Ta có = 1,64


.1,64 = 0,055

Vậy khoảng tin cậy của p là:

Ta có: 0,075 < p <0,185
Thay p = và N = 10000 ta được 750 < M <1850.
Kết luận: Với độ tin cậy 90% ta có thể nói rằng số sinh viên có hoàn
cảnh khó khăn về kinh tế nằm trong khoảng từ 750 đến 1850 sinh
viên.
Khoảng tin cậy phải (α1 = 0, α2 = α)
+ Với độ tin cậy 1 - cho trước ta tìm được phân vị chuẩn sao cho:
1.2.


P(U < ) ≈ 1 Thay biểu thức U vào ta có:
P(f – p < )
Biến đổi tương đương ta được:
P(f –
Trong đó là sai số của ước lượng.
+ Khi p chưa biết, n lớn để tính sai số ta thay p xấp xỉ bằng ước l ượng
hiệu quả nhất của nó là f : p 1 – f. Khi đó
Độ tin cậy của ước lượng là 1 –
Khoảng tin cậy phải của p là: (f – ε; +∞)
Như vậy, khoảng tin cậy phải dùng để ước lượng giá trị tối thiểu của
p.
Ví dụ: Phỏng vấn ngẫu nhiên 200 sinh viên năm cuối của một trường
đại học thì thấy có 65 người đã hoặc đang học ở các trung tâm ngoại
Page 4 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
ngữ (TTNN). Với độ tin cậy 0,99 hãy ước lượng tỷ lệ tối thi ểu ng ười
đã và đang học ở các TTNN trong số các sinh viên năm cuối của
trường.
Giải:
Gọi p là tỷ lệ người đã và đang học ở TTNN trên đám đông.
f là tỷ lệ người đã và đang học ở TTNN trên mẫu.
Vì n=200 khá lớn nên f có phân phối xấp xỉ chuẩn:

Với γ = 0,99 xác định phân vị chuẩn sao cho:
P(U < ) ≈ 1 - α
 P(f – ε < p) ≈ 1 – α với ε =
Vì p chưa biết, n khá lớn nên ta lấy p 1 – f

=>
Ta có: n = 200; f = = 0,325
γ = 0,99 => α = 1 – γ = 0,01 => = = 2,33
Từ đó tính được ε = . 2,33 = 0,077
Vậy khoảng tin cậy phải của p là: (0,325 – 0,077; 1) = (0,248; 1).
Kết luận: Với độ tin cậy 99% có thể nói rằng tỷ lệ tối thiểu người đã
và đang học ở TTNN trong số các sinh viên năm cuối là 0,248.
1.3.

Khoảng tin cậy trái ((α1 = α, α2 = 0)

+ Với độ tin cậy 1 - cho trước ta tìm được phân vị chuẩn sao cho:
P(U > - ) ≈ 1 Thay biểu thức U vào ta có:
P(f - p < - )
Biến đổi tương đương ta được:
P(p
Trong đó là sai số của ước lượng.
+ Khi p chưa biết, n lớn để tính sai số ta thay p xấp xỉ bằng ước l ượng
hiệu quả nhất của nó là f : p 1 – f. Khi đó
Độ tin cậy của ước lượng là 1 –
Page 5 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111

Khoảng tin cậy trái của p là: (0 ; f + ε)
Như vậy khoảng tin cậy trái dùng để ước lượng giá trị tối đa của p.
Ví dụ: Điều tra 50 cơ sở giết mổ gia súc tư nhân ở Hà Nội thấy có 22


cơ sở không đạt tiêu chuẩn vệ sinh. Với độ tin cậy 0,99 hãy ước l ượng
tỷ lệ tối đa các cơ sở giết mổ gia súc tư nhân không đạt tiêu chuẩn v ệ
sinh ở Hà Nội.
Giải:
Gọi p là tỷ lệ các cơ sở không đạt tiêu chuẩn trên đám đông.
f là tỷ lệ các cơ sở không đạt tiêu chuẩn trên m ẫu.
Vì n=50 khá lớn nên f có phân phối xấp xỉ chuẩn:

Với γ = 0,99 xác định phân vị chuẩn sao cho:
P(U > ) ≈ 1 - α
 P(p < f + ε) ≈ 1 – α với ε =
Vì p chưa biết, n khá lớn nên ta lấy p 1 – f
=>
Ta có: n = 50; f = = 0,44
γ = 0,99 => α = 1 – γ = 0,01 => = = 2,33
Từ đó tính được ε = . 2,33 = 0,164
Vậy khoảng tin cậy phải của p là: (0; 0,44 + 0,164) = (0; 0,604).
Kết luận: Với độ tin cậy 99% có thể nói rằng tỷ lệ tối đa các c ơ s ở
giết mổ gia súc không đạt tiêu chuẩn vệ sinh là 0,604.

2.

Kiểm định giả thuyết thống kê về kỳ vọng toán của một đại
lượng ngẫu nhiên (ĐLNN):
Giả sử dấu hiệu X cần nghiên cứu trên đám đông có E(X) = μ, Var(X)

= σ2 với μ chưa biết. Từ một cơ sở nào đó người ta tìm được μ = μ0,
nhưng nghi ngờ về điều này. Với mức ý nghĩa α cho trước ta cần kiểm
định giả thuyết : μ = μ0.
Page 6 of 13



Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
Để kiểm định giả thuyết nêu trên, từ đám đông ta lấy ra một m ẫu có
kích thước n: W = (X1, X2,….Xn). Từ mẫu này ta tính được = và S’2 = - )
2

. Ta xét các trường hợp sau:

2.1.

ĐLNN X có phân phối chuẩn với σ2 đã biết:

μ = μ0

μ ≠ μ0
μ > μ0
μ < μ0

P(G ϵ /) = α
P(|U| > uα/2) = α
P(U > uα) = α
P(U < -uα) = α

Miền bác bỏ Wα
Wα = {utn: |utn| > uα/2}
Wα = {utn: utn > uα}
Wα = {utn: utn< -uα}


Ví dụ: Một máy tự động đóng gói đường với trọng lượng quy
định là 500 gam/gói. Giả sử trọng lượng các gói đường do máy
đóng là một ĐLNN phân phối chuẩn với độ lệch chuẩn là σ = 5
gam. Lấy ngẫu nhiên 16 gói do máy đóng và tính được trọng
lượng trung bình mỗi gói là 497 gam.
Với mức ý nghĩa α = 5% hãy cho biết kết luận về ý kiến cho
rằng máy có sự cố đã làm thay đổi trọng lượng trung bình của gói
đường so với trọng lượng quy định.
Giải:
Gọi X là trọng lượng của gói đường do máy đóng.
là trọng lượng trung bình gói đường trên mẫu.
µ là trọng lượng trung bình gói đường trên đám đông.
Vì X có phân phối chuẩn nên ~ N(µ; )
Với mức ý nghĩa α = 0,05 cần kiểm định (µ0 = 500)
XDTCKĐ: U =
Giả sử H0 đúng thì U ~ N(0; 1).
Ta tìm được uα/2 sao cho P(|U| > uα/2) = α
Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

Wα = {utn: |utn| > uα/2} trong đó utn =
Ta có uα/2 = u0,025 = 1,96
utn = = -2,4 => utn ϵ Wα => Bác bỏ H0.
Page 7 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
Kết luận: Với mức ý nghĩa 5% có thể nói rằng máy có sự cố đã làm
thay đổi trọng lượng trung bình của gói đường so với trọng lượng quy
định.

2.2.

ĐLNN X chưa biết quy luật phân phối, n>30:

+ Do X chưa biết quy luật phân phối và n>30 nên ta có:
N(µ; )
+ XDTCKĐ: U =
+ Nếu đúng thì U ≈ N(0; 1)

+ Phần còn lại tiến hành như ở trường hợp 2.1. và ta lấy .
2.3.

ĐLNN X có phân phối chuẩn với σ2 chưa biết:

Do X có phân phối chuẩn với σ2 chưa biết nên:
XDTCKĐ: T =
Nếu H0 đúng thì T ~ T(n -1)

Ví dụ: Theo dõi 25 chuyến vận chuyển của một xe vận tải từ địa
điểm A đến địa điểm B thấy thời gian vận chuyển trung bình mỗi
chuyến là 19,3 phút và phương sai mẫu điều chỉnh là 0,25
(phút)2. Giả sử thời gian vận chuyển của xe là một ĐLNN phân
phối chuẩn.
Với mức ý nghĩa 5% có thể nói rằng thời gian vận chuyển trung
bình một chuyến của xe là ít hơn 20 phút hay không?
Giải:
Gọi X là thời gian vận chuyển của một chuyến xe.
là thời gian vận chuyển trung bình trên mẫu.
µ là thời gian vận chuyển trung bình trên đám đông.
Với mức ý nghĩa α = 0,05 cần kiểm định (µ0 = 20)

XDTCKĐ: T =

. Nếu H0 đúng thì T ~ T(n – 1).

Ta tìm được sao cho P(T < -) = α
Page 8 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

Wα = {ttn: ttn < - } trong đó ttn =
Ta có = = 1,711.
ttn = = -7 => ttn ϵ Wα => Bác bỏ H0.
Kết luận: Với mức ý nghĩa 5% có thể nói rằng thời gian vận chuy ển
trung bình của xe là ít hơn 20 phút.

Phần II: Bài tập thảo luận cụ thể
1)

Ước lượng tỷ lệ sinh viên Đại học Thương mại đi xe bus đến
trường:
- Đề bài: Tiến hành khảo sát 200 SV của trường ĐHTM thấy có 68
SV đến trường bằng xe bus. Với độ tin cậy 95%, hãy ước l ượng s ố
SV ĐHTM sử dụng xe bus đến trường. Biết rằng tổng số SV của
trường là 22000.
Page 9 of 13



Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111

- Tóm tắt:
n = 200; f = = 0,34
γ = 0,95
N = 22000

Ước lượng M???

Giải:
Gọi f là tỉ lệ sinh viên ĐHTM sử dụng xe buýt đến trường trên m ẫu
p là tỉ lệ sinh viên ĐHTM sử dụng xe buýt đ ến tr ường trên đám
đông.
+ Vì n khá lớn nên ta có:
+ Với γ = 0,95 xác định phân vị chuẩn u α/2 sao cho:
P( < ) ≈ 1  P(f – với
 P(N(f – ε) < M < N(f + ε) ) ≈ 1 – α với
+ Vì p chưa biết, n khá lớn nên ta lấy p ≈ f và q ≈ 1 – f
=> ε = uα/2
+ Ta có n = 200; f = = 0,34
γ = 0,95 => α = 1 – γ = 0,05 => u α/2 = u0,025 = 1,96
ε = . 1,96
+ Vậy khoảng tin cậy của N là:
() = (6028; 8932).
Kết luận: Với độ tin cậy 95% ta có thể nói rằng số sinh viên ĐHTM s ử
dụng xe bus đến trường nằm trong khoảng từ 6028 đến 8932 sinh
viên.
2)


Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN

- Đề bài: Chiều cao của nam SV ĐHTM là một ĐLNN. Điều tra 150 SV
nam của trường ĐHTM được kết quả:
Chiều cao (cm)
Số sinh viên

150 - 160
15

160 – 170
82

170 – 180
46

180 - 190
7

Với mức ý nghĩa 5%, có thể nói chiều cao trung bình của nam SV
ĐHTM cao hơn chiều cao trung bình của nam thanh niên VN không?

Page 10 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
Biết rằng chiều cao trung bình hiện nay của nam thanh niên VN là
164.4 cm.
Tóm tắt:

X – chiều cao của nam sinh viên ĐHTM
n = 150
α = 0,05
Kiểm định bài toán
Giải:
Gọi là chiều cao của nam sinh viên ĐHTM.
là chiều cao trung bình của nam trên đám đông.
là chiều cao trung bình của nam trên mẫu.
Ta lập bảng phân phối thực nghiệm:
155
15

165
82

175
46

185
7

Từ bảng trên tính được:

= x = x (15.155 + 82.165 + 46.175 + 7.185) = 168
=

x

= x 7550 = 50,67


+ Với ta kiểm định bài toán (= 164,4)
+ Vì chưa biết quy luật của , n>30 nên coi ≃ N(, ta lấy
XDTCKĐ: U =
Giả sử đúng suy ra U ≃ N(0;1)

+ Với α cho trước ta xác định phân vị chuẩn sao cho:
P (U > ) = α
+ Vì α nhỏ nên theo nguyên lý xác suất nhỏ ta có:
= { : > } với =
Page 11 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111

+ Ta có:
n = 150: = 168

α = 0,05 => = 1,65
= = 6,19 > hay ϵ , ta có đủ cơ sở bác bỏ .
Kết luận: Với mức ý nghĩa 5%, có thể nói rằng chiều cao trung
bình của nam sinh viên ĐHTM cao hơn chiều cao trung bình của
nam thanh niên Việt Nam.

KẾT LUẬN
Thống kê toán nói chung hay bài toán ước lượng và ki ểm đ ịnh nói
riêng có ứng dụng rất rộng rãi trong thực tế và đời sống. Nó không chỉ
giúp giải quyết các bài toán thực tế như chúng tôi vừa làm trên mà còn
có thể giải quyết các bài toán trong nghiên cứu khoa học.
Các phương pháp ước lượng kiểm định có ứng dụng rất l ớn trong

thực tế bởi vì trong nhiều lĩnh vực nghiên cứu chúng ta không th ể có
được những con số chính xác, cụ thể do việc nghiên cứu trên đám
đông quá lớn và tốn nhiều chi phí.
Các phương pháp này giúp chúng ta đánh giá đ ược các tham s ố trong
trường học cũng như các vấn đề về xã hội và kinh tế nh ư:
+ Xã hội: ước lượng tổn thất trong những nhiệm vụ thiên tai, ước
lượng chiều cao trung bình của người Việt Nam, trọng lượng trung
bình của trẻ sơ sinh, tỷ lệ đói nghèo để từ đó đánh giá về chất lượng
đời sống của nhân dân...
+ Kinh tế (bao gồm kinh tế vĩ mô và kinh tế vi mô): tỷ lệ th ất nghiệp
của người lao động, tỷ lệ xuất nhập khẩu hàng hóa qua từng năm, t ỷ
lệ GDP bình quân...
Page 12 of 13


Thảo luận Xác suất thống kê toán – Nhóm 1
Lớp 1670AMAT0111
Tóm lại, sau một thời gian làm việc tích cực nhóm đã thu nhập được
số liệu và bằng phương pháp thống kê toán được học dưới sự giảng
dạy của giáo viên bộ môn, nhóm đã hoàn thành bài th ảo luận c ủa
mình với kết quả như sau:
- Ước lượng bằng khoảng tin cậy về “ước lượng tỷ lệ sinh viên Đ ại
học Thương mại đi xe bus đến trường” và kết quả là nằm trong
khoảng từ 6028 đến 8932.
- Kiểm định giả thuyết về kỳ vọng toán rút ra kết luận là chiều cao
trung bình của nam sinh viên ĐHTM cao hơn chiều cao trung bình của
nam thanh niên Việt Nam.

Page 13 of 13




×