BÀI TẬP CÁ NHÂN
Môn học Thống kê
-------------------------
I - Trả lời các câu hỏi sau đây, giải thích rõ cách làm:
1. Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0
và - 1.75 là: 0.4599.
- Giả sử X là đại lượng ngẫu nhiên liên tục, xác xuất để X nhận giá trị trong đoạn [a,b]
với a< b, nào đó: P( a ≤ X ≤b) = ∫ ab f(x)dx ; Trong đó f(x) là hàm mật độ xác xuất.
Chính là diện tích hình thang cong của biểu đồ phân phối chuẩn được chặn bởi trục
hoành (x) và trục trục tung f(x) có hai giá trị đường thẳng x = a và x = b.
- Mỗi phân phối chuẩn (với trung bình và phương sai tùy ý) có thể đưa về phân phối
chuẩn tắc (standardized normal distribution) Z. Nếu với trung bình µ= 0 và phương sai
σ2 = 1, thì có phân phối theo chuẩn tắc Z ~N(0; 1). Chuyển X về Z bằng cách trừ đi
trung bình của X và chia cho độ lệch chuẩn của nó. Lúc đó ta có P (-1 ≤ Z≤ 2).
- Vì vậy giải thích diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa
hai điểm 0 và - 1.75 là: 0.4599; nói lên xác suất mà biến ngẫu nhiên liên tục X có thể
đạt trong khoảng (0; -1,75) là 45,99%.
2. Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16. Gọi
chỉ số IQ là 1 biến ngẫu nhiên X, tính P (68 < X < 132):
- Theo đề bài ta có: X ~N(100; 16) yêu cầu tìm P (68 ≤ X ≤132).
- Ta có công thức quy đổi chuẩn hoá: Z = (X- µ)/ σ ; Thay Z bằng X.
=> P(68 < X < 132) = P( 68-100)/16 ≤ Z ≤(132-100)/16
Như vậy P(68 ≤ X ≤ 132) = P( -2 ≤ Z ≤ 2) = ∫-22 f(z)dz = F(2) – F(-2)
Tra bảng ( cumulative standardized normal distribution- A(z) ta có: F(2) = 0,9772;
Vì có giá trị Z âm sử dụng tính đối xứng F(-2) = 1- 0,9772 = 0,0228
Vậy => P(68 ≤ X ≤ 132) = P( -2 ≤ Z ≤ 2) = 0,9772 – 0,0228 = 0,9544
Điêù này có nghĩa là chỉ số IQ có phân phối chuẩn của biến ngẫu nhiên X với
trung bình là 100 và độ lệch chuẩn là 16 thì có 95,44% xác suất biến nhận giá trị trong
khoảng 68 ≤ X ≤ 132.
3. Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
Page 1 of 8
- Đo điều kiện hạn chế mà ta khó có thể thực hiện nghiên cứu 1 đối tượng thống kê
người ta thường nghiên cứu các mẫu được chọn ra từ tổng thể, sau đó dựa vào các
tham số trung bình , tần suất và phương sai của mẫu ta suy ra các tham số của tổng thể
hay còn gọi là ước lượng. Với ước lượng khoảng nghĩa là xác định một khoảng giá trị
mà tham số của tổng thể chung rơi vào đó với các xác suất nhất định ( không bao giờ
chắc chắn bằng 100%).
- Giả sử tổng thể có đặc trưng θ chưa biết. Căn cứ vào mẫu có n đơn vị ta đưa ra các
đại lượng biến ngẫu nhiên θ 1, θ2 ; ( θ là tham số có mặt trong phân phối sác xuất của
tổng thể ). Ta có P(θ1≤ θ ≤ θ2) = 1- α ,với P là số thoả mãn điều kiện 0
+ Khoảng ( θ1, θ2) gọi là khoảng ước lượng của θ.
+ Và ( 1- α ) % là độ tin cậy của khoảng ước lượng, ( là xác suất để tham số
của tổng thể chung rơi vào trong khoảng tin cậy) .
Biểu hiện: (1 - α) % = độ tin cậy e.g. 90%, 95%, 99%
+ Người ta gọi α là xác suất để tham số của tổng thể chung không rơi vào
trong khoảng tin cậy.
+ Với kích thước mẫu cố định khi bề rộng của khoảng tin cậy giảm thì độ tin
cậy P cũng giảm và ngược lại.
- Như vậy: Nếu độ tin cậy giảm đi tức là (1 – α) nhỏ đi α lớn hơn khoảng tin cậy
hẹp lại.
4. Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46. Biết σ =
6.50 và kích thước mẫu n=100. Hãy tính trung bình mẫu :
- Trung bình mẫu có phân phối chuẩn X¯ ~ N(µ;σ2/n ) với độ tin cậy (1 - α) cho trước,
thì trung bình tổng thể µ trong khoảng: µ ≥ X¯ - Zα/2 x σ /√n và µ ≤ X¯ + Zα/2 x σ
/√n
- Theo bài ra ta có:
X¯ - Zα/2 x 6,5 /√100 = 62,84 => X¯ - 65Zα/2 = 62,84 (1)
X¯ + Zα/2 x 6,5 /√100 = 69,46 => X¯ + 65Zα/2 = 69,46 ( 2)
Từ phương trình (1) ta có Zα/2 = ( X¯ - 62,84 )/ 65
Thay Zα/2 vào phương trình (2) ta có: X¯ + 65( X¯ - 62,84 )/ 65 = 69,46
=> 2X¯ = 69,46 + 62,84 = 132,3 => X¯ = 132,3/2 = 66,15
Vậy trung bình mẫu là 66,15.
Page 2 of 8
5. Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α= 0.05?
a. 0.150
b. 0.100
c. 0.051
d. 0.025
- Nếu p- value ≤ α Thì bác bỏ giả thiết H0. Vì vậy p-value = 0.025 < α = 0.05
là giá trị chọn theo bài ra.
II- Hoàn thành các bài tập sau đây
Bài 1
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét. Để đánh
giá tính hiệu quả của nó xét về mặt thời gian người ta phỏng vấn ngẫu nhiên 30 khách
hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi
giao hàng như sau:
9
6
8
9
7
6
5
5
7
6
6
7
3
10
6
6
7
4
9
7
5
4
5
7
4
6
8
5
4
3
Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán
hàng theo phương pháp mới với độ tin cậy 95%. Hãy kết luận về hiệu quả của phương
pháp bán hàng mới so với phương pháp cũ. Biết rằng phương pháp bán hàng cũ có số
ngày trung bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày.
Sau khi vào Excel nhập các cột dữ liệu và xắp xếp theo thứ tự tăng dần, dùng
phần mềm Mega Stat với độ tin cậy 95% ta có số liệu trong bảng sau :
Descriptive statistics
#1
count
mean
sample variance
sample standard deviation
minimum
maximum
range
30
6,13
3,29
1,81
3
10
7
Số liệu bảng trên ta có trung bình mẫu ( mean) = 6,13( Ngày). So với phương
pháp cũ ta thấy phương pháp mới số ngày là 6,13 ( Ngày) < 7,5 ( ngày ), vì vậy có
thể kết luận hiệu quả hơn.
Bài 2
Page 3 of 8
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản
phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay
không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26
30 28 24
28
26
30
Phương án 2: 20 27 25 29 23 26
28 30 32
34
38
25
30 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với mức ý
nghĩa 5% hãy rút ra kết luận về hai phương án trên.
Sau khi vào Excel nhập các cột dữ liệu và xắp xếp theo thứ tự tăng dần, dùng
phần mềm Mega Stat với độ tin cậy 95% ta có số liệu trong bảng sau :
Descriptive
statistics
count
mean
sample variance
sample standard
deviation
minimum
maximum
range
Phương án 1:
12
29,75
19,84
Phương án 2:
14
28,21
20,95
4,45
24
38
14
4,58
20
38
18
Nhìn vào bẳng ta thấy:
+ Trung bình mẫu của phương án 1 là 29,75; phương án 2 là 28,21 chênh lệch
nhau không lớn.
+ Độ lệch chuẩn của hai phương án khác nhau không nhiều => cả hai phương
án độ phân tán các mức chi phí mẫu chọn như nhau.
3/21/2012 8:54.57 (1)
Page 4 of 8
3/21/2012 8:54.57 (2)
+ Đồ thị hộp ria mèo cho thấy phương án 2 có giá trị ngoại lai lớn hơn 35.
Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay
không ta tiến hành kiểm định giả thiết sau với mức ý nghĩa α = 5% = 0.05, bỏ qua giá
trị ngoại lai 38 của phương án 2 và giả thiết phương sai bằng nhau.
Cặp giả thiết: H0: µ1 = µ2 ( Chi phí trung bình của 2 phương án bằng nhau)
H1: µ1 ≠ µ2 (Chi phí trung bình của 2 phương án khác nhau )
Dùng phần mềm thống kê Mega Stat ta có số liệu trong bảng sau:
Hypothesis Test: Independent Groups (t-test, pooled variance)
Phương án 1:
29,75
4,45
12
Phương án 2:
27,46
3,76
13
23
2,288
16,847
4,105
1,643
0
1,39
,0885
mean
std. dev.
n
df
difference
(Phương án 1: - Phương án 2:)
pooled variance
pooled std. dev.
standard error of difference
hypothesized
difference
t
p-value (one-tailed, upper)
Kết quả cho thấy p-value (one-tailed, upper) = 0,885
Vậy P = 0,177= 17,7% > α = 5% = 0.05 => Không bác bỏ giả thiết H 0 . Vì vậy
hai phương án có chi phí sản xuất trung bình bằng nhau.
Bài 3: Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm) của một
loại hoá chất xác định. Nếu mức độ tập trung lớn hơn 247 ppm, loại thuốc này có thể
gây ra một số phản ứng phụ; nếu mức độ tập trung nhỏ hơn 247 ppm, loại thuốc này có
thể sẽ không có hiệu quả. Nhà sản xuất muốn kiểm tra xem liệu mức độ tập trung bình
quân trong một lô hàng lớn có đạt mức 247 ppm yêu cầu hay không. Một mẫu ngẫu
nhiên gồm 60 đơn vị được kiểm nghiệm và người ta thấy rằng trung bình mẫu là 250
ppm và độ lệch chuẩn của mẫu là 12 ppm.
a. Hãy kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247
ppm với mức ý nghĩa α = 0.05. Thực hiện điều đó với α=0.01.
Page 5 of 8
b. Kết luận của bạn như thế nào? Bạn có quyết định gì đối với lô hàng này?
Nếu lô hàng đã được bảo đảm rằng nó chứa đựng mức độ tập trung bình quân là 247
ppm, quyết định của bạn sẽ như thế nào căn cứ vào việc kiểm định giả thiết thống kê?
Trả lời:
a. Hãy kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247 ppm
với mức ý nghĩa α = 0.05. Thực hiện điều đó với α=0.01;
- Đây là bài toán kiểm định giả thiết về giá trị trung bình của tổng thể cung khi chưa
biết phương sai tổng thể chung nhưng mẫu lớn, kiểm định hai phía , ta có cặp giả thiết
sau kiểm định hai phía:
Cặp giả thiết: H0: µ = 247 ( mức độ tập trung bình quân trong toàn bộ lô hàng)
H1: µ ≠ 247
Theo công thức Z = ( X¯ - µ) √n /s ; Theo đề bài ta có: X¯ = 250 ; µo = 247;
n= 60; s= 12.
= > Z = ( 250- 247) √60/12 = 1,93649 ≈ 1,94
Tra bảng với mức α = 0.05. ta có Z0,5- α/2 = Z0, 475 = 1,96
Như vậy Z = 1,94 < Z0,5- α/2 = 1,96 nên có thể kết luận rằng chưa đủ cơ sở để
bác bỏ H0 , với mức ý nghĩa α = 0.05, mức độ tập trung bình quân trong toàn bộ lô
hàng là 247( ppm).
Tra bảng với mức α = 0.01 ta có Z0,5- α/2 = Z0,495 ≈ 2,58
Như vậy Z = 1,94 < Z0,5- α/2 = 2,58 nên có thể kết luận rằng chưa đủ cơ sở để
bác bỏ H0 , với mức ý nghĩa α = 0.01, mức độ tập trung bình quân trong toàn bộ lô
hàng là 247( ppm).
b. Kết luận: Căn cứ vào việc kiểm định giả thiết thống kê, lô hàng đảm bảo yêu cầu và
có thể được đưa ra sử dụng vẫn hiệu quả hoặc không gây ra phản ứng phụ.
Bài 4 Gần đây, một nhóm nghiên cứu đã tập trung vào vấn đề dự đoán thị phần của
nhà sản xuất bằng cách sử dụng thông tin về chất lượng sản phẩm của họ. Giả sử rằng
các số liệu sau là thị phần đã có tính theo đơn vị phần trăm (%) (Y) và chất lượng sản
phẩm theo thang điểm 0-100 được xác định bởi một quy trình định giá khách quan
(X).
X: 27, 39, 73, 66, 33, 43, 47, 55, 60, 68, 70, 75, 82.
Y: 2, 3, 10, 9, 4, 6, 5, 8, 7, 9, 10, 13, 12.
a. Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất lượng sản
phẩm. Kết luận ?
b. Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giưa X và Y.
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó.
Trả lời:
Page 6 of 8
a- Hàm hồi quy Y tuyến tính chất lượng sản phẩm theo thang điểm X :
Y = β0 + βX + ε ( Y là biến thị phần phụ thuộc vào biến chất lượng sản phẩm
X; β0 là tham số tự do, ε là sai số ngẫu nhiên)
Dùng phần mềm Mega Stat ( cửa sổ correlation/ regression -> scatterlot) nhập
dãy số liệu của đề bài ta vẽ được đồ thị và có hàom tương quan hồi quy cho trong bảng
dưới đây:
Ta có kết quả phương trình hồi quy mẫu tuyến tính : Y = 0,187X – 3,057;
+ Khi X= 0 thì Y bằng – 3,057 gọi là tham số tự do ( hệ số chặn)
+ Khi chất lượng sản phẩm tăng lên 1 đơn vị điểm thì thị phần trung bình
tăng lên 0,187 đơn vị. Với sai số ngẫu nhiên: ε = 1-R2 = 0,078.
b. Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giưa X và Y.
Vì quan hệ Y và X là đường thẳng hồi quy mẫu trên cơ sở quan sát 13 mẫu,
chưa phải là tổng thể, dùng phương pháp bình quân tối thiểu OLS ta có kết quả tính
toán theo Mega Stat cho trong bảng sau:
Regression Analysis
r²
r
Std. Error
ANOVA table
Source
Regression
SS
128,3321
0,922
0,960
0,995
n
k
Dep. Var.
13
1
Y (Thị phần)
df
MS
F
1
128,3321
129,53
Page 7 of 8
p-value
2,00124213E07
Residual
Total
10,8987
139,2308
11
12
0,9908
Regression output
variables
Intercept
X (chất lượng
SP)
confidence interval
coefficient
s
-3,0566
std. error
0,9710
t (df=11)
-3,148
p-value
,0093
95% lower
-5,1938
95% upper
-0,9194
0,1866
0,0164
11,381
2,00124E-07
0,1505
0,2227
- Đường hồi quy mẫu có dạng: Thị phần = 0,1866 * Chất lượng – 3,0566 ; hay
Y = 0,1866*X – 3,0566
Trong đó:β1 = 0,1866; intercept ( hệ số chặn = - 3,0566)
Để kiểm tra xem thị phần của nhà sản xuất có thực sự ảnh hưởng bởi chất lượng
của sản phẩm hay không.
Ta có cặp giả thiết kiểm định : H0 : β1 = 0
H1: β1 ≠ 0
Dùng kiểm định t, với kết quả giá trị P-value = 2,0012E-07 < α = 0.05
Bác bỏ giả thiết H0 : β1 = 0 tức là β1 ≠ 0.
Kết luận thị phần của nhà sản xuất có bị ảnh hưởng bởi chất lượng của sản
phẩm, với quan hệ tuyến tính hệ số góc β 1= 0,1866 ; khoảng tin cậy từ 0,1505 đến
0,2227; đây là khoảng tin cậy cho hệ số góc, điều này có nghĩa là nếu chất lượng sản
phẩm tăng lên 1 đơn vị điểm thì trung bình thị phần sản phẩm sẽ tăng lên từ 0,1505
đến 0,2227 ( %).
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó: Kết quả cho R 2 = 0,922 ; đây là hệ số
xác định cho biết 92,2% thay đổi của thị phần được chất lượng sản phẩm quyết định,
còn lại 7,8% là các yếu tố khác quyết định .
TÀI LIỆU THAM KHẢO
1.
2.
3.
Slide bài giảng môn học Thống kê và khoa học ra quyết định.
Thống kê trong kinh doanh. Chương trình đào tạo thạc sỹ Quản trị KD quốc tế.
Giáo trình Nguyên lý thống kê kinh tế. Nhà xuất bản thống kê
Page 8 of 8