Bài làm:
Trả lời các câu hỏi , giải thích rõ ràng cách làm:
1- Tìm P để Z nằm từ 0 đến -1,75
Cũng là tìm của Z từ 0-1,75 ( do diện tích của hai khoảng này bằng nhau).
Ta tra bảng Phân phối chuẩn ta có: P (02- µ=100
P(68X=(100;162)
P (68132-100 =2 < Z < 68-100 =2
16
16
-2 P (2Đối xứng qua O; thì P (0Vậy : P (23-Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
Khoảng tin cậy = X ± Z α /2
Ta có: Cận trên = X + Z α /2
Cận dưới = X - Z α /2
Nên KTC = Cận trên – Cận dưới = 2Z α /2
1
Nếu độ tin cậy = (1 - α)↓
Độ rộng của khoảng tin cậy: Giá trị cận trên - giá trị cận dưới
Khoảng tin cậy là chênh lệch trên – dưới
độ rộng = 2 lần của sai số
Độ rộng: 2Z α /2
Độ rộng phụ thuộc ( 1-α) và kích thước mẫu.
Nếu độ tin cậy giảm đi thì giá trị Zα/2 bị kéo vào
sai số nhỏ đi
Độ rộng hẹp.
Vậy, nếu độ tin cậy giảm đi, khoảng tin cậy sẽ hẹp lại
4. Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46. Biết σ = 6.50 và
kích thước mẫu n=100. Hãy tính trung bình mẫu:
Ta có: Cận trên = X + Z α /2
= 69.46
Cận dưới =X - Z α /2
= 62.84
⇒ 2X = 69.46 + 62.84
⇒ X = 66.15
5. Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α= 0.05?
a. 0.150
b. 0.100
c. 0.051
d. 0.025
Trả lời: Câu d: 0.025 , P-value <α: Bác bỏ giả thiết H0
B- Hoàn thành các bài tập sau đây:
Bài 1: Sử dụng phần mềm Mega Star
ta có:
Descriptive Statistics:
2
Count
confidence interval 95.% lower
confidence interval 95.% upper
half-width
Số ngày
30
5.46
6.81
0.68
Trả lời: Với độ tin cậy 95%, số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán
hàng theo phương pháp mới nằm trong khoảng từ 5,46 đến 6,81 ngày.
Hãy kết luận về hiệu quả của phương pháp bán hàng mới so với phương pháp cũ. Biết
rằng phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng
là 7,5 ngày
Theo dữ kiện đã tìm được ở trên, ta tìm được khoảng tin cậy ( 5,46; 6,84) < 7,5 ngày.
Vậy, Số ngày trung bình của phương pháp mới này thì <7,5 ngày với xác suất là: 95%
Bài 2: Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản
phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay
không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phương án 2: 20 27 25 29 23 26 28 30 32 34 25 30 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với mức ý nghĩa
5% hãy rút ra kết luận về hai phương án trên.
Sử dụng phần mềm Mega Star ta có:
3
Descriptive statistics
count
mean
sample variance
sample standard
deviation
phuong an
1
12
phuong an 2
14
29.75
19.84
28.21
20.95
4.45
4.58
hai mean chênh nhau ít
( độ lệch chuẩn ngang nhau, không có chênh lệch nhiều)
4
5
Các điểm coi như là nằm trên đường thẳng.
Coi như hai mẫu là phân phối chuẩn.
Descriptive statistics
count
mean
sample variance
sample standard
deviation
phuong an
1
12
29.75
19.84
phuong an
2
14
28.21
20.95
4.45
4.58
6
Bỏ số 38 là trường hợp ngoại lai.
* Nhận xét:
* Về giá trị trung bình : từ bảng dữ liệu trên, ta thấy giá trị trung bình của
phương án 1 là 29.75 và của phương án 2 là 27.46 <=> chênh lệch 2.29 không có sự chênh
lệch lớn về giá trị mẫu trung bình của hai phương án.
*Về độ lệch chuẩn (sample standard deviation): độ lệch chuẩn của phương án 1 là 4.45 và
của phương án 2 là 3.76 hai độ lệch chuẩn này chênh lệch nhau khá lớn, chứng tỏ độ phân
tán trong hai phương án là khác nhau.
* Đồ thị hộp ria mèo (Box plot)
- Đồ thị hộp ria mèo của phương án 1 tương đối đối xứng.
- Đồ thị hộp ria mèo của phương án 2 không đối xứng mà hơi lệch về bên phải nên lấy
thêm mẫu để kiểm tra.
+ Giá trị ngoại lai: Cả 2 phương án đều không có giá trị ngoại lai chứng tỏ các mẫu
trong 2 phương án có sự chênh lệch lớn mà tương đối đồng đều.
Thực nghiệm kiểm định:
Thực hiện phương pháp Mega Star, ta có:
7
Hypothesis Test: Independent Groups (t-test, pooled variance)
phuong an 1
29.75
4.45
12
phuong an 2
27.46
3.76
13
23
2.288
16.847
4.105
1.643
0
1.39
.1770
mean
std. dev.
n
df
difference (phuong an 1 - phuong an 2)
pooled variance
pooled std. dev.
standard error of difference
hypothesized difference
t
p-value (two-tailed)
t=1,39 , P value=17,7% > α: chưa bác bỏ H0, mà Ho =
Trung bình chi phí của hai quá trình là như nhau.
1=
2
Bài 3:
Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm) của một loại hoá chất xác
định. Nếu hàm lượng lớn hơn 247 ppm, loại thuốc này có thể gây ra một số phản ứng phụ;
nếu hàm lượng nhỏ hơn 247 ppm, loại thuốc này có thể sẽ không có hiệu quả. Nhà sản xuất muốn
kiểm tra xem liệu hàm lượng bình quân trong một lô hàng lớn có đạt mức 247 ppm yêu cầu hay
không. Một mẫu ngẫu nhiên gồm 60 đơn vị được kiểm nghiệm và người ta thấy rằng trung bình
mẫu là 250 ppm và độ lệch chuẩn của mẫu là 12 ppm.
a.Hãy kiểm định rằng hàm lượng bình quân trong toàn bộ lô hàng là 247 ppm với mức ý
nghĩa α = 0.05. Thực hiện điều đó với α =0.1
Sử dụng phương pháp Mega Star ta có:
8
Hypothesis Test: Mean vs. Hypothesized Value
247.00
250.00
12.00
1.55
60
59
hypothesized value
mean ham luong
std. dev.
std. error
n
df
1.94
.0576
t
p-value (two-tailed)
Ta tìm được p-value = 0.0576
-Với mức α = 0.05 < p-value => Chưa bác bỏ H0 => hàm lượng đảm bảo mức 247ppm
-Với mức α = 0.1> p-value => Bác bỏ H0, nghĩa là hàm lượng không đảm bảo ở mức 247ppm
Trả lời:
-Với mức α = 0.05 thì hàm lượng của hóa chất này đảm bảo ở mức chất lượng : 247ppm
-Với mức α = 0.1 thì hàm lượng của hóa chất này không đảm bảo ở mức chất lượng 247ppm
Bài 4: Gần đây, một nhóm nghiên cứu đã tập trung vào vấn đề dự đoán thị phần của nhà sản xuất
bằng cách sử dụng thông tin về chất lượng sản phẩm của họ. Giả sử rằng các số liệu sau là thị phần
đã có tính theo đơn vị phần trăm (%) (Y) và chất lượng sản phẩm theo thang điểm 0-100 được xác
định bởi một quy trình định giá khách quan (X).
X: 27, 39, 73, 66, 33, 43, 47, 55, 60, 68, 70, 75, 82.
Y: 2, 3, 10, 9, 4, 6, 5, 8, 7, 9, 10, 13, 12.
Trả lời:
a. Ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất lượng sản phẩm.
Kết luận:
9
Nhập dữ liệu vào Bảng tính Excel để hiển thị đồ thị dải điểm: Vào MegaStat→
Corelation/ Regression → Scatterplot; nhập từng cột dữ liệu vào ô thông tin. Ta có được
đồ thị như sau:
Qua đồ thị rải điểm ta thấy rõ mối quan hệ giữa thị phần và chất lượng sản phẩm. Khi chất
lượng sản phẩm tăng lên thì Thị phần tăng lên.
Trường hợp này Y = 0,187 X - 3,057 (đường hồi quy mẫu – gần nhất với các điểm xuất hiện
trên đồ thị), có thể kết luận: Nếu chất lượng sản phẩm tăng lên 1 điểm thì thị phần trung bình
của nhà sản xuất tăng lên 0,187 %.
b. Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giữa X và Y.
Nhập dữ liệu vào Bảng tính Excel:
Vào MegaStat→ Corelation/ Regression → Regression Analysis;
Nhập từng cột dữ liệu vào ô thông tin. Ta có được kết quả như sau:
10
Regression Analysis
r²
r
Std. Error
ANOVA table
Source
Regression
Residual
Total
SS
128.3321
10.8987
139.2308
0.922
0.960
0.995
df
1
11
12
n
k
Dep. Var.
13
1
Y (Thị phần)
MS
128.3321
0.9908
F
129.53
Regression output
variables
Intercept
X (Chất lượng SP)
p-value
2.00E-07
confidence interval
coefficient
s
-3.0566
0.1866
std. error
0.9710
0.0164
t
(df=11)
-3.148
11.381
p-value
.0093
2.00E-07
95% lower
-5.1938
0.1505
95% upper
-0.9194
0.2227
Y = β0 + β1 X
Trong đó:
β0: là hệ số chặn (hệ số tự do), là trung bình của Y khi X = 0
β1: là Độ dốc hay là Hệ số góc; khi X thay đổi (tăng giảm)1 đơn vị thì trung bình
của Y
thay đổi β1 đơn vị
Thị phần = - 3,0566 + 0,1866 * Chất lượng
Để kiểm tra xem chất lượng sản phẩm có thực sự ảnh hưởng đến thị phần hay không,
cần xác định rõ β1
Kiểm định về ý nghĩa của biến độc lập trong mô hình:
Chọn cặp giả thiết:
H0: β0 = 0
H1: β1 ≠ 0
Dùng kiểm định “t”
11
Ta có t trong kiểm định β1 = 0 là 11,381, có p-value ≈ 0 < α = 0,05.
Vì vậy bác bỏ giả thiết H0 → Thị phần phụ thuộc vào chất lượng sản phẩm.
Trong khoảng từ 0,1505 đến 0,2227 là Khoảng tin cậy cho hệ số góc β1 khi X
thay đổi 1 đơn vị
thì trung bình của Y thay đổi β1 đơn vị;
Chất lượng sản phẩm tăng lên 1 điểm thì thị phần sẽ tăng lên trong khoảng từ 0,1505%
đến 0,2227%.
Căn cứ vào kiểm định và đồ thị dải điểm, ta có thể nhận xét khi chất lượng sản phẩm
tăng lên thì thị phần cũng tăng theo. Hai biến Chất lượng sản phẩm và Thị phần có
mối quan hệ cùng chiều.
Quan hệ tuyến tính giữa X và Y là quan hệ cùng chiều.
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó.
Hệ số xác định R2 = 0,922 có nghĩa là 92,2% sự thay đổi của Thị phần phụ thuộc vào
Chất lượng sản phẩm. Phần còn lại 7,8% phụ thuộc vào các yếu tố khác .
TÀI LIỆU THAM KHẢO
- Giáo trình “Thống kê trong kinh doanh” - Chương trình đào tạo Thạc sỹ Quản trị kinh
doanh quốc tế - năm 2012
12
13