Tải bản đầy đủ (.pdf) (35 trang)

BÁO CÁO BÀI TẬP LỚN SỐ 1 XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.09 MB, 35 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA CƠ KHÍ
--------------o0o--------------

BÁO CÁO BÀI TẬP LỚN SỐ 1
XÁC SUẤT THỐNG KÊ
🙡🕮🙣
GVHD: Nguyễn Kiều Dung
Thực Hiện: Nhóm 05, Lớp L17

STT
1
2
3
4
5
6
7
8
9

HỌ VÀ TÊN
Huỳnh Tấn Ánh
Huỳnh Tấn Chương
Đỗ Ngọc Thành Danh
Lê Văn Duy
Bùi Văn Dư
Phạm Hồng Hiệp
Nguyễn Ngọc Trường Sơn
Trần Văn Hải
Nguyễn Bá Tồn



MSSV
1910784
1910884
1912838
1912888
1912972
1911183
1911980
1913264
1915547

LỚP/
TỔ
L17A
L17A
L17A
L17A
L17A
L17A
L17A
L17B
L17C

NGÀNH
Cơ Điện Tử
Cơ Khí
Cơ Điện Tử
Cơ Điện Tử
Cơ Điện Tử

Cơ Điện Tử
Cơ Khí
Cơ Điện Tử
Cơ Điện Tử


LỜI MỞ ĐẦU
Trong q trình học đại học nói chung và tham gia lớp học “Xác suất thống kê” nói
riêng, bài báo cáo về học phần này sẽ giúp chúng ta phần nào áp dụng những công thức vào
thực tiễn từ đó đưa ra những kết luận khách qua thơng qua những con số biết nói. Cụ thể hơn
đề tài mà nhóm chung em muốn tìm hiểu, nghiên cứu nhấn mạnh ở đây là ” Khảo sát thời gian
dành sự quan tâm đến gia đình và người thân của sinh viên” .
Nhóm chúng em làm đề tài này mong muốn đưa ra cái nhìn tổng quát nhất về vấn đề
sự quan tâm của sinh viên đến gia đình khi bước vào cánh cổng đại học thông qua những số
liệu thực tế mà nhóm thu thập được từ các bạn sinh viên Trường Đại Học Bách Khoa TPHCM.
Với những lí do khác nhau hiện diện như lí do sinh viên hay gọi về nhà: tâm lý, tiền bạc , tình
hình học tập,… cũng như tần suất các bạn sinh viên gọi về gia đình trong tuần.
Nhóm nhận thấy đây là một đề tài vô cùng thú vị không chỉ giúp các thành viên của
nhóm hiểu hơn về lý thuyết thống kê cơ đã dạy trên lớp mà cịn có những cái nhìn thiết thực,
phản ánh một phần nào đó cuộc sống cũng như nguyện vọng của những bạn sinh viên. Bài
báo cáo này được xây dựng trên cơ sở sách giáo trình “Xác suất và thống kê” của Trường Đại
Học Bách Khoa TPHCM, kiến thức đã tiếp thu được từ các bài giảng cũng như sự chỉ dẫn tận
tình của cơ Nguyễn Kiều Dung. Dữ liệu sử dụng trong bài báo cáo được nhóm thu thập thơng
qua khảo sát với sinh viên của trường Đại học Bách Khoa, nhóm xin chân thành cảm ơn sự
đóng góp của các bạn trong đề tài lần này.
Mặc dù nhóm chúng em đã cố gắng hồn thành bài báo cáo tốt nhất nhưng cũng khơng
tránh khỏi sai sót, mong nhận được sự nhận xét, đánh giá cũng như hướng dẫn của cơ để nhóm
có thể điều chỉnh và hoàn thiện hơn.



MỤC LỤC
Câu 1: .................................................................................................................................................. 1
A. Dữ liệu sử dụng: ........................................................................................................................ 1
B. Bài toán: .................................................................................................................................... 1
C. Cơ sở lý thuyết: ......................................................................................................................... 1
D. Lời giải tính tay: ........................................................................................................................ 2
E. Lời giải sử dụng Excel: ............................................................................................................. 4
Câu 2: .................................................................................................................................................. 7
A. Dữ liệu sử dụng: ........................................................................................................................ 7
B. Bài toán: .................................................................................................................................... 7
C. Cơ sở lý thuyết: ......................................................................................................................... 8
D. Lời giải tính tay: ........................................................................................................................ 8
E. Lời giải sử dụng Excel: ............................................................................................................. 9
Câu 3: ................................................................................................................................................ 10
A. Dữ liệu sử dụng: ...................................................................................................................... 10
B. Bài toán: .................................................................................................................................. 11
C. Cơ sở lý thuyết: ....................................................................................................................... 11
D. Lời giải tính tay: ...................................................................................................................... 15
E. Lời giải sử dụng Excel: ........................................................................................................... 18
Câu 4: ................................................................................................................................................ 21
A. Dữ liệu sử dụng: ...................................................................................................................... 21
B. Bài toán: .................................................................................................................................. 21
C. Cơ sở lý thuyết: ....................................................................................................................... 22
D. Lời giải tính tay: ...................................................................................................................... 22
E. Lời giải sử dụng Excel: ........................................................................................................... 23
Câu 5: ................................................................................................................................................ 24
A. Dữ liệu sử dụng: ...................................................................................................................... 24
B. Bài toán: .................................................................................................................................. 25
C. Cơ sở lý thuyết: ....................................................................................................................... 25
D. Lời giải tính tay: ...................................................................................................................... 25

E. Lời giải sử dụng Excel: ........................................................................................................... 26
Câu 6: ................................................................................................................................................ 27
A. Dữ liệu sử dụng: ...................................................................................................................... 27
B. Bài toán: .................................................................................................................................. 28
C. Cơ sở lý thuyết: ....................................................................................................................... 28
D. Lời giải tính tay: ...................................................................................................................... 29
E. Lời giải sử dụng Excel: ........................................................................................................... 30


Câu 1:
A. Dữ liệu sử dụng:
Thời gian trò truyện từ dữ liệu thu thập được từ file dữ liệu excel “A37_Dulieu.xlsx”
đính kèm, gổm 317 dữ liệu về thời gian.

B. Bài tốn:
1. Tìm các đặc trưng từ mẫu dữ liệu
2. Tìm các khoảng tin cậy cho giá trị trung bình và phương sai của tổng thể
3. Trong một cuộc khảo sát sự quan tâm đến gia đình của sinh viên, ta thấy có 186 bạn
trên tổng số 317 dùng hình thức gọi video về cho gia đình. Hãy tìm khoảng ước
lượng cho tỉ lệ gọi video với độ tin cậy 98% trên cơ sở đó.
C. Cơ sở lý thuyết:
❖ Tìm khoảng tin cậy cho trung bình tổng thể:
Cho mẫu có kích thước n, trung bình mẫu 𝑥, phương sai mẫu hiệu chỉnh s2. Tìm
khoảng ước lượng của trung bình tổng thể a với độ tin cậy là 1 − 
-

Trường hợp n  30 :

 X −
Ta có: P X −    = P 

 s


(

)

n
1

 n 
= 1−
s 



Đặt Z =

 n

X −
n
s

s
N (0,1) nên 2 ( Z ) = 1 − 

Tra bảng ta tìm được Z .
Từ đó  =


Z s
và khoảng ước lượng của a là ( x −  , x +  ) .
n

❖ Tìm khoảng tin cậy cho phương sai tổng thể:
Cho mẫu có kích thước n, phương sai mẫu hiệu chỉnh s2. Tìm khoảng ước lượng của
phương sai tổng thể  2 với độ tin cậy 1 −  .
-

Phương pháp giải trong trường hợp tổng thể có phân phối chuẩn:

(n − 1) s 2



2

 2 (n − 1)

Với 1 +  2 =  , ta có:
 2

(n − 1) s 2
P   1−1 (n − 1) 
  22 (n − 1)  = 1 − 
2





Từ đó với một mẫu cụ thể ta có khoảng ước lượng của  2 là:
 ( n − 1) s 2 ( n − 1) s 2 
; 2
 2


n

1

n

1
(
)
(
)
1−1
 2


Để thuận tiện cho việc tra bảng trong các bài toán tìm khoảng ước lượng của  2 ta
ln xét với 1 =  2 =


2

. Khi đó khoảng ước lượng của  2 là:




2
n − 1) s 2 
(
 ( n − 1) s
  2 ( n − 1) ;  2 ( n − 1) 

 

1−
 2
2

D. Lời giải tính tay:
1. Đặc trưng mẫu
- Số lượng mẫu : n=317.

2


- Trung bình : x =

1 k
1 317
x
n
=
xi = 23,70031546
 i i 317 
n i =1

i =1

- Trung vị: xk +1 = 20 (vì kích thước mẫu lẻ, sắp xếp mẫu theo thứ tự tăng dần).
- Yếu vị (mode) : mode =30 (vì xuất hiện thường xuyên nhất)
- Phương sai mẫu: s 2 =

2
2
2
1 k
1 317 2
2
n
x

x
=
xi − x = x 2 − x = 474,3739116


i i
n i =1
317 i =1

- Độ lệch mẫu: s = s 2 = 21,78012653
- Phương sai mẫu hiệu chỉnh: s 2 =

1 k
n 2
( xi − x) 2 =

s = 475,875095

n − 1 i =1
n −1

2

- Độ lệch mẫu hiệu chỉnh : s = s x = 21,8146.
2. Khoảng tin cậy cho giá trị trung bình và phương sai của tổng thể
❖ Khoảng tin cậy cho giá trị trung bình:
-

Độ lệch mẫu hiệu chỉnh là s = 21,81456153 (phút)

-

Độ tin cậy 1 −  = 95%

-

Ta có (Z ) = 0,475  Z = 1,96

=

Z .s 1,96.21,81456153
=
= 2, 4014
n
317


Vậy khoảng tin cậy cho giá trị trung bình là ( x −  ; x +  ) = (21, 2989; 26,1017)
❖ Khoảng tin cậy cho phương sai tổng thể:
-

Phương sai mẫu hiệu chỉnh là s 2 = 475,875095 (phút2)

-

Độ tin cậy 1 −  = 95%

-

Ước lượng khoảng cho phương sai là


 

2
n − 1) .s 2   ( 317 − 1) .s 2
317 − 1) .s 2 
(
(
 ( n − 1) .s
  2 ( n − 1) ;  2 ( n − 1)  =   2 ( 317 − 1) ;  2 ( 317 − 1) 

0,05
 
  0,05

1−

1−
2
2
 2
  2

2
 0,05
(317 − 1) = CHISQ.INV .RT (0.025,316) = 367,1388461
2

3


 2 0,05 (317 − 1) = CHISQ.INV .RT (0.975,316) = 268,6480377
1−

2

Vậy khoảng tin cậy cho phương sai là ( 409,59035;559,75294 )
3. Khoảng ước lượng cho tỉ lệ gọi video với độ tin cậy 98%:
-

Gọi p là tỉ lệ sinh viên dùng hình thức gọi thoại tổng thể.

-

Khoảng ƯL (đối xứng) cho p có dạng: ( f −  ; f +  )

-


Tính các đặc trưng mẫu: n = 317; f = 186/317

-

Độ tin cậy: 1 −  = 98%   ( Z ) = (1 −  ) / 2 = 0, 49  Z = 2,33

-

Tìm ngưỡng sai số (hay là độ chính xác) của ƯL:

=

Z

f (1 − f )
n

2,33
=

186  186 
1 −

317  317 
= 0,0644
317

Vậy khoảng ước lượng cho p: ( f −  ; f +  ) = ( 0,5224;0,6512 )
E. Lời giải sử dụng Excel:

1. Đặc trưng của mẫu dữ liệu thời gian trị chuyện trung bình của sinh viên (phút)
-

Chọn Data/ Data Analysis/ Descriptive Statistics

-

Nhập các mục:
+ Input Range: chọn tất cả các ô chứa dữ liệu
+ Grouped By: dữ liệu được sắp xếp theo cột chọn Columns
+ Labels in first row: ô đầu tiên chứa tên mẫu
+ Output Range: Chọn ô chứa đầu ra
4


+ Summary statistics: xuất ra các đặc trung của dữ liệu
+ Confidence for Means: độ tin cậy cho trung bình (95%)

-

Kết quả thu được:

2. Khoảng tin cậy cho giá trị trung bình và phương sai của tổng thể
-

Khoảng tin cậy cho thời gian trị chuyện trung bình tổng thể:
Khoảng tin cậy = (Trung bình – Độ chính xác; Trung bình + Độ chính xác)
Trong Excel, Z = NORMSINV (1 −  / 2) . Với độ tin cậy 95% nên  = 5%
5



-

Khoảng tin cậy cho phương sai thời gian trò chuyện tổng thể:
Dùng hàm CHISQ.INV.RT(probability, deg_freedom) để tính chi bình phương.
(probability  1, deg_freedom  1).
2
(317 − 1) = CHISQ.INV .RT (0.025,316) = 367,1388461
+  0,05
2

+  2 0,05 (317 − 1) = CHISQ.INV .RT (0.975,316) = 268,648037
1−

2

3. Khoảng ước lượng cho tỉ lệ gọi video với độ tin cậy 98%:
-

Gọi p là tỉ lệ sinh viên dùng hình thức gọi video tổng thể.

-

Khoảng ước lượng (đối xứng) cho p có dạng: ( f −  ; f +  )

-

Tính các đặc trưng mẫu: n = 317; f = 186/317 = 0,586751

-


Độ tin cậy: 1 −  = 98%   = 2%

-

Ta tính Z trên Excel bằng hàm NORMSINV (1 − 0.02 / 2)
Tìm ngưỡng sai số (hay là độ chính xác) của ước lượng:

=

Z

f (1 − f )
n

6


Vậy, khoảng ước lượng cho p:

( f −  ; f +  ) = ( 0,522411;0,65109 )

Câu 2:
A. Dữ liệu sử dụng:
Thời gian trò truyện từ dữ liệu thu thập được từ file dữ liệu excel “A37_Dulieu.xlsx”
đính kèm, gổm 317 dữ liệu về thời gian. Dữ liệu đã được phân ra 2 nhóm giới tính
nam và nữ.

B. Bài tốn:
Khảo sát thời gian (phút) mà sinh viên nam và nữ trị chuyện với gia đình. Với mức ý

nghĩa 5%, có thể cho rằng thời gian trò chuyện của sinh viên nam lớn hơn thời gian trò
7


chuyện của sinh viên nữ hay không, biết thời gian trị chuyện có phân phối chuẩn và có
phương sai bằng nhau.
C. Cơ sở lý thuyết:
Giả sử tổng thể X1 có trung bình a1 , tổng thể X2 có trung bình a 2 . Từ tổng thể X1 có
mẫu kích thước n1 , trung bình mẫu X 1 , phương sai mẫu hiệu chỉnh S12 . Từ tổng thể
X2 có mẫu kích thước n2 , trung bình mẫu X 2 , phương sai mẫu hiệu chỉnh S22 . Hãy
kiểm định giả thiết H: a1 = a2 với mức ý nghĩa  .
Giả

Giả

thiết

thiết

H0

H1

- X1 , X 2
có phân
a1=a2

phối
chuẩn
-


Chưa

biết

a1=a2

a1


 −; −t ( n1 + n2 − 2 ) 
2




  t ( n1 + n2 − 2 ) ; + 
 2


( −; −t ( n + n
1

2

Tqs =

− 2))


X1 − X 2
S p2 S p2
+
n1 n2

~ T ( n1 + n2 − 2 )

với phương sai gộp

 12 ,  22 ,

(n1 − 1) S12 + (n2 − 1) S22
S =
n1 + n2 − 2
2
p

giả thiết

 12 =  22

Tiêu chuẩn kiểm định

Miền bác bỏ Wα

a1>a2

( t ( n

1


+ n2 − 2 ) ; + )

- 2 mẫu
độc lập

D. Lời giải tính tay:
Gọi:
-

a1 là thời gian là thời gian trò chuyện trung bình với gia đình của nhóm nam.

-

a2 là thời gian là thời gian trị chuyện trung bình với gia đình của nhóm nữ.

• Giả thiết kiểm định: H0: a1 = a2 “Thời gian trị chuyện trung bình với gia đình của
nhóm nam và nhóm nữ là bằng nhau”
8


• Giả thiết bác bỏ: H1: a1 > a2 “Thời gian trị chuyện trung bình với gia đình của
nhóm nam lớn hơn nhóm nữ”
x1 = 21, 2147 ;
n1 = 177 ;

x2 = 26.8429
n2 = 140

s12 = 472,6013739 ;


s22 = 465,6298047

W = ( t (n1 + n2 − 2); + ) = ( t0,05 (315); + )  W = (1,645; +  )

s 2p =

Tqs =

(177 − 1) s12 + (140 − 1) s22
= 469,5250307
177 + 140 − 2
x1 − x2
s 2p s 2p
+
n1 n2

= −2, 2965

Ta có Tqs = −2, 2965  W = (1,645; + )
Vậy, ta tạm thời chấp nhận giả thiết H0 “thời gian trò chuyện với gia đình của
sinh viên nam và nữ là như nhau”.
E. Lời giải sử dụng Excel:
Đây là bài toán t-test với giả thiết 2 phương sai tổng thể như nhau.
Gọi a1, a2 là thời gian trị chuyện trung bình của sinh viên nam và nữ
-

Giả thiết kiểm định: H0: a1 = a2 “Thời gian trị chuyện với gia đình của nhóm nam
và nhóm nữ là bằng nhau”


-

Giả thiết bác bỏ: H1: a1 > a2 “Thời gian trò chuyện với gia đình của nhóm nam lớn
hơn nhóm nữ”

Trên thanh cơng cụ chọn:
Data/ Data Analysis/ t-Test: Two- Sample Assuming Equal Variences
Nhập các mục:
+ Variable 1 Range: Chọn dữ liệu cho cột Nam
+ Variable 2 Range: Chọn dữ liệu cho cột Nữ
+ Labels: Ô đầu tiên mỗi dãy là tên mục
+ Alpha: miền ý nghĩa 0.05 (5%)
+ Output Range: Chọn ô đầu ra:
9


-

Kết quả:

Miền bác bỏ 1 phía: W = (1,6498; + )
Ta có Tqs = −2, 2965  W = (1,6498; + )
Vậy, ta tạm thời chấp nhận giả thiết H0 “thời gian trị chuyện với gia đình của sinh viên
nam và nữ là như nhau”.

Câu 3:
A. Dữ liệu sử dụng:
Sử dụng dữ liệu về thời gian trị chuyện, hình thức trò chuyện và số lần trò chuyện
trong tuần của sinh viên trong file excel “A37_Dulieu.xlsx” được đính kèm. Các dữ
liệu đã được tạo bảng phù hợp để đáp ứng bài toán bên dưới.

10


B. Bài tốn:
Phân tích sự ảnh hưởng của hình thức trò chuyện và số lần trò chuyện của sinh viên
(ngày/tuần) đến thời gian sinh viên dành cho 1 cuộc trò chuyện.
C. Cơ sở lý thuyết:
Để tăng tính chính xác khi kết luận về ảnh hưởng của 2 yếu tố nguyên nhân đến yếu
tố kết quả của mẫu cho một tổng thể, ta tăng cỡ mẫu quan sát trong điều kiện cho
phép. Gọi L là số quan sát trong một ô, ta cso dạng tổng quả của L quan sát trong một
ơ như sau:

Nhóm (groups)

Khối
(Blocks)

1

2

11



K


1


x111 x112 ...x11L

x211 x212 ...x21L



xK11 xK12 ...xK1L

2

x121 x122 ...x12 L

x221 x222 ...x22 L

….

xK 21 xK 22 ...xK 2 L





….

….

….

H


x1H 1 x1H 2 ...x1HL

x2 H 1x2 H 2 ...x2 HL

….

xKH 1 xKH 2 ...xKHL

Bước 1: Tính các trung bình
-

Trung bình mẫu từng nhóm – group (cột):
H

c
i

x =
-

L

 x

H L

Trung bình mẫu từng khối- block (dòng):
K

r

j

x =
-

ijs

j =1 s =1

L

 x
i =1 s =1

ijs

KL

Trung bình mẫu từng ơ:
L

x

xij =
-

ijs

s =1


L

Trung bình chung của toàn bộ mẫu quan sát:
K

x=

H

L

 x
i =1 j =1 s =1

ijs

KH L

Ta có bảng sau đây ghi các kết quả tính tốn trên:
Trung

Nhóm (groups)

Khối

bình
1

2




K

dịng Aj

1

x11

x21



x K1

x1

2

x12

x22



xK 2

x2


(Blocks)

12

r

r














H

x1H

x2H



x KH


xH



xK

r

Trung
c

c

bình cột

x2

x1

c

x

Bk

Bước 2: Tính tổng các chênh lệch bình phương
1. Tổng các chênh lệch bình phương tồn bộ:

SST = SSG + SSB + SSI + SSE

K

H

L

(

SST =  xijs − x
i =1 j =1 s =1

)

2

2. Tổng các chênh lệch bình phương giữa các nhóm:
K

(

SSG = HL x − x
i =1

c
i

)

2


SSG phản ánh phần biến thiên của yếu tố định lượng kết quả đang nghiên cứu do
ảnh hưởng của yếu tố nguyên nhân thứ nhất, yếu tố dùng để phân nhóm ở cột.
3. Tổng các chênh lệch bình phương giữa các khối:
H

(

SSB = KL x − x
j =1

r
j

)

2

SSB phản ánh phần biến thiên của yếu tố định lượng kết quả đang nghiên cứu do
ảnh hưởng của yếu tố nguyên nhân thứ 2, yếu tố dùng để phân nhóm ở dịng.
4. Tổng các chênh lệch bình phương giữa các ơ (giao nhau giữa các nhóm và khối):
K

H

(

SSI = L xij − xi − x j + x
i =1 j =1

c


r

)

SSI phản ảnh phần biến thiên do tác động quan lại giữa hai yếu tố đang nghiên
cứu.
5. Tổng các chênh lệch bình phương phần dư:
13


Đặt Z =

 n

X −
n
s

s
N (0,1) nên 2 ( Z ) = 1 − 

Tra bảng ta tìm được Z .
Từ đó  =

Z s
và khoảng ước lượng của a là ( x −  , x +  ) .
n

❖ Tìm khoảng tin cậy cho phương sai tổng thể:

Cho mẫu có kích thước n, phương sai mẫu hiệu chỉnh s2. Tìm khoảng ước lượng của
phương sai tổng thể  2 với độ tin cậy 1 −  .
-

Phương pháp giải trong trường hợp tổng thể có phân phối chuẩn:

(n − 1) s 2



2

 2 (n − 1)

Với 1 +  2 =  , ta có:
 2

(n − 1) s 2
P   1−1 (n − 1) 
  22 (n − 1)  = 1 − 
2




Từ đó với một mẫu cụ thể ta có khoảng ước lượng của  2 là:
 ( n − 1) s 2 ( n − 1) s 2 
; 2
 2



n

1

n

1
(
)
(
)
1−1
 2


Để thuận tiện cho việc tra bảng trong các bài toán tìm khoảng ước lượng của  2 ta
ln xét với 1 =  2 =


2

. Khi đó khoảng ước lượng của  2 là:



2
n − 1) s 2 
(
 ( n − 1) s

  2 ( n − 1) ;  2 ( n − 1) 

 

1−
 2
2

D. Lời giải tính tay:
1. Đặc trưng mẫu
- Số lượng mẫu : n=317.

2




FK −1, KH ( L −1), là giá trị tra bảng phân phối F với K – 1 bậc tự do ở tử số và

KH(L - 1) bậc tự do ở mẫu số.


FH −1, KH ( L −1), là giá trị tra bảng phân phối F với H – 1 bậc tự do ở tử số và

KH(L – 1) bậc tự dọ ở mẫu số.


F( K −1)( H −1), KH ( L −1), là giá trị tra bảng phân phối F với (K – 1)(H – 1) bậc tự do ở

tử số và KH(L – 1) bậc tự dọ ở mẫu số.

D. Lời giải tính tay:
• Bước 1: Tính các trung bình:
-

Trung bình mẫu từng nhóm (ít – thỉnh thoảng – thường xuyên)
H

c
i

x =

-

-

-

-

L

 x
j =1 s =1

H L
Thời gian trung bình của nhóm trị chuyện ít:
c
30 + 30 + 10 + .... + 27, 2787
x1 =

= 22,0593
80  3
Thời gian trung bình của nhóm trị chuyện thỉnh thoảng:
c
10 + 10 + 45 + ... + 21,9020
x2 =
= 20, 2768
80  3
Thời gian trung bình của nhóm trị chuyện thường xuyên:
c
60 + 30 + 30 + ...23,8243
x3 =
= 25,309
80  3
Điểm trung bình từng khối (gọi video – gọi thoại – trực tiếp)
K

r
j

x =

-

-

-

ijs


L

 x
i =1 s =1

ijs

KL
Thời gian trung bình cho nhóm trị chuyện bằng gọi video:
r
30 + 10 + 60 + ... + 27, 2789 + 21,902 + 23,8243
x1 =
= 24,335
3  80
Thời gian trung bình cho nhóm trò chuyện bằng gọi thoại:
r
3 + 15 + 20 + ... + 15,5357 + 20 + 21
x2 =
= 18,8452
3  80
Thời gian trung bình cho nhóm trị chuyện bằng gọi thoại:
r
30 + 10 + 120 + ... + 23,3636 + 18,9286 + 31,1026
x3 =
= 24, 4649
3  80
15


-


Trung bình một ơ
L

xij =

x

ijs

s =1

L

Thời gian trung bình của nhóm ít trị chuyện và trị chuyện bằng hình thức gọi video:

x11 =

30 + 30 + 10 + ....27, 2789
= 27, 2789 phút
80

Tương tự như vậy đối với các khối còn lại gồm: thỉnh thoảng trò chuyện – gọi video:
21,902 phút ; thường xuyên trò chuyện- gọi video: 23,8243 phút
Thời gian trung bình của nhóm thỉnh thoảng trị chuyện và trị chuyện bằng hình
thức gọi thoại:
x 22 =

15 + 22 + 17 + ...20
= 20 phút

80

Tương tự như vậy đối với các khối cịn lại gồm: ít trị chuyện – gọi thoại: 15,5357
phút; thường xuyên trò chuyện – gọi thoại: 21phút
Thời gian trung bình của nhóm thường xun trị chuyện và trị chuyện bằng hình
thức trực tiếp:
x33 =

120 + 20 + 15 + ...31,1026
= 25,309 phút
80

Tương tự như vậy đối với các khối cịn lại gồm: ít trị chuyện- trực tiếp: 23,3636
phút, thỉnh thoảng trò chuyện- trực tiếp: 18,9286 phút.
-

Trung bình chung
K

x=
x=

H

L

 x
i =1 j =1 s =1

ijs


KH L
30 + 10 + 60 + ...23,3636 + 18,9289 + 31,1026
= 22,5484
3  3  80

Hình thức
trị chuyện

Gọi video
Gọi thoại
Trực tiếp

Tần suất trị chuyện
Thỉnh
Thường
Ít
thoảng
xun
27,2789
21,902
23,8243
15,5357
20
21
30,6958
18,9286
31,1026
16


xi

24,335
18,8452
24,4649


xi

22,0593

20,2768

25,309

• Bước 2: Tính các tổng chênh lệch bình phương (SS)
1. Tổng các chênh lệch bình phương tồn bộ: SST
K

H

L

(

SST =  xijs − x
i =1 j =1 s =1

)


2

= 158248,1272

2. Tổng các chênh lệch bình phương giữa các nhóm

(

K

SSG = HL x − x
i =1

c
i

) = 3124,76323
2

3. Tổng các chênh lệch bình phương giữa các khối:
H

(

SSB = KL x − x
j =1

r
j


) = 4938,8113
2

4. Tổng các chênh lệch bình phương giữa các ô
K

H

(

)

SSI = L xij − xi − x j + x = 5491,0363
i =1 j =1

c

r

5. Tổng các chênh lệch bình phương phần dư:
K

H

L

(

SSE =  xijs − xij
i =1 j =1 s =1


)

2

= SST − SSG − SSB − SSI = 144693,5164

• Bước 3: Tính các phương sai:
SSG 3124,76323
=
= 1562,3816
K −1
2
SSB 4938,8113
2. Phương sai giữa các khối: MSB =
=
= 2469, 4056
H −1
2
3. Phương sai giữa các ô:

1. Phương sai giữa các nhóm: MSG =

MSI =

SSI
5491,0363
=
= 1372,7591
( H − 1)( K − 1) ( 4 − 1)( 4 − 1)


4. Phương sai dư:
SSE
144693,6164
MSE =
=
= 203,5071
KH ( L − 1)
3  3  79
• Bước 4: Tính các tỉ số F
17

22,5484


MSB
= 12,1343
MSE
MSG
2. FC =
= 7,6773
MSE
MSI
3. FI =
= 6,7455
MSE
4. Tra bảng Fisher tìm
- FK −1;KH ( L −1); = F3−1;33(80−1);0,05 = F2;711;0,05 = 3,00839

1. FR =


-

FH −1;KH ( L −1); = F3−1;33(80−1);0,05 = F2;711;0,05 = 3,00839

-

F( K −1)( H −1);KH ( L −1); = F( 3−1)(3−1);33(80−1);0,05 = F4;711;0,05 = 2,384459

Ta thấy:
-

FR = 12,13425077  F2;711;0,95 = 3.00839 : ta có thể bác bỏ giả thuyết thứ nhất (hàng).

Vậy hình thức trị chuyện có ảnh hưởng đến thời gian trị chuyện trung bình của
sinh viên.
-

FC = 7,677284762  F2;711;0,95 = 3.00839 : ta có thể bác bỏ giả thuyết thứ 2 (cột).

Như vậy tần suất trị chuyện có ảnh hưởng tới thời gian trò chuyện
-

FI = 6,745510936  F4;711;0,95 = 2,384459 : bác bỏ giả thiết thứ 3.

Vậy, tương tác giữa tần suất và hình thức trị chuyện ảnh hưởng hưởng đến thời
gian dành cho gia đình của sinh viên.

E. Lời giải sử dụng Excel:
Đặt giả thuyết H0:

-

Thời gian trò chuyện trung bình của sinh viên sử dụng hình thức trị chuyện khác
nhau đều bằng nhau.

-

Thời gian trị chuyện trung bình của sinh viên có tần suất trị chuyện trong tuần khác
nhau đều bằng nhau.

-

Khơng có sự tương tác giữa tần suất trị chuyện và hình thức trị chuyện với gia đình
của sinh viên.

Cách làm:
-

Trên thanh công cụ chọn:
18


Data/ Data Analysis/ Anova: Two- Factor With Replication

-

Nhập dữ liệu vào bảng:
+ Input Range: Chọn tất cả các ô chứa dữ liệu
+ Rows per sample: số quan sát trên một mẫu (80 quan sát)
+ Alpha: miền ý nghĩa 0.05 (5%)

+ Output Range: ô chứa dữ liệu ra.

-

Kết quả:

19


Ta thấy:
-

FR = 12,13425077  F2;711;0,95 = 3.00839 : ta có thể bác bỏ giả thuyết thứ nhất (hàng).

Vậy hình thức trị chuyện có ảnh hưởng đến thời gian trị chuyện trung bình của
sinh viên.

20


-

FC = 7,677284762  F2;711;0,95 = 3.00839 : ta có thể bác bỏ giả thuyết thứ 2 (cột).

Như vậy tần suất trị chuyện có ảnh hưởng tới thời gian trị chuyện
-

FI = 6,745510936  F4;711;0,95 = 2,384459 : bác bỏ giả thiết thứ 3.

Vậy, tương tác giữa tần suất và hình thức trị chuyện ảnh hưởng hưởng đến thời

gian dành cho gia đình của sinh viên
Ta tính các giá trị F trên EXCEL bằng hàm:
F.INV(probability, deg_freedom1,deg_freedom2)

Câu 4:
A. Dữ liệu sử dụng:
Sử dụng dữ liệu về số người tham gia cuộc trị chuyện trong file excel
“A37_Dulieu.xlsx” đính kèm. Dữ liệu đã được phân ra 2 nhóm giới tính nam và nữ
để phục vụ bài toán bên dưới.

B. Bài toán:
21


Với mức ý nghĩa 5%, so sánh sự phân tán về số người tham gia trò chuyện của sinh
nam và sinh viên nữ.
C. Cơ sở lý thuyết:
Cho 2 tổng thể có phân phối chuẩn, mẫu có kích thước lần lượt là n1 và n2 ,phương sai
mẫu hiệu chỉnh s12 và s22 phương sai  12 và  22 . Hãy kiểm định giả thiết H0 :

 12 =  22 với mức ý nghĩa  .
Phương pháp giải :
Sử dụng tiêu chuẩn kiểm định :

-

s12
Fqs = 2 .
s2


Nếu Fqs  1 thì sử dụng giả thiết đối H1 :  12   22 và lấy miền bác bỏ bên phải

W = ( f (n1 − 1; n2 − 1); +) .
-

Nếu Fqs  1 thì sử dụng giải thiết đối H1 : và  12   22 và lấy miền bác bỏ bên tráí


1
W = (0; f1− (n1 − 1; n2 − 1)) =  0;
.
f
(
n

1;
n

1)

1
2



-

Tra bảng Fisher và kết luận.

D. Lời giải tính tay:

-

Gọi  12 ,  22 là phương sai của số người tham gia cuộc trò chuyện ở sinh viên nam
và nữ

-

Giả thiết kiểm định: H 0 :  12 =  22 “ sự chênh lệch về số người tham gia trò truyện
ở hai nhóm nam và nữ là như nhau”

-

Giả thiết bác bỏ: H1 :  12   22 “sự chênh lệch về số người tham gia trị truyện ở
nhóm nữ cao hơn nhóm nam”

-

Nam: n1 =177. Phương sai mẫu hiệu chỉnh: s12 = 0.88290

-

Nữ: n2 =140. Phương sai mẫu hiệu chỉnh: s22 = 1.07893

-

Fqs =

-

W = ( 0; f1− (n1 − 1; n2 − 1) )


s12
= 0,81831
s22

22


×