Tải bản đầy đủ (.pdf) (17 trang)

Bài thảo luận xác suất thống kê đề tài NGHIÊN CỨU CHI TIÊU TRUNG BÌNH CỦA SINH VIÊN TRƯỜNG ĐẠI HỌC THƯƠNG MẠI ĐỐI VỚI ĐỐI TƯỢNG ĐANG ĐI LÀM THÊM VÀ KHÔNG ĐI LÀM THÊM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.06 MB, 17 trang )

TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
BỘ MƠN: TỐN
HỌC PHẦN: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
------

BÀI THẢO LUẬN
Đề tài:
NGHIÊN CỨU CHI TIÊU TRUNG BÌNH CỦA SINH VIÊN
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI ĐỐI VỚI ĐỐI TƯỢNG
ĐANG ĐI LÀM THÊM VÀ KHÔNG ĐI LÀM THÊM

Giáo viên hướng dẫn: Thầy Mai Hải An
Nhóm thực hiện: Nhóm 09
Mã học phần: H2101AMAT0111

HÀ NỘI - 2021

1


BÀI THẢO LUẬN

GVHD: Mai Hải An

DANH SÁCH THÀNH VIÊN:

STT

Họ và tên

Nhiệm vụ



73

Trần Thị Linh

Nhóm trưởng

74

Vũ Thị Hải Linh

Thành viên

75

Vũ Thị Thu Loan

Thành viên

76

Bạch Hải Long

Thành viên

77

Hà Ngọc Long

Thành viên


79

Đỗ Thanh Thương

Thư ký

80

Hoàng Thị Ánh

Thành viên

81

Nguyễn Ngọc Ánh

Thành viên

82

Yiachong Chouvang

Thành viên

2


BÀI THẢO LUẬN


GVHD: Mai Hải An

MỤC LỤC

Contents
MỤC LỤC ............................................................................................................ 3
LỜI MỞ ĐẦU ...................................................................................................... 4
A. LÝ THUYẾT .................................................................................................. 5
1. Trung bình mẫu: ........................................................................................... 5
2. Phương sai mẫu: ............................................................................................ 5
3. Ước lượng bằng khoảng tin cậy .................................................................... 6
4. Kiểm định ...................................................................................................... 7
B.BÀI TOÁN THỰC TẾ: ................................................................................... 9
I. Ước lượng ...................................................................................................... 9
1.Ước lượng mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang
đi làm thêm: ...................................................................................................... 9
2.Ước lượng tỷ lệ các bạn sinh viên đang đi làm thêm: ................................. 11
II. Kiểm định ................................................................................................... 12
1.Kiểm định mức chi tiêu TB hàng tháng của các bạn sinh viên nữ đang đi
làm thêm đến 2,7 triệu đồng 1 tháng không ................................................... 12
2.Kiểm định mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang
đi làm thêm và không đi làm thêm: ................................................................ 13
KẾT LUẬN ........................................................................................................ 17

3


BÀI THẢO LUẬN

GVHD: Mai Hải An


LỜI MỞ ĐẦU
Xác suất thống kê là một một môn học được ứng dụng sâu rộng vào trong các
ngành kinh tế - xã hội và khoa học kỹ thuật. Môn học không chỉ khái quát chặt chẽ
một phần của tốn học mà hơn thế, nó cịn mang tính ứng dụng thực tế cao. Để giải
quyết những bài toán đặt ra trong thực tiễn, cụ thể là “Vấn đề chi tiêu trung bình của
các bạn sinh viên đang đi làm hoặc không đi làm tại Đại học Thương mại”, nhóm 9 đã
thực hiện khảo sát để nghiên cứu vấn đề trên. Với không gian là trường Đại học
Thương mại, thời gian nghiên cứu là tháng 6/2021, đã có 110 bạn sinh viên tham gia
khảo sát với số lượng sinh viên đang đi làm thêm là 60 người, số sinh viên không đi
làm thêm là 50 người.
Qua cuộc nghiên cứu, ta có thể thấy được mức chi tiêu trung bình của các bạn
sinh viên và tỷ lệ các bạn sinh viên đang đi và không đi làm, sự khác nhau trong chi
tiêu của sinh viên đang đi làm thêm và khơng đi làm thêm. Từ đó khái quát và đánh
giá được tình trạng đi làm, mức chi tiêu của sinh viên Đại học Thương mại. Ý nghĩa
của đề tài trên bám sát thực tiễn và thiết thực đối với mỗi sinh viên Thương mại. Nhận
thấy được rằng, xác suất thống kê chính là một mơn học vơ cùng hữu ích trong cuộc
sống.

4


BÀI THẢO LUẬN

GVHD: Mai Hải An

A. LÝ THUYẾT
Bảng phân phối thực nghiệm
-


-

Bảng phân phối tần số:
Ta sắp xếp các giá trị quan sát theo thứ tự tăng dần 𝑥1 < 𝑥2 < ⋯ < 𝑥𝑘
𝑥𝑖 (𝑋)
𝑥1
𝑥2

𝑥𝑖

𝑛𝑖
𝑛1
𝑛2

𝑛𝑖

Trong đó 𝑛𝑖 là tần số của quan sát 𝑥𝑖
+ Tính chất:
 0 ≤ 𝑛𝑖 ≤ 𝑛 𝑣ớ𝑖 𝑖 = 1,2 … 𝑘
 ∑𝑘𝑖=1 𝑛𝑖 = 𝑛
Bảng phân phối tần suất:
𝑥𝑖 (𝑋)
𝑥1
𝑥2

𝑥𝑖
𝑓𝑖
𝑓1
𝑓2


𝑓𝑖
𝑛𝑖
Trong đó 𝑓𝑖 = là tần số của giá trị quan sát 𝑥𝑖 . Khi đó:
𝑛
 0 ≤ 𝑓𝑖 ≤ 1 𝑣ớ𝑖 𝑖 = 1,2 … 𝑘
 ∑𝑘𝑖=1 𝑓𝑖 = 1




𝑥𝑘
𝑛𝑘

𝑥𝑘
𝑓𝑘

1. Trung bình mẫu:
a. Định nghĩa: Giả sử ta có mẫu ngẫu nhiên về dấu hiệu cần nghiên cứu X
W= (X1, X2, …, Xn)
𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 (𝑋̅ cũng là một ĐLNN)
1

𝑛

 Với mẫu cụ thể:
1

1

𝑛


𝑛

𝑥̅ = ∑𝑛𝑖=1 𝑥𝑖 = ∑𝑘𝑖=1 𝑛𝑖 . 𝑥𝑖
Nếu 𝐸(𝑋) = µ, 𝑉𝑎𝑟(𝑋) = 𝜎 2

b. Tính chất:

 𝐸 (𝑋̅ ) = 𝜇
𝜎
 𝑉𝑎𝑟(𝑋̅ ) =

2

𝑛

2. Phương sai mẫu:
2.1 Định nghĩa:
- Từ đám đông lấy ra mẫu ngẫu nhiên 𝑊 = (𝑋1 , 𝑋2 , … , 𝑋𝑛 ). Khi đó phương sai
mẫu được ký hiệu là 𝑆 2
1
𝑆 2 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2 (𝑆 2 cũng là một ĐLNN)
𝑛

2.2 Tính chất:
Nếu ĐLNN X có 𝐸(𝑋) = µ, 𝑉𝑎𝑟(𝑋) = 𝜎 2 thì:

5



BÀI THẢO LUẬN

GVHD: Mai Hải An

𝐸 (𝑆 2 ) =

𝑛−1 2
𝜎
𝑛

2.3 Phương sai mẫu điều chỉnh
Phương sai mẫu điều chỉnh được ký hiệu: 𝑆 ′2
1
∑𝑛 (𝑋 − 𝑋̅ )2 (𝑆 ′2 cũng là một ĐLNN)
𝑆 ′2 =
𝑛−1 𝑖=1 𝑖
2.4 Độ lệch tiêu chuẩn mẫu và Độ lệch tiêu chuẩn mẫu điều chỉnh
1
𝑆 = √𝑆 2 = √ ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2 và 𝑆 ′ = √𝑆 ′2 = √
𝑛

1
𝑛−1

∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2

3. Ước lượng bằng khoảng tin cậy
Ước lượng kỳ vọng toán của ĐLNN
- Giả sử ĐLNN X trên đám đơng có 𝐸(𝑋) = µ, 𝑉𝑎𝑟(𝑋) = 𝜎 2 , trong đó 𝜇 chưa
biết

3.1 ĐLNN X có phân phối chuẩn, phương sai đã biết
- Vì 𝑋~𝑁(µ, 𝜎 2 ) nên:
𝑋̅ ~ 𝑁 (µ,
-

𝜎2
𝑋̅ − 𝜇
) → 𝑈 = 𝜎 ~𝑁(0,1)
𝑛
√𝑛

Khoảng tin cậy:
Xác suất
Hai phía

Khoảng tin cậy

𝑃 (|𝑈| < 𝑈𝛼 ) = 1 − 𝛼 = 𝛿

(𝑋̅ − 𝑈𝛼 .

𝜎

𝜎

; 𝑋̅ + 𝑈𝛼 .

2 √𝑛
√𝑛
𝜎

(
)
Trái
𝑃 𝑈 > −𝑈𝛼 = 1 − 𝛼 = 𝛿
(−∞; 𝑋̅ + 𝑈𝛼 . )
√𝑛
𝜎
Phải
𝑃(𝑈 < 𝑈𝛼 ) = 1 − 𝛼 = 𝛿
(𝑋̅ − 𝑈𝛼 .
; +∞)
√𝑛
3.2 ĐLNN X có phân phối chuẩn, phương sai chưa biết, 𝑛 < 30
2

-

-

Vì 𝑋~𝑁(µ, 𝜎 2 ) nên ta xây dựng thống kê:
𝑋̅ − 𝜇
𝑇=
~𝑇 (𝑛−1)
𝑆′
√𝑛
Khoảng tin cậy:
Xác suất
Hai phía
Trái


𝑃 (|𝑇| < 𝑡𝛼𝑛−1 ) = 1 − 𝛼 = 𝛿
𝑃 (𝑇 >

2
−𝑡𝛼𝑛−1 )

=1−𝛼 =𝛿

2

Khoảng tin cậy
(𝑋̅ −


𝑛−1 𝑆
𝑡𝛼 .
;
2
√𝑛

𝑋̅ +


𝑛−1 𝑆
𝑡𝛼 . )
2
√𝑛


(−∞; 𝑋̅ + 𝑡𝛼𝑛−1 .

2

6

)

𝑆

√𝑛

)


BÀI THẢO LUẬN

GVHD: Mai Hải An

𝑃(𝑇 < 𝑡𝛼𝑛−1 ) = 1 − 𝛼 = 𝛿

Phải

(𝑋̅ − 𝑡𝛼𝑛−1 .
2

𝑆′
√𝑛

; +∞)

3.3 Chưa biết quy luật phân phối của ĐLNN X, 𝑛 > 30

-

Vì 𝑛 > 30 nên:

𝜎2
𝑋̅ − 𝜇
) → 𝑈 = 𝜎 ≅ 𝑁(0,1)
𝑛
√𝑛
Từ đó các bài tốn được giải quyết tương tự trường hợp X có phân phối chuẩn
 Chú ý: Do 𝜎 chưa biết, vì 𝑛 > 30 nên ta lấy 𝜎 ≈ 𝑠 ′
𝑋̅ ≅ 𝑁 (µ,

4. Kiểm định
4.1 ĐLNN X có phân phối chuẩn với 𝝈𝟐 đã biết.

2

𝜎
Do X có phân phối chuẩn với 𝜎 2 đã biết nên 𝑋̅ ~ N (𝜇, )

TCKĐ:

U=

𝜎
√𝑛

Nếu 𝐻0 đúng thì U ~ N ( 0, 1).
𝐻0

𝜇= 𝜇0

𝐻1
𝜇 ≠ 𝜇0

P (𝐺 ∈

𝜇

̅ − 𝜇0
𝑋

𝑊∝
𝐻0

Miền bác bỏ 𝑊∝

)= ∝

P (|𝑈| > 𝑈∝ ) = ∝

𝑊∝ = {𝑈𝑡𝑛 ∶ |𝑈𝑡𝑛 | > 𝑈∝ }

𝜇 > 𝜇0

P (𝑈 > 𝑈∝ ) = ∝

𝑊∝ = {𝑈𝑡𝑛 : 𝑈𝑡𝑛 > 𝑈∝ }

𝜇 < 𝜇0


P (𝑈 < −𝑈∝ ) = ∝

𝑊∝ = {𝑈𝑡𝑛 : 𝑈𝑡𝑛 < −𝑈∝ }

2

2

4.2 ĐLNN có phân phối chuẩn với 𝝈𝟐 chưa biết.
Do X có phân phối chuẩn với 𝜎 2 chưa biết nên
XĐTCKĐ:

T=

𝑋̅ −𝜇0
𝑆′
√𝑛

Nếu 𝐻0 đúng thì T ~ T ( n- 1)
𝐻0
𝜇= 𝜇0

𝐻1

P (𝐺 ∈

𝑊∝
𝐻0


Miền bác bỏ 𝑊∝

)= ∝

𝜇 ≠ 𝜇0

P (|𝑇| > 𝑡∝⁄

𝜇 > 𝜇0

P (𝑇 > 𝑡∝

𝜇 < 𝜇0

P (𝑇 < −𝑡∝

(𝑛−1)
2

(𝑛−1)

)=∝

)= ∝

(𝑛−1)

7

)= ∝


(𝑛−1)
𝑊∝ = {𝑡𝑡𝑛 ∶ |𝑡𝑡𝑛 | > 𝑡∝⁄ }
2

(𝑛−1)

𝑊∝ = {𝑡𝑡𝑛 : 𝑡𝑡𝑛 > 𝑡∝

}

(𝑛−1)

𝑊∝ = {𝑡𝑡𝑛 : 𝑡𝑡𝑛 < −𝑡∝

}


BÀI THẢO LUẬN

GVHD: Mai Hải An

4.3 Kiểm định giả thuyết về tỷ lệ của đám đông
 Giả sử trên một đám đông tỷ lệ phần tử mang dấu hiệu A là p. Với mức ý nghĩa
∝ ta cần kiểm định giả thuyết 𝐻0 , p= 𝑝0
 Chọn từ đám đông mẫu có kích thước n từ đó ta tìm được f là tỷ lệ phần tử
mang dấu hiệu A trên mẫu
𝑝𝑞
 Khi n đủ lớn, ta có : f ≅ N(𝑝; )
𝑛


XĐTCKĐ: U=

𝑓−𝑝𝑜
𝑝 𝑞
√ 0 0
𝑛

𝐻0
𝑝= 𝑝0

𝐻1

P (𝐺 ∈

𝑝 ≠ 𝑝0

𝑊∝
𝐻0

Miền bác bỏ 𝑊∝

)= ∝

P (|𝑈| > 𝑈∝ ) = ∝

𝑊∝ = {𝑈𝑡𝑛 ∶ |𝑈𝑡𝑛 | > 𝑈∝ }

𝑝 > 𝑝0


P (𝑈 > 𝑈∝ )= ∝

𝑊∝ = {𝑈𝑡𝑛 : 𝑈𝑡𝑛 > 𝑈∝ }

𝑝 < 𝑝0

P (𝑈 < −𝑈∝ )= ∝

𝑊∝ = {𝑈𝑡𝑛 : 𝑈𝑡𝑛 < −𝑈∝ }

2

2

4.4 Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn
 Giả sử ĐLNN X có E(X) = 𝜇, Var(X)= 𝜎 2 . Với mức ý nghĩa ∝ ta cần kiểm
định giả thuyết 𝐻0 : 𝜎 2 = 𝜎0 2
Lấy mẫu W= (𝑋1 , 𝑋2 ,... 𝑋𝑛 ) từ đó ta tìm được :
1
1
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2
𝑋̅ = (∑𝑛𝑖=1 𝑋𝑖 ) ;
𝑆 ′2 =
𝑛

𝑛−1

Do X có phân phối chuẩn nên ta có TCKĐ
𝑥2 =


(𝑛−1)𝑆 ′2
𝜎0 2

Nếu 𝐻0 đúng thì 𝑋 2 ~ 𝑋 2 (𝑛 − 1)
𝐻0

𝐻1

𝜎 2 = 𝜎0 2

𝜎 2 ≠ 𝜎0 2

P (𝐺 ∈

𝑊∝
𝐻0

Miền bác bỏ 𝑊∝

)= ∝

P[(𝑥 2 < 𝑥 2(𝑛−1)1−∝ ) +
2

𝑊∝ = {𝑥 2 𝑡𝑛 : 𝑥 2 𝑡𝑛 < 𝑥 2(𝑛−1)1−∝ }
2

2

2


2(𝑛−1) ∝

(𝑥 2 > 𝑥 2(𝑛−1) ∝ )] = ∝

U {𝑥

𝜎 2 > 𝜎0 2

P(𝑥 2 > 𝑥 2(𝑛−1) ∝ )= ∝

𝑊∝ = {𝑥 2 𝑡𝑛 : 𝑥 2 𝑡𝑛 > 𝑥 2(𝑛−1) ∝ }

𝜎 2 < 𝜎0 2

P(𝑥 2 < 𝑥 2(𝑛−1)1−∝ )= ∝

𝑊∝ = {𝑥 2 𝑡𝑛 : 𝑥 2 𝑡𝑛 < 𝑥 2(𝑛−1)1−∝ }

2

8

𝑡𝑛 :

𝑥

𝑡𝑛

>𝑥


2

}


BÀI THẢO LUẬN

GVHD: Mai Hải An

B.BÀI TOÁN THỰC TẾ:
Đề tài: Tiến hành khảo sát điều tra mẫu về các bạn sinh viên ĐHTM để giải quyết các
đề tài sau với mức ý nghĩa 5%, độ tin cậy 95%.
a, Vấn đề 1: Ước lượng mức chi tiêu trung bình hàng tháng của các bạn sv đang đi
làm thêm.
b, Vấn đề 2: Ước lượng tỷ lệ các bạn sinh viên đang đi làm thêm.
c, Vấn đề 3: Liệu mức chi tiêu TB hàng tháng của các bạn sinh viên nữ đang đi làm
thêm đến 2,7 triệu đồng 1 tháng hay không?
d, Vấn đề 4: So sánh mức chi tiêu TB hàng tháng của các bạn sv đang đi làm thêm và
ko đi làm thêm.
→ Với mẫu thu được là 110 – chủ yếu là sinh viên đến từ các khoa: Marketing,
Thương mại điện tử, Hệ thống thông tin quản lý,... với 51 sinh viên nam, 59 sinh viên
nữ, 60 sinh viên đang đi làm, 50 sinh viên khơng đi làm thêm nhóm 9 thu được số liệu
như trong bảng excel (gửi kèm bài thảo luận)
I. Ước lượng
1.Ước lượng mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi
làm thêm:
Trong excel thực hiện lệnh: Data/ Data Analysis/ Desciptive Statistics, ta có:
(Độ tin cậy 95%, n=60)
Mức chi tiêu trung bình trong 1 tháng

Mean (Trung bình mẫu)
Standard Error (Sai số chuẩn)
Median
Mode
Standard Deviation (Độ lệch chuẩn có điều chỉnh)
Sample Variance (Phương sai mẫu có điều chỉnh)
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Confidence Level(95.0%) (Sai số biên)

3.395
0.100967775
3.5
3.5
0.78209302
0.611669492
-0.634840841
0.344979582
3
2
5
203.7
60
0.20203605


Bảng thống kê mơ tả
Bài làm:
Gọi: X là mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm

9


BÀI THẢO LUẬN

GVHD: Mai Hải An

𝑋̅ mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm trên
mẫu
𝜇 mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm thêm trên
đám đơng
2

𝜎
Vì n = 60 > 30 nên 𝑋̅ ≅ 𝑁 (𝜇, ) do đó 𝑈 =
√𝑛

𝑋̅ − 𝜇
𝜎
⁄ 𝑛


≅ N(0,1)

Với độ tin cậy 95%, ta tìm khoảng tin cậy đối xứng:
(𝑋̅ − 𝑈𝛼⁄2 .


𝜎
√𝑛

; 𝑋̅ + 𝑈𝛼⁄2 .

𝜎
√𝑛

)

Với 𝛾 ta tìm được 𝑈𝛼⁄2 sao cho:
P ( | U | < 𝑈𝛼⁄2 ) = 1 – 𝛼 = 𝛾
Vì 𝜎 chưa biết mà n đủ lớn nên ta lấy 𝜎 = 𝑠 ′ = √0,782
Ta có: 𝑈𝛼⁄2 = 𝑈0.025 = 1,96
Khoảng tin cậy đối xứng
0,782

(3,395 + 1,96. √

√60

0,782

; 3,395 − 1,96. √

√60

)


(3,193;3,597)
Kết luận: Với độ tin cậy 95% thì khoảng tin cậy đối xứng cho chi tiêu trung bình hàng
tháng của các bạn sinh viên đang đi làm thêm trong khoảng từ 3,193 đến 3,597 triệu
đồng.
Kiểm tra kết quả qua bảng excel:
Khoảng tin cậy đối xứng cho chi tiêu trung bình hàng tháng của các bạn sinh viên
đang đi làm thêm (𝜇):
𝑥̅ ± 𝑀𝐸 = 3,395 ± 0,202 → (3,193;3,597)
Vậy với độ tin cậy 95% thì khoảng tin cậy đối xứng cho chi tiêu trung bình hàng
tháng của các bạn sinh viên đang đi làm thêm trong khoảng từ 3,193 đến 3,597 triệu
đồng.

10


BÀI THẢO LUẬN

GVHD: Mai Hải An

2.Ước lượng tỷ lệ các bạn sinh viên đang đi làm thêm:
Trong excel thực hiện lệnh: Data/ Data Analysis/ Desciptive Statistics, ta có:
(Độ tin cậy 95%, n=110, Tình trạng làm thêm: Có-1, Khơng-0)
Tình trạng làm thêm
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis

Skewness
Range
Minimum
Maximum
Sum
Count
Confidence
Level(95.0%)

0.545454545
0.047693006
1
1
0.500208464
0.250208507
-2.002483558
-0.185108009
1
0
1
60
110
0.094525987

Bảng thống kê mô tả
Bài làm:
Gọi f là tỷ lệ sinh viên ĐHTM đang đi làm thêm trên mẫu.
p là tỷ lệ sinh viên ĐHTM đang đi làm thêm trên đám đông.
𝑝𝑞
- Bước 1: Với n=110 khá lớn nên f có phân phối xấp xỉ chuẩn: 𝑓 ≃ 𝑁 (𝑝, )

𝑛

XDTK:
𝑈=

𝑓−𝑝
𝑝. 𝑞

𝑛

≃ 𝑁(0,1)

- Bước 2: Với độ tin cậy 𝛾 = 0,95 ta có:
𝑃(−𝑢𝛼/2 < 𝑈 < 𝑢𝛼/2 ) = 𝛾
⇒ 𝑃 (𝑓 − 𝜀 < 𝑝 < 𝑓 + 𝜀 ) = 𝛾
Với
𝑝. 𝑞
𝜀 = 𝑢𝛼/2 . √
𝑛
- Bước 3: Có:
𝛾 = 0,95
⇒ 𝛼 = 1 − 𝛾 = 1 − 0,95 = 0,05
⇒ 𝑢𝛼/2 = 𝑢0,05/2 = 𝑢0,025 = 1,96
Có:
𝑝. 𝑞
𝜀 = 𝑢𝛼/2 . √
𝑛

11



BÀI THẢO LUẬN

GVHD: Mai Hải An

Vì p chưa biết, n khá lớn
𝑛𝐴
60
𝑝≈𝑓=
=
≈ 0,545
⇒{
𝑛
110
𝑞 ≈ 1 − 𝑓 = 0,455
⇒ 𝜀 = 𝑢𝛼/2 . √

𝑝. 𝑞
0,545.0,455
= 1,96. √
≈ 0,0931
𝑛
110

⇒ 𝑓 − 𝜀 = 0,545 − 0,0931 = 0,4519
𝑓 + 𝜀 = 0,545 + 0,0931 = 0,6381
Kết luận: Với độ tin cậy 95%, ta có thể nói rằng tỷ lệ sinh viên ĐHTM đang đi làm
thêm nằm trong khoảng (45,19;63,81)%
Kiểm tra kết quả qua bảng excel:
Khoảng tin cậy cho tỷ lệ với mẫu lớn (n≥ 100)

𝑓=

∑ 𝑥𝑖
𝑛

= 𝑥̅ ,

𝑥𝑖 𝜖 {0; 1},

𝑓(1−𝑓)



𝑛

≈ 𝑠𝑒(𝑋 ) =

𝑠
√𝑛

Khoảng tin cậy cho tỷ lệ các bạn sinh viên đang đi làm thêm (p) với mẫu n=110:
𝑓 ± 𝑀𝐸 = 0,5455 ± 0,0945→ (0,451;0,64)
Vậy với độ tin cậy 95% thì khoảng tin cậy cho tỷ lệ các bạn sinh viên đang đi làm
thêm tại trường Đại học Thương mại là: (0,451;0,64)
II. Kiểm định
1.Kiểm định mức chi tiêu TB hàng tháng của các bạn sinh viên nữ đang đi làm
thêm đến 2,7 triệu đồng 1 tháng hay không?
Trong excel thực hiện lệnh: Data/ Data Analysis/ Desciptive Statistics, ta có:
(Độ tin cậy 95%, n=40)
Mức chi tiêu trung bình trong 1 tháng (Triệu đồng)

Mean (TB mẫu)
Standard Error (Sai số chuẩn)
Median
Mode
Standard Deviation (Độ lệch chuẩn có điều chỉnh)
Sample Variance (Phương sai mẫu điều chỉnh)
Kurtosis
Skewness
Range
Minimum
Maximum

12

3.385
0.12662
3.5
3.5
0.800817
0.641308
-0.63385
0.595847
2.8
2.2
5


BÀI THẢO LUẬN

GVHD: Mai Hải An


Sum
Count
Confidence Level(95.0%) (Sai số biên)

135.4
40
0.256114

Bảng thống kê mô tả
Gọi X là mức chi tiêu trung bình hàng tháng của các bạn sinh viên nữ đang đi làm
thêm.
𝑥̅ là mức chi tiêu trung bình hàng tháng của các bạn sinh viên nữ đang đi làm thêm
trên mẫu.
n=40; 𝑥̅ = 3,385; s’ = 0,8008; 𝛼 = 0,05; 𝜇0 = 2,7
{

𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 > 𝜇0

Xây dựng tiêu chuẩn kiểm định : 𝑈 =

𝑥̅ −𝜇0
𝜎

. √𝑛 ≈ N(0,1)

Nếu 𝐻0 đúng:
𝛼=0,05 =>𝑢𝛼 = 𝑢0,05 = 1,65
P(𝑢 >𝑢𝛼 ) = 𝛼  P(𝑢 >1,65) = 𝛼

Vì 𝛼 khá nhỏ nên theo nguyên lý xác suất nhỏ ta được:
𝑊𝛼 = {𝑢𝑡𝑛 : 𝑢𝑡𝑛 > 1,65}
Trên mẫu cụ thể : n>30
𝑢𝑡𝑛 =

𝑥̅ −2,7
𝜎

. √𝑛 ≈

𝑥̅ −2,7
𝑠′

. √𝑛 =

3,385−2,7
0,8008

. √40 ≈ 5.4 > 2,7

=> 𝑢𝑡𝑛 ∈ 𝑊𝛼
Kết luận: với 𝛼 = 0,05 có thể nói rằng là mức chi tiêu trung bình hàng tháng của các
bạn sinh viên nữ đang đi làm thêm lớn hơn 2,7 triệu đồng.
2.Kiểm định mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi
làm thêm và không đi làm thêm:
2.1 Báo cáo tổng hợp
Trong excel sử dụng bảng Pivot Table, ta có:

13



BÀI THẢO LUẬN
Tình trạng
làm thêm

Khơng
(blank)
Grand Total

GVHD: Mai Hải An

Average of Mức chi tiêu trung bình trong 1 tháng
(Triệu đồng)
3.395
3.018
3.223636364

Mức chi tiêu trung bình trong một tháng của sinh viên đang đi làm thêm là 3,395 triệu
đồng.
Mức chi tiêu trung bình trong một tháng của sinh viên không đi làm thêm là 3,018
triệu đồng.
2.2 Đồ thị biểu diễn mức chi tiêu của sinh viên đang đi làm thêm và không đi làm
thêm:
12
10
8


6


Khơng
4
2
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59

 Nhận xét:
-

Chi tiêu của hai nhóm dao động quanh giá trị 3 (triệu đồng)

-

Biên độ dao động mức chi tiêu của nhóm khơng đi làm thêm dường như rộng
hơn (phương sai lớn hơn) nhóm khơng đi làm thêm.

2.3So sánh 2 phương sai của nhóm đang đi làm thêm và khơng đi làm thêm:
Kiểm định bằng p-value
-

p-value < 𝛼 =0,05 → Bác bỏ 𝐻0 , chấp nhận 𝐻1 .

-

p-value > 𝛼 =0,05 → Chấp nhận 𝐻0 , bác bỏ 𝐻1 .

14


BÀI THẢO LUẬN


GVHD: Mai Hải An

→ Kiểm định: Mức chi tiêu của các sinh viên đang đi làm thêm ổn định hơn (ít dao
động hơn, đồng đều hơn) so với các sinh viên không đi làm thêm.
-{

𝐻𝑜 : 𝜎𝐶 = 𝜎𝐾
𝐻1 : 𝜎𝐶 < 𝜎𝐾

Sử dụng excel, Data/ Data Analysis/ F-test Two-sample for Variances, 𝛼 =0,05 :

Có làm thêm
3.395
0.611669492
60
59
0.439638176

Khơng làm
thêm
3.018
1.391302041
50
49

Mean
Variance
Observations
df

F
P(F<=f) onetail
0.001361387
F Critical onetail
0.638816208
F-Test Two-Sample for Variances

Như vậy, p-value = 0,00136 < 𝛼 =0,05 → Bác bỏ 𝐻0 , chấp nhận 𝐻1
Kết luận với mức ý nghĩa 5%, mức chi tiêu của các sinh viên đang đi làm thêm ổn
định hơn (ít dao động hơn, đồng đều hơn) so với các sinh viên không đi làm thêm.
2.4 Kiểm định mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi làm
thêm và không đi làm thêm là như nhau hay không?
-{

𝐻𝑜 : 𝜇𝐶 = 𝜇𝐾
𝐻1 : 𝜇𝐶 ≠ 𝜇𝐾

Với 𝜎𝐶 ≠ 𝜎𝐾 , trong excel chọn Data/ Data Analysis/ t-Test: two-sample Assuming
Unequal Variances, 𝛼 =0,05, ta có:

Mean
Variance
Observations
Hypothesized Mean
Difference
df
t Stat
P(T<=t) one-tail

Có làm thêm

3.395
0.611669492
60

Khơng làm
thêm
3.018
1.391302041
50

0
82
1.93344692
0.028315953

15


BÀI THẢO LUẬN

t Critical one-tail
P(T<=t) two-tail
t Critical two-tail

GVHD: Mai Hải An

1.663649184
0.056631907
1.989318557


t-Test: Two-Sample Assuming Unequal Variances

Đề bài: Sau khi tiến hành khảo sát 110 sv , ta thu được thống kê rằng: Có 60 sv đi làm
thêm, trung bình mức chi tiêu hàng tháng là 3,24 triệu/ng , độ lệch chuẩn hiệu chỉnh là
1tr/ng; 50 sv không đi làm thêm, trung bình mức chi tiêu hàng tháng là 3,22 triệu/ng,
độ lệch chuẩn hiệu chỉnh 1 triệu/người. Có thơng tin cho rằng, mức chi tiêu trung bình
hàng tháng của các bạn sinh viên đang đi làm thêm và không đi làm thêm là như nhau.
Kiểm định giả thuyết vừa nêu.
Giải:
Ta có: 𝑛𝑥 = 60; 𝑥̅ = 3,24; 𝑠𝑥 = 1: 𝑛𝑦 = 50; 𝑦̅ = 3,22; 𝑠𝑦 = 0,9
Gọi 𝜇𝑥 , 𝜇𝑦 lần lượt là trung bình mức chi tiêu hàng tháng của sv đang đi làm thêm và
sv không đi làm thêm
Đặt giả thuyết {

𝐻0 : 𝜇𝑥 = 𝜇𝑦
𝐻1 : 𝜇𝑥 ≠ 𝜇𝑦

Giá trị kiểm định: 𝑍 =

𝑥̅ −𝑦̅−𝐷0
2
𝜎2 𝜎
√ 𝑥+ 𝑦
𝑛𝑥 𝑛𝑦

=

3,24−3,22−0
2


60

Với mức ý nghĩa 5%, ta có𝑍𝛼 = 𝜑 −1 (
2

2

√1 +0,9

= 0,104

50

1−0,05
2

) = 𝜑 −1 (0,045) = 1,96

Ta có |𝑍| < 𝑍𝛼 nên ta chấp nhận giả thuyết 𝐻0 , bác bỏ giả thuyết 𝐻1
2

Kết luận: Với mức ý nghĩa 5%, mức chi tiêu trung bình của các sinh viên đang đi làm
thêm giống mức chi tiêu trung bình của các bạn sinh viên khơng đi làm thêm.
Kiểm tra kết quả qua bảng excel:
Như vậy, p-value = 0,05663 > 𝛼 =0,05 → Chấp nhận 𝐻0 , bác bỏ 𝐻1
Vậy với mức ý nghĩa 5%, mức chi tiêu trung bình của các sinh viên đang đi làm thêm
giống mức chi tiêu trung bình của các bạn sinh viên khơng đi làm thêm.

16



BÀI THẢO LUẬN

GVHD: Mai Hải An

KẾT LUẬN
Qua cuộc khảo sát ước lượng và kiểm định về mức thu nhập của sinh viên đang đi
làm, không đi làm của trường Đại học Thương mại, chúng ta đã hiểu rõ hơn, cụ thể
hơn về mức thu nhập của sinh viên trong trường. Qua cái nhìn khái qt đó, mỗi
chúng ta có thể nhận định lại và điều chỉnh mức chi tiêu của bản thân thêm hợp lý hơn
nữa. Phạm vi và thời gian nghiên cứu của nhóm có hạn vì vậy sẽ khó tránh khỏi
những lỗi sai, hay chưa thực sự sát với thực tế, vậy nên bài nghiên cứu của nhóm được
xây dựng để tham khảo. Nhóm chúng em mong rằng sẽ nhận được sự góp ý của thầy
để chúng em có thể hồn thiện bài làm hơn nữa.

17



×