Tải bản đầy đủ (.docx) (15 trang)

Báo cáo Xác xuất thống kê nhóm 7 ĐH BK HCM Thầy Nguyễn Bá Thi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (723.18 KB, 15 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA GIAO THÔNG

BÁO CÁO
XÁC SUẤT THỐNG KÊ
GVHD: Thầy Nguyễn Bá Thi

Sinh viên thực hiện:
Họ Tên: NPQ
MSSV:

Hồ Chí Minh, tháng 6 năm 2020


Câu 1: Một cuộc điều tra xã hội được tiến hành ở 5 thành phố A,
B, C, D, E yêu cầu những người được hỏi diễn tả mức độ thoả mãn
của mình đối với thành phố mà họ đang sống. Kết quả như sau:
Thành Phố
A
B
C
D
E

Mức độ thỏa mãn
Rất thỏa mãn
Tương đối
220
121
130


207
84
54
156
95
122
164

Không
63
75
24
43
73

Với mức ý nghĩa , mức độ thoả mãn cuộc sống có giống nhau
trong 5 thành phố trên hay không?

Bài làm:
Dạng bài: Kiểm định giả thiết về tỉ lệ 5 mẫu
Phương pháp giải: Sử dụng tiêu chuẩn
Công cụ: Sử dụng lệnh CHITEST trong MS-Excel để tính giá trị
quan sát P
Giả thiết H0: Mức độ thoả mãn cuộc sống các thành phố là như
nhau
H1: Mức độ thỏa mãn cuộc sống các thành phố là không
giống nhau
Thực nghiệm: Tính các tổng số.



Tính các tần số lý thuyết:
-Ta có tần số lý thuyết = tổng hàng* tổng cột/ tổng cộng.

Dùng hàm CHITEST tính xác suất P(X > 2).
Giá trị< 0,05
 Bác bỏ H0: Mức độ thoả mãn cuộc sống các thành phố là
như nhau
Kết luận: Mức độ thoả mãn cuộc sống của 5 thành phố là không
giống nhau


Bài 2: Để đánh giá hiệu quả của một chiến dịch quảng cáo, người
ta so sánh doanh số của công ty tại 6 khu vực thị trường trước và
sau chiến dịch quảng cáo và thu được các số liệu sau (đơn vị triệu
đồng/tháng)
Sau quảng
Trước quảng cáo
cáo
620
660
600
620
640
670
630
620
570
580
600
630

Với độ tin cậy 95% hãy ước lượng doanh số trung bình trước và
sau chiến dịch quảng cáo. Với mức ý nghĩa 5% hãy cho ý kiến là
chiến dịch quảng cáo có thành công hay không? Biết rằng doanh
số của công ty là biến ngẫu nhiên phân phối chuẩn.

Bài làm:
Dạng bài: Ước lượng khoảng trung bình tổng thể và kiểm định
giả thuyết về giá trị trung bình hai mẫu.
Công cụ giải: Descriptive statistics trong MS-Excel để tìm
khoảng ước lượng doanh số trung bình, dùng t-Test: Paired Two
Sample for Means là công cụ để kiểm định giả thuyết về giá trị
trung bình.
Giả thiết: H0 – a1 = a2 Chiến dịch quảng cáo không làm thay đổi
doanh số
H1 – a1 < a2 Chiến dịch quảng cáo làm tăng doanh số.
Biện luận: Ước lượng giá trị trung bình theo công thức sau:

Trong đó

: là giá trị trung bình, còn

= là độ chính xác.


Bảng số liệu nhập vào:( bảng 1).

Tính toán:
 Chọn tab Data  Data Analysis  Descriptive statistics.
 Sau đó thực hiện như hình:


Bấm OK ta nhận được bảng kết quả:


Khoảng ước lượng doanh số trung bình :
Khoảng ước lượng doanh số trung bình trước chiến dịch quảng
cáo: (583.45, 636.55) triệu đồng/ tháng.
Khoảng ước lượng doanh số trung bình sau chiến dịch quảng cáo:
(586.16, 663.84) triệu đồng/ tháng.
Dùng công cụ t-Test: Paired Two Sample for Means.

Bảng xuất ra (nhập từ bảng 1):


Bác bỏ H0, chấp nhận H1 : Chiến dịch làm ảnh hưởng đến doanh
thu
Và doanh số trung bình sau quảng cáo lớn hơn nên chiến dịch
quảng cáo thành công
Bài 3: Một nghiên cứu được tiến hành ở Mỹ để xác định mối quan
hệ giữa chiều cao X của một người và cỡ giày Y của họ. Nhà
nghiên cứu đã thu được số liệu như sau:
7 6 6 6 6 6 7 6 6
1 2 4 6 3 7 1 2 4
1
1
1
Y 9 7 8
6
6 8 5
5 9
0

1
2
Tính tỷ số tương quan, hệ số tương quan và hệ số xác định của Y
đối với X. Với mức ý nghĩa có kết luận gì về mối quan hệ giữa X
và Y(Có phi tuyến không? Có tuyến tính không?)? Tìm đường hồi
quy của Y đối với X, đường hồi quy và các hệ số hồi quy có ý
nghĩa hay không?
X

6
6

6
3

6
7

Bài làm:
Dạng bài: Tương quan và hồi qui mẫu
Phương pháp giải: Phân tích tương quan tuyến tính, tương quan
phi tuyến, hồi quy.


Công cụ giải: Sử dụng Correlation, Anova: Single Factor,
Regression trong MS-Excel
Giả thiết:

H0: X và Y không có tương quan tuyến tính.


H1: X và Y không có tương quan phi tuyến.
Biện luận: Hệ số quan sát:

Nếu |T|
F < c chấp nhận giả thiết H1 và ngược lại.
Phương pháp giải trên Excel:
 Nhập bảng đề bài vào excel, sau đó mở hộp thoại Data
Analysis trong thẻ Data, chọn Correlation, và nhập số liệu
như bảng sau:


Thu được kết quả:
X
X
Y

1
0.53314
3

Y

1

Hệ số tương quan 0.533142624
Hệ số xác định 0.284241057
1. Phân tích tương quan tuyến tính

T = 2.182984421

Tra bảng 2.228138852
V nên chấp nhận giả thiết H0.
 Kết luận: X và Y không có tương quan tuyến tính
2. Phân tích tương quan phi tuyến
Bảng vào
X
66 63 67

71 62

64


Y

9
7 8 10 6 11
6
8 5 12 5
9
Mở hộp thoại Data Analysis trong thẻ Data, chọn Anova Single
Factor
Hộp thoại Anova Single Factor xuất hiện:

Bảng xuất ra:


Từ bảng ANOVA ta có:
SSF
SST


Tổng bình phương các yếu
= 44 tố
Tổng bình phương các độ
= 58 lệch

Vì |F|= 3.77  Kết luận: Y và X có tương quan phi tuyến
3. Phân tích hồi quy
Bảng ra (nhập từ bảng
2)


ta sử dụng Regression:

Từ cột Coefficients


Hệ số góc b = 0.392523364
Hệ số tự do a
=
17.71028037
Đường hồi quy truyến tính mẫu Y theo X là :
Giả thiết:
H2 - Hệ số góc không có ý nghĩa
H3 - Hệ số tự do không có ý nghĩa
H4 – Đường hồi quy không có ý nghĩa
Kiểm định hệ số a,b (từ cột
tStat)
=1.9927830

Tb
17
=Ta
1.371285224
=2.2281
Ngưỡng kiểm định t(0.05,10)
39
| Tb|< t(0.05,10) chấp nhận giả thiết H2
| Ta|< t(0.05,10) chấp nhận giả thiết H3
Kết luận: Cả hệ số góc và hệ số tự do đều không có ý nghĩa

Fqs = 3.971184151
Fkđ= 4.964603

Significance F = 0.0743 > α = 0.05  chấp nhận giả thiết H4
Kết Luận: Đường hồi quy không có ý nghĩa.
Câu 4: Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt
động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở
bảng số liệu về thu nhập của một hộ tương ứng với các ngành
nghề nói trên như sau (mức ý nghĩa 5%):
Nghề chính

Nghề phụ
(1)

(2)

(3)

(4)



Trồng lúa (1)

3.5

7.4

8.0

3.5

Trồng cây ăn quả (2)

5.6

4.1

6.1

9.6

Chăn nuôi (3)

4.1

2.5

1.8


2.1

Dịch vụ (4)

7.2

3.2

2.2

1.5

Bài làm:
Dạng bài: Kiểm định giá trị trung bình 2 nhân tố
Phương pháp giải: Phân tích phương sai 2 nhân tố không lặp
Giả thiết:

H1 - Thu nhập các ngành chính bằng nhau

H2 - Thu nhập các ngành phụ bằng nhau
Công cụ : Anova: Two-Factor Without Replication trong MS-Excel

Bảng nhập vào :
Nhập các số liệu cần thiết vào bảng tính, sau đó chọn công cụ Anova: Two-Fa
Without Replication trong thẻ Data và chọn như sau.

Bảng xuất ra


Từ bảng ANOVA so sánh:

|Frow| = 1.9966 < Fcrit
H1

row

|Fcolums| = 0.1106 < Fcrit
thiết H2

= 3.8625 nên chấp nhận giả thiết

columns

= 3.8625 nên chấp nhận giả

 Kết luận: Thu nhập các ngành chính bằng nhau và thu
nhập các ngành phụ bằng nhau



×