Tải bản đầy đủ (.docx) (13 trang)

Câu 9 XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (395.53 KB, 13 trang )

Câu 9. Khảo sát hệ số tương quan giữa 2 biến cụ thể, dự
đốn phương trình đường hồi quy tuyến tính giữa chúng
(có hình vẽ minh họa) và nhận xét về mối tương quan giữa
2 biến.
Khảo sát hệ số tương quan giữa 2 biến độ tuổi và chỉ số
cholesterol, dự đốn phương trình đường hồi quy tuyến tính giữa chúng
và nhận xét về mối tương quan giữa 2 lực nén và độ bền nén.

Độ tuổi

Chỉ số Cholesterol
(mg/dl)

63
37
41
56
57
57
56
44
52
57
54
48
49
64
58
50
58
66


43
69
59
44
42
61
40
71
59
51
65
53
41
65
44
54
51

233
250
204
236
354
192
294
263
199
168
239
275

266
211
283
219
340
226
247
239
234
233
226
243
199
302
212
175
417
197
198
177
219
273
213


46
54
54
65
65

51
48
45
53
39
52
44
47
53
53
51
66
62
44
63
52
48
45
34
57
71
54
52
41
58
35
51
45
44
62

54
51
29
51
43
55
51
59
52
58
41
45
60
52
42
67
68
46

177
304
232
269
360
308
245
208
264
321
325

235
257
216
234
256
302
231
141
252
201
222
260
182
303
265
309
186
203
211
183
222
234
220
209
258
227
204
261
213
250

245
221
205
240
250
308
318
298
265
564
277
197


54
58
48
57
52
54
45
53
62
52
43
53
42
59
63
42

50
68
69
45
50
50
64
57
64
43
55
37
41
56
46
46
64
59
41
54
39
34
47
67
52
74
54
49
42
41

41
49
60
62
57
64
51

214
248
255
207
223
288
160
226
394
233
315
246
244
270
195
240
196
211
234
236
244
254

325
126
313
211
262
215
214
193
204
243
303
271
268
267
199
210
204
277
196
269
201
271
295
235
306
269
178
208
201
263

295


43
42
67
76
70
44
60
44

303
209
223
197
245
242
240
226


Cơ sở lý thuyết:
Hệ số tương quan
 Phân tích tương quan: Hai biến số ngẫu nhiên X,Y
có thể liên quan tuyến tính, có khuynh hướng tuyến
tính, hoặc khơng liên quan đến nhau.
 Hệ số tương quan:
R=


√ [n ∑ x

∑ x i y i−∑ x i ∑ y i
i

2

−( ∑ x i ) ] [ n ∑ y i − ( ∑ y )
2

2

2

]

Nếu R > 0 thì X, Y tương quan thuận.
Nếu R < 0 thì X, Y tương quan nghịch.
Nếu R = 0 thì X, Y khơng tương quan.
Nếu | R |= 1 thì X, Y có quan hệ hàm bậc nhất.
Nếu | R |→ 1 thì X, Y có tương quan chặt (tương quan
mạnh).
Nếu | R |→ 0 thì X, Y có tương quan khơng chặt (tương
quan yếu)
Quan hệ giữa X và Y:
Chúng ta muốn kiểm định các giả thiết liên quan đến giả
thiết các giá trị khác nhau của hệ số tương quan tổng thể, ký hiệu
ρ , dựa trên phân phối mẫu của hệ số tương quan mẫu R
Kiểm định giả thiết:
H 0 : ρ=0 đối với H 1: ρ ≠ 0 (hoặc ρ > 0 hoặc ρ<0 ¿

Người ta chứng minh được rằng với giả thiết H 0 , phân phối

mẫu của R đối xứng; từ đó, thống kê
T=R



n−2
1−R2

Student (n−2)

Ước lượng đường hồi quy:


Phương trình hồi quy tuyến tính:
ys

S

= a + bx, a = r Sy , b = y – ax

Kiểm định hệ số a, b:
Giả thiết H 0: Hệ số hồi quy khơng có ý nghĩa (=0).
Giả thiết H 1: Hệ số hồi quy có ý nghĩa (≠0).
Kiểm định phương trình hồi quy:
Giả thiết H 0: “Phương trình hồi quy tuyến tính khơng thích hợp”.
Giả thiết H 1: “Phương trình hồi quy tuyến tính thích hợp”.

Dạng bài: Phân tích tương quan và hồi quy

Phương pháp giải: Dùng tiêu chuẩn student và tiêu chuẩn Fisher
Cơng cụ giải: Correlation, Regression
Giải quyết bài tốn trên Excel:
1. Xác định hệ số tương quan:
Bước 1: Nhập bảng số liệu vào Excel


Bước 2: Sử dụng công cụ “Correlation” trong Data/ Data Analysis


Bước 3: Chọn các mục như hình
* Input: địa chỉ tuyệt đối chứa dữ liệu.
* Output Range: vị trí xuất kết quả.
* Labels in first row

Kết quả:

Kết luận: Dựa vào kết quả trên Excel ta có hệ số tương quan:
R= 0,004060987
Chứng tỏ giữa độ tuổi và chỉ số Cholesterol có quan hệ không chặt
chẽ và tương quan nghịch


2. Dự đốn phương trình đường hồi quy tuyến tính:
Bước 1: Nhập bảng số liệu

Bước 2: Sử dụng công cụ “Regression” trong Data/ Data Analysis

Bước 3: Chọn các mục như hình
* Input: địa chỉ tuyệt đối chứa dữ liệu.



* Output Range: vị trí xuất kết quả.
* Labels in first row

Kết quả:


Bước 4: Biện luận:
Kiểm định hệ số a, b có nghĩa thống kê (a là hệ số tự do, b là hệ số
góc)
* Giả thiết H 0: a, b khơng có ý nghĩa thống kê.
* Giả thiết H 1: a, b có ý nghĩa thống kê.


* P- Value = 0.954731884 > 0.05 → Chấp nh ận H 0. Vậy hệ số tự do
a khơng có ý nghĩa thống kê.
* P – Value = 2.02586E-19 < 0.05 → Bác b ỏ H 0 , chấp nhận H 1. Vậy
hệ số góc b có ý nghĩa thống kê

hợp.

Kiểm định đường hồi quy tuyến tính:
* Giả thiết H 0: Phương trình đường hồi quy tuyến tính khơng thích
* Giả thiết H 1 : Phương trình đường hồi quy tuyến tính thích hợp
* Significance F = 0,990006384 > 0.05 → Chấp nhận H 0
* Kết luận: Phương trình đường hồi quy tuyến tính khơng thích hợp.
3. Nhận xét về mối tương quan giữa độ tuổi và chỉ số Cholesterol:
Bước 1: Nhập bảng số liệu:





×