Tải bản đầy đủ (.docx) (11 trang)

Btl xac suat XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (494.05 KB, 11 trang )

Bài 1: Trong một thí nghiệm nghiên cứu ung thư, 162 con chuột được ghép khối u

và chia thành 4 nhóm. Mỗi nhóm được chiếu xạ với cường độ khác nhau. Bảng sau đây
cho kết quả thí nghiệm.
Mức
1
2
3
4
Kết quả
10
32
37
32
Hết khối u
32
9
2
8
Không hết
Với mức = 1%, hãy so sánh tỷ lệ chữa khỏi ung thư của 4 nhóm nói trên.

Bài làm
Nhận xét : Đây là bài toán kiểm định giả thiết về tỷ lệ.
Giả thiết Ho: Tỷ lệ chữa khỏi ung thư trong các nhóm là như nhau.
Thực hiện bài tốn bằng Excel với α = 1%.
Nhập giá trị vào bảng tính:

* Tính các tổng số :
 Tổng hàng:
Chọn F4 và nhập =SUM(B4:E4), dùng con trỏ kéo nút tự điền từ F4 đến F5.


 Tổng cột:
Chọn B6 và nhập =SUM(B4:B5), dùng con trỏ kéo nút tự điền từ B6 đến E6 .
 Tổng cộng:
Chọn F8 và nhập =SUM(F4:F5).
* Tính các tần số lý thuyết:
 Hết khối u:
Chọn B12 và nhập =B6*$F$4/$F$8, dùng con trỏ kéo nút tự điền từ B12 đến E12.
 Không hết:
Chọn B13 và nhập =B6*$F$5/$F$8, dùng con trỏ kéo nút tự điền từ B13 đến E13. *
Áp dụng hàm số CHITEST :
 Chọn B15 và nhập =CHITEST(B4:E5,B12:E13).
 Ta s có được kết quả của P(X>X²).


- Biện luận: P(X>X²) = 4,995e-12 < α = 0,01.
=> Bác bỏ giả thiết Ho.
- Kết luận: Tỉ lệ chữa khỏi ung thư của 4 nhóm là khác nhau.

Bài 2: Một cơ quan khí tượng tiến hành so sánh nhiệt độ cao nhất trong ngày ở

hai lục địa châu Âu và châu Á. Các thành phố lớn trong mỗi lục địa được chọn ngẫu
nhiên và nhiệt độ cao nhất trong ngày 1/7/1996 được ghi lại như sau (đo bằng độ
Fahrenheit):
Châu Âu: Athens: 95, Geneva: 72 , London : 77, Moscow: 86, Rome 88.
Châu Á: Bắc kinh: 91, Jerusalem : 88, New Delhi: 94 , Tokyo : 77, Hongkong: 90
Với độ tin cậy 95%, hãy ước lượng nhiệt độ trung bình cao nhất trong ngày của
châu Âu và của châu Á. Hãy so sánh nhiệt độ trung bình cao nhất trong ngày của hai
châu lục nói trên với mức ý nghĩa 5%. Giả thiết nhiệt độ là biến ngẫu nhiên phân phối
chuẩn.


Bài làm

Nhận xét: Đây là bài tốn phân tích phương sai một yếu tố.
Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của
một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát.
* Giả thiết:
H0: µ1= µ2=…µk <=> ”Các giá trị trung bình bằng nhau”
H1: µ1≠ µ2 <=> ”Có ít nhất hai giá trị trung bình khác nhau”
* Giá trị thống kê: F = (MSF/MSE).
* Biện luận :
Nếu F < Fα (k -1; N-k) => Chấp nhận giả thiết H0.


Nhập giá trị vào bảng tính :

Vào Data Analysis, chọn Anova: Single Factor.
Cách tạo Data Analysis:
Bước 1:  Vào File >> Options
Bước 2: Tiếp theo bạn chọn Add-Ins >> Analysis ToolPak và nhấn Go.
Bước 3: Một hộp thoại hiện ra bạn check Analysis ToolPak và nhấn OK.
Bước 4: Như vậy là Data Analysis đã được thêm vào trong mục Data của bạn, bạn có
thể click Datavà sẽ thấy Data Analysis bên góc phải.

Trên màn hình sẽ hiện lên hộp thoại của Anova: Single Factor.
Ta nhận các thơng số như hình bên dưới:
-Phạm vi các biến số Y(Input Range):ta kéo chuột từ A3 tới ô B8.
-Alpha: 0.05
-Group by: columns
-Tọa độ đầu ra (Output Range):kích chuột vào A9.



được kết quả sau:

Ta

Biện luận:
Ta thấy F = 0769475 < F0,05 = F crit = 5,317655
 Chấp nhận giả thuyết H0 ở mức 5%

Bài 3: Tính tỉ số tương quan của Y đối với X, hệ số tương quan, hệ số xác định

của tập số liệu sau đây. Với mức ý nghĩa 5%, hãy kết luận v mối tương quan giữa X và Y
(Có phi tuyến khơng? Có tuyến tính khơng?). Tìm đường hồi quy của Y đối với X.
x
1,32
0,95
1,45
1,3
1,32
1,2
0,95
1,45
1,3
y
0,37
-0,70 0,55
0,35
0,3
0,32
-1,70 0,75

1,3


Bài làm
Nhận xét: Đây là bài tốn phân tích tương quan.
(i) Phân tích tương quan tuyến tính.
Nhập giá trị vào bảng tính:

 Thiết lập bảng Correlation.
Vào Data /Data analysis , chọn Correlation.


Trong hộp thoại Correlation lần lượt ấn định:
 Phạm vi đầu vào: Input Range, quét vùng (A3:B12).
 Cách nhóm theo hang hay cột: Group By, chọn Columns (nhóm theo cột).
 Chọn Labels in first row (nhãn dữ liệu ở hàng đầu).
 Phạm vi đầu ra: Output Range, chọn ô D6.

Nhấn OK, ta có bảng kết quả sau:

Ta tìm được hệ số tương quan: r = 0,84043.
2
Và hệ số xác định: r = 0,70632.
* Giả thiết Ho : X và Y khơng có tương quan tuyến tính.
Ta có: T = 4,10307 với
Mà: c = 2,365.
T n2

r


1 r

2


(c là phân vị mức α/ = 0.025 của phân bố Student với n – 2 = 7 bậc tự do).
Vì |T| > c nên có cơ sở bác bỏ giả thiết Ho.
Vậy: Kết luận được X và Y có tương quan tuyến tính.

(i) Phân tích tương quan phi tuyến.
(ii) Phân tich hồi quy tuyến tính.

Giả thiết Ho : X và Y hồi quy tuyến tính.

Vào Data /Data analysis, chọn Regression.

Trong hộp thoại Regression lần lượt ấn định:
 Phạm vi đầu vào: Input Y Range, quét vùng (B3:B12).
Input X Range, quét vùng (A3:A12).
 Chọn Labels (thêm nhãn dữ liệu).
 Phạm vi đầu ra: Output Range, chọn ô I3.
 Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy.


Sau đó nhấn OK ta có kết quả :

Kết luận : Đường hồi quy của Y đối với X là : Y=3,949351X-4,761189

X Line Fit Plot
2


Y

1
Y

0
1.32 0.95 1.45

1.3 1.32

1.2

0.95

1.45 1.3

-1
-2

X

Sai số tiêu chuẩn của đường hồi quy : 0,51
Ta thấy: F = 16,8 > c = 5,59
(tra bảng phân tố Fisher với bậc tự do (1,7) ở mức α = 0,05)
Vậy: có hồi quy tuyến tính giữa Y với X.

Predicted Y



Bài 4: Trên cơ sở tập số liệu sau đây hãy phân tích xem tỷ lệ đỗ loại giỏi có phụ

thuộc vào trường phổ thông và ban hay không với α = 0,05. Ở đây z là tỷ lệ đỗ loại giỏi
(%); f là trường phổ thông số 1, 2, 3,4; g là ban (1 = ban A, 2 = Ban B)
stt

z

f

g

stt

z

f

g

1

38

1

1

9


35

3

2

2

38

1

1

10

32

3

1

3

42

1

2


11

33

3

1

4

42

1

2

12

34

3

2

5

41

2


1

13

31

4

1

6

42

2

2

14

33

4

1

7

44


2

1

15

33

4

2

8

45

2

2

16

35

4

2

Bài làm
Nhận xét: Đây là bài tốn phân tích phương sai hai yếu tố có lặp.

S phân tích này nhằm đánh giá s ảnh hưởng của hai yếu tố trên các giá trị
quan sát Yij(i=1, 2…r: yếu tố A; j= 1 ,2…c: yếu tố B).
* Giả thiết:
H0: µ1= µ2=…µk <=> ”Các giá trị trung bình bằng nhau” H1: µ1≠ µ2 <=> ”ít
nhất hai giá trị trung bình khác nhau”
* Giá trị thống kê:
FR = (MSB)/(MSE) và FC = (MSF)/(MSE)
* Biện luận:
Nếu FR < Fα[b-1,(k-1)(b-1)] => chấp nhận H0(yếu tố A)
Nếu FC < Fα[b-1,(k-1)(b-1)] => chấp nhận H0(yếu tố B)
Ta giả thiết H01: yếu tố Ban không ảnh hưởng đến tỷ lệ đỗ loại giỏi của trường.
Ta giả thiết H02: yếu tố trường phổ thông không ảnh hưởng đến tỷ lệ đỗ loại giỏi của trường
đó.
Nhập giá trị vào bảng tính:


Vào Data Analysis

Chọn Anova: Two-Factor With Replication => sẽ hiện lên hộp thoại
Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor With Replication
Ta nhập vào các thông số như hình bên dưới
-Phạm vi của biến số Y(Input Range):ta kéo chuột từ ô A3 tới ô E7
-Tọa độ đầu ra (Output Range):kích chuột vào ơ G3

Ta được kết quả như sau:


Biện luận:
Ta thấy FR = 11,571429 > F0.05 = 5,317655 => Bác bỏ giả thiết H01
FC = 55,380952 > F0.05 =4,066181=> Bác bỏ giả thiết H02

Vậy cả 2 yếu tố Ban và trường phổ thông đều ảnh hưởng đến tỷ lệ đỗ loại
giỏi của các trường.



×