Tải bản đầy đủ (.pdf) (30 trang)

BÁO cáo bài tập lớn môn xác SUẤT THỐNG kê hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố ph (a), nhiệt độ (b) và chất xúc tác (c) được

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (16.76 MB, 30 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍNH MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
……………⁂……………

BÁO CÁO BÀI TẬP LỚN
MÔN XÁC SUẤT THỐNG KÊ
Giáo viên hướng dẫn : NGUYỄN ĐÌNH HUY
Sinh viên : Trần Thị Ngọc Phượng
MSSV : 1914789
Nhóm 7 - Lớp: L15

1


MỤC LỤC

CÂU 1A:............................................................................................................................. 3
1. Đề bài :.......................................................................................................................... 3
2. Dạng bài: Phân tích phương sai 3 yếu tố...................................................................... 3
3. Cơ sở lý thuyết:............................................................................................................. 3
4. Giải toán bằng phần mềm IBM SPSS........................................................................... 4
CÂU 1B:............................................................................................................................. 8
1. Đề bài:........................................................................................................................... 8
2. Dạng bài: hồi quy tuyến tính đa tham số.......................................................................9
3. Cơ sở lí thuyết:.............................................................................................................. 9
4.Giải toán bằng phần mềm IBM SPSS.......................................................................... 10
CÂU 2:.............................................................................................................................. 19
1. Đề bài:......................................................................................................................... 19
2. Dạng bài: Phân tích phương sai 1 yếu tố.................................................................... 19
3. Cơ sở lý thuyết:........................................................................................................... 19
4. Giải bài toán bằng phần mềm EXCEL........................................................................19


CÂU 3:.............................................................................................................................. 20
1. Đề bài:......................................................................................................................... 20

2. Dạng bài: Kiểm định tính độc lập............................................................................................ 21

3. Cơ sở lý thuyết:........................................................................................................... 21
4. Giải toán bằng phần mềm EXCEL..............................................................................21
CÂU 4:.............................................................................................................................. 24
1. Đề bài: ........................................................................................................................ 24
2. Dạng bài: Kiểm định về phân bố.................................................................................25
3. Cơ sở lý thuyết:........................................................................................................... 25
4. Giải toán bằng phần mềm EXCEL..............................................................................25
CÂU 5............................................................................................................................... 28
1. Đề bài: ........................................................................................................................ 28
2. Dạng bài: Phân tích phương sai 2 yếu tố khơng lặp....................................................28
3. Cơ sở lý thuyết:........................................................................................................... 28
4. Giải toán bằng phần mềm EXCEL..............................................................................28

2


BÀI TẬP LỚN SỐ 7:
CÂU 1A:
1. Đề bài :
Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố:
pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố B

Yếu tố A


B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2
12
C3
15
C4
12
C1
10
A3
C3
13
C4
14
C1
11
C2

14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng
2. Dạng bài: Phân tích phương sai 3 yếu tố
3. Cơ sở lý thuyết:
- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 2 yếu tố trên các giá trị
quan sát G (i=1, 2, ….r: yếu tố A; j=1, 2, ….r: yếu tố B; k=1, 2, ….r: yếu tố C).
- Mơ hình:
Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mơ
hình vng la tinh n x m. Ví dụ mơ hình vng la tinh 4 x 4.
B
C
D
A

C
D
A
B

D
A

B
C

A
B
C
D

Mơ hình vng la tinh 3 yếu tố được trình bày như sau:
Yếu tố B

Yếu tố
A

B1

B2

B3

B4

A1

C1

C2

C3


C4

A2

C2

C3

C4

C1

A3

C3

C4

C1

C2

A4

C4

C1

C2


C3

3


Bảng ANOVA
Bậc tự do

Tổng số bình phương

Yếu tố
A
(hàng)
Yếu tố
B
(cột)

Bình phương trung
bình

Giá trị
thống kê

Yếu tố
C
Sai số
Tổng
cộng
Trắc nghiệm
- Giả thiết:

⬄ “Các giá trị trung bình bằng nhau”

⬄ “Có ít nhất hai giá trị trung bình khác nhau”
- Giá trị thống kê FR, FC, F
- Biện luận:
Nếu

-> Chấp nhận H0(Yếu tố A)

Nếu

-> Chấp nhận H0(Yếu tố B)

Nếu

-> Chấp nhận H0(Yếu tố C)

4. Giải toán bằng phần mềm IBM SPSS
Bước 1: Đặt giả thiết:
H1: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào pH (Yếu tố
pH không ảnh hưởng đến hiệu suất phản ứng trung bình).
: Tồn tại 2 pH có hiệu suất phản ứng trung bình khác nhau.
H2: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào nhiệt độ (Yếu
tố nhiệt độ không ảnh hưởng đến hiệu suất phản ứng trung bình).
: Tồn tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau.

4


H3: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào chất xúc tác

(Yếu tố chất xúc tác không ảnh hưởng đến hiệu suất phản ứng trung bình).
: Tồn tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau.
Bước 2: Khai báo biến dữ liệu trong cửa sổ Varible view:

Bước 3: Nhập số liệu vào cửa sổ Data view:

Bước 4: Chọn Analyze → General Linear Model → Univariate
5


Bước 5: Đưa biến Hieusuatphanung vào khung Dependent Variable; đưa các biến pH,
Nhietdo và Chatxuctac vào khung Fixed Factor(s).

6


Bước 6: Chọn Model → Build terms → đưa các biến pH, Nhietdo và Chatxuctac vào
khung Model → Continue.

Bước 7: Chọn Options, nhập mức ý nghĩa ở ô Significance level = 0,05 → Continue.

Bước 8: Kết quả và biện luận.

7


- Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do [ (r-1);(r-1)(r-2)]=(3;6)
ta được F0,05(3;6)=4,76 ( dị bảng VIII trang 201 Giáo trình với n1=3, n2=6)
- Bảng Test of Between-Subjects Effects cho ta kết quả:F0,05(3;6)=4,76


( hoặc

) → Chấp nhận giả thiết H1(pH)

( hoặc

) → Bác bỏ giả thiết H2(Nhietdo)

(
) → Bác bỏ giả thiết H3(Chatxuctac)
Bước 9: Kết luận:
- Yếu tố pH không ảnh hưởng đến hiệu suất phản ứng trung bình..
- Tồn tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau.
- Tồn tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau.
CÂU 1B:
1. Đề bài:
Người ta đã dùng ba mức nhiệt độ gồm 105, 120, 135℃ kết hợp với ba khoảng thời gian
là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%)
được trình bày trong bảng sau đây:
Thời gian (phút) X1
Hiệu suất (%) Y
Nhiệt độ (℃) X2
105
1.87
15
30

105

2.02


60

105

3.28

15

120

3.05

30

120

4.07

60

120

5.54

15

135

5.03


30

135

6.45
8


135

60

7.26

Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu
suất của phản ứng tổng hợp? Nếu có thì điển kiện nhiệt độ 115℃ trong vịng 50 phút
thì hiệu suất phản ứng sẽ là bao nhiêu?
2. Dạng bài: hồi quy tuyến tính đa tham số
3. Cơ sở lí thuyết:
Chúng ta xem xét mối liên hệ tuyến tính giữa một biến phụ thuộc Y và các biến độc lập
Xi (i = 1, 2,...k). Đồ thị phân tán giữa các biến là một gợi ý cho chúng ta loại hàm số tốn
học thích hợp để mơ tả và tóm tắt các dữ liệu quan sát.
Phương trình tổng quát:
Bảng ANOVA:
Nguồn sai
số

Bậc tự do


Tổng số bình
phương

Bình phương trung
bình

Giá trị thống


Hồi quy
Sai số
Tổng cộng
Giá trị thống kê
Giá trị R bình phương:
Giá R2được hiệu chỉnh( Adjusted R Square)

Giá trị được R2 hiệu chỉnh (Adjusted R Square)

(R2ii sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ )
Độ lệch chuẩn:
(S≤ 0,30 là khá tốt)

Trắc nghiệm thống kê:
Đối với một phương trình hồi quy YX=B0 +BX, ý nghĩa thống kê của các hệ số Bi (B0
hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích
hợp của phương trình YX=f(X) được đánh giá bằng trắc nghiệm F (phân bố Fischer).
Trắc nghiệm t:
- Giả thiết:
“Các hệ số hồi quy khơng có ý nghĩa”


9


“Có ít nhất vài hệ số hồi quy có ý nghĩa”
Bậc tự do của giá trị t:

.

- Giá trị thống kê:
Phân bố Student
Biện luận: Nếu
Trắc nghiệm F
Giả thiết:

→Chấp nhận giả thiết H0

“Phương trình hồi quy khơng thích hợp”.
“Phương trình hồi quy thích hợp” với ít nhất vài Bi.
���
Giá trị thống kê: .F=���
Phân bố Fischer v1=k, v2= N−k−1
Biện luận:
Nếu F< Fα(k, N−k−1) →Chấp nhận giả thiết H0
4.Giải toán bằng phần mềm IBM SPSS
Bước 1: Đặt giả thiết:
H: “Hệ số tự do và hệ số góc khơng có ý nghĩa thống kê”
: “Hệ số tự do và hệ số góc có ý nghĩa thống kê”
H0: “Phương trình hồi quy khơng thích hợp”
: “Phương trình hồi quy là thích hợp”
Bước 2: Khai báo biến dữ liệu trong cửa sổ Variable View.


10


Bước 3: Nhập số liệu vào cửa sổ Data View:

Bước 4: Chọn Analyze → Regression → Linear Regression

Bước 5: Hộp thoại Linear Regression hiện lên, nếu:
+ Tìm phương trình YX1=f(X1), ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập
X1, vào ô Independent(s).

11


+ Tìm phương trình YX2=f(X2), ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập
X2, vào ô Independent(s).

+ Tìm phương trình
độc lập X1, X2 vào ơ Independent(s).

, ta đưa biến phụ thuộc Y vào ô Dependent, biến

12


Bước 6: Chọn Statistics → click chọn R squared change và Descriptives…→Continue
Với mức ý nghãi mặc định là 0,05 chọn OK.

Bước 7: Vẽ đồ thị: trong cửa sổ Output chọn Graphs → Legacy Dialogs →

Scatter/Dot... → Simple Scatter →Define

13


Bước 8: Chọn biến tương ứng hai trục X, Y→OK

14


Bước 9: Kết quả và biện luận:
*Phương trình hồi quy: :YX1=f(X1)

15


Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số : B0=2,73 và B1=0,045
Suy ra phương trình hồi quy:
Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (1; N-k-1) = (1; 7) (N = 9 và
k = 1 là số biến độc lập), ta được F0.05(1;7) = 5,59
Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 7 (N = 9 và k = 1
là số biến độc lập), ta được t0.025 = 2,365
t0 = 2,129 < t0,025 = 2,365 (Hay Sig. = 0,071 > = 0,05) → Chấp nhận giả thiết H
t1 =1,381 < t0,025 = 2,365 (Hay Sig. = 0,21 > = 0,05) → Chấp nhận giả thiết H
F = 1,908 < F0,05 = 5,59 (Hay Sig. = 0,21 > = 0,05) → Chấp nhận giả thiết H0
Kết luận:
- Vậy các hệ số 2,37(B0); 0,045(B1) của phương trình hồi quy YX1=2,73+0,045X1 đều
khơng có ý nghĩa thống kê.
- Phương trình hồi quy khơng thích hợp.
- Yếu tố thời gian khơng có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.

*Phương trình hồi quy: YX2=f(X2)

16


Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 7 (N = 9 và k = 1
là số biến độc lập), ta được t0.025 = 2,365
t0 = 3,415 > t0,025 = 2,365 (Hay Sig.= 0,011 < = 0,05) → Bác bỏ giả thiết H
t1 =4,754 > t0,025 = 2,365 (Hay Sig.= 0,002 < = 0,05) → Bác bỏ giả thiết H
F = 22,598 > F0,05 = 5,59 (Hay Sig.= 0,002 < = 0,05) → Bác bỏ giả thiết H0
Kết luận:
- Vậy các hệ số -11,14 (B0); 0,13 (B2) của phương trình hồi quy
17


YX2 = -11,14 + 0,13X2 đều có ý nghĩa thống kê.
- Phương trình hồi quy này thích hợp.
- Yếu tố nhiêt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
*Phương trình hồi quy:

Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số:B0= -12,7 và B1= 0,045 và
Suy ra phương trình hồi quy:

Dị bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (2; N-k-1) = (2; 6) (N = 9 và
k = 2 là số biến độc lập), ta được F0.05(2;6) = 5,14
Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 6 (N = 9 và k = 2
là số biến độc lập), ta được t0.025 = 2,447
t0 = 11,519 > t0,025 = 2,447 (Hay Sig.= 0,000026 < = 0,05) → Bác bỏ giả thiết H
t1 = 7,582 > t0,025 = 2,447 (Hay Sig. = 0,000274 < = 0,05) → Bác bỏ giả thiết H
t2 = 14,328 > t0,025 = 2,447 (Hay Sig. = 0,000007 < = 0,05) → Bác bỏ giả thiết H

F = 131,204 > F0,05 = 5,14 (Hay Sig.= 0,000011 < = 0,05) → Bác bỏ giả thiết Ho
Kết luận:
- Vậy các hệ số -12,70 (B0); 0,045 (B1); 0,13 (B2) của phương trình hồi quy
YX1X2= -12,70 + 0,045X1 + 0,13X2 đều có ý nghĩa thống kê.
- Phương trình hồi quy này thích hợp.
18


- Hiệu suất suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là nhiệt
độ và thời gian.
- Hiệu suất phản ứng trong điều kiện nhiệt độ 115℃ trong vòng 50 phút là:

CÂU 2:
1. Đề bài:
Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên các cây cà
chua và theo dõi số quả cà chua mọc trên mỗi cây, kết quả thu được như sau:
Loại phân
A
B
C
24
21
16
18
26
22
27
32
19
28

25
17
Với mức ý nghĩa 5%, hãy so sánh số quả cà chua mọc trung bình khi bón 3 loại phân A,
B, C nói trên.
2. Dạng bài: Phân tích phương sai 1 yếu tố
3. Cơ sở lý thuyết:
4. Giải bài toán bằng phần mềm EXCEL
Bước 1: Đặt giả thiết:
H0: Số quả cà chua mọc trung bình khi bón 3 loại phân A, B, C là bằng nhau.
H1: Tồn tại 2 loại phân khi bón có số quả cà chua mọc trung bình khác nhau.
Bước 2: Nhập bảng số liệu:

Bước 3: Chọn Data → Data Analysis → Anova: Single – Factor

2.

19


Bước 4: Input range: quét vùng số liệu, Grouped By: Rows, Anpha: 0,05, chọn labels in
first Column, Ouput range: chọn địa chỉ ô cần xuất dữ liệu → OK

Bước 5: Kết quả và biện luận.

F = 3,8557 < Fcrit = 4,2565 (hay P-value = 0,0617 > = 0,05) → Chấp nhận giả thiết H0
Bước 6: Kết luận: - Số quả cà chua mọc trung bình khi bón 3 loại phân A, B, C là bằng
nhau.
CÂU 3:
1. Đề bài:
Cho bảng số liệu về màu tóc của 422 người sau:

Màu tóc
Nam
Đen
56
Hung
37
Nâu
84
Vàng
19

Nữ
32
66
90
38

20


Với mức ý nghĩa 3%, nhận định xem số liệu có mối quan hệ giữa màu tóc và giới tính
hay khơng?
2. Dạng bài: Kiểm định tính độc lập
3. Cơ sở lý thuyết:
4. Giải toán bằng phần mềm EXCEL
Bước 1: Đặt giả thiết:
H0: Màu tóc và giới tính độc lập với nhau.
H1: Màu tóc và giới tính phụ thuộc nhau.
Bước 2: Nhập bảng số liệu:


Bước 3: Tính tổng hàng, tổng cột:
Quét bảng số liệu dư 1 hàng 1 cột:

Vào Formulas → chọn Autosum

Kết quả:

Bước 3: Lập bảng tần số lý thuyết:

21


Tần số lý thuyết được tính theo cơng thức:
TSLT=

�ổ�� ℎà��× �ổ�� �ộ�
�ổ�� �ộ��

Qt 8 ơ có chứa các giá trị tần số lý thuyết cần tìm:

Sử dụng tổ hợp phím F2 + (Ctrl Enter)
Kết quả:

Bước 4: Tính P – Value:
Vào Formulas → chọn Insert Function

22


Gõ CHITEST vào thanh tìm kiếm hàm → Go


Chọn hàm CHITEST → OK

23


Actual_Range: quét vùng số liệu đề bài, Expected_Range: quét vùng tần số lý thuyết →
OK

Bước 5: Kết quả và biện luận:

p-value = 0,0002 < α=0,03 → Bác bỏ giả thiết H0
Bước 6: Kết luận: - Màu tóc và giới tính có mối quan hệ với nhau.
CÂU 4:
1. Đề bài:
Tiến hành thăm dị ba nhóm xã hội khác nhau: cơng nhân, nơng dân, trí thức. Kết quả
cuộc thăm dị như sau:
Tầng lớp
Cơng nhân
Nơng dân
Trí thức
Tổng số
Ý kiến
Tăng
Như cũ
Giảm
Khơng ý kiến
Tổng số

100

200
50
30
380

300
400
80
70
850

20
30
5
5
60

420
630
135
105
1290

Với mức ý nghĩa 2%, có sự khác nhau về ý kiến trong các tầng lớp xã hội trên hay không?
24


2. Dạng bài: Kiểm định về phân bố
3. Cơ sở lý thuyết:
4. Giải toán bằng phần mềm EXCEL

Bước 1: Đặt giả thiết:
H0: Phân bố tỷ lệ về các ý kiến giữa các tầng lớp là như nhau.
H1: Tồn tại 2 tầng lớp có phân bố tỷ lệ về các ý kiến là khác nhau.

Bước 2: Nhập bảng số liệu:

Bước 3: Lập bảng tần số lý thuyết:
Tần số lý thuyết được tính theo cơng thức: TSLT=

�ổ�� �ộ� ×�ổ�� ℎà��
�ổ�� �ộ��

Qt 12 ô có chứa các giá trị tần số lý thuyết cần tìm:

Sử dụng tổ hợp phím F2 + (Ctrl Enter)

25


×