Tải bản đầy đủ (.docx) (32 trang)

So 9 XÁC SUẤT THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (703.42 KB, 32 trang )

1

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP. HỒ CHÍ MINH
KHOA KHOA HỌC ỨNG DỤNG
BỘ MƠN TỐN ỨNG DỤNG
…….oOo…….

BÁO CÁO BÀI TẬP LỚN
XÁC SUẤT THỐNG KÊ
Đề tài 9
GVHD: NGUYỄN KIỀU DUNG
Nhóm: 9
1.
2.
3.
4.
5.
6.
7.
8.

Nguyễn Đức Duy - 1410579 - L06
Bùi Duy Khánh - 1411750 - L01
Hồ Việt Long - 1412075 - L01
Ngô Quang Nghĩa - 1414919 -L01
Trần Minh Nhựt - 1412783 -L01
Lương Ngọc Thuận - 91303997 - L01
Ngô Điền Trung - 1414289 - L01
Trần Tri Văn -1414609 - L01
1



2

Tp.HCM, Ngày 05 tháng 05 năm 2016

Mục lục......................................................................................................................................2
Bài 1.............................................................................................................................................3
1. Thực hiện phương pháp phân tổ dữ liệu (A).............................................3
2. Vẽ đồ thị phân phối tần số và đa giác tần số (A).......................................5
3. Tính các đặc trưng mẫu và ước lượng giá trị trung bình của
dấu hiệu quan sát vớiđộtin cậy 95% (A)...................................................7
4. Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồthị.................9
Bài 2.............................................................................................................................................12
Bài 3.............................................................................................................................................16
Bài 4.............................................................................................................................................21
Bài 5.............................................................................................................................................26
1. Tìm hệ số tương quan giữa X,Y................................................................27
2. Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay khơng? Nếu
có, hãy ước lượng đường hồi quy tuyến tính Y theo X.............................28
3. Tìm hệ số xác định ...............................................................................31

2


3

Bài 1:
Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu
đó cho các yêu cầu sau:
1) Thực hiện phương pháp phân tổ dữ liệu (A).

2) Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với
độ tin cậy 96% (A).
4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài làm:
_ Dạng bài: Thống kê mô tả.
_ Dữ liệu (A): Khảo sát số testcase(testcase: các trường hợp để kiểm tra code của sinh viên trong
bài tập) đúng của 40 sinh viên khoa máy tính khi học Kĩ thuật lập trình ta có bảng số liệu:

_ Dữ liệu (B): Phân ngành sinh viên khoa Máy tinh K14 trường Đại học Bách Khoa thành phố Hồ
Chí Minh.

1) Thực hiện phương pháp phân tổ dữ liệu A:
_ Nhập dữ liệu (A) vào Excel:
3


4

1

+ Xác định số tổ cần chia: k = (2 x n) 3
Chọn ô A6 nhập vào biểu thức =(2*Count(A1:J4))^(1/3)
Kết quả 4.31
Chọn k = 4
+ Xác định trị số khoảng cách h theo công thức: h =

( Xmax −Xmin)
k


Chọn ô A7 nhập vào biểu thức =(Max(A1:J4)-Min(A1:J4))/4
Kết quả 20
Chọn h = 20
+ Ta xác định được các cận trên và cận dưới các tổ lần lượt là:
. Tổ 1: 12 – 32
. Tổ 2: 32 – 52
. Tổ 3: 52 – 72
. Tổ 4: 72 – 92
 Nhập vào các ô từ A9 đến A13 lần lượt các giá trị:

Chọn chức năng Data/ Data Analysis/Histogram.
+ Input Range: địa chỉ tuyệt đối chứa dư liệu.
+ Bin Range: địa chỉ chứa bảng phân nhóm.
4


5

+ Output options: vị trí xuất kết quả.
+ Confidence Level for Mean: độ tin cậy cho trung bình.
+ Chọn Cumulative Percentage để tính tần suất tích lũy nếu khơng Excel chỉ
tính tần số.

 Kết quả(đã chỉnh lại các tên miền):

2) Vẽ đồ thị phân phối tần số và đa giác tần số (A):
_ Vẽ đồ thị phân phối tần số:
+ Quét chọn bảng tần số B2:B5
5



6

+ Dùng chức năng Insert Column Chart trên menu Insert.

 Kết quả sau khi chỉnh sửa:

_ Vẽ đa giác tần số:
+ Sử dụng bảng phân phối tần số của dữ liệu (A):
+ Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số:

6


7

+ Quét chọn B2:B7, dùng chức năng Insert Line Chart trên menu Insert

 Kết quả sau chỉnh sửa

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ
tin cậy 95% (A).
_ Nhập dữ liệu vào bảng tính:

7


8

_ Chọn chức năng Data/Data Analysis/Descriptive Statistics.

+ Input Range: địa chỉ tuyệt đối chứa dư liệu.
+ Output options: vị trí xuất kết quả.
+ Confidence Level for Mean: độ tin cậy cho trung bình.

8


9

 Kết quả nhận được:

4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
_ Nhập dữ liệu vào bảng tính:
9


10

_ Tính tỉ lệ sinh viên cho các ngành:
Nhập vào C3: =B3/$B$10, copy cho các ơ cịn lại.

_ Vẽ biểu đồ đứng thể hiện số lượng sinh viên ở các chuyên ngành.
+ Quét chọn cột Số sinh viên (B3:B9)
+ Dùng chức năng Insert /Insert Column Chart/2-D Column trên menu Insert.

10


11


 Kết quả thu được:

_ Vẽ biểu đồ tròn thể hiện tỉ lệ sinh viên ở các chuyên ngành.
+ Quét chọn cột Số sinh viên (C3:C9)
+ Dùng chức năng Insert/Insert Pie/2-D Pie trên menu Insert

 Kết quả thu được:
11


12

Bài 2:
Hai máy cùng gia công một loại chi tiết. Để kiểm tra xem 2 máy này có c ủng đ ộ chính xác
như nhau hay khơng, người ta lấy ngẫu nhiên từ mỗi máy 7 chi ti ết, đem đo và thu đ ược k ết
quả sau (đơn vị mm):
Máy A
137
138
135
140
138
137
139
Máy B
142
135
140
138
136

138
141
Có thể cho rằng 2 máy có độ chính xác như nhau hay khơng, với mức ý nghĩa 2%? Giả thiết
rằng kích thước chi tiết có phân phối chuẩn.
Bài làm:
 Dạng bài: Kiểm định giảthuyết cho phương sai hai tổng thể.
 Công cụ: F-Test Two-Sample for Variances


Cơ sở lý thuyết: Khi cần kiểm định hai tổng thểcó mức độ đồng đều
nhưnhau hay không chúng ta dùng phương pháp kiểm đ ịnh ph ương sai c ủa
hai tổng thể độc lập dựa trên một đại lượng F như sau:

Trong đó:

S1 l à phương sai của mẫu thứ nhất, mẫu này có cỡ n1
S2 là phương sai của mẫu thứ hai, mẫu này có cỡ n2.

- Thơng thường để xác định mẫu nào là mẫu thứ nhất và mẫu nào là mẫu thứ hai ta
làm như sau, trong khi tính đại lượng F thì giá trị phương sai lớn hơn sẽ được
12


13

đặt ở tử số,và như vậy mẫu tương ứng với phương sai đó là mẫu thứnhất.
- Giả thiết đặt ra là kiểm định hai bên:
H

:


vàH1:

0

- Nếu tỉ số F rất lớn hoặc rất nhỏ ta có thể suy diễn bằng hai phương sai tổng thể
khó mà bằng nhau, ngược lại nếu tỉ số này gần đến 1 ta sẽ có bằng chứng ủng h ộ gi ả
thuyết HoNếu tổng thể lấy mẫu được giả định có phân phối bình thường thì tỉ lệ F có phân
phối xác suất gọi tên là phân phối Fisher. Các giá trị tới hạn của phân ph ối F ph ụ thuộc và
hai giá trị bậc tự do, bậc tự do tử số (d𝑓1=n1-1 gắn liền với mậu thứ nhất và bậc tự do mẫu
số gắn liền với mẫu thứ hai (d𝑓2=n2-1)
Quy tắc thực sự để bác bỏ 𝐻o với kiểm định hai bên khi d𝑓1=n1-1 và d𝑓2=n2-1 mức ý nghĩa α
là: giả thiết 𝐻0 bị bác bỏ nếu giá trị kiểm định F lớn hơn giá trị tới hạn trên FU=Fdf1;df2;α/2
của phân phối F hoặc bé hơn giá trị tới hạn dưới FL=Fdf1;df2;α/2 tức là FttFtt>Fdf1;df2;α/2
-

Nếu chúng ta kiểm định bên phải:
H

0

Quy t ắ c bác b ỏ 𝐻o là khi





:


vàH1:

Ftt>FU(n1-1;n2-1;α)

Giá tr ị th ố ng kê:

Gi ả thi ết:

H0 : σ2 1

. Phân phối Fischer:

=



σ2 2

Y1=N1 -1

H1 : σ21

>

σ 22

Y2=N2 -1

 Biện luận:
Nếu F


13


14

 Nhập dữ liệu vào bảng tính:

 Vào Data/ Data Analysis/ F-Test Two-Sample for Variances.

14


15
ọChụn các mưc như hình:
+ Input: địa chỉ tuyệt đối chứa dư liệu tương ứng của mẫu 1 và 2.
+ Output options: vị trí xuất kết quả.
+ Apha:mức ý nghĩa α (chọn tại ô alpha)



Kết quả

15


16




Biện luận
 Giả thiết:

+ Ho : σ12 = σ22 “ độ chính xác chi tiết của 2 máy là giống nhau ”.
+ H1 : σ12> σ22 “ độ chính xác chi tiết của 2 máy là khác nhau ”.

F=0.388489 > F0.02=0.15643  Bác bỏ giả thuyết 𝐻o , chấp nhận giả thuyết H1
Kết luận : Độ chính xác chi tiết của máy là khác nhau
.

Bài 3: Theo giới thiệu của nhà phân phối, mức tiêu thụ nhiên liệu trung bình c ủa 4 lo ại
xe ô tô là như nhau. Sau một thời gian ch ạy xe, người ta đo l ại trên các quãng đ ường
như nhau thì được kết quả sau:
Loại xe

Mức tiêu thụ nhiên liệu

I

20

21,2

18,7

19,5

20,1

22


21

II

21,2

21,2

20,4

19.6

22

21,1

20

III

21,5

21,2

21

21,5

22


20,7

IV

19,9

22

21

23

21,2

20,6

21,7

21,3

Có thể coi mức tiêu thụ nhiên liệu của 4 loại xe này cịn gi ống nhau hay khơng, v ới m ức
ý nghĩa 4%? Tìm hệ số xác định R2 của bài tốn và giải thích ý nghĩa của nó.
Bài làm:
 Dạng bài: Kiểm định giá trị trung bình một nhân tố.


Phương pháp giải: Phân tích phương sai một nhân tố.




Cơng cụ giải: Anova single factor.



Cơ sở lý thuyết:
Giả sử nhân tố A có k mức X1, X2, …,Xk với Xj có phân phối chuẩn N(a,σ2) có mẫu
điều tra:

16


17
X1

X2

X11

X12

X21

X22





Xn(1)1


Xn(2)2



Xk
X1k



X2k

Xn(k)k

Với mức ý nghĩa α ta kiểm định giả thiết:
- H0: a1=a2=…=ak
H1: “Tồn tại j1≠j2 sao cho aj1≠aj2
Đặt:

- Tổng quan sát:
- Trung bình mẫu thứ j (j=1,2,…,k):

v ới

- Trung b ìnhchung

v ới
- Tổng bình phương độ lệch do nhân tố Sum of Squares for Factor:

- Tổng bình phương độ lệch do sai số Sum of Squares for Error


- Tổng bình phương độ lệch chung Total Sum of Squares:

-

hay SST=SSF+SSE
Trung bình bình phương của nhân tố Mean Square for Error:

Trong đó, k-1 là bậc tự do của nhân tố.
- Trung bình bình phương của sai số Mean Square for Error:

17


18

Tỷ sốF :
- Bảng ANOVA
Nguồn
Nhân tố
Sai số
Tổng số

Tổng bình
phương
SSF
SSE
SST

Bậc tự do

k-1
n-k
n-1

Trung bình
bình phương
MSF
MSE

Tỷ số F
MSF/MSE

So sánh F ở trên với F lý thuyết tra từ bảng phân phối F với k-1 bậc tự do ở t ử
số và n-k bậc tự do ở mẫu số với mức ý nghĩa α, ta kết luận:
-

Nếu F > F lý thuyết, ta bác bỏ Ho.
Nếu F < F lý thuyết, Ho đúng.

Hệ số xác định R2
chính là tỷ lệ hay số phần trăm chiếm trong tổng số
100% của toàn bộ sự sai lệch của Xij so với giá trị trung bình của chúng
Thực hiện bài tốn:



Nhập dữ liệu vào bảng tính.

 Vào Data/ Data Analysis/Anova: Single Factor.
 Chọn các thư mục như hình:

-

Input Range: địa chỉ tuyệt đối chứa dữ liệu.

18


19
-

Output options: vị trí xuất kết quả.
- Alpha: mức ý nghĩa α.



Kết quả:

19


20



Biện luận:
Giả thiết:
H0: Mức tiêu thụ nhiện liệu 4 loại xe là giống nhau.
H1: Mức tiêu thụ nhiên liệu 4 loại xe là khác nhau.
Vì F = 1.284075 < F critical = 3.234466 nên ta giả thiết H0 đúng.



Vậy mức tiêu thụ nhiên liệu của 4 loại xe là giống nhau.
Tính hệ số xác định R2:
Từ bảng “Anova: Single Factor” ta tính được hệ số tương quan R 2theo cơng
thức:
2



Thực hiện trên Excel:
- Chọn ô đưa ra kết quả của R2
- Nhập công thức: =D53/D56
Ta thu được kết quả sau:

20



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×