Tải bản đầy đủ (.docx) (24 trang)

bài tập lớn xác suất thông kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (617.92 KB, 24 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM

ĐỀ TÀI : 10

Giảng viên hướng dẫn : Nguyễn Kiều Dung
Sinh viên thực hiện

:


Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ
liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ
tin cậy 96% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó
hay không.
BÀI LÀM:
Dạng bài:

Thống kê mô tả thời gian tiện phôi cho trước của 40 sinh viên ngành cơ kĩ thuật

Dữ liệu A: Khảo sát thời gian (phút) của .
8
6
10
8


8
3
7
6

10
4
5
4

9
6
7
3

7
5
3
5

8
4
6
8

9
5
9
6


Dữ liệu B: làm đồ án
Đề tài
Máy bay
Máy bơm thủy lực
Kính đi trong mưa
Cầu gỗ
Thuyền chong chóng

Số sinh viên
12
32
26
34
38

1. Thực hiện phương pháp phân tổ dữ liệu A:
 Nhập dữ liệu A vào excel

+Xác định số tổ cần chia :

k=
=(2*COUNT(A1:E4))^(1/3)

Kết quả
Chọn k = 4
+ Xác định trị số khoảng cách h theo công thức: ℎ=

7
3
5

4

4
2
7
9

6
4
3
2


==(MAX(A1:E4)-MIN(A1:E4))/3
Kết quả
Chọn h =2
+ Ta xác định được các cận trên và cận dưới các tổ lần lượt là:
Tổ 1: 2-4
Tổ 2: 4-6
Tổ 3: 6-8
Tổ 4: 8-10
 Nhập các giá trị:

 Chọn chức năng Data/ Data Analysis/Histogram.

+

Input Range: địa chỉ tuyệt đối chứa dư liệu.

+


Bin Range: địa chỉ chứa bảng phân nhóm.

+

Output options: vị trí xuất kết quả.

+

Confidence Level for Mean: độ tin cậy cho trung bình.

+

Chọn Cumulative Percentage để tính tần suất tích lũy nếu không

tính tần số.

Excel chỉ


 Kết quả

 Có thể chỉnh sửa lại như sau

8
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
• +Quét chọn bảng tần số
• Dùng chức năng Insert Column Chart trên menu Insert.
Kết quả:



 Vẽ đa giác tần số:
+ Sử dụng bảng phân phối tần số của dữ liệu (A):
+ Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số:

+ Quét chọn B39:B43, dùng chức năng Insert Line Chart trên menu Insert

 Kết quả sau chỉnh sửa:


3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 96% (A).
 Nhập dữ liệu vào bảng tính:

 Chọn chức năng Data/Data Analysis/Descriptive Statistics.
+

Input Range: địa chỉ tuyệt đối chứa dư liệu.

+

Output options: vị trí xuất kết quả.

+

Confidence Level for Mean: độ tin cậy cho trung bình.


 Kết quả nhận được:


Khoảng ước lượng p: (16.125-1.7666 ; 16.125+1.7666)
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
 Nhập dữ liệu và bảng tính:


 Tính tỉ lệ sinh viên cho các ngành:
Nhập vào C3: =B2/$B$10, copy cho các ô còn lại

 Vẽ biểu đồ đứng thể hiện số lượng sinh viên ở các chuyên ngành.
+

+ Quét chọn cột Số sinh viên (B2:B6)
Dùng chức năng Insert /Insert Column Chart/2-D Column trên menu Insert

 Kết quả thu được:

 Vẽ biểu đồ tròn thể hiện tỉ lệ sinh viên ở các chuyên ngành.
+ Quét chọn cột Số sinh viên (C2:C6)


+

Dùng chức năng Insert/Insert Pie/2-D Pie trên menu Insert

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Giả thiết kiểm định Ho : phù hợp phân phối chuẩn
Giả thiết đối H1: không phù hợp phân phối chuẩn
Ta có χ^20.04(4-2-1) =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W α= (4.2179; +∞)


Kết luận : χ^2 = 3.702592775 nằm ngoài miền bác bỏ nên chấp nhận H 0, vậy số liệu trên là phù hợp
phân phối chuẩn


Bài 2:
Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung bình là 4 kg sơn. Dữ
liệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn cùng một loại xe trong 2 ngày liên
tiếp:
Ngày 1: 3,8 4,2

3,6 4,1

Ngày 2: 4,5 3,8

4,1

3,9 4,3

3,9 4,5

3,8

4,1 3,8
4

3,95 4

4,2

đơn vị: kg.


Hãy kiểm định xem máy phun sơn có sử dụng lượng sơn trung bình khác nhau giữa 2 ngày hay
không, với mức ý nghĩa 1%.
Bài làm:




Dạng bài: Kiểm định trung bình
Phương pháp giải: So sánh 2 trung bình với phương sai bằng nhau
Công cụ giải: t-test:Two-Sample Assuming Equal Variances
Thực hành trên excel:

 Vào Data -> Data Analysis -> t-test:Two-Sample

Assuming Equal Variances


 Kết quả:

GTKĐ : H0 :a1=a2: Máy phun sơn sử dụng lượng sơn trung bình giống nhau giữa 2 ngày
H1: a1 ≠ a2 : Máy phun sơn sử dụng lượng sơn trung bình khác nhau giữa 2 ngày
KL : |t|= -0.409009273 < ta/2 = 3.054539589 nên chấp nhận H 0
Vậy : Máy phun sơn sử dụng lượng sơn trung bình giống nhau giữa 2 ngày

Bài 3:
Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với các
loại tín hiệu khác nhau. Các đối tượng ( 15 nam, 15 nữ) tham gia thí nghiệm được yêu cầu nhấn
nút ngay khi nhận biết có tín hiệu. Đây là bảng số liệu ghi lại thời gian (giây) từ khi tín hiệu
được phát đi cho đến khi đối tượng khảo sát có tín hiệu trả lời.

Âm thanh

Ánh sáng

Xung

Nam

10,0
7,2
6,8
6,0
5,0

6,0
3,7
5,1
4,0
3,2

9,1
5,8
6,0
4,0
5,1

Nữ

10,5
8,8

9,2
8,1
13,4

6,6
4,9
2,5
4,2
1,8

7,3
6,1
5,2
2,5
3,9

Hãy áp dụng bài toán phân tích phương sai 2 yếu tố thích hợp với cơ sở số liệu trên và mức ý
nghĩa α = 5%; trình bày các kết luận thu được.
Bài làm
 Dạng bài: Kiểm định giá trị trung bình hai nhân tố.


 Phương pháp giải: Phân tích phương sai 2 nhân tố có lặp
 Công cụ giải: Anova: Two-Factor With Replication


 Thực hiện trên excel:
 Nhập dữ liệu :




 Kết quả

Ho1: thời gian trung bình phản ứng giữa nam và nữ với các loại tín hiệu là như nhau
Ho2: thời gian trung bình các yếu tố âm thanh, ánh sang và xung có tác động như nhau
H03: có sự tương tác giữa giới tính và các lại tín hiệu
 FA = 0.6410 < F =4.2597 suy ra bác bỏ H01: thời gian trung bình phản ứng giữa nam và

nữ với các loại tín hiệu là khác nhau
FB = 14.6119 > F = 3.4028 suy ra chấp nhận H02: thời giant rung bình các yếu tố âm
thanh, ánh sang và xung có tác động như nhau
FAB = 3.4952 > F = 3.4028 chấp nhận H03 có sự tương tác giữa giới tính và các loại
tín hiệu


Bài 4:
Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỉ lệ những người đi
làm bằng xe máy, xe đạp, xe buýt. Việc điều tra được tiến hành trên 2 nhóm và có kết quả như
sau:
Xe máy

Buýt

Xe đạp

Nữ

25

100


125

Nam

75

120

205

Với mức ý nghĩa α = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng các phương
tiện giao thông đi làm trong 2 nhóm người lao động nam và nữ hay không.
Bài làm:
Dạng bài: kiểm định tính độc lập (so sánh tỉ lệ)
Công cụ : dùng CHITEST
Cơ sở lý thuyết:

Giả thuyết Ho : tỉ lệ sử dụng các phương tiện giao thông để đi làm trong 2 nhóm công nhân
nam và nữ là như nhau
 Thực hiện trong excel:
• Nhập bảng số liệu:



Tính tổng hàng và tổng cột = lệnh SUM





Tính tần số lý thuyết = Tổng hàng * tổng cột / tổng cộng



Để tính

ta dùng hàm CHITEST(B2:D3,B18:D19)

=0.002189 < 0.05
Suy ra bác bỏ giả thiết Ho
Kết luận: Vậy tỷ lệ sử dụng phương tiện giao thông để đi làm của nhóm công nhân nam và nữ
là khác nhau
Bài 5
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy
tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.

Bài làm:

a) Bảng số liệu về thời gian thao tác trên máy tiện so với khối lượng phoi thải của gia
công tiện được lấy ngẫu nhiên ở một số máy bào của xưởng C1:

Thời gian
(phút)
Khối lượng phoi
thải(gam)


20

10

35

15

23

12

500

300

600

400
000

550

320

1) Tìm hệ số tương quan giữa X và Y:
Cơ sở lý thuyết:




Nếu R > 0 thì X,Y tương quan thuận.



Nếu R < 0 thì X,Y tương quan nghịch.



Nếu R = 0 thì X,Y không tương quan.

40

37

17

22

30

45

1200 7000 470
0

530

590


1300
0




Nếu |R |= 1 thì X,Y có quan hệ hàm bậc nhất.




Nếu |R |→ 1 thì X, Y có tương quan chặt (tương quan mạnh).
Nếu |R |→ 0 thì X, Y có tương quan không chặt (tương quan yếu).

Thực hiện trên excel:

 Ta có hệ số tương quan là R = 0.891520502 chứng tỏ giữa thời gian và khối
lương phoi thu được có quan hệ khá chặc chẻ và có tương quan thuận.

2)Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi
quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

Giả thiết : H0: X và Y không có tương quan tuyến tính:




Tính T : chọn ô B5 và nhập biểu thức =B7*SQRT(12-2)/SQRT(1-B7^2).




Tính c: chọn ô B7 và nhập biểu thức =TINV(0.05,10) (c là phân vị mức
α/2=0.025 của phân bố Student với n-2=10 bậc tự do).

Vì |T| > c nên bác bỏ giả thiết H0.
Vậy: X và Y có tương quan tuyến tính.

 Ước lượng đường hồi quy tuyến tính Y theo X.
Phương trình đường hồi quy tuyến tính:
y¯x = a + bx , a=r

, b = y¯ − ax̅
s

Kiểm định hệ số a,b:

+
+
+

Giả thiết H0: Hệ số hồi quy không có ý nghĩa (=0).
H1: Hệ số hồi quy có ý nghĩa (≠0).
Kết luận: t < t , n-2: chấp nhận H0

Kiểm định phương trình đường hồi quy:
+
+

Giả thiết H0: “Phương trình hồi quy tuyến tính không thích hợp”.
H1: “Phương trình hồi quy tuyến tính thích hợp”.

Kết luận: F < F ,1,n-2: chấp nhận H0




 Thực hiện trên Excel:
Nhập số liệu vào bảng tính:

Dùng chức năng Data/Data Analysis/Regression



Kết quả:



Biện luận:
Phương trình hồi quy: y¯s¯ = 4.144811+ 24.21654x
Hệ số hồi quy: 0.970214 > 0.05 suy ra hệ số tự do có ý nghĩa.
0.0000983573 < 0.05 suy ra hệ số của x không có ý nghĩa.
Vậy phương trình hồi quy tuyến tính này không thích hợp vì 0.0000983573 < 0.05
3)Tìm sai số chuẩn của ước lượng:
 Dùng kết quả từ bảng SUMMARY OUTPUT từ câu trên ta xác định được
sai số chuẩn của ước lượng:


-

Đối với biến tự do: SE = 108.26234


-

Đối với biến X: SE = 3.89099




×