Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử
dụng các dữ liệu đó cho các yêu cầu sau:
1) Thực hiện phương pháp phân tổ dữ liệu (A).
2) Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu
quan sát với độ tin cậy 96% (A).
4) Trình bày dữ liệu định tính dạng phân loại bằng đồ thị (B).
BÀI LÀM
Dạng bài: Thống kê mô tả
Dữ liệu A: Khảo sát tuổi thọ của 40 ổ lăn tại xưởng cơ khí, ta có bảng số
liệu sau (đơn vị: giờ)
2383 2205 3058 9850 1350 8206 2150 1650
5420 1953 7681 3020 5420 1953 7681 1953
2165 2100 2523 5900 4890 8934 6630 1420
4000 1950 4861 3520 4537 1953 7370 1993
5620 3296 3058 5620 1350 8206 6505 4970
1) Thực hiện phương pháp phân tổ dữ liệu (A).
Nhập dữ liệu A vào excel:
Xác định số tổ cần chia:
Chọn ô D7 nhập vào biểu thức: =(2*COUNT(A1:H5))^(1/3)
Kết quả: 4.31
Ta chọn k=4
Xác định trị số khoảng cách h theo công thức: h
Kết quả: h=2125
Ta xác định được các cận trên và cận dưới các tổ lần lượt là:
• Tổ 1: 1350-3475
• Tổ 2: 3475-5600
• Tổ 3: 5600-7725
• Tổ 4: 7725-9850
Nhập vào các ô từ A11 đến A14 lần lượt các giá trị như sau:
Chọn Data/ Data Analysis/ Histogram:
• Input Range: địa chỉ tuyệt đối chứa dư liệu.
• Bin Range: địa chỉ chứa bảng phân nhóm.
• Output options: vị trí xuất kết quả.
• Confidence Level for Mean: độ tin cậy cho trung bình.
Chọn Cumulative Percentage để tính tần suất tích lũy nếu
không Excel chỉ tính tần số.
Kết quả sau khi hiệu chỉnh:
2) Vẽ đồ thị phân phối tần số và đa giác tần số (A).
Vẽ đồ thị phân phối tần số
+ Quét chọn bảng tần số B19:B22
+ Dùng chức năng Insert Column Chart trên menu Insert.
Kết quả sau khi hiệu chỉnh:
Vẽ đa giác tần số
+ Sử dụng bảng phân phối tần số của dữ liệu A
+ Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số
+ Quét chọn
B18:B23; chọn Insert
Line
Kết quả sau khi hiệu
chỉnh:
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của
dấu hiệu quan sát với độ tin cậy 96% (A).
Nhập dữ liệu vào bảng tính:
Chọn chức năng Data/Data Analysis/Descriptive Statistics.
+ Input Range: địa chỉ tuyệt đối chứa dư liệu.
+ Output options: vị trí xuất kết quả.
+ Confidence Level for Mean: độ tin cậy cho trung bình.
Kết quả:
Trun
g vị:
Me = +
Me là giá trị trung vị(xấp xỉ) đang cần tính
là giá trị cận dưới của tổ chứa trung vị đã xác định ở bước 1
là khoảng cách tổ của tổ chứa trung vị
là tổng các tần số của các tổ trong bảng tần số, nguyên tắc là =n
là tổng các tần số của tổ đứng trước tổ chứa trung vị
là tần số của tổ chứa trung vị
Số mode (yếu vị)
Mo =
Trong đó
Mo là giá trị mode (xấp xỉ) đang cần tính
là giá trị cận dưới của tổ chức chứa mode đã xác định được ở bước 1
là khoảng cách tổ chức chứa mode
là tần số của tổ chứa mode
là tần số của tổ đứng sát trước tổ chứa mode
là tần số của tổ đứng sát sau tổ chứa mode
Phương sai và độ lệch chuẩn
=
Trong đó:
là giá trị của tổ hoặc giá trị đại diện của các tổ được tính bằng cách lấy giá trị cận
trên cộng giá trị cận dưới rồi đem kết quả chia đôi (i=1,2 k)
là trị trung bình được của tập dữ liệu đã lập bảng phân bố
là tần số của các tổ tương ứng,
Trung bình của tổng thế
Trong đó
. N là số quan sát hay qui mô tổng thể
. là giá trị trên quan sát thứ i
Phương sai và độ lệch chuẩn
Trong đó
. N là số quan sát hay qui mô tổng thể
là giá trị trên quan sát thứ i
. là trung bình tổng thể
Dữ liệu B: Để làm đồ án 2 tại trường ĐHBK thầy giáo hướng dẫn đã phân đề tài
là: làm một bảng đồng hồ điện tử hiển thị thời gian thực gồm 2 phần chính đó là
board lập trình và phần cứng đáp ứng. Phần cứng đáp ứng có liên quan trực tiếp
đến led. Chính vì vậy nhóm đã có làm một cuộc khảo sát tại các cửa hàng chuyên
bán led tại chợ Nhật Tảo và chọn ra được loại led hãng SEN YANG để thiết kế
phần cứng đáp ứng và kết quả dữ liệu định tính thu thập với 1000 con cho mỗi loại
được cho như bảng sau:
MÃ MÀU LED MÀU SẮC
TUỔI THỌ
W
Trắng
Rất cao
R
Đỏ
Cao
G
Xanh lục
Trung bình
B Xanh dương
Thấp
4) Trình bày dữ liệu định tính dạng phân loại bằng đồ thị (B).
Bài 2: Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung
bình là 4kg sơn. Dữ liệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn
cùng 1 loại xe trong 2 ngày liên tiếp:
Ngày 1: 3,8 4,2 3,6 4,1 3,9 4,3 4,1 3,8 3,95
Ngày 2: 4,5 3,8 4,1 3,9 4,5 3,8 4 Đơn vị: kg
Hãy kiểm định xem máy phun sơn có sử dụng lượng sơn trung bình khác nhau
giữa 2 ngày hay không, với mức ý nghĩa 1%
Tìm thêm giá trị P trong kiểm định
BÀI LÀM
Cơ sở dữ liệu
GT
KĐ
GT
đối
Tiêu chuẩn kiểm
định
Miền bác bỏ với mức ý nghĩa α
BT 1
mẫu
=
Nếu chưa biết thì
dùng s thay thế
-Tổng thể phân phân
phối chuẩn, đã biết
- Hoặc tt tùy ý, n30
Tổng thể phân phân
phối chuẩn, chưa
biết
- Hoặc tt tùy ý, n30
a= a≠ = ( -∞, -) U ( +∞) = ( -∞, -) U ( +∞)
a< = ( -∞, -) = ( -∞, )
a> = ( +∞) = (
BT 2
mẫu
Nếu chưa biết và
thì dùng và để
thay thế
=
-2 tổng thể tùy ý
-, ≥ 30
- Giả thiết 2 phương
sai tổng thể khác
nhau
= ≠ = ( -∞, -) U ( +∞)
= = ( -∞, -)
> = ( +∞)
Từ số liệu đề bài cho, ta tính được :
= 4.0219 ( kg )
x = 0.2494 ( kg )
Sx = 0.2575 ( kg )
Gọi a là mức sơn tiêu hao trung bình để phun sơn 1 xe ô tô
= 16 < 30; Sx = 0.2575 ( kg ) ( đã tính ở trên ); = 4.0219 ( kg ) ( đã tính ); = 4
( kg )
Đặt giả thuyết kiểm định
+ GT KĐ a = 4 ( kg )
+ GT đối a ≠ 4 ( kg )
Mức ý nghĩa = 1% => Tra bảng Student 2 phía : ( n – 1 ) = ( 15 ) = 2.9467
Miền bác bỏ = ( -∞ ; -2.9467 ) U ( 2.9467; +∞ )
Tiêu chuẩn kiểm định
= = = 0.3402
Do ≠ nên ta chấp nhận , bác bỏ . Vậy ta xem như máy phun sơn có sử dụng lượng
sơn trung bình giống nhau giữa 2 ngày
GIẢI BÀI TOÁN 2 BẰNG EXCEL
Nhập dữ liệu vào bảng tính:
Vào Data/ Data Analysis/ F-Test Two-Sample for Variances
Chọn như hình dưới đây:
Trong đó:
Bài 3:
Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối
với các loại tín hiệu khác nhau. Các đối tượng (15 nam, 15 nữ) tham gia thí nghiệm
được yêu cầu nhấn nút ngay khi nhận biết có tín hiệu . Đây là bảng số liệu ghi lại
thời gian (giây) từ khi tín hiệu được phát đi cho đến khi đối tượng khảo sát có tín
hiệu trả lời
Âm thanh Ánh sáng Xung
Nam
10
7,2
6,8
6,0
5,0
6,0
3,7
5,1
4,0
3,2
9,1
5,8
6,0
4,0
5,1
Nữ
10,5
8,8
9,2
8,1
13,4
6,6
4,9
2,5
4,2
1,8
7,3
6,1
5,2
2,5
3,9
Hãy khảo sát xem có thể coi thời gian phản ứng đối với các loại tín hiệu phụ thuộc
vào giới tính không? Có thể coi thời gian phản ứng đối với các tín hiệu là khác
nhau không? Có sự tương tác giữa các yếu tố giới tính và tín hiệu không?
BÀI LÀM
GIẢ THUYẾT:
: Các mức âm thanh, ánh sáng, xung có thời gian phản ứng trung bình của
mỗi người là như nhau.
: Các mức âm thanh, ánh sáng, xung có thời gian phản ứng trung bình của
mỗi người là khác nhau.
: yếu tố giới tính và tín hiệu không có sự tương tác với nhau.
: yếu tố giới tính và tín hiệu có sự tương tác với nhau.
BÀI 3:
GIỚI TÍNH ÂM THANH ÁNH SÁNG XUNG
Nam
10
7.2
6.8
6.0
5.0
6.0
3.7
5.1
4.0
3.2
9.1
5.8
6.0
4.0
5.1
Nữ
10.5
8.8
9.2
8.1
13.4
6.6
4.9
2.5
4.2
1.8
7.3
6.1
5.2
2.5
3.9
Bước 1: tính các = tổng các số liệu trong mỗi mẫu và tính các trung bình
mẫu.
Vd:
Nam: = = 10+7.2+6.8+6.0+5.0 = 35
= == 7
Tương tự cho các chỉ tiêu còn lại ta được kết quả như sau:
GIỚI TÍNH ÂM THANH ÁNH SÁNG XUNG TỔNG
NAM
= 7 = 4.4
= 6
NỮ
=10 = 4 = 5
TỔNG
= 8.5
= 8.5
= 42
= 4.2
= 55
= 5.5
Từ tổng hàng và tổng cột, ta có:
= 87 ; = 95 ;()
= 85 ; = 42 ; ()
Và T=182 ; n=30 (T===);(n=)
A = +()+ +(= 1306.68 ( A = ).
Bước 2:
Tính tổng các chênh lệch bình phương.
SST = A - = 1306.68 - = 1306.68 – 1104.13 = 202.55
Vì các mẫu chọn ra đều có 5 phần tử (5 người) được thử nghiệm trong 3 lĩnh
vực(âm thanh, ánh sáng, xung.) nên bằng cách áp dụng các công thức ta tính được:
SS = - = 1106.27 -1104.13 = 2.14
SSTổng bình phương cho nhân tố A(âm thanh, ánh sáng, xung.)
SS = - = – 1104,13 =97,27
(r=2 vì có 2 yếu tố theo hàng là nam và nữ(r: row)).
SS: tổng bình phương cho nhân tố B(Nam-nữ)
Tổng bình phương do sai số:
SSE = A - = 1306,68 - = 79.88
Tổng bình phương do sai số:
SSI = SSI - SS- SS- SSE = 202.55 -2.14 – 97.27 – 79.88 = 23.26.
Bước 3: Tính các phương sai(là trung bình của các chênh lệch bình phương).
Trung bình bình phương của nhân tố A
MS = = = 2.14
Trung bình bình phương của nhân tố B
MS = = = 48.64
Trung bình bình phương của tương tác
MSI = = = 11.63
Trung bình bình phương của sai số
MSE = = = 3.33
Bước 4: Kiểm định giả thuyết:
Tỷ số khác nhau cho nhân tố A: = =
Tỷ số khác nhau cho nhân tố B: = =
Tỷ số khác nhau cho nhân tố Avà B: = =
Với mức ý nghĩa = 5%, ta có:
(1.24) = 4.26
(2.24) = 3.4
Ta có: = 0.64 < (1.24) = 4.26 suy ra bác bỏ . Nhà nghiên cứu biện luận: thời
gian phản ứng trung bình của mỗi người đối với loại tín hiệu (âm thanh, ánh sáng,
xung) là khác nhau.
GIẢI BÀI 3 BẰNG EXCEL
Nhập số liệu vào bảng tính:
Bài 4:
Giả thiết:
Ho: có sự bằng nhau về các cơ cấu sử dụng phương tiện giao thông đi làm
trong 2 nhóm công nhân nam và nữ
H
1
: có sự khác nhau về các cơ cấu sử dụng phương tiện giao thông đi làm
trong 2 nhóm công nhân nam và nữ
Đây là bài toán phân tích Anova 2 yếu tố: phương tiện giao thông là yếu tố
thứ nhất, giới tính là yếu tố thứ 2
B1: Tính các tổng và trung bình mẫu
Xe máy Buýt Xe đạp Tổng - TB
Nữ 25 100 125 ) 250
Nam 75 120 205 ) 400
Tổng-TB (50) 100 (110) 220 (165) 330 ) 650
Các số trong dấu ( ) là các trung bình trong từng cột, từng dòng
Như vậy:
T
10
=250
T
01
=100
T=650
T
20
=400
T
02
=220
T
03
=330
n=6
A=
+ ++++=88300
B2: Tính tổng các chênh lệch bình phương
1. Tổng các chênh lệch bình phương chung:
SST=A - = 88300 - =17883.4
2. Tổng các chênh lệch bình phương giữa các khối hàng:
SST
A
=3750
3. Tổng các chênh lệch bình phương giữa các khối cột:
SST
B
=13233.4
4. Tổng các sai lệch bình phương phần dư do sai số:
SSE=0
5. Tổng các chênh lệch bình phương giữa các ô:
SSI=SST- SST
A
- SST
B
-SSE=900
B3: Tính các phương sai