Tải bản đầy đủ (.pdf) (5 trang)

BÀI GIẢNG ỨNG DỤNG TIN HỌC TRONG THIẾT KẾ THÍ NGHIỆM VÀ XỬ LÝ SỐ LIỆU (Phương pháp nghiên cứu nâng cao) part 4 docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (341.27 KB, 5 trang )


16

Hình 11. Đồ thị Box-Plot mô tả mối quan hệ giữa công thức phân bón và
năng suất của lúa
Qua đồ thị trên ta không thấy những giá trị ngoại lệ. Có thể hiểu một cách
đơn giản là các giá trị nằm ngoài các đuôi của đồ thị Box-Plot thì nên được xem
xét về tính chính xác cũng như có thể được xem xét như các trường hợp ngoại lệ.
Ví dụ 11. Một nhóm nghiên cứu điều tra ảnh hưởng củ
a tuổi của chủ hộ
đến việc chấp nhận (Y) hay không chấp nhận (N) trồng giống ngô địa phương. Kết
quả được thể hiện ở bảng 6. Hãy kiểm tra kết quả nhập số liệu.
Bảng 6. Số liệu về ảnh hưởng của tuổi chủ hộ đến chấp nhận giống ngô địa
phương
Loại hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ
Tuổi chủ hộ
N 48 24 36
12
10
N 17 36 48 36 6
Y 46 60 5 36 14
N 24 36 24 32 92
N 17 48 36 12 12
N 17 14 24 24 2
Y 24 36 60 5 8
Y 48 36 7,5 24 8
Y 168 5 4 24 5
N0 N1 N2 N3 N4
Công thức phân bón
2500
3000


3500
4000
4500
5000

5500
6000
6500
Năng suất

17
Y 40 30 60 36 36
N 6 54824 8
Y 16 36 48 34 144
N 12 8 8 22 30
N 28 12 5 19 10
Y 46 12 72 36 7
Y 36 26 72 12 24
N 17 6102414
N 36 24 12 18 1
N 24 15 12 18 20
N 24 24 36 25 12
N 12 6 48 8 2
N 36 12 24 10 12
N 29 14 18 42 48
N 36 14 5 4 48
N 48 36 36 6 48
N 36 24 36 9 2
Y 48 24 36 60 30
N 36 24 36 46 12

N 12 12 60 24 12
N 84 6 8 32 15
N 9 36 7 92 10
Y 18 36 26 7 7
N 36 48 36 7 72
Y 60 24 22 7 30
N 15 36 18 8 60

Vẽ đồ thị kiểu Box-Plot, kết quả được trình bày ở hình 12.
Qua hình 12. có thể đặt nghi ngờ vào một số bản ghi hay đơn vị thí nghiệm thứ 9,
212, 58, 79, 76, 204, 64, 191 và 30 trong file số liệu. Các số liệu đó có thể do sai
sót khi nhập số liệu, cũng có thể là những trường hợp ngoại lệ, do vậy chúng ta
cần kiểm tra lại những số liệu này. Cần đặc biệt chú ý là không được loại bỏ các s

liệu này khi không có lý do chính đáng. Các trường hợp ngoại lệ thông thường làm
cơ sở cho việc đề xuất ý tưởng nghiên cứu mới.
Chúng ta có thể vừa kiểm tra số liệu vừa xem xét khuynh hướng của
phân bố số liệu hay xem xét mối quan hệ giữa các biến. Điều này có thể được thực
hiện thông qua đồ thị kiểu Scatter-Plot. Tiến trình vẽ đồ thị kiểu Scatter-Plot tuân
theo các bước như sau : Graphs - Scatter- Simple. Sau
đó chọn biến x và biến y.

18
Chỉ chọn Simple khi ta muốn vẽ đồ thị đơn chỉ gồm một biến x và một biến y
(Hình 13).

Hình 12. Đồ thị Box-Plot để kiểm tra số liệu

Hình 13. Các bước vẽ đồ thị Scatter-Plot
NY

loaiho
0
50
100
150
200
t
u
o
i
58
64
30
204
191
79 76
9
212

19
Hình 14 trình bày một ví dụ về đồ thị Scatter-Plot từ một tập hợp số liệu với
573 đơn vị thí nghiệm. Do tập hợp số liệu khá lớn cho nên chúng tôi không trình
bày tập hợp số liệu.
Qua hình 14 ta có thể vừa kiểm tra số liệu vừa suy đoán mối quan hệ giữa
các biến. Chúng ta có thể hoàn toàn nghi ngờ bản ghi/đơn vị thí nghiệm ở hàng
262 và 481 của file nhập số liệu là những tr
ường hợp ngoại lệ, hoặc có thể chúng
đã được nhập sai.
0 20 40 60 80 100 120 140
x

50
100
150
200
250
y1
262
481

Hình 14. Đồ thị Scatter-Plot biểu thị mối quan hệ giữa biến độc lập x và
biến phụ thuộc y
Mặt khác qua hình 14 ta thấy rằng khi x nhỏ thì khi x tăng thì y tăng, nhưng
khi tiếp tục tăng x thì y sẽ không tăng nữa. Như vậy khi xem xét mối quan hệ giữa
y và x chúng ta không thể dùng một hàm tuyến tính đơn thuần được.
Tóm lại, có nhiều cách khác nhau để kiểm tra số liệu đồng thời định hình
mối quan hệ giữa các biến nghiên cứu. Người làm nghiên cứu cần chú ý đến kiểm
tra số liệu thật kỹ trước khi phân tích số liệu.

BÀI 3. PHÂN TÍCH THỐNG KÊ MÔ TẢ
Trong các chương trước chúng ta đã biết một trong những nội dung quan
trọng nhất của thống kê mô tả là tính toán các tham số đặc trưng cho mức độ tập

20
trung như trung bình, trung vị, và yếu số và các tham số đặc trưng cho mức độ
phân tán như phương sai, độ lệch chuẩn, sai số chuẩn của số trung bình (sai số của
số trung bình). Trong nội dung của chương này chúng tôi sẽ đề cập đến cách phân
tích các tham số đó bằng trình ứng dụng descriptive statistics. Trong SPSS có rất
nhiều trình ứng dụng có thể tính toán được các tham số thống kê mô tả hay nói
cách khác trình ứng dụng descriptive statistics có thể được thực hi
ện từ các trình

ứng dụng khác, ví dụ từ trình ứng dụng General Linear Model hay Compare
means.
3.1. Phân tích thống kê mô tả trong trường hợp tập hợp số liệu không phân
nhóm
Ví dụ 12. Hảy tính toán các tham số thống kê mô tả của năng suất lúa trong
ví dụ 2.
Chúng ta có thể thực hiện theo các bước sau :
• Bước 1: Nạp số liệu vào SPSS
• Bước 2: Vào trình ứng dụng descriptive statistics (hình 15)
• Bước 3 : Lựa chọn biến cầ
n được thực hiện thống kê mô tả (hình 15)
• Bước 4: Lựa chọn các tham số thống kê cần tính toán (hình 15)

Hình 15. Phân tích thống kê mô tả khi số liệu không phân nhóm

×