Tải bản đầy đủ (.pdf) (17 trang)

thống kê II phân tích số liệu định lượng phần 4 pps

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (468 KB, 17 trang )





52
(i) Tính các tần số, các tỷ lệ và các biểu đồ cột cho biến giới tính, trình
dộ học vấn, nghề nghiệp.
(ii) Kiểm tra xem tuổi có phân bố chuẩn hay không
(iii) Nếu tuổi là phân bố chuẩn, thì sử dụng giá trị trung bình, độ lệch
chuẩn, biểu đồ Box-and-Whisker, nếu không
(iv) Nếu tuổi không là phân bố chuẩn, sử dụng gía trị trung vị, cực tiểu,
cực đại và bi
ểu đồ Box-and Whisker.

Mô tả sơ lược về giới tính và tuổi của mẫu trong vùng.

Câu hỏi này yêu cầu mô tả mối liên quan giữa hai biến,

• Mô tả giới trong các vùng nghiên cứu
• Mô tả tuổi trong các vùng nghiên cứu

Các biến: giới tính và vùng miền đều là biến danh mục vì thế yêu cầu các thống kê mô tả
cho biến danh mục bằng các mối liên quan danh mục.

Tuổi là biến liên tục và vùng miền là biến danh mục, biế
n này yêu cầu các thống kê mô
tả.

Tóm tắt: Theo bảng 3.2, nếu nếu mối liên quan giữa hai biến danh mục thì trình bày kết
quả bằng bảng có tần số và tỷ lệ. Với giới tính theo vùng, chúng ta có thể có bảng như
sau:



Bảng … Phân bố giới tính theo vùng


Tần số Tỷ lệ nam giới (%)
Vùng

Tây Bắc
Đông Bắc
Đồng bằng sông Hồng
Bắc trung bộ
Duyên hải ven trung bộ
Tây nguyên
Đông nam bộ
Đồng bằng sông Mekong


Là một điều tốt nếu chúng ta luôn để số lượng các đối tượng trong từng loại danh mục.

Bảng trên cho ta thấy số lượng các đối tượng trong từng vùng theo giới tính, yêu cầu các
tỷ lệ theo hàng ngang khi chúng ta muốn có tỷ lệ của nam trong từng miền theo như bảng
trên.





53
Bảng 3.1 gợi ý rằng các giá trị trung bình và độ lệch chuẩn, được tóm tắt trong từng vùng
là một tóm tắt phù hợp bằng số cho mối liên quan giữa tuổi trong các vùng. Bảng có

dạng sau:

Bảng … Phân bố giới tính theo vùng
Tần số Tỷ lệ nam giới (%)
Vùng

Tây Bắc
Đông Bắc
Đồng bằng sông Hồng
Bắc trung bộ
Duyên hải ven trung bộ
Tây nguyên
Đông nam bộ
Đồng bằng sông Mekong



Cách này yêu cầu các giá trị trung bình và các độ lệch chuẩn và cũng đưa ra biểu đồ box-
and-whisker để giải thích.


Một mô tả về điểm chất lượng cuộc sống trước chấn thương và xem xét điểm này có bị
ảnh hưởng bởi tuổi hay không.

Các biến: Câu hỏi này đề cập đến mối liên quan giữa hai biến liên tục, chất lượng cuộc
sống trước chấn thương và tuổ
i.


Tóm tắt: Từ bảng 3.1, hầu hết các tóm tắt bằng biểu đồ phù hợp của mối liên quan này là

biểu đồ chấm điểm (scatter) và nếu mối liên quan này gần như một đường thẳng thì hệ số
tương quan hầu như sẽ phù hợp tóm tắt dưới dạng số. Nếu hai biến là phân bố chuẩn hệ
số tương quan Pearson’s la thích hợp, nếu không nên sử dụng hệ số
tương quan
Spearman’s.

Thực hiện một kế hoạch phân tích

Mô tả thống kê bộ số liệu có thể dùng dưới dạng số hoặc biểu đồ. Các phần tiếp theo sẽ
mô tả cho bạn dùng SPSS như thế nào để đưa ra hầu hết các dạng thông thường của tóm
tắt thống kê. Chúng được trình bày theo cách xác định kế hoạch phân tích được liệt kê ở
trên cho các câu hỏi mô tả bộ số liệu m
ẫu.

3.5. Phân tích mô tả cho một biến

3.5.1. Một biến danh mục

3.5.1.1. Bảng tần số




54

Các bảng tần số và biểu đồ cột của tần suất và tỷ lệ mô tả phân bố các giá trị của một
biến danh mục có được qua SPSS bằng cách dùng lệnh sau:

Dùng SPSS cung cấp những thông tin bạn cần về một phân bố tần số



Từ thực đơn dọc chọn: Analyse /Descriptive Statistics/Frequencies

1. Từ danh sách các biến, chọn biến sex (giới tính), edgrp (trình độ học vấn), và
occupati (nghề nghiệp) và chuyển chúng vào hộp Variable(s) bằng cách nhấp chuột
lên phím mũi tên





3.5.1.2 Biểu đồ cột

Để vẽ biểu đồ cột biểu diễn bảng tần số, nhấp chuột lên Charts để. Bạn có thể chọn biểu
đồ cột biểu diễn tần suất nhưng tốt hơn là biểu diễn dưới dạng các tỷ lệ (các tần số liên
quan).






55



SPSS sẽ cho kết quả trong cửa sổ kết quả.

Frequency Table
sex

1107 64.3 64.3 64.3
614 35.7 35.7 100.0
1721 100.0 100.0
male
female
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent

Education - grouped
83 4.8 4.9 4.9
474 27.5 27.8 32.7
991 57.6 58.2 91.0
154 8.9 9.0 100.0
1702 98.9 100.0
19 1.1
1721 100.0
Children
Less than secondary
Secondary
More than secondary
Total
Valid
-1.00Missing
Total
Frequency Percent Valid Percent
Cumulative
Percent






56
occupation
546 31.7 31.9 31.9
217 12.6 12.7 44.6
84 4.9 4.9 49.6
39 2.3 2.3 51.8
309 18.0 18.1 69.9
129 7.5 7.5 77.5
190 11.0 11.1 88.6
69 4.0 4.0 92.6
22 1.3 1.3 93.9
66 3.8 3.9 97.8
38 2.2 2.2 100.0
1709 99.3 100.0
12 .7
1721 100.0
farmer
gov. off
petty tr
employer
studying
children
handicra
retired
poor hea

unemploy
other
Total
Valid
SystemMissing
Total
Frequency Percent Valid Percent
Cumulative
Percent


Bar Chart
sex
sex
femalemale
Percent
70
60
50
40
30
20
10
0





57

Education - grouped
Education - grouped
More than secondary
Secondary
Less than secondary
Children
Percent
70
60
50
40
30
20
10
0

occupation
occupation
other
unemploy
poor hea
retired
handicra
children
studying
employer
petty tr
gov. off
farmer
Percent

40
30
20
10
0




3.5.2. Một biến liên tục

Dùng bảng tần số cho một biến liên tục là không phù hợp, vì có rất nhiều gía trị
được đưa vào bảng. Các tóm tắt thống kê bằng số, ví dụ các giá trị trung bình và các giá
trị trung vị tương ứng lượng giá độ phân tán, sẽ phù hợp hơn. Vì đo lường liên tục lượng
giá cho biến liên tục, biểu đồ cột liên tục phù hợp hơn là biểu đồ cột. Trong bộ s
ố liệu
mẫu, chúng ta muốn mô tả phân bố của tuổi trong mẫu nghiên cứu.
Phân bố của tuổi cần được đánh giá là phân bố chuẩn (xem phần 4.8). Vì thế bạn
thực sự cần phải có cả hai giá trị trung bình và trung vị, các thống kê khác là có khả năng
quyết định giá trị trung bình hay giá trị trung vị là thích hợp!

3.5.2.1 Trung bình và sự phân tán: Giá trị trung bình và độ lệch chuẩn.





58
Giả định biến tuổi là phân bố chuẩn, và bạn muốn sử dụng giá trị trung bình và độ lệch
chuẩn để mô tả phân bố của biến này.


Dùng SPSS để có những thông tin bạn cần về giá trị trung bình và độ lệch chuẩn.


1. Từ thực đơn dọc chọn Analyse/Descriptive Statistics/Frequencies

2. Từ danh sách biến, chọn biến age (tuổi) và chuyển vào hộp Variable(s) bằng
cách nhấp chuột lên biểu tượng





4. Nhấp chuột lên Statistics, chọn Mean và Std deviation.




3.5.2.2 Biểu đồ cột liền




59

Trong cùng một kết quả bạn có thể yêu cầu vẽ biểu đồ biểu diễn sự phân bố ví dụ biểu đồ
cột liên tục.

5. Nhấp chuột lên Continue trở về màn hình chính, nhấp chuọt lên Charts, chọn
Histogram và Normal curve.




6. Nhấp chuột lên Continue trở về thực đơn chính. Vì bạn biết rằng bảng tần số cho
tuổi có rất nhiều phân loại, nhấp chuột lên nút Format, và trong thực đơn chọn
Suppress….





7. Nhấp chuột lên Continue để trở về màn hình chính, nhấp chuột lên OK để kết thúc
lệnh. Kết quả sẽ xuất hiện trong màn hình kết quả của SPSS như sau

Frequencies




60
Statistics
age (rounded)
1721
0
29.83
15.245
Valid
Missing
N
Mean

Std. Deviation

age (rounded)
65.0
60.0
55.0
50.0
45.0
40.0
35.0
30.0
25.0
20.0
15.0
10.0
5.0
0.0
age (rounded)
Frequency
300
200
100
0
Std. Dev = 15.24
Mean = 29.8
N = 1721.00





3.5.2.3 Trung bình và sự phân tán: Giá trị trung vị và khoảng


Giả định biến tuổi không là phân bố chuẩn, và bạn cần có giá trị trung vị và một số giá trị
lượng giá độ phân tán để mô tả phân bố của biến này. Đo lường độ phân tán bao gồm
những giá trị đơn giản là giá trị cực tiểu và giá trị cực đại của phân bố, hoặc chính thức
hơn là khoảng (cực tiểu-cực đại) hoặc lựa chọn mộ
t trong những nhóm đó, thường là
nhóm 2.5 và 97.5 chứa 95% phân bố. Để yêu cầu các thống kê này bạn thực hiện các
bước từ 1 đến 4 trong phần 3.4.2.1 ở trên sau đó thực hiện tiếp:


Dùng SPSS cung câp thông tinbạn cần về giá trị trung vị và độ phân tán thống kê.




2. Nhấp chuột lên Statistics, chọn Median, Minimum, Maximum, và Range.






61



Nếu bạn muốn chọn nhóm 2.5
th

và 97.5
th
, chọn hộp Percentiles, nhập số 2.5 vào
hộp liền kề, nhấp chuột lên Add, nhập số 97.5 vào hộp này và nhấp chuột lên
Add.



Nhấp chuột lên Continue/OK để hoàn thành lệnh. Phần kết quả thống kê của SPSS đữa
ra như sau:





62
Statistics
age (rounded)
1721
0
28.00
65
0
65
4.00
61.95
Valid
Missing
N
Median

Range
Minimum
Maximum
2.5
97.5
Percentiles



3.5.2.4 Biểu đồ Box-and-Whisker

Một dạng khác của biểu đồ biểu diễn biến liên tục là biểu đồ Box-and-Whisker, biểu đồ
này phù hợp với cả phân bố chuẩn và không phải phân bố chuẩn.


Dùng SPSS để vẽ biểu đồ BOX-and-WHISKER


1. Từ thực đơn dọc chọn: Graph/Boxplot , chọn Summaries of Separate
Variables/Define



2. Từ danh sách các biến trong màn hình tiếp theo, chọn biến age (tuổi) và chuyển
vào hộp Variable(s) bằng cách nhấp chuột lên


3. Nhấp chuột lên OK để kết thúc lệnh.

Kết quả trong SPSS có dạng:





63
1721N =
age (rounded)
70
60
50
40
30
20
10
0
-10







64

3.6. Tóm tắt các mối liên quan

3.6.1. Liên quan giữa biến danh mục với biến danh mục

Mô tả về giới tính của mẫu nghiên cứu theo vùng.


Giới tính và vùng dều là các biến danh mục, vì thế kết quả SPSS CROSSTABS sẽ đưa
ra kết quả cần thiết.

Dùng SPSS cung cấp giá trị trung bình và độ lệch chuẩn


1. Từ thực đơn dọc chọn: Analyse/Descriptive Statistics /Crosstabs


2. Từ danh sách biến, chọn biến region và chuyển vào hộp Row(s) bằng cách nhấp
chuột lên


3. Chọn biến sex và chuyển vào hộp Column(s).




4. Nhấp chuột lên nút Cells và chọn nút Row để yêu cầu đưa kết quả tỷ lệ theo hàng
(giới tính theo vùng).





65




5. Nhấp chuột lên Continue sau đó OK để hoàn thành lệnh.

Kết quả trong SPSS có dạng:


region - stratum * sex Crosstabulation
141 59 200
70.5% 29.5% 100.0%
34 22 56
60.7% 39.3% 100.0%
124 76 200
62.0% 38.0% 100.0%
171 88 259
66.0% 34.0% 100.0%
96 56 152
63.2% 36.8% 100.0%
107 47 154
69.5% 30.5% 100.0%
194 99 293
66.2% 33.8% 100.0%
240 167 407
59.0% 41.0% 100.0%
1107 614 1721
64.3% 35.7% 100.0%
Count
% within region - stratum
Count
% within region - stratum
Count
% within region - stratum

Count
% within region - stratum
Count
% within region - stratum
Count
% within region - stratum
Count
% within region - stratum
Count
% within region - stratum
Count
% within region - stratum
ne
nw
rr
nc
cc
ch
se
mr
region -
stratum
Total
male female
sex
Total







66
Bảng này không phù hợp để trong báo cáo, vì dạng bảng không quen thuộc với người
đọc. Tuy nhiên, trong bảng này có toàn bộ các thông tin để cung cấp cho các bảng khác
dễ đọc hơn trong kế hoạch nghiên cứu.


3.6.2. Mối liên quan giữa một biến liên tục và một biến danh mục

Mối liên quan giữa một biến liên tục và một biến danh mục có thể được mô tả theo cả hai
cách bằng số và biểu đồ.

Hãy cân nhắc hai cách tiếp cận cho câu hỏi nghiên cứu thứ hai,

Mô tả sơ lược tuổi của mẫu nghiên cứu theo vùng

3.6.2.1 Tóm tắt bằng số

Tuổi là biến liên tục và vùng là biến danh mục. Có nhiều cách để có giá trị trung bình
(trung vị) trong các nhóm của biến khác. Cách toàn diện nhất là:

Dùng SPSS để tính giá trỉ trung bình trong từng phân nhóm.


1. Từ thực đơn dọc chọn: Analyse/Reports/Case Summaries

2. Từ danh sách biến, chọn biến ageround (tuổi) và chuyển vào hộp biến, sau đó
chọn region và chuyển vào hộp Grouping Variable(s) bằng cách nhấp chuột lên



3. Bỏ đánh dấu ở Display Cases – bạn không muốn điều này.






67


4. Nhấp chuột lên nút Statistics, và bôi đen Mean và Standard Deviation, sau đó
chuyển chúng qua hộp Cell Statistics.





5. Nhấp chuột lên nút Continue, sau đó là nút OK để hoàn thành lệnh.

Kết quả trong SPSS có dạng như hình dưới đây. Một lần nữa bạn thấy, trong khi bảng
này không phù hợp trong các báo cáo thì bạn đã có tất cả các thông tin cần thiết được mô
tả ở trên.

Case Summaries
age (rounded)
200 31.47 13.066
56 32.43 13.042
200 31.88 15.689
259 30.41 16.515

152 29.32 12.943
154 26.82 14.535
293 29.47 14.820
407 28.89 16.582
1721 29.83 15.245
region - stratum
ne
nw
rr
nc
cc
ch
se
mr
Total
N Mean Std. Deviation



Dùng SPSS cung cấp giá trị trung vị trong các phân nhóm.





68

Để có được giá trị trung vị thay vì giá trị trung bình, lặp lại bước 1 đến 3 ở trên, sau đó



4. Nhấp chuột lên nút Statistics, bôi đen Median, Minimum, Maximum, và Range,
rồi chuyển vào hộp Cell Statistics.



5. Nhấp chuột lên nút Continue, sau đó chọn OK để hoàn thành lệnh.

Kết quả trong SPSS có dạng như dưới đây

Case Summaries
age (rounded)
200 31.00 0 65 65
56 32.00 5 59 54
200 31.00 3 64 61
259 29.00 2 65 63
152 28.00 4 61 57
154 26.00 2 65 63
293 27.00 1 63 62
407 24.00 0 65 65
1721 28.00 0 65 65
region - stratum
ne
nw
rr
nc
cc
ch
se
mr
Total

N Median Minimum Maximum Range




3.6.2.2 Tóm tắt bằng biểu đồ Boxplot trong các phân nhóm

×