Tương quan giữa hai hay nhiều
biến định lượng
Muốn biết các biến có mối quan hệ với nhau như thế nào,
chúng ta phải tính hệ số tương quan (ký hiệu là r)
Hệ số tương quan này có giá trị từ –1 đến 1. Kết quả hệ
số tương quan sẽ có ý nghóa khác nhau như sau
r=0 :không có mối tương quan giữa hai biến quan tâm
r<0 : có mối tương quan nghịch
r > 0 : có mối tương quan thuận
0 < |r| < 0.2 : có mối tương quan rất yếu
0.2< |r| < 0.5 : có mối tương quan yếu
0.5 < |r| < 0.7 : có mối tương quan trung bình
0.7 < |r| < 0.9 : có mối tương quan chặt chẽ
> 0.9 : có tương quan rất chặt chẽ.
Nhưng trên thực tế 0.5 < |r| < 0.7 đã được gọi là tương quan
khá chặt chẽ.
Chúng ta có thể tính được hệ số tương quan bằng lệnh corr
hay pwcorr và chúng ta có thể xem được các mối tương quan
này bằng đo àthị khi gõ lệnh graph matrix để vẽ ma trận
đồ thị chấm điểm.
Cú pháp Tính hệ số tương quan giữa hai biến hay
corr varlist
hoặc ma trận các hệ số tương quan của
pwcprr varlist.., sig một nhóm các biến định lượng
star(5) Tính hệ số tương quan cho từng cặp biến
định lượng, các option có ý nghóa:
sig : thể hiện mức ý nghóa
thống kê của hệ số tương
quan
star(5) : đánh dấu sao vào
những hệ số có ý nghóa
graph matrix varlist…., thống kê
options Các option sử dụng trong câu lệnh này
laø:
half : chỉ vẽ một bên ma
traän
jitter(..) :loại bỏ ngẫu nhiên
những chấm tượng trưng
cho số lượng rất nhoû
tránh việc những điểm
naøy trùng lắp.
msymbol(..) : biểu tượng của dấu
chấm (hình tròn dạng lỗ,
troøn…)
msize( …) : kích thước của chấm
diagonal : dán nhãn cho các biến
. corr weight iq age
(obs=100)
| weight iq age
-------------+---------------------------
weight | 1.0000
iq | -0.2920 1.0000
age | 0.4131 -0.4363 1.0000
Diễn giải kết quả:
Hệ số tương quan này được tính trên số quan sát chung
(obs=100) trả lời đủ ba câu hỏi về weight, iq, và age. Số
Giữa iq và weight có tương quan nghịch yếu
Giữa weight và age có tương quan thuận yếu
Giữa iq và age có tương quan nghịch yếu
. pwcorr weight iq age, obs sig star(5)
| weight iq age
-------------+---------------------------
weight | 1.0000
|
| 106
|
iq | -0.3006* 1.0000
| 0.0025
| 99 109
|
age | 0.4152* -0.4366* 1.0000
| 0.0000 0.0000
| 106 109 117
|
Diễn giải kết quả
Lệnh pwcorr dùng để tính hệ số tương quan cho từng cặp
biến vì vậy dân số để tính sẽ khác nhau tùy vào từng
số quan sát trả lời đủ cho cặp biến đó
Có 99 quan sát trả lời đủ hai câu hỏi về iq và weight.
Giữa biến iq và biến weight có tương quan nghịch yếu có
ý nghóa thống kê (p=0,00025)
Có 106 quan sát trả lời đủ hai câu hỏi về age và weight.
Giữa biến age và biến weight có tương quan thuận yếu có
ý nghóa thống kê (p=0,000)
Có 109 quan sát trả lời đủ hai câu hỏi về iq và age. Giữa
biến iq và biến age có tương quan nghịch yếu có ý nghóa
thống kê (p=0,00)
. graph matrix weight iq age, half jitter(1) msymbol(circle_hollow) msize(small)
Dieãn giải kết quả:
Ô đồ thị chấm điểm giữa biến weight và biến iq đi
xuống chứng tỏ tương quan nghịch. Các chấm điểm rời
rạc không thành đường thẳng chứng tỏ hai biến tương
quan yếu
Ô đồ thị chấm điểm của biến age và biến weight ñi
leân chứng tỏ chúng tương quan thuận. Tuy nhiên các
chấm điểm cũng rời rạc nên chúng ta cũng kết luận
rằng chúng tương quan yếu.
Ô đồ thị chấm điểm của biến iq và biến age cũng có
hình dạng tương tự như giữa biến weight và biến iq.
Tương quan giữa một biến định
lượng và một biến định tính
Trong trường hợp một hoặc hai biến định lượng có phân bố
không chuẩn hay một biến là biến định tính, chúng ta không
thể sử dụng lệnh corr hay pwcorr để tìm hệ số tương quan mà
chúng ta phải sử dụng lệnh Spearman và lệnh ktau để tính
hệ số tương quan spearman và hệ số tương quan ktau. Chúng
ta cũng có thể sử dụng đồ thị để mô tả mối tương quan
bằng lệnh twoway
Cú pháp
spearman var1 var2 Tính hệ số tương quan spearman
ktau var1 var2 Tính hệ số tau-b của kendall
twoway (scatter bpt1 bpt2 if Caùc option được sử dụng trong
bđl==#, option) (scatter bpt1 lệnh này:
bpt2 if bđ;==##, option) , msymbol(..) : bieåu
options tượng
của chấm (tròn,
tròn lỗ, dấu x..)
mcolor (…) : màu của
chaám (ñen,
traéng..)
jitter(..) :
Ví dụ:
. spearman weight life
Number of obs = 105
Spearman's rho = 0.0622
Test of Ho: weight and life are independent
Prob > |t| = 0.5282
. ktau weight life
Number of obs = 105
Kendall's tau-a = 0.0359
Kendall's tau-b = 0.0513
Kendall's score = 196
SE of score = 308.818 (corrected for ties)
Test of Ho: weight and life are independent
Prob > |z| = 0.5278 (continuity corrected)
Diễn giải kết quả
Kết quả cho thấy mối tương quan Spearman(0.0622) và
Kendall(0.0513) giữa hai biến weight và biến life đều rất
yếu.
Hệ số ktau-b bằng 0,0513 với p=0,5278 chứng tỏ giữa hai
biến weight và life không có mối tương quan.
. twoway (scatter weight age if life==1, msymbol(circle) mcolor(black)
jitter(1)) (sca if life==2, msymbol(x) mcolor(black) jitter(1)), legend
> tter weight age
(order(1 "no
> " 2 "yes"))
Diễn giải kết quả
Đồ thị chấm cho thấy ở cả nhóm có ý định tự tự và
không có ý định tự tự có sự tăng trọng nhiều ở nhóm phụ
nữ có độ tuoåi cao.