Sử dụng spss để tìm hiểu về các hệ số tương quan giữa các cặp biến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.37 MB, 54 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC VINH

LÊ THỊ MINH NGA

SỬ DỤNG SPSS ĐỂ TÌM HIỂU VỀ CÁC HỆ SỐ
TƢƠNG QUAN GIỮA CÁC CẶP BIẾN

LUẬN VĂN THẠC SỸ TOÁN HỌC

Vinh, 2014
1

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC VINH

LÊ THỊ MINH NGA

SỬ DỤNG SPSS ĐỂ TÌM HIỂU VỀ CÁC HỆ SỐ
TƢƠNG QUAN GIỮA CÁC CẶP BIẾN
Chuyên ngành:

Lý thuyết xác suất và thống kê toán h c
Mã số: 60.46.01.06

LUẬN VĂN THẠC SỸ TOÁN HỌC

Ngƣời hƣớng dẫn khoa h c : TS. NGUYỄN TRUNG HÒA

Vinh, 2014

2

MỤC LỤC
MỤC LỤC ............................................................................................................. 3
MỞ ĐẦU ............................................................................................................... 4
CHƢƠNG 1. KIẾN THỨC CHUẨN BỊ .............................................................. 6
1.1. BIẾN NGẪU NHIÊN ................................................................................ 6
1.1.1. Định nghĩa ........................................................................................... 6
1.1.2. Phân loại biến ngẫu nhiên ................................................................... 6
1.1.3. Hàm phân phối xác suất ...................................................................... 6
1.1.4. Các số đặc trƣng của biến ngẫu nhiên................................................. 7
1.2. VECTƠ NGẪU NHIÊN ............................................................................ 9
1.2.1. Định nghĩa ........................................................................................... 9
1.2.2. Bảng phân phối xác suất của vectơ ngẫu nhiên rời rạc hai chiều ....... 9
1.2.3. Hàm phân phối xác suất của vectơ ngẫu nhiên hai chiều ................... 9
1.2.4.Hàm mật độ xác suất của vectơ ngẫu nhiên liên tục hai chiều .......... 10
1.3. MẪU NGẪU NHIÊN VÀ MẪU QUAN SÁT ........................................ 10
1.3.1.Định nghĩa .......................................................................................... 10
1.3.2. Trung bình mẫu ngẫu nhiên .............................................................. 11
1.3.3. Phƣơng sai mẫu ................................................................................. 11
1.3.4.Các phƣơng pháp ch n mẫu quan sát ................................................ 11
1.3.5. Các phƣơng pháp mô tả số liệu thực nghiệm .................................... 12
1.4. HỆ SỐ TƢƠNG QUAN........................................................................... 13
1.4.1.Hệ số tƣơng quan Pearson:................................................................. 13
1.4.2. Hệ số tƣơng quan hạng Spearman .................................................... 15
CHƢƠNG II. SỬ DỤNG SPSS ĐỂ TÌM HIỂU VỀ TƢƠNG QUAN .............. 16
2.1. GIỚI THIỆU VỀ SPSS ............................................................................ 16
2.1.1. SPSS là gì? ........................................................................................ 16
2.1.2. Các chức năng chính của SPSS......................................................... 16

2.1.3. Những lĩnh vực ứng dụng của SPSS ................................................. 16
2.1.4. Các thành phần chính của SPSS ....................................................... 17
2.1.5. Cài đặt SPSS 16.0 ............................................................................. 17
2.2. SPSS VỚI PHÂN TÍCH TƢƠNG QUAN............................................... 29
2.2.1. SPSS với phân tích tƣơng quan Pearson ........................................... 29
2.2.2. SPSS với phân tích tƣơng quan Spearman ....................................... 36
2.2.3. SPSS với một vài bài toán thực tế ..................................................... 41
KẾT LUẬN ......................................................................................................... 53
TÀI LIỆU THAM KHẢO ................................................................................... 54

3

MỞ ĐẦU
1. Lý do chọn đề tài
Khi nghiên cứu một đối tƣợng ngƣời ta thƣờng nghiên cứu nhiều chỉ tiêu
đối với đối tƣợng đó. Các chỉ tiêu đƣợc đo lƣờng và xác định cụ thể trên đối
tƣợng quan sát. Mục đích của việc nghiên cứu là làm rõ hơn bản chất của đối
tƣợng nhằm tìm ra quy luật, dự đốn xu thế biến động của nó. Để làm đƣợc điều
đó một trong những việc phải làm là phân tích mối quan hệ phụ thuộc giữa các
chỉ tiêu phản ánh nội dung của đối tƣợng cần nghiên cứu. Cụ thể là phải giải bài
toán xác định mức độ phụ thuộc giữa các nhân tố, dấu hiệu. Hệ số tƣơng quan là
hệ số đo lƣờng mối liên quan tuyến tính của các biến số.
Thu thập, quản lí, xử lí số liệu là một vấn đề đƣợc quan tâm đặc biệt từ
trƣớc tới nay. Khoa h c thống kê ra đời giúp cải tiến dần cách thức thu thập,
quản lí và xử lí số liệu. Hiện nay trên thế giới có ba bộ chƣơng trình chun
phục vụ cho việc xử lí và phân tích số liệu thống kê là SAS, STATA, SPSS.
SPSS có nhiều chức năng và linh hoạt đƣợc sử dụng rộng rãi trong nhiều ngành
khoa h c khác nhau nhƣ: Kinh tế h c, Xã hội h c, Y h c, Tâm lý h c,... Trong
nghiên cứu khoa h c xã hội và thống kê tại Việt nam cũng nhƣ trên thế giới,

SPSS đƣợc biết đến nhƣ một trong những phần mềm hữu ích và thuận tiện nhất
giúp ngƣời sử dụng làm việc với dữ liệu định lƣợng. SPSS là một phần mềm
thống kê toàn diện dùng liệt kê dữ liệu, lập bảng biểu, thống kê, xử lý dữ liệu.
Vì vậy trong luận văn này chúng tơi viết về bài tốn xác định hệ số tƣơng
quan và sử dụng phần mềm SPSS để giải quyết bài tốn này. Đó là lí do tơi ch n
đề tài luận văn của mình là :"SỬ DỤNG SPSS ĐỂ TÌM HIỂU VỀ CÁC HỆ
SỐ TƢƠNG QUAN GIỮA CÁC CẶP BIẾN".
2. Mục đích nghiên cứu
 Nghiên cứu về lý thuyết hệ số tƣơng quan.
 Nghiên cứu ứng dụng SPSS để tính hệ số tƣơng quan.
 Ứng dụng để xử lí bộ số liệu thực tế và đƣa ra kết luận.
4

Nội dung của luận văn bao gồm hai chƣơng
Chƣơng 1. Kiến thức chuẩn bị. Trong chƣơng này chúng tơi trình bày một số
kiến thức cơ sở về lý thuyết xác suất và thống kê toán.
Chƣơng 2. Sử dụng SPSS để tìm hiểu về tƣơng quan. Chƣơng 2 là nội dung
chính của luận văn, trong chƣơng này chúng tôi giới thiệu sơ lƣợc về SPSS và
cách sử dụng SPSS để tính hệ số tƣơng quan. Trên cơ sở đó ứng dụng để xử lí
bộ số liệu thực tế và đƣa ra kết luận.
Luận văn đã hoàn thành tại trƣờng Đại h c Vinh. Có đƣợc luận văn này, tác
giả xin bày tỏ lòng biết ơn chân thành và sâu sắc tới Tiến sĩ Nguyễn Trung Hồ
đã trực tiếp hƣớng dẫn, dìu dắt giúp đỡ tác giả trong suốt quá trình triển khai,
nghiên cứu và hoàn thành đề tài.
Xin chân thành cảm ơn các thầy cô giáo đã giảng dạy, truyền đạt những kiến
thức khoa h c cho tác giả trong những năm tháng qua.
Xin chân thành cảm ơn trƣờng Cao đẳng Tài nguyên và Môi trƣờng Miền
trung đã tạo điều kiện thuận lợi giúp tác giả thu thập số liệu cũng nhƣ những tài
liệu nghiên cứu liên quan đến đề tài.

Xin ghi nhận những đóng góp q báu và nhiệt tình của các bạn h c viên,
nhóm nghiên cứu lớp cao h c K20 Toán chuyên ngành Lý thuyết Xác suất và
Thống kê toán trƣờng Đại h c Vinh.
Xin chân thành cảm ơn gia đình, bạn bè đã quan tâm, động viên, khuyến
khích để tác giả hồn thành luận văn.
Tác giả rất mong nhận đƣợc sự đóng góp, phê bình của quý thầy cô, các nhà
khoa h c , độc giả và các bạn đồng nghiệp.
Ngh

n th ng

n m

5

CHƢƠNG 1. KIẾN THỨC CHUẨN BỊ
1.1. BIẾN NGẪU NHIÊN
1.1.1. Định nghĩa
Biến ngẫu nhiên là biến sao cho mỗi giá trị mà nó nhận đƣợc tƣơng ứng
với một xác suất nào đó.
Thực chất biến ngẫu nhiên có thể nhận giá trị trong m i phạm trù nhƣ
màu sắc, hình dạng, phƣơng hƣớng, thái độ, trình độ h c vấn... Tuy nhiên bằng
các ánh xạ chúng ta thƣờng có thể chuyển việc nghiên cứu m i biến ngẫu nhiên
về việc nghiên cứu các biến ngẫu nhiên nhận giá trị là các số. Vì vậy ngƣời ta
thƣờng hay nói đến biến ngẫu nhiên thực và định nghĩa nhƣ sau:
Giả sử (, F ,P) là không gian xác suất, G là  - đại số con của  - đại số
F. Khi đó ánh xạ X :  

đƣợc g i là biến ngẫu nhiên G -đo đƣợc nếu nó là

ánh xạ G /B( ) đo đƣợc( tức là với m i B  B( ) thì X-1(B)  G ).
Đặc biệt, nếu X là biến ngẫu nhiên F - đo đƣợc thì X đƣợc g i một cách
đơn giản là biến ngẫu nhiên.
1.1.2. Phân loại biến ngẫu nhiên
- Biến ngẫu nhiên g i là rời rạc nếu tập hợp các giá trị có thể có của nó là một
tập hữu hạn hoặc đếm đƣợc.
Ví dụ: Số chấm xuất hiện khi tung một con xúc sắc, số con trai trong số
100 trẻ sắp đƣợc sinh ra tại một bệnh viện phụ sản là các biến ngẫu nhiên rời
rạc.
- Biến ngẫu nhiên g i là liên tục nếu tập hợp các giá trị có thể có của nó lấp đầy
một khoảng nào đó của trục số.
Ví dụ: sai số khi đo lƣờng một đại lƣợng vật lý, khoảng cách từ điểm
chạm của viên đạn tới tâm bia khi bắn súng là các biến ngẫu nhiên liên tục.
1.1.3. Hàm phân phối xác suất
- Định nghĩa:

6

Hàm phân phối x c suất của biến ngẫu nhiên X ký hi u là F X(x) là xác
suất để biến ngẫu nhiên X nhận gi trị nhỏ hơn x với x là một số thực bất kỳ.
FX ( x)  P( X  x) .

- Tính chất: Hàm phân phối xác suất FX(x) của một biến ngẫu nhiên X có các
tính chất sau:
 0 ≤ FX(x) ≤ 1, FX ()  0 , FX ()  0 .
 FX ( x) là hàm không giảm, nghĩa là với x1 < x2 thì FX(x1) ≤ FX(x2).
 FX ( x) là hàm liên tục trái.
 Nếu X là biến ngẫu nhiên liên tục thì FX(x) liên tục trên tồn miền giá trị

của biến ngẫu nhiên X và P(X = xo) = 0 với m i xo.
 P(a ≤ X < b) = FX(b) - FX(a).
- Ý nghĩa: Hàm phân phối xác suất phản ánh mức độ tập trung xác suất ở về
phía bên trái một số thực x nào đó.
1.1.4. Các số đặc trƣng của biến ngẫu nhiên
1.1.4.1. Kỳ vọng toán
- Định nghĩa:
Nếu X là biến ngẫu nhiên rời rạc nhận một trong c c gi trị có thể có x 1,
x2, ..., xn với c c x c suất tương ứng p1, p2, ..., pn thì kỳ vọng to n E(X) của biến
ngẫu nhiên là E(X) =

n

x p
i 1

i

i

.

Nếu X là biến ngẫu nhiên liên tục với hàm mật độ x c suất f(x) thì kỳ vọng


to n E(X) của biến ngẫu nhiên là E(X) =

 xf ( x)dx .



- Các tính chất:

 Với C là hằng số thì E(C) = C, E(CX) = C.E(X).
 E(X + Y) = E(X) + E(Y).
 Nếu X và Y là các biến ngẫu nhiên độc lập thì
E(X.Y) = E(X).E(Y).

7

- Ý nghĩa: Kỳ v ng toán của biến ngẫu nhiên là giá trị trung bình số h c của các
giá trị quan sát của biến ngẫu nhiên.
1.1.4.2.Phƣơng sai
- Định nghĩa:
Phương sai của biến ngẫu nhiên X ký hi u là D(X) là kỳ vọng to n của
bình phương độ l ch giữa biến ngẫu nhiên X và kỳ vọng to n của nó.
D(X) = E[X - E(X)]2
- Các tính chất:





DX 0 với m i biến ngẫu nhiên X.
DC = 0 nếu C là hằng số.
D(CX) = C2DX Với C là hằng số.
D(X + Y)=D(X - Y) = DX + DY nếu X,Y là hai biến ngẫu
nhiên độc lập.
- Ý nghĩa: Phƣơng sai phản ánh mức độ phân tán của các giá trị của biến ngẫu

nhiên xung quanh giá trị trung bình của nó.
1.1.4.3. Độ lệch chuẩn
Độ lệch chuẩn của biến ngẫu nhiên X ký hiệu là  x là căn bậc hai của
phƣơng sai:  x = D(X )
1.1.4.4. Trung vị
Trung vị ký hi u là md là gi trị nằm ở chính giữa tập hợp c c gi trị có
thể có của biến ngẫu nhiên X.
1.1.4.5. Mốt
Mốt ký hi u là mo là gi trị của biến ngẫu nhiên tương ứng với x c suất
lớn nhất nếu là biến ngẫu nhiên rời rạc tương ứng với cực đại của hàm mật độ
x c suất nếu là biến ngẫu nhiên liên tục.
1.1.4.6. Giá trị tới hạn mức 
Giả sử X là biến ngẫu nhiên gi trị tới hạn mức  của biến ngẫu nhiên X
ký hi u là x là gi trị của X thỏa mãn điều ki n: P(X > x ) =  .

8

1.2. VECTƠ NGẪU NHIÊN
1.2.1. Định nghĩa
Giả sử X1, X2, ..., Xn là c c biến ngẫu nhiên khi đó X = ( X1, X2, ..., Xn)
được gọi là một vectơ ngẫu nhiên n chiều.
Ví dụ: Tiến hành đo chiều cao và cân nặng của h c sinh nam ở một
trƣờng A, g i X là biến ngẫu nhiên biểu thị chiều cao, Y là biến ngẫu nhiên biểu
thị cân nặng ta có vectơ ngẫu nhiên hai chiều (X, Y).
1.2.2. Bảng phân phối xác suất của vectơ ngẫu nhiên rời rạc hai chiều
- Bảng phân phối xác suất đồng thời của vect ngẫu nhiên rời rạc hai chiều (X, Y):
P(X = xi; Y = yj) = pij với mọi i = ... n; j = 1,...,m.
Y

y1

y2

...

ym

PY

x1

p11

p12

...

p1m

p1

x2

p21

p22

...

p2m

p2

xn

pn1

pn2

...

pnm

pn

PX

q1

q2

...

qm

1

X

...

- Bảng phân phối xác suất của X: pi = P( X = xi) =

m

 p ij

với m i i = 1,2...,n.

j 1

X

x1

x2

...

xn

PX

p1

p2

...

pn

- Bảng phân phối xác suất của Y: qj = P( Y = yj) =

n

 pij

với m i j = 1,2...,m.

i 1

Y

y1

y2

...

ym

PY

q1

q2

...

qm

1.2.3. Hàm phân phối xác suất của vectơ ngẫu nhiên hai chiều
- Định nghĩa:

9

Hàm phân phối x c suất của vectơ ngẫu nhiên hai chiều (X,Y) ký hi u là
F(x, y) là x c xuất để biến ngẫu nhiên X nhận gi trị nhỏ hơn x và biến ngẫu
nhiên Y nhận gi trị nhỏ hơn y với x y là c c số thực tùy ý.
F(x, y) = P(X < x, Y < y)
- Tính chất:
 0 ≤ F(x, y) ≤ 1, với m i x,y.
 F(x, y) là một hàm không giảm theo từng biến.
 F(-  , y) = 0; F(x,-  ) = 0; F(-  , -  ) = 0; F(+  , +  ) = 1.
 P(a ≤ x < b, c ≤ y < y) = F(b, d) + F(a, c) - F(a, d) - F(b, c).
1.2.4.Hàm mật độ xác suất của vectơ ngẫu nhiên liên tục hai chiều
- Định nghĩa:
Hàm mật độ x c suất của vectơ ngẫu nhiên liên tục hai chiều (X,Y) ký
hi u là f(x, y) là đạo hàm riêng hỗn hợp bậc hai của hàm phân phối x c suất:
 2 F ( x, y )
f(x, y) =
x.y

- Tính chất:
 f(x, y)  0.
 P[(X, Y)  D] =

 f ( x, y)dxdy .

D



 f ( x, y)dxdy


= 1.

2

1.3. MẪU NGẪU NHIÊN VÀ MẪU QUAN SÁT
1.3.1.Định nghĩa
Mẫu ngẫu nhiên kích thước n đối với một biến ngẫu nhiên X là tập hợp
của n biến ngẫu nhiên X1, X2,..., Xn độc lập được thành lập từ biến ngẫu nhiên X
và có cùng quy luật phân phối x c suất với X.
Mẫu ngẫu nhiên thường được ký hi u là W = (X1, X2,..., Xn ).
Giả sử X1 nhận gi trị x1, X2 nhận gi trị x2,..., Xn nhận gi trị xn, khi đó
tập hợp n gi trị x1, x2,..., xn tạo thành một gi trị cụ thể của mẫu ngẫu nhiên và
được gọi là mẫu quan s t, ký hi u w = (x1, x2,..., xn).
10

Tập hợp các số liệu quan sát cụ thể g i là các số liệu thực nghiệm.
Mẫu ngẫu nhiên hai chiều: Giả sử trên cùng một tổng thể phải nghiên cứu
đồng thời hai dấu hiệu nghiên cứu, trong đó dấu hiệu nghiên cứu thứ nhất có thể
xem là biến ngẫu nhiên X còn dấu hiệu nghiên cứu thứ hai là biến ngẫu nhiên Y.
Khi đó việc nghiên cứu hai dấu hiệu của tổng thể tƣơng đƣơng với việc nghiên
cứu biến ngẫu nhiên hai chiều (X, Y).
Mẫu ngẫu nhiên hai chiều kích thước n của dấu hi u nghiên cứu (X,Y) là

một dãy gồm n biến ngẫu nhiên hai chiều (X1, Y1), (X2, Y2),...,(Xn, Yn) độc lập và
có cùng quy luật phân phối xác suất với (X, Y).
Mẫu ngẫu nhiên hai chiều đƣợc kí hiệu là:
W = [(X1, Y1), (X2, Y2),...,(Xn, Yn)]
Khi đó giả sử thành phần (Xi, Yi) nhận giá trị (xi, yi), i = 1,...,n ta thu đƣợc
mẫu quan sát cụ thể w = [(x1, y1), (x2, y2),...,(xn, yn)].
Các giá trị xi (i = 1,..., n) g i là thành phần X của mẫu, các giá trị yi (i = 1,...,n)
g i là thành phần Y của mẫu.
1.3.2. Trung bình mẫu ngẫu nhiên
Giả sử (X1, X2,..., Xn ) là một mẫu ngẫu nhiên kích thước n khi đó trung
bình mẫu ký hi u là X được x c định bởi:
n

X
i 1

X=

i

n

1.3.3. Phƣơng sai mẫu
Giả sử (X1, X2,..., Xn ) là một mẫu ngẫu nhiên kích thước n với trung bình mẫu
2

X , khi đó phương sai mẫu ký hi u là S được x c định bởi:
n

S2 =

(X
i 1

i

 X )2

n 1

1.3.4.Các phƣơng pháp chọn mẫu quan sát
- Ch n mẫu đơn: lấy ngẫu nhiên theo danh sách.
- Ch n mẫu hệ thống: ch n ngẫu nhiên phần tử đầu tiên, các phần tử tiếp theo
đƣợc ch n cách đều hoặc theo một quy luật nào đó.
11

- Ch n mẫu phân tầng: chia thành các nhóm, tầng theo một đặc tính nào đó rồi
ch n mẫu từ các nhóm, các tầng đó.
- Ch n mẫu chùm: ch n mẫu chỉ trong một tập con nào đó đƣợc xem là đại diện
cho tổng thể.
1.3.5. Các phƣơng pháp mô tả số liệu thực nghiệm
- Bảng phân phối tần số thực nghiệm và tần suất thực nghiệm:
Nếu một mẫu ngẫu nhiên kích thƣớc n của X nhận giá trị xi với tần số xuất hiện
r i, f i =

ri
g i là tần suất của xi trong đó i = 1,..., k, x1 < ...< xk, r1 + ... + rk = n.
n

Khi đó ta có thể mơ tả mẫu ngẫu nhiên qua bảng phân phối tần số thực nghiệm
và tần suất thực nghiệm của X nhƣ sau:
X

x1

x2

...

xk

X

x1

x2

...

xk

Tần số

r1

r2

...

rk

Tần suất

f1

f2

...

fk

- Bảng phân phối tần số ghép lớp:
Trong trƣờng hợp mẫu có kích thƣớc lớn hoặc khi các giá trị của X nhận
giá trị khác nhau nhƣng lại rất gần nhau, ngƣời ta thƣờng xác định một số các
khoảng y1, y2, ..., yk sao cho mỗi giá trị của X thuộc vào một khoảng nào đó. Khi
đó ta có bảng phân phối tần số ghép lớp:
k

y1

y2

...

yi

...

yk

n

n1

n2

...

ni

...

nk

Trong đó :
yi+1 - yi = h
ni là số các giá trị quan sát thuộc nửa khoảng [yi - h/2; yi + h/2).
k là số các khoảng.
n là kích thƣớc mẫu.
Việc ch n số khoảng và độ rộng các khoảng tùy theo vấn đề nghiên cứu
và kinh nghiệm của ngƣời nghiên cứu. Một trong những gợi ý để ch n số
khoảng k tối ƣu là hãy ch n số k nguyên nhỏ nhất sao cho 2k  n nhƣ sau:
n:kích thƣớc mẫu

9 - 16

k: số khoảng

4

17 - 32 33 - 64
5

6

65 - 128

129 - 256

257 - 512

7

8

9
12

- Mô tả mẫu ngẫu nhiên hai chiều:
Giả sử ta có mẫu ngẫu nhiên hai chiều W = [(X1, Y1), (X2, Y2),..., (Xn, Yn)]
Khi đó ta sắp xếp các giá trị thành phần của X và Y theo thứ tự tăng dần:
x1< x2 < ... < xi < ... xh và y1 < y2 < ...< yj < ... < yk.
Kí hiệu nij là tần suất của cặp giá trị (xi, yj), rõ ràng các tần suất nij thỏa
k

h

mãn hệ thức  nij = 1. Lúc đó mẫu ngẫu nhiên hai chiều W = [(X1, Y1), (X2, Y2),..., (Xn, Yn)]

j 1 i 1

đƣợc mô tả theo bảng sau:

Y

y1

y2

...

yk

ni*

x1

n11

n12

...

n1k

n1*

x2

n21

n22

...

n2k

n2*

...

...

...

...

...

...

xh

nn1

nn2

...

nnk

nh*

n*j

n*1

n*2

...

n*k

1

X

1.4. HỆ SỐ TƢƠNG QUAN
1.4.1.Hệ số tƣơng quan Pearson:
- Định nghĩa:
Giả sử {(Xi, Yi)}, i = 1,...,n là một mẫu ngẫu nhiên hai chiều thu đƣợc
khi quan sát vectơ ngẫu nhiên (X, Y) thì hệ số tƣơng quan mẫu rXY của X, Y đƣợc
xác định nhƣ sau:
n

rXY 

 (X  X )(Y  Y )
i 1

i

i

n

n

i 1

i 1

 ( X i  X )2  (Yi  Y )2
n

Hay

rXY 

 X Y  n X .Y
i 1

n

i i

n

( X i 2  n X )( Yi 2  nY )

i 1

2

2

i 1

13

n

Trong đó:

X

X
i 1

n

n

i

;

Y

Y
i 1

n

i

; X và Y là các biến ngẫu

nhiên tuân theo quy luật phân phối chuẩn.
Hệ số r còn đƣợc g i là hệ số Pearson để ghi nhận cống hiến của nhà
thống kê h c nổi tiếng Karl Pearson, ngƣời đầu tiên phát triển lí thuyết về tƣơng
quan vào đầu thế kỉ XX.
- Nhận xét: Hệ số tƣơng quan r khơng có đơn vị, r ln ln biến động trong
khoảng (-1; 1), nếu hệ số tƣơng quan r dƣơng cho biết X và Y biến động cùng
chiều và âm thì ngƣợc lại.
- Ý nghĩa của hệ số tƣơng quan:
Hệ số tƣơng quan r

Ý nghĩa

0,01 < r < 0,1

Mối tƣơng quan quá thấp không đáng kể.

0,2 < r < 0,3

Mối tƣơng quan thấp

0,4 < r < 0,5

Mối tƣơng quan trung bình

0,6 < r < 0,7

Mối tƣơng quan cao

r > 0,8

Mối tƣơng quan rất cao

- Ví dụ:
Ðể thấy đƣợc đặc tính của r, bốn trƣờng hợp sau đây trình bày sự liên hệ
tuyến tính giữa X và Y tƣơng ứng với các giá trị của r.

14

1.4.2. Hệ số tƣơng quan hạng Spearman
Hệ số tƣơng quan tính đƣợc từ kỹ thuật Spearman là kết quả của việc xếp
hạng các số liệu, mà không dùng giá trị thực của chúng.
- Định nghĩa:
Giả sử ta có hai biến X và Y h số Spearman được tính như sau: Sắp xếp
c c gi trị của X thành c c hạng theo thứ tự t ng hoặc giảm ta được c c hạng
RX sắp xếp c c gi trị của Y tương ứng ta được c c hạng RY, di là sự chênh l ch
của hai hạng tương ứng khi đó h số Spearman được tính bằng:
S  1

6 d i 2
i

n(n 2  1)

.

- Ý nghĩa: Hệ số Spearman có khoảng giá trị biến thiên và cách diễn đạt giống
nhƣ hệ số Pearson r.

15

CHƢƠNG II. SỬ DỤNG SPSS ĐỂ TÌM HIỂU VỀ TƢƠNG QUAN

2.1. GIỚI THIỆU VỀ SPSS
2.1.1. SPSS là gì?
SPSS (viết tắt của Statistical Package for the Social Sciences) là một phần
mềm máy tính phục vụ cơng tác phân tích thống kê. Thế hệ đầu tiên của SPSS
đƣợc đƣa ra từ năm 1968 chuyên sử dụng cho các máy chủ ở Mỹ.
SPSS cung cấp một hệ thống quản lý dữ liệu và khả năng phân tích thống
kê với giao diện thân thiện cho ngƣời dùng trong môi trƣờng đồ h a, sử dụng
các trình đơn mơ tả và các hộp thoại đơn giản
SPSS là phần mềm thống kê đƣợc sử dụng rộng rãi trong nhiều nghành
khoa h c khác nhau nhƣ: Xã hội h c, Y h c, Nhân h c, Tâm lý h c, Kinh tế
h c, Marketing...
2.1.2. Các chức năng chính của SPSS
 Nhập và làm sạch dữ liệu.
 Xử lý biến đổi và quản lý dữ liệu.
 Tóm tắt, tổng hợp dữ liệu và trình bày dƣới các dạng biểu bảng, đồ thị bản
đồ.
 Phân tích dữ liệu, tính toán các tham số thống kê và diễn giải kết quả.

2.1.3. Những lĩnh vực ứng dụng của SPSS
SPSS đƣợc các nhà khoa h c sử dụng rộng rãi cho các nghiên cứu trong
nhiều lĩnh vực nhƣ:
 Ứng dụng SPSS trong nghiên cứu tâm lý h c: Tâm lý tội phạm, tâm lý
h c sinh - sinh viên...
 Ứng dụng SPSS trong nghiên cứu xã hội h c: đánh giá chất lƣợng dịch vụ
công, xin ý kiến ngƣời dân trong việc xây lại khu chung cƣ,...
 Ứng dụng SPSS trong nghiên cứu kinh doanh: nghiên cứu và định hƣớng
phát triển sản phẩm, mở rộng thị trƣờng, sự hài lòng của khách hàng,...

16

 Ứng dụng SPSS trong nghiên cứu đa dạng sinh h c, phát triển nông lâm
nghiệp.
 Ứng dụng SPSS trong nghiên cứu y sinh.
2.1.4. Các thành phần chính của SPSS
Mơi trƣờng làm việc của SPSS gồm hai phần:
 Phần soạn thảo dữ liệu đầu vào SPSS Data Editor (cửa sổ hiệu đính dữ
liệu), SPSS Data Editor gồm Data View và Variable View cho phép định
nghĩa,nhập, hiệu đính và thể hiện dữ liệu đầu vào trực tiếp hoặc từ các file số
liệu có sẵn .
 Phần kết quả đầu ra Output SPSS Viewer, Output SPSS Viewer chứa các
kết quả sau khi chạy các phép toán.
2.1.5. Cài đặt SPSS 16.0
Cài đặt SPSS 16.0 sử dụng đĩa CD SPSS 16.0.
Hình 1. Các Thƣ mục trong đĩa CD SPSS16

Bƣớc 1: Nhấp chuột vào biểu tƣợng Keygen

(Xem Hình 2)

→ Hình 3 xuất hiện
Hình 2: Biểu tƣợng Keygen ở thƣ mục E:\KEYGEN

17

Hình 3: Hộp thoại SPSSv16.Keygen

Trong Hình 3, bấm vào nút Generate. Keygen sẽ cung cấp :
- Serial Number và Authorization Code (Dãy số nhận đƣợc có thể khác với
số trong Hình 3)
- Trong ví dụ này: Serial Number là 985015 và Authorization Code là
32AC429E342387705258
Tiếp theo bôi đen con số 9850150046 và bấm CTRL-C (để lát nữa dán
vào nơi yêu cầu)
18

Cịn mã 32AC429E342387705258, lát nữa sẽ sử dụng đến nó
Bƣớc 2: Ch n biểu tƣợng
Hình 4 xuất hiện

trong thƣ mục gốc của ổ đĩa E:\ (Xem Hình 1)

Hình 4
Ch n Install SPSS 16.0 → Hình 5

Hình 5

19

Ch n Single user license, và bấm Next → Hình 6

Hình 6
Ch n I accept the terms in the license agreement, bấm Next → Hình 7

Hình 7
Ch n Next → Hình 8

20

Hình 8
Trong hình 8, Vùng User Name, và Organization tự nhập
Vùng Serial Number: nhấp chuột vào đó và bấm CTRL-V để dán số Serial
Number mà Keygen đã cung cấp ở Hình 3.
Ch n Next → Hình 9

Hình 9
Ch n Next → Hình 10

21

Hình 10
Ch n Install → Hình 11

Hình 11
Đợi vài phút để Install các thành phần của SPSS vào máy tính, khi nào nút
Next đậm lên bấm Next.

22

Hình 12
Trong q trình Install sẽ có Hộp thoại nhƣ Hình 12 xuất hiện, hãy bỏ dấu
ch n ở mục Register with spss.com, rồi bấm OK → Hinh13

Hình 13
Khi hộp thoại Hình 13 xuất hiện, mặc định ch n License my product now
(recommended), rồi Next → Hình 14

23

Hình 14
Ch n Next → Hình 15

Hình 15
Khi Hình 15, xuất hiện, hãy Quay trở lại Keygen (Hình 1) và Copy mã
Authorization Code là 32AC429E342387705258 và dán vào mục Enter
Code, Ch n Next → Hình 16

24

Hình 16

Trong Hình 16, ch n Telephone, rồi bấm Next → Hình 17

Hình 17
Trong hình này SPSS đã cung cấp Lock Code là 100-2138B( có thể là số
khác), hãy bơi đen con số 2138B bấm CTRL-C và ch n Next → Hình 18

25

Sử dụng spss để tìm hiểu về các hệ số tương quan giữa các cặp biến

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về