Tải bản đầy đủ (.doc) (20 trang)

PHÂN TÍCH PHƯƠNG SAI ANOVA

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (662.59 KB, 20 trang )

PHẦN A:
MINH HỌA CÁC VÍ DỤ VỀ PHÂN TÍCH PHƯƠNG SAI ANOVA
1. Phân tích phương sai một nhân tố:
Một nghiên cứu được thực hiện nhằm xem xét năng suất lúa trung bình của 3 giống lúa.
Kết quả thu thập qua 4 năm như sau:
Năm

A

B

C

1

65

69

75

2

74

72

70

3


64

68

78

4

83

78

76

Hãy cho biết năng suất lúa trung bình của 3 giống lúa có khác nhau hay không?
α = 0.01 .
Bài giải
Gọi Xi là năng suất lúa trung bình của 3 giống lúa thứ i, i = 1,3
2
Xi ~ N ( µ i , σ )

Xét các giả thuyết
H0: µ1 = ... = µ3 , năng suất lúa trung bình của 3 giống lúa là như nhau
H1: ∃i ≠ j : µi ≠ µ j , năng suất lúa trung bình của 3 giống lúa là khác nhau
Ta có bảng ANOVA như sau:
Anova: Single Factor
SUMMARY
Groups

Count


Sum

Average Variance

A

4

286

71.5

79

B

4

287

71.75

20.25

C

4

299


74.75 11.58333

ANOVA
Source of Variation
Between Groups

SS

df

MS

26.16667

2 13.08333
1

F

P-value

F crit

0.354135 0.711136 8.021517


Within Groups

332.5


Total

9 36.94444

358.6667

11

Kết luận
Vì F = 0.354135 < Fk −1;n −k ;1−α = 8.021517 nên ta chấp nhận giả thuyết H0, nghĩa là năng
suất lúa trung bình của 3 giống lúa là như nhau.
2. Phân tích phương sai 2 nhân tố không lặp:
Có 4 công ty tài chính được yêu cầu dự đoán về tốc độ tăng trưởng (%) trong năm tới
của 5 công ty ngành nhựa. Dự đoán được ghi nhận như sau:
Chuyên gia
Công ty

A

B

C

D

1

8


12

8.5

13

2

14

10

9

11

3

11

9

12

10

4

9


13

10

13

5

12

10

10

10

Hãy lập bảng ANOVA. Có thể nói rằng dự đoán tốc độ tăng trưởng trung bình là như
nhau cho cả năm công ty nhựa được không? α = 0.05
Bài giải
Gọi Xij là dự đoán tốc độ tăng trưởng trung bình công ty nhựa thứ i ở chuyên gia công
2
ty tài chính thứ thứ j, i = 1,5, j = 1, 4 , Xij ~ N (α i + β j , σ )
Xét các giả thuyết
H0: α1 = ...α 5 , nghĩa là tốc độ tăng trưởng trung bình công ty nhựa là như nhau
H0’: β1 = ...β 4 , nghĩa là 4 công ty tài chính dự đoán là như nhau
Ta có bảng ANOVA như sau:
Anova: Two-Factor Without Replication
SUMMARY

Count Sum


Average

Variance

1

4

41.5

10.375

6.229167

2

4

44

11

4.666667

2


3


4

42

10.5

1.666667

4

4

45

11.25

4.25

5

4

42

10.5

1

A


5

54

10.8

5.7

B

5

54

10.8

2.7

C

5

49.5

9.9

1.8

D


5

57

11.4

2.3

ANOVA
Source of
Variation
Rows

SS

df

MS

F

P-value

F crit

2.3

4

0.575


0.144654 0.961924 3.259167

5.7375

3

1.9125

0.481132 0.701475 3.490295

Error

47.7

12

3.975

Total

55.7375

19

Columns

Kết luận
+ Vì FA = 0.144654 < F4;12;0.95 = 3.259167 nên tốc độ tăng trưởng trung bình 5 công
ty nhựa là như nhau.

+ Vì FB = 0.481132 < F4;12;0.95 = 3.490295 nên dụ đoán của 4 công ty là như nhau.
3. Phân tích phương sai 2 nhân tố có lặp:
Hãy phân tích tình hình kinh doanh của một số ngành nghề ở 4 quận trên cơ sở số liệu doanh
thu một số của hàng như sau:
Quận
Ngành nghề kinh doanh
Điện lạnh

Q1

Q2

Q3

Q4

2.5

3.1

2.2

11.2

2.7

3.5

2


12

2

2.7

9.5

19.8

3


Vật liêu xây dựng

Dịch vụ tin học

3

3.2

2.1

15.8

0.6

1.2

3.3


4.2

10.4

1

2.3

1

11.2

9.8

6.7

3.8

8.3

1.8

1.9

2.5

4.2

3.2


0.4

3.1

5

3

3

1

6.2

7.8

9.8

3.6

3.3

2.5

2.8

3.9

Giải

Gọi Xijk là quan sát thứ k về doanh thu ứng với ngành thứ i và quận thứ j, k = 1,4, i = 1,3, j = 1,4 ;
2
Xijk ~ N ( µ , α i + β j , σ )
Xét giả thuyết
H0: α1 = ...α 3 , nghĩa là tình hình kinh doanh của các ngành nghề là như nhau
H0’: β1 = ...β 4 , nghĩa là tình hình kinh doanh ở các quận là như nhau
Ta có bảng ANOVA như sau:
Anova: Two-Factor With Replication
SUMMARY

Q1

Q2

Q3

Q4

Total

Điện lạnh
Count

4

4

4

4


16

Sum

10.2

12.5

15.8

58.8

97.3

Average

2.55

3.125

3.95

14.7

6.08125

0.176667 0.109167 13.69667

15.58667


32.58963

Variance

Vật liêu xây dựng
Count
Sum

4

4

4

4

16

30.5

13.8

14.2

11.5

70

4



Average

7.625

Variance

3.45

3.55

2.875

4.375

23.42917 18.03667 4.756667

2.089167

13.48867

Dịch vụ tin học
Count

4

4

4


4

16

18.7

16.5

16

11.6

62.8

4.675

4.125

4

2.9

3.925

1.515833 6.089167 16.34667

1.713333

5.575333


Sum
Average
Variance

Total
Count

12

12

12

12

Sum

59.4

42.8

46

81.9

Average

4.95 3.566667 3.833333


6.825

Variance

11.57545 6.798788 9.535152

39.11477

ANOVA
Source of
Variation

SS

df

MS

F

P-value

F crit

Sample

41.40375

2 20.70188


2.399155

0.105169

3.259446

Columns

78.94229

3 26.3141

3.049559

0.040902

2.866266

Interaction

385.2246

6 64.2041

7.440658

3.14E-05

2.363751


Within

310.6375

36 8.628819

Total

816.2081

47

Kết luận
Vì P-value trên hàng = 0.105 > α = 0.05 nên ta chấp nhận giả thuyết H 0, nghĩa là các ngành
nghề khác nhau không ảnh hưởng đến tình hình kinh doanh
Vì P-value trên cột = 0.04 < α = 0.05 nên ta bác bỏ giả thuyết H0’, nghĩa là tại các quận khác
nhau tình hình kinh doanh các cửa hàng khác nhau.
5


PHẦN B
PHÂN TÍCH THÀNH PHẦN CHÍNH
MINH HỌA BÀI TẬP VỚI SỬ DỤNG PHẦN MỀM SPSS
A. CƠ SỞ LÝ THUYẾT:
1. Đặt vấn đề:
Phân tích thành phần chính (Principal Component Analysis – PCA) là một trong những
phương pháp phân tích dữ liệu nhiều biến đơn giản nhất. Khi không gian có số chiều lớn, ta
cần phải tìm cách đưa dữ liệu về không gian có số chiều nhỏ hơn.
PCA là một trong những phương pháp như thế với nhiều đặc tính tốt:



Giúp giảm số chiều của dữ liệu,

Thay vì giữ lại các trục tọa độ của không gian cũ, PCA xây dựng một không gian mới ít
chiều hơn, nhưng lại có khả năng biểu diễn dữ liệu tốt tương đương không gian cũ, nghĩa là
đảm bảo độ biến thiên của dữ liệu trên mỗi chiều mới.



Các trục tọa độ trong không gian mới là tổ hợp tuyến tính của không gian cũ, do đó về
mặt ngữ nghĩa, PCA xây dựng feature mới dựa trên các feature đã quan sát được. Điểm hay là
những feature này vẫn biểu diễn tốt dữ liệu ban đầu.

Trong không gian mới, các liên kết tiềm ẩn của dữ liệu có thể được khám phá, mà nếu
đặt trong không gian cũ thì khó phát hiện hơn, hoặc những liên kết như thế không thể hiện rõ.


Nói một cách ngắn gọn, mục tiêu của PCA là tìm một không gian mới (với số chiều nhỏ hơn
không gian cũ). Các trục tọa độ trong không gian mới được xây dựng sao cho trên mỗi trục, độ
biến thiên của dữ liệu trên đó là lớn nhất có thể, còn gọi là maximize the variability. Ba chữ
này gói gọn ý tưởng chính của PCA.
2. Các kiến thức cơ sở và ý tưởng phân tích thành phần chính:
a.

Giá trị riêng, vectơ riêng:
Giả sử trong R n với tích vô hướng gắn với ma trận vuông A, và f là ánh xạ tuyến tính
từ R n vào R n .Véc tơ v ≠ 0 trong R n là vectơ riêng của f nếu: f ( v ) = λv ( λ là hằng số
khác không ). Khi đó λ gọi là giá trị riêng của ánh xạ f .
Nếu tồn tại một cơ sở trong R n sao cho ma trận A biểu diễn trong cơ sở có dạng chéo thì


6


ma trận A sẽ chéo hóa được, tức là tồn tại ma trận P khả nghịch sao cho: A ' = P −1A P có
dạng chéo.
b.
Kỳ vọng và phương sai của thống kê chiều chiều:
+ Kỳ vọng:
Trong thống kê nhiều chiều, mỗi một mẫu thống kê là một vectơ nhiều chiều. Giả sử ta có
biến ngẫu nhiên X = [ x 1 , x 2 ,..., x n ] , khi đó kỳ vọng của E [ X
1

]

được ước lượng bằng trung

N

bình của mẫu X với: X = ∑ X i , với N là tổng số mẫu trong thống kê.
N i =1
+ Ma trận hiệp phương sai:
Giá trị phương sai trong thống kê một chiều để đo mức độ phân tán của một biến ngẫu
nhiên xung quanh kỳ vọng của nó. Trong thống kê nhiều chiều, giá trị này được mở rộng
T
thành ma trận hiệp phương sai: C = E  X − E [ X ]   X − E [ X ]  .
Ma trận hiệp phương sai là một ma trận đối xứng, mỗi phần tử ϕij của ma trận hiệp phương
sai thể hiện mối quan hệ giữa 2 thành phần x i và x j trong vectơ X.
ϕij =

cov ( X i , X


)

j

DX i .DX

j

Nếu ϕij = 0 ta nói 2 thành phần x i và x j độc lập với nhau, ϕij ≠ 0 thì x i và x j không độc lập
hay chúng phụ thuộc lẫn nhau.
c. PCA (Principal Component Analysis )
Giả sử ta cần giảm số chiều từ tập mẫu n chiều ban đầu x = av
1 1 + a2v 2 + ... + aNv N (trong đó v 1 ,
v 2 , ..., v N là cơ sở của không gian N chiều) xuống thành k chiều với y = b1u1 + b2u 2 + ... + b N u k
( u1 , u 2 , ..., u N là cơ sở của không gian K chiều. Gọi M là tổng số mẫu có trong thống kê.
Gọi x là một vectơ trong không gian n chiều, y là một vectơ trong không gian k chiều.
Phương pháp PCA tìm một phép biến đổi tuyến tính T thỏa: y = T .x với T là ma trận cấp kxn
sao cho trung bình bình phương lỗi là bé nhất
b1 = t 11a1 + t 12a2 + ... + t 1naN
b2 = t 21a1 + t 22a2 + ... + t 2 n aN



b k = t k 1a1 + t k 2a2 + ... + t kn aN

 t 11 t 12
t
 21 t 22
T

=
với
 ... ...

t K 1 t K 2

... t 1N 
... t 2 N 
... ... 

... t KN 
1

M

Gọi x là vectơ trung bình của các vectơ x trong tập X: x =
∑x i
M i =1
Gọi C là ma trận hiệp phương sai của các phần tử trong tập X:
C =

(

1 M
∑ xi −x
M − 1 i =1

)(x

i


−x

)

T

Khi đó T là một ma trận mà mỗi hàng là một vectơ riêng của C và m vectơ riêng này ( m
hàng của ma trận T) ứng với m trị riêng lớn nhất thì T chính là phép biến đổi tuyến tính thỏa
điều kiện trung bình bình phương lỗi khi loại bỏ một số thành phần trong x để thu được y sẽ
bẳng tổng phương sai của những thành phần bị loại bỏ nhỏ nhất.
7


Gọi Φ là ma trận vuông nxn mà mỗi cột là một vectơ riêng của C đã được chuẩn hóa với
y = ( y 1 , y 2 ,..., y n )
phép biến đổi y = ΦT .x
Tóm lại, phương pháp phân tích thành phần chính ánh xạ một vectơr từ không gian n chiếu
xuống không gian k chiều sẽ đi tìm các trị riêng và vectơr riêng của ma trận hiệp phương sai
C của tập X và giữ lại k vectơr riêng ứng với k trị riêng lớn nhất làm cơ sở cho không gian k
chiều này.
3. Tóm tắt phân tích thành phần chính : gồm các bước sau:
Giả sử X là một biến ngẫu nhiên trong không gian N chiều và M là tổng số mẫu có
trong thống kê.


B1: x =

1
M


M

∑x
i =1

i



B2: Thực hiện Φ i = x i − x



B3:Lập ma trận A = [ Φ1 Φ 2 ... Φ M

]

và tính C =

1
M

M

∑Φ Φ
i =1

i


T
i

=AAT



B4: Tính giá trị riêng của C: λ1 ≥ λ2 ≥ ... ≥ λN



B5: Tính các vectơ riêng của C: u1 ,u 2 ,...,u N
Vì C đối xứng (N x N) nên u1 ,u 2 ,...,u N là một cơ sở ta có:
x − x = b1u1 + b2u 2 + ... + bN u N



B6: (Giảm số chiều) Giữ lại thuộc tính tương ứng giá trị riêng lớn nhất.
K

xµ − x = ∑ bi u i trong đó K << N
i =1

Do đó sự biểu diễn của xµ − x trong u1 ,u 2 ,...,u K là:
b1 
 
b2 
... 
 
bK 


Phép biến đổi tuyến tính R N → R K nhằm giảm số chiều sẽ là:
T
b1  u1 
   T
b2  = u 2  x − x = U T x − x
...  ... 
   T
bK  u K 

(

)

(

)

B. SỬ DỤNG PHẦN MỀM SPSS ĐỂ MINH HỌA BÀI TẬP
Sử dụng một số hàm trong phần mềm SPSS để phân tích dữ liệu từ bảng điểm của lớp Giải
tích khóa 17 của Trường Đại học Cần Thơ. Chúng tôi có file dữ liệu nguồn SPSS file giai tich
k17_du lieu.sav của 25 học viên với 15 môn: Triết học, PPNC KHGD, đại số tuyến tính, giải
tích hàm, tin học ứng dụng, tôpô đại cương, giải tích thực, phương trình vi phân, giải tích số,
giải tích hàm nâng cao, phương trình đạo hàm, giải tích phức, giải tích lồi và ứng dụng, pp
phần tử hữu hạn, phương trình vi phân. (tương ứng với các biến x1,x2, …, x15).
Bảng dữ liệu điểm 15 môn của 25 học viên cao học ngành giải tích K17 Cần Thơ
8


STT


x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

x13

1

7.7


8.5

6.5

6.5

9

6

6.5

8.5

7

10

6

2.3

8

7.5

8

2


8.2

9

8.5

8

9.3

7

7.5

8.5

7.5

8.5

7

3.3

6

7

9


3

7.1

8

7.5

6

9

8

6

7.5

8

8

6.5

4.5

6

1


8

4

7.1

7

8.5

8

8.5

8

9

8.5

7.5

10

5.5

3.8

8


6.5

8.5

5

8.2

9

8.5

9

8.8

7

8

8.5

8

10

6.5

4


8.5

7

7.5

6

8

8.5

9

9

9.7

7

8.5

8.5

7

9.5

5.5


7

8.5

6

7.5

7

7.4

8.5

8

9

8.8

5.5

9

8

7

9.5


7

6

5.8

7.5

8

8

7.4

9

9

10

9

10

8.5

9

8.5


10

7.5

9

9

6.5

8.5

9

7.9

8.5

8

7

8.7

7

7

8


8.5

9.5

5.5

2

6

8

8.5

10

7.9

8.5

8.5

9

9.3

7

8.5


8

8.5

7.5

7

4.5

7

6.5

9

11

7.9

8

7.5

8

9.8

5.5


8

7.5

7

8

6.5

3

8.5

6

7.5

12

7.5

6

8

6

8.5


6

5.5

8

8

9.5

5.5

3

8

6.5

8.5

13

7.9

8.5

7.5

8


8

5.5

4.5

9

9

9

5.5

4.3

6.5

5.5

9

14

8

7

8


6

9.3

7

4

8

9

8

5.5

5.5

7

6.5

7.5

15

8

8.5


8

5.5

9

5.5

6.5

8

8.5

7.5

5.5

3.5

7.5

5.5

7.5

16

7.6


8.5

8.5

6.5

9.7

5.5

7

8.5

8.5

8.5

6.5

4.5

7.3

7.5

8

17


7.7

8.5

7.5

7

10

5.5

6

7.5

9

8.5

6.5

2

7.5

7

8.5


18

7.5

7

7.5

7

9

7

7

9

9

10

6.5

5.5

8

7.5


8

19

7.4

7.5

7.5

8.5

9.5

5.5

5.5

8.5

8.5

9.5

5.5

2.3

5.8


8

8

20

8

8.5

7.5

8

9

5.5

7

9

7

9

6

4


7.3

7

8.5

21

7.4

9

7.5

8

8.5

7

6.5

8.5

8.5

10

6.5


5.5

7.5

8.5

9

22

7.7

7.5

7.5

9

9

7

7

8.5

8.5

10


7

3.5

8

6.5

8

23

7.7

8

6

5.5

8.5

7

5.5

8.5

8


10

5

2

7

6.5

8.5

24

7.8

8.5

8

7.5

9

10

8

8


7.5

8.5

6.5

5.5

7.5

7.5

7.5

25

7.3

7.5

7.5

5.5

7

5.5

4.5


8.5

5.5

7.5

5.5

4.5

7

7

9

9

x14 X15


Dữ liệu được nhập trên phần mềm SPSS:

Bắt đầu phân tích giảm số chiều: Anlyze → Dimension Reduction → Factor

Đánh dấu tất cả các biến sẽ chọn là x1, x2, …, x15 và chọn bấm vào Descriptives như sau:
10



Khi chọn Descriptives, hộp thoại như xuất hiện, đánh dấu chọn KMO and Bartlett’s test of sphericity.

Khi chọn Extraction, hộp thoại xuất hiện. Ta sử dụng phương pháp trích mặc định của SPSS là
Principal components. Một phương pháp hay được sử dụng khác là Principal axis factoring.
Tiếp theo, nhấn nút Continue, sau đó nhấp vào Scores. Scores sẽ thêm các cột mới vào tập dữ
liệu của chúng ta, mỗi cột mới sẽ bao gồm Scores của mỗi biến trên mỗi thành phần rút

11


ra. Chọn Save as variables nếu bạn muốn lưu lại nhân số (đã chuẩn hoá) của từng nhân tố.
Sau đó, click vào nút Continue, sau đó nhấn nút OK

Khi bấm nút Options, hộp thoại Factor Analysis: Options xuất hiện. Trong hộp thoại này:
+Chọn Sorted by size để sắp xếp các biến quan sát trong cùng một nhân tố đứng gần nhau
+Chọn suppress absolute value less than nếu không thể hiện các trọng số nhân tố có rị tuyệt
đối nhỏ hơn một giá trị nào đó (ví dụ: 0.10)

KẾT QUẢ:

Bảng Ma trận nhân tố:
12


Component Matrixa
Component
1

2


3

4

5

6

x1

.140

-.395

.640

.008

-.211

.486

x2

.478

-.142

.394


-.497

-.055

.083

x3

.685

-.172

-.178

-.131

-.066

.304

x4

.824

.147

.202

-.114


.051

-.139

x5

.378

-.680

.292

.274

.221

-.173

x6

.557

.123

-.475

.098

.214


.087

x7

.812

-.084

.002

-.022

-.241

-.367

x8

.230

.772

.228

.051

-.007

.359


x9

.065

-.142

.186

.231

.881

.243

x10

.287

.642

.218

.463

.170

-.278

x11


.708

-.147

-.045

-.310

.214

-.270

x12

.668

.172

-.451

-.072

-.027

.357

x13

.445


.100

-.103

.594

-.285

.134

x14

.151

.403

.633

.103

-.122

-.112

x15

-.172

.538


.078

-.631

.240

-.032

Extraction Method: Principal Component Analysis.
a. 6 components extracted.
Trong bảng kết quả ở hình trên, có bao nhiêu cột tức là có bấy nhiêu thành phần chính (nhân
tố) được rút ra. Có 6 nhân tố được rút ra.
Bảng KMO và kiểm định Bartlett

13


Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Bartlett's Test of
Sphericity

Approx. Chi-Square

.562
127.159

df

105


Sig.

.070

KMO là một chỉ tiêu dùng để xem xét sự thích hợp của EFA, 0.5≤KMO≤1 thì phân tích nhân
tố là thích hợp. Kiểm định Bartlett xem xét giả thuyết Ho: độ tương quan giữa các biến quan
sát bằng không trong tổng thể. Nếu kiểm định này có ý nghĩa thống kê (Sig ≤ 0.05) thì các biến
quan sát có tương quan với nhau trong tổng thể.
Các bảng thống kê mô tả đơn giản là báo cáo, có nghĩa là độ lệch tiêu chuẩn, số trường hợp
cho mỗi biến trong phân tích.

14


Descriptive Statistics
Mean

Std.
Deviation

Analysis
N

x1

7.692

.3135


25

x2

8.120

.7676

25

x3

7.840

.6880

25

x4

7.500

1.3150

25

x5

8.956


.6212

25

x6

6.700

1.2910

25

x7

6.840

1.4195

25

x8

8.320

.4537

25

x9


7.960

.8651

25

x10

9.040

.9120

25

x11

6.160

.6727

25

x12

4.190

1.6883

25


x13

7.320

.9285

25

x14

6.660

1.3973

25

x15

8.220

.5416

25

15


Total Variance Explained
Initial Eigenvalues
% of

Variance

Total

Extraction Sums of Squared Loadings

Cumulative
%

Total

% of
Variance

Cumulative
%

1

3.845

25.635

25.635

3.845

25.635

25.635


2

2.252

15.012

40.647

2.252

15.012

40.647

3

1.705

11.367

52.015

1.705

11.367

52.015

4


1.496

9.971

61.986

1.496

9.971

61.986

5

1.214

8.090

70.076

1.214

8.090

70.076

6

1.025


6.832

76.908

1.025

6.832

76.908

7

.785

5.234

82.142

8

.583

3.885

86.026

9

.564


3.761

89.787

10

.511

3.406

93.193

11

.315

2.099

95.293

12

.254

1.693

96.985

13


.202

1.347

98.333

14

.132

.879

99.212

15

.118

.788

100.000

Extraction Method: Principal Component Analysis.

Trong hình trên, bạn quan tâm đến một con số ở cột cuối cùng của dòng số 6 (vì có 6 nhân tố
được rút ra). Con số này là 76.908. Người ta nói phương sai trích bằng 76.908 %. Con số này
cho biết 6 nhân tố giải thích được 76.908 % biến thiên của các biến quan sát (hay của dữ liệu).
Scree Plot


16


Biểu đồ gấp khúc thể hiện thông tin trong bảng trước gồm giá trị riêng của các thành phần.

17


Communalities
Initial

Extraction

x1

1.000

.867

x2

1.000

.660

x3

1.000

.644


x4

1.000

.776

x5

1.000

.844

x6

1.000

.614

x7

1.000

.861

x8

1.000

.833


x9

1.000

.948

x10

1.000

.862

x11

1.000

.740

x12

1.000

.812

x13

1.000

.671


x14

1.000

.624

x15

1.000

.781

Extraction Method: Principal
Component Analysis.

Phương sai tương đối của các yếu tố đơn giản là tổng bình phương của các thành phần và đại
diện cho lượng phương sai của biến số chiếm đa số trong các thành phần. Ví dụ, cả sáu thành
phần chiếm 78.1% phương sai trong biến số x15 ( 0.781) .
Để xác định một thành phần có liên quan hay không, chúng ta có thể kiểm tra một tương quan
đơn trên các thành đã lưu. Click vào Analyze > Correlate > Bivariate

18


Tiếp theo, đánh dấu các nhân tố REGR và sử dụng các nút mũi tên để di chuyển chúng đến
hộp Variables, click OK

Correlations
REGR

factor
score 1
for
analysis
STT
1

REGR
factor
score 2
for
analysis
1

REGR
factor
score 3
for
analysis
1

REGR
factor
score 4
for
analysis
1

-.320


.218

.089

.080

.057

.126

.119

.294

.671

.703

.788

.549

25

25

25

25


25

25

25

REGR Pearson
-.320
factor Correlation
score
.119
1 for Sig. (2analysis tailed)
1
N
25

1

.000

.000

.000

.000

.000

1.000


1.000

1.000

1.000

1.000

25

25

25

25

25

25

.000

1

.000

.000

.000


.000

STT

Pearson
Correlation

1

Sig. (2tailed)
N

REGR Pearson
factor Correlation
score

.218

19

REGR REGR
factor
factor
score 5 score 6
for
for
analysis analysis
1
1



Sig. (2tailed)

.294

1.000

1.000

1.000

1.000

1.000

25

25

25

25

25

25

25

REGR Pearson

factor Correlation
score
3 for Sig. (2analysis tailed)
1
N

.089

.000

.000

1

.000

.000

.000

.671

1.000

1.000

1.000

1.000


1.000

25

25

25

25

25

25

25

REGR Pearson
factor Correlation
score
4 for Sig. (2analysis tailed)
1
N

.080

.000

.000

.000


1

.000

.000

.703

1.000

1.000

1.000

1.000

1.000

25

25

25

25

25

25


25

REGR Pearson
factor Correlation
score
5 for Sig. (2analysis tailed)
1
N

.057

.000

.000

.000

.000

1

.000

.788

1.000

1.000


1.000

1.000

25

25

25

25

25

25

25

REGR Pearson
factor Correlation
score
6 for Sig. (2analysis tailed)
1
N

.126

.000

.000


.000

.000

.000

1

.549

1.000

1.000

1.000

1.000

1.000

25

25

25

25

25


25

N

Bảng trên thể hiện các thành phần có mối tương quan với nhau.

20

1.000

25



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×