Tải bản đầy đủ (.pptx) (35 trang)

Bài giảng SPSS suy luận cơ bản trong thống kê ths lê văn hùng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (698.58 KB, 35 trang )

BÀI GIẢNG SPSS

SUY LUẬN CƠ BẢN TRONG THỐNG KÊ

(Basic Inferential Statistics)

THS. LÊ VĂN HÙNG

ĐT: 0906238311 – Email:

12/4/15

1


Nội dung

1

CHI-SQUARE

2

TƯƠNG QUAN (CORELATIONS)

3

HỒI QUY (REGRESSION)


1. CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN



1. Biến độc lập (independent variable)
Biến độc lập là một đặc tính được lựa chọn để nghiên cứu. Biến độc lập được giả thuyết là một biến không
phụ thuộc vào biến khác, sự biến đổi của nó có ảnh hưởng chi phối hoặc gây ra những biến đổi kéo theo ở
một biến khác.
2. Biến phụ thuộc (dependent variable)
Biến phụ thuộc là một biến mà sự biến đổi của nó chịu sự chi phối (đáp ứng) của 1 biến khác. Một biến được
gọi là biến phụ thuộc khi giá trị của nó tuỳ thuộc vào giá trị của biến độc lập. Nó chính là hiệu quả giả định
của biến độc lập.

12/4/15

3


1. CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)

3. Mốt (yếu vị_mode)
Yếu vị của một tập hợp các đo lường là trung điểm của khoảng đẳng loại chứa đựng tần số tối đa hay trong trường hợp
các biến định tính, nó là tên của loại đo lường có tần số lớn nhất.

4.Trung vị (median)
Trung vị của một tập hợp đo lường là trị số rơi vào chính giữa khi các số đo lường ấy được xếp đặt theo thứ tự độ lớn của
chúng
Công thức tính trung vị = số hạng thứ1/2* (N+1)
Nếu có số chẵn quan sát thì lấy giá trị trung bình của thứ hạng đứng trường và sau.

12/4/15

4



1. CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)

5. Giá trị trung bình (mean)

Trung bình mẫu (ký hiệu là µ, hoặc EX hoặc), được xác đònh theo công thức:

m

xi .ki m
µ=∑
= ∑ pi . xi
i =1 n
i =1
Nếu cho dạng ghép lớp thì dùng trung điểm của đoạn làm giá trị đại diện

12/4/15

Chương 6 - SPSS

5


1. CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)

6.Hiệp phương sai (covariance)

 Hiệp phương sai là độ đo sự biến thiên cùng nhau của hai biến ngẫu nhiên (phân biệt với phương sai đo mức độ biến thiên của một biến)


 Nếu 2 biến có xu hướng thay đổi cùng nhau (nghĩa là, khi một biến có giá trị cao hơn giá trị kỳ vòng thì
biến kia có xu hướng cũng cao hơn giá trị kỳ vọng), thì hiệp phương sai giữa hai biến này có giá trị
dương. Mặt khác, nếu một biến nằm trên giá trị kì vọng còn biến kia có xu hướng nằm dưới giá trị kì
vọng, thì hiệp phương sai của hai biến này có giá trị âm

12/4/15

6


1. CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)

7. Phương sai (variance)
Phương sai dùng để đo lường mức độ phân tán của dữ liệu. Nếu phương sai lớn thì dữ liệu phân tán, không
đồng đều. Ngược lại nếu phương sai mà nhỏ thì dữ liệu tập trung, ít phân tán.

8. Độ lệch chuẩn (Standard deviation)
Độ lệch chuẩn là căn bậc 2 của phương sai. Có ý nghĩa tương tự như phương sai.

12/4/15

7


2. KIỂM NGHIỆM CHI-SQUARE

Analyze/Descriptive statistics/ Crosstabs sau đó chọn statistics...

12/4/15


8


2. KIỂM NGHIỆM CHI-SQUARE

 Là một công cụ thông kê sử dụng để kiểm nghiệm giả thuyết cho rằng các biến trong hàng và cột thì
độc lập với nhau (H0).

 Phương pháp kiểm nghiệm này chỉ cho ta biết được liệu một biến này có quan hệ hay không với một
biến khác

 Phương pháp kiểm nghiệp này không chỉ ra cường độ của mối quan hệ giữa hai biến mạnh hay yếu
(nếu có quan hệ), cũng như không chỉ ra hướng thuận hay nghòch của mối quan hệ này (nếu có quan
hệ).

12/4/15

9


2. KIỂM NGHIỆM CHI-SQUARE



Giả thuyết H0 (Null hypothesis): “ Không có mối liên hệ nào giữa hai biến” ( Hay ta hiểu hai biến độc lập với nhau)



Đối thiết H1: Hai biến có quan hệ với nhau




Tính toán:



i =1 làj =bậc
1 tự do (degree
ij
Tìm giá trị giới hạn với df = (r-1).(c-1)
of freedom)

r

c

X 2 = ∑∑

(Oij − E ij ) 2
E

 Kết luận:
2
Nếu X > giá trị giới hạn thì bác bỏ H 0, ngược lại thì chấp nhận H0.
(Hoặc sử dụng Sig (mức ý nghĩa quan sát_Observed significane level) để tránh dùng bảng tra: nếu sig>

12/4/15

10



2. KIỂM NGHIỆM CHI-SQUARE

Để việc kiểm nghiệm này là đáng tin cậy thì các số liệu trong bảng chéo giữa hai biến đang khảo sát phải thỏa
mãn một số điều kiện nhất đònh sau:

 Không tồn tại ở bất kỳ ô giao nhau giữa hai biến có giá trò mong đợi nhỏ hơn 1.
 Không vượt quá 20% lượng ô giao nhau giữa hai biến đang khảo sát trong bảng chéo có giá trò nhỏ hơn 5 (đối
với bảng 2x2-bảng mà mỗi biến trong bảng chéo chỉ có hai giá trò, phần trăm giới hạn này là 0%)

12/4/15

11


2. KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

Từ menu chọn Analyze/Descritipve Statistics/ Crosstabs

12/4/15

12


2. KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

Nhấn vào Statistics, nhấn Chi-square rồi nhấn continue

Các đại lượng kiểm định
dành cho trường hợp 2 biến

định danh

Các đại lượng kiểm định
dùng cho trường hợp 2 biến
dạng thứ bậc

12/4/15

13


2. KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

Nhấn vào cell nhằm xác định các đại lượng thống kê

12/4/15

14


2. KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

12/4/15

15


2. KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ




Dòng cuối cùng thơng báo Số ơ có tần số <5



Đối với dạng bảng chéo có hai cột và hai dòng (2X2 tables) – mỗi biến trong bảng chỉ có hai giá trò, ta dùng các chỉ số Yate’s corrected chisquare hay còn gọi là Continuity Correction đánh giá mối tương quan giữa hai biến trong bảng



Likelihood Ratio tương tự như pearson Chi-square



Linear-by-Linear Association: Đo lường mối quan hệ tuyến tính giữa hai biến, chỉ số này chỉ có ý nghĩa khi số liệu trong hàng và cột đã được sắp
xếp theo thứ tự tăng dần.

12/4/15

16


3. CORRELATION (SỰ TƯƠNG QUAN)



Dùng để đo lường mối tương quan giữa hai biến thứ t ự hoặc khoảng cáchï. Việc đo lường mối tương quan giữa hai biến thứ tự này
chủ yếu dự vào hai hệ số Spearman’s correlation coefficient rho và Pearson correlation coefficient




Spearman’s rho được dùng để đo lường mối quan hệ giữa hai biến thứ tự (các biến này hầu hết đều được xắp xếp từ thấp nhất đến
cao nhất)



Khi các biến trong bảng là các biến đònh lượng ta sử dụng hệ số Pearson correlation coefficient để đo lường mối quan hệ tuyến
tính giữa các biến này



Các giá trò của hệ số tương quan biến thiên từ –1 đến 1, dấu cộng hoặc trừ chỉ ra hương tương quan giữa các biến (thuận hay
nghòch), giá trò tuyệt đối của chỉ số này cho biết cường độ tương quan giữa hai biến, giá trò này càng lớn mối tương quan càng
mạnh.

12/4/15

17


3. CORRELATION (SỰ TƯƠNG QUAN)



Dùng để đo lường mối tương quan giữa hai biến thứ tư hoặc khoảng cáchï. Việc đo lường mối tương quan giữa hai biến thứ tự này
chủ yếu dự vào hai hệ số Spearman’s correlation coefficient rho và Pearson correlation coefficient



Spearman’s rho được dùng để đo lường mối quan hệ giữa hai biến thứ tự (các biến này hầu hết đều được xắp xếp từ thấp nhất đến
cao nhất)




Khi các biến trong bảng là các biến đònh lượng ta sử dụng hệ số Pearson correlation coefficient để đo lường mối quan hệ tuyến
tính giữa các biến này



Các giá trò của hệ số tương quan biến thiên từ –1 đến 1, dấu cộng hoặc trừ chỉ ra hương tương quan giữa các biến (thuận hay
nghòch), giá trò tuyệt đối của chỉ số này cho biết cường độ tương quan giữa hai biến, giá trò này càng lớn mối tương quan càng
mạnh.

12/4/15

18


3. CORRELATION (SỰ TƯƠNG QUAN)



Giữa hai biến đònh danh:

Để đo lường mối quan hệ giữa hai biến biểu danh. Sử dụng các hệ số Phi (coefficient) và Cramer’s V, Contingency coefficient để đo
lường nếu dựa vào kết quả kiểm nghiệm Chi-bình phương. Ở đây các hệ số này sẽ bằng 0 nếu và chỉ nếu hệ số Pearson chi bình phương
bằng 0. Do đó người ta sử dụng các thông số này để kiểm nghiệm giả thuyết cho rằng các hệ số này đều bằng 0 - điều này tương đương
với giả thuyết độc lập giữa hai biến, hay hai biến không có môí quan hệ với nhau. Ta sẽ từ chối giả thuyết này




Phi: Chỉ dùng cho dạng bảng 2x2 tables, hệ số phi coefficient này biến thiên từ -1 đến +1. Do đó hệ số này ngoài khả năng chỉ ra
mối quan hệ và cường độ của mối quan hệ nó còn chỉ ra hướng của mối quan hệ đo



Cramer's V và Contingency coefficient (hệ số liên hợp): Được sử dụng cho bảng mà số cột và hàng là bất kỳ, giá trò kiểm nghiệm
biến thiên từ 0 đến 1, với giá trò 0 chỉ ra không có mối quan hệ giữa các biến

12/4/15

19


3. CORRELATION (SỰ TƯƠNG QUAN)



Lambda (symmetric and asymmetric lambdas and Goodman and Kruskal’s tau), và Uncertainty coefficient. Là các đo lường không
dựa vào giá trò Chi-square để tính toán, và không quan tâm đến tính đối xứng của phân phối chuẩn.



Các giá trò của hệ số này cũng biến thiên từ 0 đế 1 và được dùng để đo lường khả năng dự báo của một biến (biến độc lập) đối với
một biến khác (biến phụ thuộc).



Với giá trò 0: chỉ ra khơng có mối liên hệ giữa các biến nhận được có ý nghóa rằng những kiến thức về biến độc lập không
giúp ích gì cho việc dự báo những khả năng xảy ra của biến phụ thuộc,




Giá trò 1 cho biết khi ta biết được những thông tin về biến độc lập thì nó sẽ giúp ta xác đònh được một cách hoàn hảo các khả
năng xảy ra cho biến phụ thuộc

12/4/15

20


4. SỬ DỤNG SPSS TRONG TƯƠNG QUAN





Xét 2 biến c19.3 (mức độ quan tâm đến chủ đề gia đình) và dotuoi (nhóm tuổi).
Vào Analyze/Descritipve Statistics/ Crosstabs
Đưa c19.3 vào Row và dotuoi vào column

12/4/15

21


4. SỬ DỤNG SPSS TRONG TƯƠNG QUAN

12/4/15

22



4. SỬ DỤNG SPSS TRONG TƯƠNG QUAN

12/4/15

23


5. TƯƠNG QUAN VÀ HỒI QUY

5.1. TƯƠNG QUAN TUYẾN TÍNH
Hệ số tương quan đơn r (pearson Correlation Coefficient)



R để đo mức độ chặt chẽ của mối quan hệ tuyến tính giữa 2 biến định lượng



cho chúng ta biết mức độ chặt chẽ của mối liên hệ tuyến tính. Nếu tiến gần đến 1 thì mối tương quan tuyến tính
chặt chẽ.



R=0 thì 2 biến không có mối liên hệ tuyến tính.

12/4/15

24



5.1. HỆ SỐ TƯƠNG QUAN

Vào Analyze/Correlate/Bivariate…

Two– tailed: Kiểm định
2 phía

Hệ số tương
quan hạng

12/4/15

25


×