Tải bản đầy đủ (.pdf) (63 trang)

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - HỒI QUY TUYẾN TÍNH ĐA BIẾN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.37 MB, 63 trang )

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

Hồi quy tuyến tính đa biến
Lê Đông Nhật Nam


Lời nói đầu
Chào các bạn, chúng ta lại có dịp gặp nhau lần này để bàn về một chủ đề khá thú vị, đó là mô hình hồi quy
tuyến tính. Thực ra các bạn sinh viên Y khoa chịu thiệt thòi nhiều hơn sinh viên ngành Kinh tế, vì bên đó
mô hình hồi quy được dạy rất chi tiết và sâu. Tuy nhiên trong việc khám chữa bệnh hằng ngày, chúng ta lại
ứng dụng mô hình hồi quy rất nhiều, để tiên lượng và dự báo. Tất cả những khái niệm định lượng trong
cuộc sống đều liên quan tới phương pháp này.
Khi còn là học sinh lớp 7, người ta bắt trẻ con khảo sát và vẽ đồ thị hàm số bậc nhất, giải phương trình bậc
2 và 5 năm sau học sinh lại bị ép buộc phải khảo sát những hàm bậc cao hơn, giải những phương trình
phức tạp hơn… nhưng chưa bao giờ trường lớp dạy cho ta biết ý nghĩa thực sự của những việc nhàm chán
này. Trong khi ra đời ta liên tục chịu những áp lực về sự thành/bại và trong hoàn cảnh khó khăn ta phải tự
tìm giải pháp cho chính mình. Một trong những tình huống đó là dự báo kết quả (1 con số) từ nhiều yếu tố
khách quan, với hy vọng có thể thay đổi số phận. Muốn thi vào Y khoa thì phải học 3 môn Toán, Hóa, Sinh,
vào đại học rồi phải lo dự báo điểm tốt nghiệp, điểm TOIEC, IELTS…, khi đi làm thì lập kế hoạch tài chánh
cho việc kết hôn, mua nhà… tất cả đều là những hàm số đa biến mà kết quả (Y) có thể đảo lộn hoàn toàn
chỉ vì một thay đổi nhỏ của biến số, hệ số, tham số bên trong. Ngược lại, nghiệm ra giá trị (X) cũng như giải
một phương trình của chính cuộc đời mình. Cuộc đời thực dạy môn toán cho chúng ta tốt hơn bất cứ ông
thầy nào.
Qua tập tài liệu « nhỏ » này, tác giả hy vọng giúp các bạn thực hiện phân tích hồi quy tuyến tính một cách
dễ dàng và nhanh chóng nhất. Có thể bạn là 1 bác sĩ nội trú đang chạy đua với thời gian hoàn thành luận
văn, hoặc một sinh viên y khoa tò mò đang vọc phá SPSS, không sao cả vì nội dung trình bày và cách tiếp
cận trong tài liệu rất giản dị. Như thường lệ, BS. Khả Nhi sẽ đơn giản hóa tối đa những lý thuyết phức tạp
và trao cho bạn một công cụ dễ sử dụng, cho phép bạn tự mình làm mọi thứ ngay sau khi đọc xong.
Chúc các bạn thành công.



Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái
Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ. Anh ta sẽ xuất
hiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và
ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lý
thuyết thống kê. Tuy nhiên BS Thái lại rất bận rộn nên không đủ thời
gian đi vào cách thực hiện chi tiết. Anh ta cũng hay trình bày lý thuyết
thuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũi
với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống
kê …

Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành
thạo SPSS. Như tên gọi của mình, BS Nhi có tính cách hồn
nhiên và ngây thơ như trẻ con, vì vậy cô ấy luôn có khuynh
hướng đơn giản hóa tối đa mọi vấn đề. Khả Nhi sẽ hướng
dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ
những mẹo vặt, thủ thuật để giúp các bạn đi đến kết quả
nhanh và dễ dàng nhất.

Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên
cứu khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra
nhiều câu hỏi liên quan đến thống kê. Mặc dù những đế tài do Bảo
thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ
hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu.


3


1

1.1 Tình huống thí dụ

Thẩm phân phúc mạc

Khảo sát vận tốc sóng mạch

Vận tốc lan truyền sóng mạch là một chỉ số cận lâm sàng cho phép khảo sát tính
đàn hồi của thành động mạch. Các bệnh nhân được can thiệp bằng thẩm phân
phúc mạc hay lọc thận nhân tạo kéo dài có nguy cơ tăng độ cứng thành mạch.
Trong nghiên cứu nhỏ này, một bác sĩ nội trú khoa ngoại niệu muốn khảo sát sự
liên hệ giữa vận tốc sóng mạch cổ chân-cánh tay với những đặc điểm lâm sàng và
điều trị trên 40 bệnh nhân thậm phân phúc mạc định kỳ kéo dài > 4 tháng.
Vận tốc sóng mạch được đo bằng máy Omron VP-1000. Các yếu tố lâm sàng và
điều trị thu thập được gồm có. Tuổi, số đo huyết áp, BMI, thời gian thẩm phân
phúc mạc; và các loại thuốc hạ áp khác nhau như: Ức chế men chuyển, đối kháng
thụ thể Angiotensin, Beta blocker, Calci blocker.
Sau khi đã hoàn tất số liệu, chúng ta phải dùng phương pháp thống kê nào để trả
lời cho câu hỏi nghiên cứu đã đặt ra ban đầu ?

Bảo thân mến, đây là một trường hợp điển hình có thể áp dụng
phân tích hồi quy tuyến tính đa biến. Đây là phương pháp toàn
diện và triệt để hơn nhiều so với phân tích tương quan Pearson
rời rạc. Chúng ta sẽ khởi hành nhé ?



1

1.2 Giới thiệu
Phù hợp ?

Y
Mẫu khảo sát

Y

Giá trị quan sát thực tế (Y)

Giá trị dự báo: Pred(Y)

Biến định tính
nhị phân

N trường hợp

Tương quan tuyến tính
giữa Y và A

B

A

D

C


Biến định lượng

Biến thứ hạng
Mô hình hồi quy [M]
Quần thể chung

Pred Y t.bình

Y

Tương quan bộ phận giữa Y và
A,B,C,D…
A

B
D

C
Y

A

Pred Yi

Cá thể i

B

A


D

C

Dự báo giá trị Y của 1 các thể bất kì
Trong quần thể ngẫu nhiên

Mô hình hồi quy [M]

Nguyên tắc của hồi quy tuyến tính:
Trong một mẫu khảo sát với n đối tượng, nghiên cứu sinh ghi nhận giá trị thực tế của Y,A,B,C,D.
Y là 1 biến số định lượng liên tục (biến phụ thuộc).
A,B,C,D là những biến độc lập hay yếu tố dự báo, hay tham số. Chúng có thể là biến định lượng, định tính hoặc
thứ hạng.
Nghiên cứu sinh xây dựng mô hình hồi quy có dạng:
Y=Hằng số Bo +b1*A+b2*B+b3*C+ sai số ngẫu nhiên
Mô hình này cho phép dự báo giá trị Y = Pred(Y)
Nếu mô hình phù hợp tốt, Pred(Y) sẽ rất gần với Y thực tế.

Ứng dụng của phân tích hồi quy tuyến tính:
1.

Cho phép dự báo giá trị Y của một cá thể i bất kỳ trong quần thể chung, cũng như xác định giá trị Y trung
bình, và những giới hạn trên và dưới của Y trong 1 quần thể đồng nhất. Ứng dụng này rất hữu ích trong
lâm sàng: xác định giá trị bình thường của 1 đại lượng sinh lý, bệnh học và ngưỡng chẩn đoán, tiên lượng
kết quả điều trị…

2.


Khảo sát mối liên hệ riêng và bộ phận giữa các yếu tố độc lập và 1 đại lượng Y. Mô hình hồi quy cho ra cái
nhìn toàn diện và chính xác hơn so với phép phân tích tương quan đơn giản, về quan hệ giữa Y và các yếu
tố này. Mô hình hồi quy là giải pháp tối ưu để chứng minh 1 giả thuyết nghiên cứu phức tạp chứa nhiều
biến số.

3.

Mô hình hồi quy tuyến tính là cơ sở của rất nhiều thiết kế nghiên cứu khảo sát, so sánh biến số định
lượng; tất cả những thiết kế thông dụng như test t cho phân nhóm độc lập, ANOVA đơn biến, ANCOVA,
Moderation, Mediation… đều có bản chất là mô hình hồi quy tuyến tính.

Kết luận: Nên sử dụng phương pháp hồi quy tuyến tính cho: Thiết kế nghiên cứu định lượng, với nhiều biến số,
và/hoặc với mục đích dự báo.


1

1.2 Giới thiệu

Trong trường hợp đơn giản nhất ta có:
Mẫu khảo sát

Y

Giá trị dự báo Y = hằng số + hệ số x biến số dự báo + sai số
Y =Bo+ b*X + ε
Mô hình này có thể mở rộng với nhiều biến số (hay yếu tố) dự
báo (x1, x2… xi)

N=5 trường hợp


X
Y

Hằng số bo là hệ số dự báo đặc biệt tương ứng với giá trị biến số
dự báo x=0
Nếu bạn còn nhớ về những kỷ niệm năm lớp 7, bạn sẽ nhận ra
đây chính là hàm số bậc nhất. Còn kiến thức năm lớp 12 sẽ cho
biết đây là phương trình của một đường thẳng trong hệ tọa độ
OXY. Đồ thị của hàm số dự báo này là 1 đường thẳng, cắt trục
tung OY ở giá trị bo, với hệ số góc b1 (nếu chỉ có 1 yếu tố dự báo
thì b1 chính là hệ số dự báo).

bo
X

Mô hình hồi quy tuyến tính đơn giản nhất chỉ có 1 biến số, gọi là
hồi quy đơn biến :
Y = bo + bx + ε
Mô hình hồi quy tuyến tính tổng quát có thể chứa nhiều yếu tố
dự báo, gọi là hồi quy đa biến :
Y = bo + (b1x1)+(b2x2)+… (bi*Xi) + ε
Hàm số này cho phép dự báo giá trị y tùy theo giá trị của x cho
trước.
Trong phương pháp hồi quy tuyến tính :

Ví dụ về mô hình hồi quy 2 biến: Đồ thị của
quan hệ 3 chiều giữa vận tốc sóng mạch và
Tuổi, HA tâm thu.


Y gọi là biến số phụ thuộc (dependent variable) hay giá trị dự báo
(predicted outcome)
X gọi là biến số độc lập (independent variable) hay yếu tố dự báo
(factor, predictor)
Giá trị ε gọi là sai số hay phần bất định (residual, error)
B gọi là hệ số hồi quy (Beta)
Một mô hình được xem là tốt khi nó cho ra giá trị dự báo phù
hợp với giá trị thực tế quan sát được (tính phù hợp dữ liệu là một
tiêu chuẩn để đánh giá chất lượng của mô hình).


1

1.3 Test F của Fisher
Mô hình hồi quy cho phép
dự báo thu được 10,000
mũi tên ± sai số ngẫu nhiên

Mô hình này có k= 5 (tính cả hằng số Bo)
Gia Cát Lượng chỉ áp dụng 1 lần duy nhất, nhưng
không biết trong đầu ông ta đã làm bootstrap bao
nhiêu lần ?

Mức độ phù hợp số liệu của mô hình được đánh giá bằng test F (giống như test F mà ta biết trong ANOVA)
F là tỉ số giữa giá trị trung bình phương sai hệ thống (do mô hình: MSM) và trung bình của phương sai ngẫu nhiên
(MSR)

𝑆𝑆𝑀
)
𝑀𝑆𝑀

𝑑𝑓𝑀
𝐹=
=
𝑆𝑆𝑅
𝑀𝑆𝑅
𝑑𝑓𝑅
(

dfM

SSM

dfR

SSR
SST

Trong đó MSM là trung bình bình phương sai số do mô hình, MSR là trung bình bình phương sai số không do mô hình
(yếu tố ngẫu nhiên, phần bất định): SSM và SSR là tổng phương sai của do mô hình và do yếu tố ngẫu nhiên.
dfM và dfR lần lượt là độ tự do của SSM và SSR. Trung bình bình phương bằng tổng bình phương chia cho độ tự do df
dfM = số lượng yếu tố dự báo (biến số x) có trong mô hình;
𝑑𝑓𝑀 = 𝑘
ví dụ mô hình dự báo
y = bo+b1*X1+b2*X2 có 3 yếu tố (Bo, X1, X2) do đó df =3
dfR = số trường hợp quan sát (cỡ mẫu) trừ cho số lượng tham số k (bao gồm cả hằng số bo và hệ số bi)
𝑑𝑓𝑅 = 𝑁 − 𝑘
ví dụ mô hình y = bo+b1x được thiết lập dựa vào quần thể có n = 20, thì dfR = 20 –2 = 18.
Căn bậc 2 của hệ số R2 chính là hệ số tương quan r của Pearson, đo lường sự tương quan giữa Y và X



1

1.3 Test F của Fisher
F for « Fisher »
Kiểm định F được GS. Ronald A. Fisher thiết kế
năm 1920. Test F dùng để kiểm tra giá trị của các
mô hình hồi quy.

Not this Fisher !

Giáo sư Ronald Aylmer Fisher
(1890-1962) Nhà di truyền học và
thống kê người Anh

F khảo sát mức độ phù hợp của mô hình, tỉ lệ giữa khả năng dự báo nội tại và phần sai số do ngẫu nhiên. Giá trị F > 1
được trông đợi, và F càng cao thì mô hình càng tốt (càng phù hợp tốt với dữ liệu thực tế ) vì MSR càng nhỏ thì sai
biệt giữa giá trị dự báo và giá trị thực tế càng nhỏ).
F cũng có thể biểu diễn như một test thống kê kiểm tra ý nghĩa của hệ số R2
𝐹=

𝑁 − 𝑘 − 1 𝑅2
𝑘(1 − 𝑅2 )

Với N = số trường hợp, k là số lượng yếu tố dự báo
Với giả thuyết H0 là R2 = 0

1.4 Test t: kiểm tra ý nghĩa của hệ số hồi quy Beta
Cây giờ ta sẽ đánh giá ý nghĩa của mỗi yếu tố dự báo (biến số x), thông qua hệ số hồi quy Beta (B)
Một yếu tố dự báo (hay biến xi) không có ý nghĩa khi nó nhận hệ số bi=0 ; tức là dù xi thay đổi nhưng
không ảnh hưởng gì đến y. Như vậy: giả thuyết H0: bi = 0

Để kiểm tra giả thuyết liệu 1 chỉ số nào đó khác 0 ?, ta lại sử dụng test t
Đầu tiên ta tính giá trị t:
𝑡=
Do b trong giả thuyết = 0, nên 𝑡 =

𝑏 𝑡ℎự𝑐 𝑡ế − 𝑏 𝑔𝑖ả 𝑡ℎ𝑢𝑦ế𝑡
𝑆𝐸𝑏

𝑏 𝑚𝑜𝑑𝑒𝑙
𝑆𝐸𝑏

Độ tự do của t 𝑑𝑓𝑡 = (𝑁 − 𝑘) − 1
Trong đó k là số lượng yếu tố dự báo (biến số)
Ví dụ mô hình hồi quy tuyến tính đơn biến có dft = (N-2)
Kiểm tra giả thuyết này bằng cách đọc bảng t, tìm giá trị p… như ta đã biết
Đến đây, chắc các bạn đã phát hiện ra điều thú vị là hầu hết những phương pháp ta thường dùng (so
sánh bằng test t, ANOVA, tương quan pearson) đều dẫn về một nguồn gốc chung là mô hình hồi quy
tuyến tính.


2

2.1 Quy trình phân tích hồi quy đa biến trong SPSS

Mục tiêu: Lọc ra những biến số độc lập có quan hệ mạnh
nhất với biến số Y

1

2


Thăm dò biến số

Thăm dò các mô hình hồi quy đa biến

Công cụ:
Biến định lượng: Kiểm tra bằng ma trận tương quan, sử dụng
r của Pearson.
Biến định tính: Kiểm tra bằng mô hình hồi quy đơn biến

Mục tiêu: Tìm ra mô hình hồi quy tối ưu với những tiêu chí:
khả năng dự báo tốt nhất, sai số thấp nhất, phù hợp dữ liệu
cao nhất.
Phương pháp: Thăm dò từng bước tất cả khả năng tổ hợp
giữa các biến số độc lập.
Có thể làm thủ công, hoặc áp dụng quy trình tự động
(stepwise, thoái triển, tiến triển trong SPSS).

3

Kiểm tra nội dung mô hình tối ưu

Sau khi tìm ra mô hình tối ưu ở cuối bước 2, ta chạy phân
tích hồi quy lần 2 trên chính mô hình này, có sao lưu dữ liệu
về sai số.
Mục tiêu:
+ Kiểm tra những giả định về phẩm chất mô hình.
+ Phát hiện điểm cá biệt và gây ảnh hưởng xấu cho mô hình
+ Phát hiện các vi phạm như đa cộng tuyến, tự tương
quan…


4

Kiểm tra ý nghĩa phổ quát mô hình

Chạy phân tích hồi quy lần 3 cho cùng mô hình tối ưu, lần
này có kèm Bootstrap.
Mục tiêu: Kiểm tra lần cuối về ý nghĩa phổ quát của hệ số hồi
quy.

Không có quy trình cố định nào cho việc xây dựng mô hình hồi quy tối ưu. Tài liệu này cũng sẽ không đưa
ra 1 quy trình cụ thể nào.
Quy trình có thể đơn giản hay phức tạp tùy thuộc vào câu hỏi nghiên cứu, số lượng biến số cần nghiên
cứu và phẩm chất của bảng số liệu. Trong đa số trường hợp, bạn cần đi qua 4 công đoạn:
(1) Tìm ra phần « lõi » của mô hình bằng cách phân lập những biến số có tương quan mạnh nhất với Y
(2) Thăm dò tất cả tổ hợp có thể giữa phần lõi và những biến số nghi ngờ, công đoạn này có thể làm thủ
công hoặc tự động;
(3) Khi đã loại bỏ tất cả biến số yếu, ta sẽ có mô hình tối ưu, như thế vẫn chưa đủ, bạn còn phải kiểm tra
khả năng dự báo chính xác của nó và phát hiện những case không phù hợp với mô hình này.
(4) Cuối cùng, bạn sẽ áp dụng bootstrap để kiểm tra ý nghĩa phổ quát của mô hình. Bootstrap còn cho
phép cải thiện một số vi phạm về số liệu mà bước 3 đã phát hiện ra.


2

2.2 Mô tả giao diện chức năng phân tích hồi quy trong SPSS
2.2.1 Kích hoạt chức năng phân tích hồi quy

1


2
3

4

7
6
5

Quy trình hồi quy tuyến tính trên giao diện
1-3) Kích hoạt quy trình: Nhấn Analyze > Regression > Linear
4) Kéo biến số Y vào ô Dependent
5) Chọn phương pháp : Enter, Stepwise, Backward, Forward…
6) Kéo biến số dự báo vào ô Independent
7) Tùy chỉnh thống kê


2

2.2 Mô tả giao diện chức năng phân tích hồi quy trong SPSS
2.2.2 Tùy chỉnh thông kê

Hộp thoại Option cho phép tùy chỉnh một số tiêu chuẩn như:
-

Tiêu chuẩn đánh giá mô hình trong quy trình thăm dò tự động (Stepwise)
Cách xử trí trong trường hợp sót dữ liệu (missing value)
Mô hình có hay không có hằng số Bo?

Case


X1

X2

1

X1-1

X2-1

2

X1-2

3

X1-3

X2-3

X1-5

X2-5

4
5

Nếu chọn Exclude case Listwise:
Case 2 và 4 sẽ không được xét trong cả 2 phân tích tương

quan Y(X1) và Y(X2).
Nếu chọn Exclude case Pairwise
Case 2 sẽ không được xét trong phân tích tương quan Y(X2)
nhưng vẫn được xét trong tương quan Y(X1).
Case 4 dĩ nhiên không được xét trong cả 2 phân tích.
Nếu chọn Replace with mean: SPSS sẽ tự động lấp chỗ trống
số liệu cho case 2 bằng giá trị trung bình X2 và Case 4 bằng
giá trị trung bình của X1 và X2.
Nhận xét: Nên chọn Exclude cases pairwise để đạt được cỡ
lẫu tối ưu cho mỗi biến số dự báo. Hai lựa chọn còn lại
không nên chọn, vì sẽ gậy sai lệch cho hệ số hồi quy trong
mô hình.
Nên chọn: Include constant in equation.
Nên chọn sử dụng xác suất của trị số F hơn là bản thân giá
trị F.


2

2.2 Mô tả giao diện chức năng phân tích hồi quy trong SPSS
2.2.3 Tùy chỉnh thống kê phụ
c
a
d
e

b

f


h

g

i

Danh mục các tùy chỉnh thống kê:

a

Estimates: Tính hệ số hồi quy beta cho mỗi biến độc lập, làm test t để kiểm định giả thuyết B=0 nhằm xác
nhận vai trò của yếu tố dự báo.

b

CI95% Xác định khoảng tin cậy 95% của mỗi hệ số hồi quy B (có hoặc không sử dụng Bootstrap).

c

Model fit: đây là chức năng quan trọng, bao gồm bảng ANOVA với test F nhằm kiểm tra ý nghĩa thống kê
của mô hình, tính hệ số R2 và R2 hiệu chỉnh theo Wherry.

d

e

f

R2 change: Chức năng này hữu ích khi thực hiện thăm dò qua nhiều bước (Blockwise, stepwise, forward
hay backward), nó cung cấp giá trị thay đổi của R2 giữa mô hình mới và mô hình cũ có trước, sau khi

thêm, bớt 1 hay nhiều biến số. Thay đổi R2 có ý nghĩa thống kê là một trong các tiêu chí để lựa chọn mô
hình tối ưu.
Descriptive: Thực hiện thống kê mô tả, cung cấp giá trị trung bình, SD và cỡ mẫu cho mỗi yếu tố dự báo
X. Ngoài ra nó còn quét ma trận tương quan giữa tất cả biến số độc lập, nhằm kiểm tra vấn đề đa cộng
tuyến.
Part-Partial correlation: Tính hệ số tương quan riêng (Pearson) và tương quan bộ phận và bán bộ phận
(có xét đến những yếu tố khác) giữa Y và mỗi tham số X. Ghi chú: Tương quan bán bộ phận khảo sát quan
hệ giữa X và 1 phần biến thiên của Y chưa được giải thích bởi những tham số khác trong mô hình.

g

Collinearity diagnostic: Chẩn đoán đa cộng tuyến: cung cấp giá trị VIF, Tolerance, eigen value cho mỗi
yếu tố dự báo, nhằm chẩn đoán vấn đề đa cộng tuyến.

h

Kiểm định Durbin Watson: nhằm kiểm tra giả định về tính độc lập của sai số.

i

Case wise diagnostic: Liệt kê giá trị dự báo và thực tế của Y, kèm theo sai biệt giữa chúng (sai số thặng dư
và sai số chuẩn hóa): cho toàn bộ quần thể nghiên cứu, hay phân lập riêng những trường hợp cá biệt
(RSD > 3).
Kèm theo bảng tóm tắt giá trị dự báo và Residual: Min, max, Mean và SD


2.2 Mô tả giao diện chức năng phân tích hồi quy trong SPSS
2.2.4 Vẽ biểu đồ khảo sát sai số và giá trị dự báo

2


a
b

Trục tung

A

c
d
e

Trục hoành

f

g

D

B
C

Danh mục những biến số có thể chọn để vẽ biểu đồ tương quan tuyến tính:

a Dependent: Đây là giá trị dự báo hay giá trị Y được ước tính dựa vào mô hình (cần phân biệt với giá trị
Y thực tế quan sát được)

b


*Zpred: Standardized predicted value: Giá trị dự báo chuẩn hóa hay Z-score của giá trị dự báo

c

*Zresid: Standardized residual: Sai số chuẩn hóa = khác biệt giữa giá trị dự báo và giá trị thực tế, đã
chuẩn hóa.

d

*Dresid: Deleted residual

e

*AdjPred: Adjusted predicted value = giá trị dự báo sau hiệu chỉnh

f

*Sresid: Studentized residual = Sai số chuẩn hóa theo Student = Residual/ SE của nó

g

*SDResid: Studentized deleted residual: = Dresid/ SE của nó

A

Hộp thoại cho phép dựng biểu đồ tương quan tuyến tính giữa 1 đại lượng Y và 1 đại lượng X, tùy chọn.
Ghi chú: Trong thực hành, bạn chỉ cần dựng 2 biểu đồ như sau:
Y=Zresid và X= Zpred : nhằm kiểm tra giả định về tính độc lập của sai số, giả định homoscedasticity và
giả định linearity.
Y=Sresid và X=Zpred, nhằm phân lập những trường hợp vi phạm giả định về homoscedasticity.


B

Mô tả phân phối của sai số thặng dư (Residual) bằng Histogram, kiểm tra giả định phân phối chuẩn của
sai số.

C

Vẽ các biểu đồ kiểm tra giả định phân phối chuẩn của Residual.

D Dựng tất cả biểu đồ tương quan tuyến tính bộ phận giữa Y= giá trị dự báo Y và X= biến số độc lập Xi.
Giúp phát hiện điểm cá biệt, khống chế (outliers), quan hệ phi tuyến tính, cộng tuyến…


2

2.2 Mô tả giao diện chức năng phân tích hồi quy trong SPSS
2.2.5 Sao lưu dữ liệu

x
x

A

x

x

x
x

x

B x
x

A

Những thông số nhằm đánh giá phẩm
chất mô hình, xét về khả năng dự báo
và sai biệt so với thực tế.

B

Những thông số nhằm phát hiện
những trường hợp cá biệt, khống chế
ảnh hưởng đến phẩm chất mô hình.
X Các thông số cần sao lưu.
Ghi chú: Nên dùng giá trị đã chuẩn
hóa (standardized hay Studentized) vì
cho phép diễn giải dễ dàng hơn

Chức năng sao lưu những thông số của mô hình:
Đây là một chức năng hữu ích, vì nó cho phép đánh giá phẩm chất mô hình, bao gồm độ phù hợp với dữ liệu
thực tế, khả năng dự báo chính xác, và phân lập những trường hợp có nguy cơ gây ảnh hưởng xấu cho mô
hình. Bạn sẽ thấy một hộp thoại với nhiều ô tùy chọn, mỗi ô là một thông số có thể sao lưu. Khi bạn chọn
những thông số này trước khi chạy 1 phân tích hồi quy, SPSS sẽ sao lưu giá trị các thông số được chọn, thẳng
vào bảng số liệu dưới dạng những biến số mới. Sau đó bạn có thể dùng những biến số được sao lưu này để
chẩn đoán về phẩm chất của mô hình và kiểm tra các giả định.
Lưu ý:
+ Điểm bất lợi thứ nhất của chức năng sao lưu, đó là tên các biến số đều viết tắt, và mỗi lần bạn chạy 1 phân

tích mới, quy trình sao lưu được lặp lại và nếu cứ theo hướng này, hàng loạt biến mới lại được chèn vào
database, bảng số liệu của bạn sẽ bị kéo dài và cực kì rối rắm. Do đó, bạn chỉ nên kích hoạt chức năng Save 1
lần duy nhất, cho mô hình tối ưu, sau khi kiểm tra mô hình xong bạn nên xóa toàn bộ những biến số sao lưu
để dọn dẹp sạch sẽ bảng số liệu trước khi thực hiện 1 lệnh Save khác.
+Điểm bất lợi thứ 2 là chức năng Save và Bootstrap triệt tiêu lẫn nhau, bạn không thể vừa làm sao lưu, vừa
chạy Bootstrap. Do đó với 1 mô hình hồi quy bạn phải chạy phân tích ít nhất 3 lần:
Lần thứ 1: Không kích hoạt Save và Bootstrap: Thăm dò thủ công hoặc Stepwise, nhằm tìm ra mô hình tối ưu
Lần thứ 2: Bạn chạy lại phân tích lần nữa, không sử dụng bootstrap nhưng kích hoạt Save,để đánh giá phẩm
chất mô hình.
Lần thứ 3: Đã có mô hình tối ưu: Bạn chạy phân tích lần nữa kèm theo Bootstrap, không sao lưu để kiểm tra ý
nghĩa phổ quát


2

2.2 Mô tả giao diện chức năng phân tích hồi quy trong SPSS
2.2.5 Sao lưu dữ liệu

Bảng: Danh sách tên viết tắt và ý nghĩa những biến số sao khi được sao lưu vào database:
Viết tắt
PRE_1
ZPR_1
ADJ_1
SEP_1
RES_1
ZRE_1
SRE_1
MAH_1

Ý nghĩa

Predicted value
Standardized Pred
Adjusted pred
SE of Predicted val
Residual
Standardized Res.
Studentized Res.
Mahalanobis distance

COO_1
LEV_1
SDB0_1

Cook’s distance
Leverage value
Standardized DfBeta for
Intercept

SDB1_1

Standardized DfBeta for
predictor1
Standardized DfBeta for
predictor2
Covariance ratio

SDB2_1

COV_1


Diễn giải
Giá trị dự báo không chuẩn hóa
Giá trị dự báo đã chuẩn hóa
Giá trị dự báo hiệu chỉnh
Sai số chuẩn của giá trị dự báo
Sai số thặng dư không chuẩn hóa
Sai số thặng dư có chuẩn hóa
Sai số chuẩn hóa theo phân phối Student
Khoảng cách giữa giá trị thực tế và trung bình
của biến số dự báo
Thông số dùng để phát hiện điểm cá biệt
Thông số dùng để phát hiện điểm áp chế
Trị số DfBeta cho hằng số Bo
Trị số DfBeta cho biến số X1
Trị số DfBeta cho biến số X2

Tỉ số hiệp phương sai: một thông số khác để
chẩn đoán điểm cá biệt và áp chế.

Ghi chú: con số nằm ở cuối tên biến (Ví dụ: 1) cho biết lần sao lưu, nếu bạn lặp lại lệnh Save thì 1 loạt
biến mới sẽ được sao lưu với tên gọi mới: ví dụ sao lưu lần 2 bạn sẽ có: PRE_1, COO_2… Trên thực tế bạn
nên xóa sạch những biến số cũ nếu muốn sao lưu cho mô hình mới


3

3. Hướng dẫn chi tiết quy trình phân tích hồi quy
3.1 Lập bảng số liệu

Nghiên cứu này có 13 biến số:

Y là biến số phụ thuộc trong mô hình hồi quy = Vận tốc sóng mạch Cổ chân-cánh tay
12 biến số độc lập: Các yếu tố lâm sàng và điều trị thu thập được gồm có. Tuổi, số đo huyết áp, BMI,
thời gian thẩm phân phúc mạc, thuốc lá, Cholesterol toàn phần; và các loại thuốc hạ áp khác nhau như:
Ức chế men chuyển, đối kháng thụ thể Angiotensin, Beta blocker, Calci blocker.

Việc nhập số liệu thì chắc bạn dễ dàng thực hiện. Chỉ lưu ý là những biến định lượng nhị phân nên được
mã hóa giá trị =0/1.


3

3.2 Syntax và Cách sử dụng syntax

1

Tải file syntax có tên « Hoiquytuyentinh.SPS » từ Google drive của tác giả về máy của bạn:
/>
2

Mở file syntax: Có 2 cách, hoặc bạn đi từ màn hình chính của SPSS như sau
1

2
4
3

!

Hoặc đơn giản là bạn click chuột 2 lần trực tiếp vào
icon của file syntax


Cửa sổ Syntax editor sẽ mở ra, hiển thị
nội dung những lệnh bên trong


3

3.2 Syntax và Cách sử dụng syntax

2

1
2

Để thi hành một khối lệnh tùy chọn:
1° Đánh dấu chọn 1 khối lệnh cần thi hành
2° Click chuột phải trong syntax editor rồi chọn Run Selection,
hoặc nhấn nút Run (màu xanh) trên menu.
Lưu ý:
Tài liệu này khuyến khích sử dụng syntax thay vì thao tác trên giao diện, nhằm tiết kiệm
thời gian cho chính bạn. Tuy nhiên ứng với mỗi đoạn syntax tác giả cũng cung cấp screen
capture về thiết kế tùy chỉnh trên giao diện.
Những khối lệnh phải được thi hành riêng rẽ và tuần tự, không nên chạy hàng loạt. Trong
đa số trường hợp bạn phải điều chỉnh lại nội dung cho phù hợp với nghiên cứu của bản
thân. Một số khối lệnh phải được chỉnh sửa và thi hành lặp lại nhiều lần, ví dụ để thăm dò
biến số và thăm dò mô hình.
SPSS rất mạnh trong việc thăm dò tự động, và đa số trường hợp kết quả rất chính xác, phù
hợp với nhau (đường nào cũng về La Mã); nhưng tác giả không tin tưởng vào bất cứ quy
trình tự động nào, chính nghiên cứu sinh phải chủ động kiểm soát mọi công đoạn.
Hơn nữa, khi làm thủ công bạn có thể nhìn thấy được những mô hình trung gian, và dùng

trị số R2 hiệu chỉnh, BIC hay AIC để lựa chọn, chức năng này không được hỗ trợ bởi SPSS.
Tác giả đã cung cấp cho các bạn 1 bảng Excel kèm theo với rất nhiều tiêu chí được lập trình
sẵn, nhằm kiểm tra phẩm chất mô hình và giúp bạn lựa chọn được mô hình tối ưu và có
bằng chứng xác thực cho lựa chọn này để báo cáo.


3

3.3.1 Khai báo biến, dán nhãn biến bằng Syntax

Mục tiêu của phần này là để giúp các bạn hiểu cú pháp lệnh trong bộ syntax để có thể chỉnh sửa cho nghiên cứu
của riêng bạn. Phần màu đỏ có thể tùy chỉnh. Những dòng bắt đầu bằng dấu * không phải là lệnh mà chỉ là chú
thích kèm theo.
*Bước 1: Khai báo biến
* 1A. Dán nhãn tên biến
VARIABLE LABELS
Y "BA.PWV (cm/s)"
X1 "Giới tính"
X2 "Tuổi"
X3 "BMI (kg/m2)"
X4 "Cholesterol (mg/dL)"
X5 "Đối vận Angiotensin 2"
X6 "HA T.Thu (mmHg)"
X7 "HA T.Trương (mmHg)"
X8 "Thuốc lá"
X9 "Ức chế men chuyển"
X10 "Ức chế thụ thể Beta"
X11 "Ức chế kênh calci"
X12 "Thời gian thẩm phân".
* 1B. Dán nhãn giá trị cho biến định tính nhị phân

VALUE LABELS
X1 1 "Nam" 2 "Nữ".
VALUE LABELS
X5 0 "Không" 1 "Có".
VALUE LABELS
X8 0 "Không" 1 "Có".
VALUE LABELS
X9 0 "Không" 1 "Có".
VALUE LABELS
X10 0 "Không" 1 "Có".
VALUE LABELS
X11 0 "Không" 1 "Có".

Khối lệnh 1A có nội dung khai báo (dán nhãn) tên của
những biến số được sử dụng trong nghiên cứu.
Nghiên cứu thí dụ này có 12 biến số X đánh số từ 1 tới 12.
Lệnh đặt tên biến số có cú pháp:
VARIABLE LABELS
Xi ‘’Tên biến số ‘’
Nếu nghiên cứu của bạn có nhiều biến số hơn, bạn có thể
kéo dài nội dung với X13, X14…
Nếu nghiên cứu của bạn có ít biến số hơn, chỉ cần xóa bớt
những biến thừa.
Chú ý: dòng lệnh cuối cùng kết thúc bằng dấu chấm (.)
Khối lệnh 1B có nội dung dán nhãn giá trị cho những biến
định tính
Ví dụ biến X1 (giới tính) được mã hóa: 1=Nam, 2=Nữ.
Cú pháp lệnh dán nhãn giá trị là:
VALUE LABELS
Xi [Giá trị số] ‘’Nhãn’’

Mỗi giá trị cách nhau 1 khoảng trắng.
Vì thí dụ này chỉ có biến nhị phân nên giá trị chỉ được mã
hóa =1/0 hoặc 1,2
Nếu bạn có biến định tính nhiều giá trị, bạn có thể dán nhãn
tiếp tục cho giá trị 3,4,5…

Sau khi chạy syntax, nội dung biến số trong database sẽ được thay đổi. Bạn cũng có thể dùng Editor ở chế độ
Variable view để làm thủ công nếu không quen dùng Syntax, nhưng như ta thấy, dùng syntax dễ hơn…


3

3.3.2 Thăm dò biến số

*Bước 2A: Thăm dò tương quan giữa Y và các biến
định lượng
BOOTSTRAP
/SAMPLING METHOD=SIMPLE
/VARIABLES INPUT=Y X2 X3 X4 X6 X7 X12
/CRITERIA CILEVEL=95 CITYPE=BCA
NSAMPLES=1000
/MISSING USERMISSING=EXCLUDE.
CORRELATIONS
/VARIABLES=Y X2 X3 X4 X6 X7 X12
/PRINT=ONETAIL NOSIG
/MISSING=PAIRWISE.

Khối lệnh 2A có nội dung lập ma trận tương quan theo
phương pháp Pearson, nhằm thăm dò liên hệ tuyến
tính giữa Y và tất cả những biến định lượng khác.

Đầu tiên, ta áp dụng bootstrap, để lấy mẫu ngẫu nhiên
lặp lại 1000 lần, bước này chỉ để bảo đảm trong trường
hợp bạn có cỡ mẫu hạn chế.
Sau đó áp dụng lệnh CORRELATIONS để phân tích
tương quan theo phương pháp mặc định là Pearson,
với giá trị p 1 bên.
Trong thí dụ này ngoài Y, chỉ có 6 biến định lượng là
X2,X3,X4,X6,X7 và X12.
Khi áp dụng bộ syntax cho nghiên cứu của mình, bạn
nên sửa lại nội dung 2 phần màu đỏ, với những biến
định lượng của riêng bạn.

Trong trường hợp bạn thích thao tác trên giao diện: quy trình
phân tích tương quan được thực hiện như sau:


3.3.2 Thăm dò biến số

3

Correlations
Cholester
BA.PWV

BA.PWV (cm/s)

Pearson Correlation
Sig. (1-tailed)

ol


HA T.Thu T.Trương

Thời gian
thẩm

(cm/s)

Tuổi

(kg/m2)

(mg/dL)

(mmHg)

(mmHg)

phân

1

,961**

-,871**

,738**

,914**


,228

,276*

,000

,000

,000

,000

,079

,042

40

40

40

40

40

40

40


2

N

1

BMI

HA

Bootstrap

Bias

0

,000

,001

-,002

-,001

-,007

-,004

c


Std. Error

0

,009

,048

,075

,022

,152

,137

.

,938

-,951

,559

,866

-,086

-,013


.

,980

-,772

,873

,950

,487

,533

BCa 95%

Lower

Confiden

Upper

3

ce
Interval

Tương quan có ý nghĩa thống kê : Tốt
Khoảng tin cậy của hệ số tương quan không chứa giá trị 0: Tốt


Chọn vào danh sách ứng cử viên

Trường hợp nghi ngờ : nằm gần ngưỡng 0,05 nhưng tương quan yếu
Chắc chắn không có tương quan: p>0,05 hoặc CI95% của r chứa giá trị 0

Loại khỏi danh sách ứng cử viên

Đây là kết quả thăm dò tương quan tuyến tính giữa Y và các biến định lượng, với mục tiêu chọn ra
những biến định lượng có quan hệ tuyến tính mạnh nhất với Y để đưa vào danh sách ứng cử viên
yếu tố dự báo tiềm năng cho mô hình hồi quy.
Bạn chỉ cần đọc kết quả hàng đầu tiên: Y (BA.PWV), và tập trung vào 2 tiêu chí:
+ Giá trị p (1 phía) : cho biết ý nghĩa thống kê của quan hệ tuyến tính giữa Y và X
+ Khoảng tin cậy của hệ số tương quan Pearson r:
Tiêu chuẩn lựa chọn:
P<0,05 VÀ CI95% của r không chứa giá trị 0 (Lower và Upper phải cùng dấu)
Loại trừ những biến số có:
P<0,05 HOẶC CI95% của r CÓ chứa giá trị 0 (Lower và Upper trái dấu)
Trong thí dụ này, ta đã tuyển chọn được 4 biến số định lượng: Tuổi, BMI, Cholesterol, HA tâm thu
để đưa vào bước thăm dò mô hình.
Và loại trừ được 2 biến số: HA tâm trương và Thời gian thẩm phân.


3

3.3.2 Thăm dò biến số

*Bước 2B: Thăm dò những yếu tố định tính
bằng mô hình hồi quy đơn biến
*Thí dụ cho biến X10
BOOTSTRAP

/SAMPLING METHOD=SIMPLE
/VARIABLES TARGET=Y INPUT= X10
/CRITERIA CILEVEL=95 CITYPE=BCA
NSAMPLES=1000
/MISSING USERMISSING=EXCLUDE.
REGRESSION
/MISSING PAIRWISE
/STATISTICS COEFF OUTS CI(95) R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Y
/METHOD=ENTER X10
/RESIDUALS DURBIN
/CASEWISE PLOT(ZRESID) OUTLIERS(3).

Khối lệnh 2B có nội dung thực hiện 1 phân tích hồi quy
tuyến tính đơn biến để khảo sát liên hệ giữa Y và 1 biến
số định tính.
Khối lệnh trong bộ syntax chỉ là 1 thí dụ cho trường hợp
biến X10. Chúng ta phải lặp lại quy trình này nhiều lần
cho tất cả biến số định tính có trong dữ liệu.
Chỉ cần thay X10 bằng Xi bất kì, rồi thi hành toàn bộ
khối lệnh.
Dĩ nhiên bạn cũng có thể dùng khối lệnh 2B này để
kiểm tra tương quan của biến định lượng, nhưng kết
quả sẽ không khác so với phương pháp Pearson. Bản
thân hệ số r của Pearson chính là dựa trên mô hình hồi
quy đơn biến.

Khối lệnh 2B tương đương với thao tác trên giao diện như hình dưới đây



3.3.2 Thăm dò biến số

3

Sau đây là hướng dẫn cách đọc kết quả phân tích hồi quy đơn biến cho biến định tính trong bước 2B: Thí
dụ với biến số Giới tính (X1)

Model Summaryb
Adjusted R

Std. Error of the
Estimate

Durbin-Watson

268,30953

,009

Model

R

R Square

Square

1


,030a

,001

-,025

a. Predictors: (Constant), Giới tính
b. Dependent Variable: BA.PWV (cm/s)

Bảng Model Summary:
Nội dung: Đánh giá năng lực dự báo của mô hình hồi quy đơn biến với yếu tố Xi là 1 biến định tính nhị phân.
Thông tin: giá trị R2, R2 dự báo cho biết vai trò của biến số Xi
và kết quả test Durbin Watson nhằm kiểm tra giả định Tự tương quan của sai số.
Cách diễn giải:
Ghi nhận giá trị R2 và R2 hiệu chỉnh để so sánh với những biến số định tính khác. Nếu nghi ngờ: tính thủ công
giá trị R2 theo Stein vì chính xác hơn R2 hiệu chỉnh bởi SPSS.
Test Durbin Watson: giá trị trông đợi : gần với 2. Những giá trị <1 hay > 3 là nghi ngờ có vi phạm giả định
autocorrelation
Trong thí dụ này: Biến số Giới tính có vai trò rất nhỏ, chỉ cho phép giải thích <0,01% biến thiên của Y. Đây là 1
biến số yếu. Nghi ngờ có autocorrelation vì D.W =0,009 <1.
ANOVAa
Model
1

Sum of Squares
Regression

df


Mean Square

2489,798

1

2489,798

Residual

2735620,202

38

71990,005

Total

2738110,000

39

F

Sig.
,035

,853b

a. Dependent Variable: BA.PWV (cm/s)

b. Predictors: (Constant), Giới tính

Bảng ANOVA
Nội dung: Khảo sát ý nghĩa thống kê của mô hình hồi quy đơn biến với yếu tố Xi là 1 biến định tính nhị phân.
Thông tin: Test F, giá trị p và RSS, TSS, MMS và RMS của mô hình
Cách diễn giải: Đọc giá trị p của test F. Nếu cần: ghi nhận RSS để so sánh với những biến số X khác hoặc tính
các trị số AIC và BIC.
Giá trị trông đợi: p<0,05
Trong thí dụ này: Mô hình hồi quy đơn biến với Giới tính không có ý nghĩa thống kê (p=0,853).
Kết luận: Có thể loại bỏ biến số Giới tính khỏi danh sách cần thăm dò.


3.3.2 Thăm dò biến số

3

Coefficientsa
Standardized
Unstandardized Coefficients
Model
1

B

Std. Error

(Constant)

1777,495


130,723

Giới tính

-15,859

85,274

Coefficients
Beta

-,030

95,0% Confidence Interval for B
t

Sig.

Lower Bound

Upper Bound

13,597

,000

1512,860

2042,130


-,186

,853

-188,488

156,770

a. Dependent Variable: BA.PWV (cm/s)

Bootstrap for Coefficients
Bootstrapa
BCa 95% Confidence Interval
Model
1

B

Bias

Std. Error

Sig. (2-tailed)

Lower

Upper

(Constant)


1777,495

1,035

132,964

,001

1517,673

2021,608

Giới tính

-15,859

-1,171

87,621

,851

-186,923

154,896

a. Unless otherwise noted, bootstrap results are based on 1000 bootstrap samples

Bảng Coefficient và Coefficient với bootstrap trình bày nội dung mô hình, ở giai đoạn này bạn chỉ cần đọc nhanh 3
cột cuối cùng để biết ý nghĩa thống kê của hệ số hồi quy cho biến X1 (Giới tính).

Giá trị trông đợi: p<0,05 VÀ CI95% của hệ số B không chứa giá trị 0 (2 ngưỡng Lower và Upper phải cùng dấu);
cho thấy biến số Xi có vai trò ý nghĩa trong việc dự báo giá trị Y.
Trong trường hợp này: p=0,85 >0,05 và CI95% có giá trị 0 (trái dấu); chứng tỏ vai trò của biến X1 (giới tính) không
có ý nghĩa thống kê.
Đến đây ta có thể khẳng định là biến Giới tính không có liên hệ nào với giá trị dự báo của Y; ta sẽ loại bỏ nó ra
khỏi mô hình ở những bước tiếp theo.


3.3.2 Thăm dò biến số

3

Thí dụ thứ 2: Phân tích hồi quy đơn biến cho biến số « sử dụng thuốc Ức chế men chuyển Angiotensin ».
Các bạn có thể tự diễn giải kết quả này.
Model Summaryb
Std. Error of the
Model
1

R

R Square

Adjusted R Square

Estimate

Durbin-Watson

,322a


,104

,080

254,16056

,264

a. Predictors: (Constant), Ức chế men chuyển
b. Dependent Variable: BA.PWV (cm/s)
ANOVAa
Model
1

Sum of Squares

df

Mean Square

F

Sig.

Regression

283401,657

1


283401,657

4,387

,043b

Residual

2454708,343

38

64597,588

Total

2738110,000

39

a. Dependent Variable: BA.PWV (cm/s)
b. Predictors: (Constant), Ức chế men chuyển
Coefficientsa
Standardize

Model
1

(Constant)


Unstandardized

d

95,0% Confidence

Coefficients

Coefficients

Interval for B

B

Std. Error

1722,686

42,961

254,514

121,512

Lower

Upper

t


Sig.

Bound

Bound

40,099

,000

1635,716

1809,656

2,095

,043

8,526

500,502

Beta

Ức chế men
chuyển

,322


a. Dependent Variable: BA.PWV (cm/s)
Bootstrap for Coefficients
Bootstrapa
BCa 95% Confidence
Interval
Model
1

(Constant)
Ức chế men chuyển

B

Bias

Std. Error

Sig. (2-tailed)

Lower

Upper

1722,686

,761b

43,031b

,001b


1638,293b

1811,981b

254,514

-3,014b

63,066b

,001b

138,276b

371,038b

a. Unless otherwise noted, bootstrap results are based on 1000 bootstrap samples
b. Based on 994 samples

Kết luận: Như bạn thấy, đây là một biến số có vai trò yếu, không rõ rệt lắm. Nó chỉ cho phép giải thích
được 0,8% biến thiên của Y. F test cho ra kết quả nghi ngờ: p=0,043. CI95% của hệ số hồi quy không chứa
giá trị 0. Ta tạm chấp nhận đưa biến số này vào danh sách ứng cử viên, nhưng còn nghi ngờ.


×