Tải bản đầy đủ (.docx) (60 trang)

Phân tích thống kê hoạt động sản xuất kinh doanh của công ty sách giáo dục hà nội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (413.19 KB, 60 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-------------------

ĐÀO VĂN THÁI

PHÂN TÍCH THỐNG KÊ HOẠT ĐỘNG SẢN XUẤT KINH
DOANH CỦA CÔNG TY SÁCH GIÁO DỤC HÀ NỘI

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội - Năm 2013


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-------------------

ĐÀO VĂN THÁI

PHÂN TÍCH THỐNG KÊ HOẠT ĐỘNG SẢN XUẤT KINH
DOANH CỦA CÔNG TY SÁCH GIÁO DỤC HÀ NỘI

Chuyên ngành: Xác suất thống kê
Mã số:

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. HỒ ĐĂNG PHÚC

Hà Nội - Năm 2013




Mục lục
Mở đầu

……………………

Chương 1 HỒI QUY LOGISTIC ……………………………………
1.1

Mô hình hồi quy logistic ………………………………………

1.1.1 Ước lượng các tham số của mô hình hồi quy logistic ……
1.1.2 Kiểm định sự phù hợp của mô hình hồi quy logistic……..
1.2

1.3

Mô hình hồi quy logistic bội ………………………………
1.2.1

Ước lượng mô hình h

1.2.2

Kiểm định sự phù hợ

Ý nghĩa hệ số của mô hình hồi quy logistic……………………
1.3.1


Mô hình có biến độc

1.3.2

Mô hình có biến độc

1.3.3

Mô hình có biến độc

Chương 2. PHÂN TÍCH SỐ LIỆU KINH DOANH SÁCH…………
2.1

Nguồn gốc số liệu…………………………………………………

2.2

Mô tả số liệu………………………………………………………

2.3

Ảnh hưởng các nhân tố lên khả năng in mới, tái bản và nối b
A. Phân tích ảnh hưởng của các nhân tố lên khả năng in mới
B. Phân tích ảnh hưởng của các nhân tố lên khả năng tái bản

C .Phân tích ảnh hưởng của các nhân tố lên khả năng nối bản
2.4 Bàn Luận

……………………………………………………


KỂT LUẬN………………………………………………………
Tài liệu tham khảo ……………


Mở Đầu
Trong thời đại ngày nay, kinh tế trên toàn thế giới đang phát triển
nhanh. Ở Việt nam, nền kinh tế đang phắt triển rất mạnh mẽ, kéo theo sự ra
đời thường xuyên của hàng loạt các công ty. Nhưng chính sự phát triển ngày
càng mạnh mẽ đó thì tính cạnh tranh của các công ty ngày càng gay gắt và
khốc liệt dẫn đến hàng năm ở Việt nam có tới hành nghìn công ty được thành
lập, đồng thời cũng có hàng nghìn công ty bị phá sản và giải thể.
Một công ty muốn tồn tại và phát triền thì vai trò của hoạt động sản
xuất và kinh doanh là then chốt. Muốn hoạt động và sản xuất và kinh doanh
của công ty đem lại hiệu quả ổn định, bền vững và lâu dài, công ty phải có kế
hoạch xây dựng chiến lược đúng đắn, định hướng các hoạt động của mình.
Các công cụ phân tích thống kê có thể hỗ trợ các nhà kinh tế phân tích
các thông tin về hoạt động của công ty trong quá khứ để tìm ra các quy luật ẩn
chứa trong dữ liệu, từ đó tư vấn cho lãnh đạo công ty thiết lập chiến lược hoạt
động của công ty trong tương lai
Mục tiêu của luận văn này là sử dụng các phương pháp thống kê thích
hợp để phân tích các số liệu liên quan đến hoạt động của Công ty Cổ phần
Sách giáo dục Hà Nội trong những năm gần đây nhằm đưa ra các kết luận về
một số nhân tố ảnh hưởng đến các hoạt động sản xuất kinh doanh của Công
ty, làm bằng chứng khuyến nghị Công ty đưa ra những định hướng mới giúp
cải thiện hiệu quả hoạt động của Công ty trong những năm sau.
Chương 1 của luận văn giới thiệu cơ sở lý thuyết của phương pháp hồi
quy logistic, là phương pháp thống kê cơ bản được sử dụng trong phần sau
của luận văn. Dựa trên cơ sở lý thuyết đó, Chương 2 của luận văn trình bày
các kết quả và phân tích thống kê được tiến hành thông qua việc sử dụng phần
mềm SSPS, đưa ra các kết luận về những yếu tố ảnh hưởng đến khả năng một



đầu sách được in ra là sách in mới, sách tái bản, hay sách nối bản. Các kết
luận đó có thể hỗ trợ các nhà điều hành sản xuất đưa ra các quyết định hợp lý,
nhằm đem lại hiệu quả cao nhất cho Công ty.
Luận văn được hoàn thành dưới sự hướng dân trực tiếp của PGS.TS.
Hồ Đăng Phúc, Viện Toán học, Viện Khoa học và Công nghệ Việt Nam. Tôi
xin bày tỏ long biết ơn chân thành và sâu sắc nhất tới thầy, người đã tận tình
hướng dẫn, chỉ bảo và giúp đỡ tôi trong suốt quá trình làm luận văn này.
Tôi xin chân thành gửi lời cảm ơn sâu sắc tới các thầy cô giáo, các anh
chị thành viên trong seminar “Thống kê toán học”, Viện Toán học về những ý
kiến đóng góp quý báu sự giúp đỡ tận tình và sự cổ vũ hết sức to lớn trong
thời gian qua.
Nhân đây tôi cũng trân trọng gửi lời cảm ơn tới các thầy cô khoa Toán Cơ - Tin học trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
đối với công lao dậy dỗ trong suốt quá trình giáo dục và đào tạo của nhà
trường.
Cho phép tôi gửi tới ban lãnh đạo Công ty Cổ phần Sách giáo dục Hà
nội. Đặc biệt là ông Hà Sĩ Tuyển, thành viên hội đồng quản trị công ty, lời
cảm ơn chân thành về những điều kiện thuận lợi dành cho tôi trong quá trình
thu thập số liệu hướng dẫn những kiến thức chuyên môn về sản xuất và kinh
doanh sách.
Hà nội, tháng 4 năm 2013
Học viên
Đào Văn Thái


Chương 1
HỒI QUY LOGISTIC

1.1 Mô hình hồi quy logistic

Phân tích hồi quy nghiên cứu mối quan hệ phụ thuộc của một biến (gọi là
biến phụ thuộc hoặc biến được giải thích) với một hay nhiều biến khác (được
gọi là (các) biến độc lập hay biến giải thích). Ta sử dụng các ký hiệu
*

Y là biến phụ thuộc (hay biến được giải thích),

*

Xi là biến độc lập (hay biến giải thích thứ i).

Một trong các vấn đề phân tích hồi quy giải quyết là ước lượng giá trị
trung bình của biến phụ thuộc ứng với giá trị đã cho của biến độc lập E(Y/Xi).
Nói chung, E(Y/Xi) là một hàm của Xi:
E(Y/Xi) = f(Xi),
trong đó f(Xi) được gọi là hàm hồi quy tổng quát. Khi đó
• Nếu hàm hồi quy tổng quát có một biến độc lập thì được gọi là hàm
hồi quy đơn.


Nếu hàm hồi quy tổng quát có nhiều hơn một biến độc lập thì được

gọi là hàm hồi quy bội.
Nếu hàm hồi quy tổng quát có dạng
f(Xi)= β0 + β1Xi
trong đó β0,β1 là các hệ số chưa biết nhưng cố định, thì f(Xi) được gọi là hàm
hồi quy tuyến tính đơn và β0,β1 gọi là hệ số hồi quy.
Trong các mô hình hồi quy quen biết, biến phụ thuộc thường là biến
dịnh lượng (biến liên tục). Tuy nhiên trong thực tế người ta hay bắt gặp những
trường hợp mà biến được giải thích lại không phải là biến liên tục.



Do vậy cần xây dựng các mô hình hồi quy thích hợp cho các trường hợp đó.

Phổ biến nhất là mô hình với biến phụ thuộc là một biến định tính chỉ
nhận hai giá trị đối lập nhau (có – không có, đau ốm – khỏe mạnh, thất nghiệp
– được tuyển dụng, …)
Mô hình hồi quy logictis là một trong những mô hình được xây dựng
tương ứng với biến phụ thuộc là biến định tính nhận hai giá trị, còn các biến
độc lập có thể là các biến định lượng hoặc / và các biến định tính.

Để thuận tiện trong tính toán, ta thường mã hoá hai giá trị của biến phụ
thuộc là 1 và 0. Lúc ấy, biến đó được gọi là biến nhị phân. Nếu không có ghi
chú gì đặc biệt, trong luận văn này chúng ta luôn xét biến phụ thuộc là biến
nhị phân.
Mô hình hồi quy logistic là một mô hình hồi quy phi tuyến, trong đó các
biến độc lập là định tính hoặc định lượng, đồng thời biến phụ thuộc là một
biến định tính nhị phân.
Định nghĩa 1.1.1. Hàm hồi quy logistic đơn dùng để ước lượng giá trị của
biến phụ thuộc nhị phân Y theo một biến độc lập X có dạng

E(Y/X)
Trong đó
*

β0 là hệ số tự do (hay hệ số chặn),

*

β1 là hệ số dốc.


Chú ý. Hàm

e 0 1x

 ( x )  E (Y / x) 

1 e 0 1 X


là kỳ vọng có điều kiện của biến phụ thuộc Y cho bởi giá trị x của biến độc lập
X. Từ (1.1) ta có
  x

  x



( x )(1  e



( x )  1  ( x ) e

0

1

)e


0



1

0

,

 x
1

,

Định nghĩa 1.1.2. Phép biến đổi sau được gọi là phép biến đổi logit

g(x)= ln 



1

Nhận xét.
(i)g(x)= β0 + β1x là hàm tuyến tính của x với x  (−∞,+∞).
(ii)

0  π(x)  1 với mọi giá trị của X.

(iii)

Giả sử giá trị quan sát y của biến phụ Y có dạng y = π(x)+,
trong đó 
gọi là sai số (hiệu giá trị quan sát và kì vọng có điều kiện của biến phụ thuộc).
Khi đó  nhận hai giá trị sau:
*

Nếu y =1 thì  =1 − π(x) với xác suất π(x).

*

Nếu y = 0 thì  = −π(x) với xác suất 1 − π(x).

Từ đó,  có phân phối nhị thức với
E()=0 và Var()= Var(Y)= π(x)[1 − π(x)].
1.1.1 Ước lượng các tham số của mô hình hồi quy logistic
Để xác định được mô hình, ta cần ước lượng các tham số của mô hình qua số
liệu thu được trong mẫu quan sát. Có nhiều phương pháp ước lượng tham số.
Ta hãy xét phương pháp ước lượng hợp lý cực đại.
Giả sử mẫu có n quan sát độc lập (xi,yi),i = 1, n ,với yi là giá trị của biến
phụ thuộc và xi là giá trị của biến độc lập tại quan sát thứ i. Việc ước lượng



các tham số của mô hình bằng phương pháp hợp lý cực đại được thực hiện
theo quy trình như sau:
a. Theo (1.1) ta có P(Y =1/x)= π(x), do đó P(Y =0/x)=1 − π(x).
Như vậy Y nhận giá trị 1 với xác suất bằng π(xi) và nhận giá trị 0 với xác suất
bằng 1 − π(xi), i = 1, n ,. Với mỗi cặp (xi,yi), i = 1, n , đặt




( xi )   ( xi ) y

i

1  ( xi )1 y

i

b. Với mẫu n quan sát độc lập (xi,yi),i = 1, n , ta thành lập hàm hợp lý có dạng.
l()

Lấy logarit hàm hợp lý (1.3) ta nhận được hàm số có dạng

L() 
1

i

c.

Lấy đạo hàm hàm L(β) theo β0 và β1 ta có hệ phương trình hợp lý
n


yi

 i1



n x 



 i1

1

 ( x1 )   0

yi   ( x1 )   0

(1.5)

d. Giải hệ (1.5) ta có nghiệm của hệ phương trình hợp lý là ước lượng hợp lý
ˆ
cực đại của các tham số β =(β0,β1). Ta ký hiệu  là ước lượng hợp lý cực đại

của β.
1.1.2 Kiểm định sự phù hợp của mô hình hồi quy logistic
Việc kiểm định sự phù hợp của mô hình, nhằm trả lời câu hỏi: "Mô
hình chứa biến độc lập cho chúng ta thông tin về biến phụ thuộc nhiều hơn
một cách đáng kể (có ý nghĩa thống kê) so với mô hình không chứa biến độc
lập hay không?"


a. Kiểm định tỷ lệ hàm hợp lý


Đánh giá ý nghĩa sự có mặt của biến độc lập trong mô hình ta đi xét sự thay

đổi độ lệch của hai mô hình khi không có biến độc lập và khi có biến độc lập.

Định nghĩa 1.1.3. Độ lệch của mô hình hồi quy logistic, ký hiệu là D, có dạng
 Hµm hîp lý logisstic 

Ký hiệu ˆ i  ˆ( xi ) . Từ (1.3) ta thấy (1.6) có dạng

D

n
yi
yi 1 yi

2 ln   ˆ i (1 ˆ )


ii

= -2

n

1

y ln

y

y


i i 

(1  y )1

y 

ii

 ˆ 
i

 1 y ln

 1ˆ 
i

yi1y

 i

ii

1

ii

Như vậy, độ lệch D của mô hình hồi quy logistic là giá trị so sánh giữa logarit
hàm hợp lý của mô hình hồi quy logitstic và logarit hàm hợp lý bão hòa (mô
hình bão hoà là mô hình có số hệ số bằng số quan sát).
Định nghĩa 1.1.4. Hiệu độ lệch của hai mô hình không có và có biến độc lập

được gọi là tiêu chuẩn tỷ lệ hợp lý, ký hiệu là G:
G = D(Mô hình không có biến độc lập) − D(Mô hình có biến độc lập).
Vì hai mô hình này có chung hàm hợp lý bão hòa nên ta có:
G 2ln
Ta kiểm tra sự phù hợp của mô hình hồi quy logistic đơn bằng cách
kiểm định giả thuyết H: β1 =0, với đối thuyết K: β1  0, tức là ta xét xem biến
độc lập X thực sự có tác động tới biến phụ thuộc Y hay không.
Xét mẫu có n quan sát, giải phương trình hợp lý khi mô hình không có
biến độc lập (tức là β1 =0) ta có


n

n 

Đặt

1



y

i

i 1

hay
G
 2{[yi ln(ˆ i )  (1  yi ) ln(1  ˆi )]  [n1 ln( n1 )  n0 ln( n0 )  n ln(

n)]}
n

i1

Định lý 1.1.1. [8] Với giả thuyết β1 = 0 thì tiêu chuẩn thống kê G có phân
phối tiệm cận phân phối 2 với bậc tự do bằng 1.
Với hiệu lực của định lý trên, để thực hiện kiểm định sự phù hợp của
mô hình hồi quy logistic đơn ta có thể tiến hành các bước như sau:


Tính tiêu chuẩn tỷ lệ hợp lý G và giá trị -2logarit hàm hợp lý của mô

hình có 1  0, đặt giá trị ấy bằng -2l.


Với 2(1)là biến ngẫu nhiên có phân phối khi bình thường 1 bậc tự do,

tính xác xuất ý nghĩa  = P[ 2 (1) >2l].

So sánh α với mức ý nghĩa α0 cho trước (thường được ấn định
bằng
0.01 hoặc bằng 0.05).
* Nếu α  α0, ta bác bỏ H (với mức ý nghĩa α0).


*

Nếu α > α0, ta chấp nhận H (với độ tin cậy 100(1 −


α0)%). b. Kiểm định theo tiêu chuẩn Wald
Bên cạnh phương pháp kiểm định tỷ lệ hàm hợp lý ta có thể sử dụng
phép kiểm định thống kê Wald (đơn).


Định nghĩa 1.1.5. Tiêu chuẩn thống kê Wald là tỷ số

ˆ

 là giá trị ước lượng của tham số

với

1

cực đại,
Định lý 1.1.2 [8] Với giả thuyết 1 = 0 thì tiêu chuẩn thống kê W có phân
phối tiệm cận chuẩn N(0,1).
Với định lý trên, phép kiểm định theo tiêu chuẩn Wald với giả thuyết
H: 1 = 0 và đối thuyết K: 1  0 thì tiêu chuẩn thống kê W có phân phối tiệm
cận chuẩn N(0,1).



Tính tiêu chuẩn thông kê W.

Với Z là biến ngẫu nhiên có phân phối chuẩn N(0,1), tính xác suất ý

nghĩa  = P[|Z| > |W|].



So sánh  với mức ý nghĩa 0 cho trước

*

Nếu α  α0, ta bác bỏ H (với mức ý nghĩa α0).

*

Nếu α > α0, ta chấp nhận H (với độ tin cậy 100(1 − α0)%).

1.2 Mô hình hồi quy logistic bội
Xét tập p biến độc lập X1,X2,...,Xp. Kí hiệu vectơ X = (X1,X2,..., Xp). Xác
suất điều kiện của biến phụ thuộc Y theo các giá trị của biến độc lập X có dạng

P(Y =1/x)= π(x)
P(Y =0/x)=1 − π(x).
Khi đó hàm logit của mô hình hồi quy logistic bội được biểu diễn qua các
biến độc lập bằng phương trình
g(x)= β0 + β1x1 + β2x2 + ... + βpxp
trong đó βi,i = 1, p , là các hệ số chưa biết còn β0 là số hạng chắn.

 theo


Định nghĩa 1.2.1. Mô hình hồi quy logistic bội có dạng

 ( x) 
Trong một số trường hợp, biến độc lập là rời rạc hoặc là biến định tính,
ví dụ như địa chỉ, nghề nghiệp của sản phụ, sản phụ sinh vào mùa nào trong

năm, v.v. Để đưa những biến này vào mô hình ta sử dụng phương pháp thiết
kế biến (lập biến giả).
Giả sử biến độc lập thứ j là định tính có kj khả năng, khi đó có kj −1
biến giả Dju với u = 1, k  1. Ta gọi hệ số của các biến giả này trong mô hình
hồi quy là βju. Lúc đó, hàm logit của mô hình hồi quy logistic tương ứng có
dạng
k

j1

g x    0  1 x1  ···   ju D ju p xp
u1

Mô hình hồi quy logistic với hàm logit g(x) dạng (1.10) được sử dụng
nhiều trong các bài toán thực tế.
1.2.1 Ước lượng mô hình hồi quy logistic bội
Để ước lượng mô hình hồi quy logistic bội ta phải ước lượng vectơ hệ số β =
(β0,β1,..., βp). Tương tự như trong mô hình hồi quy logistic đơn, ta sử dụng
phương pháp ước lượng hợp lý cực đại.
Giả sử (xi,yi); xi =(xi1,xi2,...,xin), I = 1, p , là mẫu gồm n quan sát độc
lập. Quy trình tiến hành ước lượng vectơ hệ số của mô hình được thực hiện
như sau:
a. Lập hàm hợp lý và logarit hàm hợp lý của mẫu n có dạng
n

l (  )   ( X i ) yi [1  ( X i )]1 yi
i1
n

l (  )  {y i ln [ ( X i )]+(1-y i ) ln[1  ( X i )]}

i

1


b. Đạo hàm logarit hàm hợp lý theo p +1 tham số β0,β1,..., βp, ta có hệ phương
trình hợp lý gồm p +1 phương trình
n

[y i - (X i )]  0



nx



 i1


i1





[y - (X )]  0

i


i

....................




n x



[y - (X )]  0
ip

i

i

c. Giải hệ phương trình hợp lý trên, ta nhận được nghiệm là ước lượng hợp lý

ˆ

ˆ

ˆ

ˆ

cực đại của vectơ hệ số β =(β0,β1,...,βp), kí hiệu   (  0 ,  1 , ...,  p )
Lấy đạo hàm riêng cấp 2 của logarit hàm hợp lý theo các biến

β0,β1,...,βp, ta có


2

j2ij

L( )
  n x2 (1  )

ii
i1





2

L(  )

 n xij xiu  i (1 i )

 j ui1
với j, u = 0, p . Ký hiệu

2L(












2

I[]

2




2L(



 






p



Khi đó, ma trận hiệp phương sai của các hệ số ước lượng được xác định bởi
phương trình
trong đó
 2( )

() 

( ,






( ,

=1, p
ˆ

ˆ

ˆ

với σ2(βj) là phương sai của  j , j =1, p , σ(βj, βu) là hiệp phương sai của  j và  u , với j, u =

Từ các công thức trên ta thấy ước lượng của ma trận hiệp phương sai

ˆ


ˆ

 (  ) là giá trị của Σ(β) tại  . Ước lượng này có dạng

 2 (ˆ

ˆ
 ( 1,

ˆ
()  




Từ đó ước lượng các sai số chuẩn của các hệ số ước lượng bằng

ˆ ˆ
SE( i
Ta sẽ sử dụng các ký hiệu này khi kiểm định sự phù hợp của các hệ số
trong mô hình và xác định khoảng ước lượng của các hệ số đó.
1.2.2 Kiểm định sự phù hợp của mô hình hồi quy logistic bội
Để kiểm định sự phù hợp của mô hình hồi quy logistic bội, ta tiến hành việc
kiểm định giả thuyết

 (1,


H: β1 = β2 = ... = βp = 0, với đối thuyết
K: Một trong số các tham số β1; β2; ... ; βp khác 0.



a. Kiểm định tỷ lệ hàm hợp lý
Hàm hợp lý của mô hình logistic khi giả thuyết H đúng có dạng
e

() 
1 e0
H

l

0

Ngược lại, khi đối thuyết K đúng, hàm hợp lý của mô hình sẽ là
n

l K (  )   ( X i ) y [1- ( Xi )]1 y
i

i

i 1

ˆ ˆ
Gọi l H , l K là giá trị cực đại các hàm hợp lý. Theo (1.6) và (1.7), ta có
tiêu chuẩn tỷ số hợp lý G dạng

 lˆ
G 2 ln 



l

 K
Định lý 1.2.1. [8] Nếu giả thuyết H đúng thì đại lượng thống kê G có phân
phối tiệm cận phân phối 2 với p bậc tự do.
Với hiệu lực của định lý trên, để thực hiện kiểm định sự phù hợp của
mô hình hồi quy logistic bội ta có thể tiến hành các bước như sau:


Tính tiêu chuẩn tỷ số hợp lý G và giá trị -2logarit hàm hợp lý của mô

hình ứng với đối thuyết K. Ta gọi giá trị này là −2l.


Với 2(p) là biến ngẫu nhiên có phân phối khi bình phương p bậc tự do,

tính xác suất ý nghĩa α = P[ 2(p) > −2l].

*



So sánh α với mức ý nghĩa α0 cho trước

*

Nếu α  α0, ta bác bỏ H (với mức ý nghĩa α0).


Nếu α > α0, ta chấp nhận H (với độ tin cậy 100(1 − α0)

%). b. Kiểm định theo tiêu chuẩn Wald
Định nghĩa 1.2.2. Trong mô hình hồi quy logistic bội, tiêu chuẩn thống kê
Wald xác định như sau:


W
=

ˆ

ˆ

ˆ

ˆ

  '[  | ( )]1

ˆ

ˆ

 '(X 'VX )

trong đó ma trận X có dạng
1






1

X


1

còn ma trận V là V = diag[ˆ1 (1 ˆ1 ),ˆ 2 (1 ˆ 2 ),..., ˆ n (1ˆn )]
Theo tài liệu [8] ta có định lý sau:
Định lý 1.2.2. Khi giả thuyết H đúng thì thống kê W có phân phối tiệm cận
phân phối Khi – bình phương với p +1 bậc tự do.
Thực hiện phép kiểm định theo tiêu chuẩn Wald trong mô hình hồi quy
logistic bội được thực hiện theo các bước sau:


Tính tiêu chuẩn thống kê W.



Với Z là biến ngẫu nhiên có phân phối
α



2

(p+1), tính xác suất ý nghĩa


= P[Z > W].

So sánh α với mức ý nghĩa α0 cho trước
*

Nếu α  α0, ta bác bỏ H (với mức ý nghĩa α0).

*

Nếu α > α0, ta chấp nhận H (với độ tin cậy 100(1 − α0) %).

1.3 Ý nghĩa hệ số của mô hình hồi quy logistic
Sau khi ước lượng và kiểm định sự phù hợp của mô hình hồi quy logistic,
chúng ta đi đánh giá ý nghĩa, tầm quan trọng của các hệ số trong mô hình, tức
là chúng ta đi trả lời câu hỏi: "Với các hệ số đã được ước lượng thì biến độc
lập tương ứng có tác động như thế nào tới mô hình nghiên cứu?".
Trước khi đi đánh giá ý nghĩa hệ số của mô hình hồi quy, ta giả sử mô
hình đã được ước lượng và kiểm định sự phù hợp. Đầu tiên ta xác định hàm


của biến phụ thuộc cho bởi một hàm tuyến tính của biến độc lập. Đối với một
số mô hình gần với mô hình tuyến tính, hàm này được gọi là hàm liên kết. Đối
với mô hình hồi quy tuyến tính, hàm liên kết cũng chính là hàm hồi quy y
= ax + b. Như vậy, khi biến độc lập tăng thêm một đơn vị thì biến phụ thuộc
trong mô hình tuyến tính tăng thêm a đơn vị.
Trong mô hình hồi quy logistic hàm liên kết là hàm biến đổi logit
g(x)= ln{π(x)/[1 − π(x)]} = β0 + β1x.
Khi đó ta có hệ số dốc β1 = g(x +1) − g(x).
Ý


nghĩa của mỗi hệ số trong mô hình hồi quy logistic được lý giải tuỳ

thuộc kiểu của biến độc lập tương ứng. Sau đây ta sẽ xét mô hình chứa từng
loại biến độc lập cụ thể.
1.3.1 Mô hình có biến độc lập là nhị phân
Trong khuôn khổ luận văn ta chỉ xét trường hợp biến độc lập X nhị phân nhận
hai giá trị 0 và 1. Khi đó ta có bảng các giá trị hồi quy của mô hình như sau:
Bảng 1.1: Giá trị hồi quy logistic với biến độc lập là nhị phân.
y=1

y=0
Tổng
Độ chênh (odds) giá trị hồi quy giữa hai giá trị của biến phụ thuộc tại x
=1 là π(1)/[1 − π(1)]. Tương tự độ chênh giá trị hồi quy giữa hai giá trị của
biến phụ thuộc tại x = 0 là π(0)/[1 − π(0)]. Khi đó ta có logarit các độ chênh
này là
g(1) = ln{π(1)/[1 − π(1)]} = β0 + β1,
g(0) = ln{π(0)/[1 − π(0)]} = β0.


Tỷ số chênh (odds ratio), kí hiệu là ψ, là tỷ lệ giữa hai độ chênh giá trị
hồi quy tại x =1 và tại x =0. Ta có phương trình


Gọi π(1) là xác suất xảy ra sự cố (ứng với các trường hợp biến phụ
thuộc nhận giá trị 1 trong nhóm thử, khi đó 1 −π(1) là xác suất không xảy ra
sự cố trong nhóm thử. Gọi π(0) là xác suất xảy ra sự cố trong nhóm chứng,
1−π(0) là xác suất không xảy ra sự cố trong nhóm chứng. Tỷ số chênh là tỷ lệ
giữa độ chênh (nguy cơ xảy ra sự cố) trong nhóm thử và độ chênh (nguy cơ

xảy ra sự cố) trong nhóm chứng. Các khả năng có thể xảy ra của tỷ số chênh
ψ như sau:
* ψ =1: nguy cơ xảy ra sự cố giữa nhóm thử và nhóm chứng là như
nhau.
*
ψ > 1: nguy cơ xảy ra sự cố ở nhóm thử lớn hơn nguy cơ xảy ra
sự cố


nhóm chứng.
*
ψ < 1: nguy cơ xảy ra sự cố ở nhóm thử nhỏ hơn nguy cơ xảy ra
sự cố



nhóm chứng.
Lấy logarit của tỷ số chênh ta có log-tỷ số chênh hoặc log-độ chênh,


ln 

Theo Bảng 1.1 ta có tỷ số chênh ψ có dạng
















Từ đó, log-tỷ số chênh có dạng


×