Tải bản đầy đủ (.pdf) (65 trang)

Luận văn thạc sĩ khoa học: Kết luận thống kê về nhu cầu chăm sóc sức khỏe ở Hải Dương

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (12.9 MB, 65 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

ĐẠI HOC QUỐO GIA HÀ NỘI

<small>TRƯỜNG ĐẠI HOC KHOA HOO TỰ NHIÊN</small>

<small>Nguyễn Huyền Trang</small>

KET LUẬN THONG KE

VỀ NHU CAU CHAM SÓC

SỨC KHỎE O HAI DƯƠNG

<small>Chuyên ngành: Xác suất và Thống kê toán học</small>

<small>Mã số: 60 46 15</small>

<small>LUẬN VAN THẠC SĨ KHOA HOC TOÁN HOO</small>

<small>Người hướng dẫn khoa. học;</small>

<small>PGS.TS. Hồ Đăng Phúc</small>

<small>Hà Nội - 2011</small>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

1.3.2 Kiếm định sự phù hợp của mơ hình hồi quy logistic 13

1.4 Mơ hình hồi quy Logistiobội... 16<small>1.4.1 Ước lượng mơ hình hồi quy Logistiobội... 19</small>

1.4.2 Kiểm định sự phù hợp của mơ hình hồi quy logistic

<small>0 21</small>

1.5 Ý nghĩa hệ số của mơ hình hồi quy Logistic ... . 23

2 Mơ hình nhiều mức cho dữ liệu nhị phan 27

2.1 Mơ hình tuyến tính nhiều mức... 282.2 Mơ hình nhiều mức cho dữ liệu nhị phân ... - 30<small>2.3 Giới thiệu phan mềm xử ly số liệu SPSS và SVATA ... 3ä</small>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

3 Kết luận thong kê về nhu cầu chăm sóc sức khoe ở Hải

<small>Dương 36</small>

<small>3.1 Motasdlibu 2... ee ee ee 36</small>3.2 Phau tích số liệu mẫu ... 42

3.3 Phân tích số liu m4u2 —... 51

3.4 Kétluan.. 2... 58

<small>Tai liệu tham khảo 64</small>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

Lời nói đầu

Thống kê tốn học là ông cụ nghiên cứu được sử dụng rộng rãi tronghau hết ác ngành khoa học thực nghiệm nhất là trong y hoo, sinh học,xã. hội học, kinh tế và môi trường... thống kê toán họo giúp cho cáo<small>ngành khoa học khám phá ra từ các số liệu thực nghiệm các quy luật</small>

<small>HỘI tai của các hiện tượng trong tự nhiên và trong xa hội.</small>

Ode nghiên cứu về y tê cộng đồng cũng địi hoi sử dụng ắc cơng. cu

của thơng kệ toán học để giải đáp các câu hỏi liêu quan đến hệ thơng

chăm soo sức khỏe tồn dân, đưa ra các bằng chứng giúp xây dựng cácchú trương, chính sách liện quan đến mang lưới oung cấp các dịch vụchăm soo sức khỏe, nâng cao hiệu quả phục vụ của hệ thống y tế.

Nghiên cứu này có mục đích đánh giá cáo yếu tổ anh hưởng đến uhucầu khám chữa. bệnh tại nha đối với hai nhóm đối tượng người trong độ

tuổi lao dong và tré em dưới 16 tuổi, thơng qua việc 4p dụng mơ hình

hồi quy logistic nhiều mito — phương pháp thống kê hiện đại đang được<small>sử dụng rộng rãi trong nghiên cứu 6 nhiều nước trên thé giới và bước</small>đầu được sử dụng bại Việt Nam.

Luận văn “ Kết luận thông kê về nhu cầu chăm sóc sức khóe ở Hải

Dương” bao gồm 3 chương: và danh mục tài liệu tham khảo.

Ohuong 1 trình bày các vấn đề cơ ban về phương pháp phân tích hồi

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

quy logistio và mơ hình hồi quy logistio bội.

Ohuong 2 giới thiệu phương pháp phan tích thơng kê được dùng trong:nghiên cứu này là md hình nhiều mức cho dữ liệu nhị phan, đặc biệt là,<small>mô hình hồi quy, logistic nhiều mức.</small>

Dua trên cơ sở lý thuyết của hai chương đầu, Chương 3 đưa ra cáokết quả phan tích ảnh hưởng của. các u tơ kinh tê - xã hội đến nhu cần

khám chữa bệnh tại nhà của hai nhóm đối tượng người trong độ tuổi

lao động: và trẻ em dưới 16 tuổi. Phần cuối cia chương 3 dua ra một sỐ

ý kiến về xây dựng và phát triển mơ hình y tế gia đình nhằm nâng cao

chat lượng y tế vdng đồng.

Trước tiên, tôi xin được bày tỏ lòng biết ơn sâu sắc tới thầy giáohướng dan - PGS. LS Hồ Đăng Phúc - Viện Loan học - Viện Khoa họcvà Công nghệ Việt Nam, người thay đã luôn động viên, giúp đỡ và chi

dẫn nhiệt tình cho tơi trong suốt q trình nghiên cứu.

<small>Loi xin trân trọng cắm ơn cáo thầy giáo trong khoa Toán — Oo — Lin,</small>

đặc biệt cáo thầy trong tổ Bộ mon Xáo suất và hông kê — Lrudug Dai

hoo Khoa học Lu nhiên đã cung cấp cho tôi các kiên thức chuyên ngành

cần thiết để thực hiện dé tài. Loi cũng xin chân thành cắm ơn cáo thầy.

cơ Phịng Sau đại họo đã nhiệt tình giúp đỡ tơi trong suốt thời gian họctập. lồi xin gửi lời cẩm ơn đến cáo anh chị em trong lớp Cao học Lythuyết Xác suất và hông kê 2009 — 2011, cùng áo bạn đồng nghiệp và,<small>gia đình đã, nhiệt tình đóng góp ý kiến, động viên, giúp đỡ tơi trong suốt</small>

<small>q. trình lam luận van.</small>

Đặc biệt tôi xiu chân thành cam ơn sâu sắc tới sở y tê Hải Dương da<small>nhiệt tình và nghiêm tic cung cấp những dữ liệu chính xác và quý bau,</small>

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

mà nếu thiêu nguồn số liệu này tôi không thể thực hiện được.

Tuy đã có nhiều cỗ gắng nhưng bắn luận văn này cũng khơng tránhkhỏi những thiêu xót, tac giả rất mong có sự tham gia đóng góp ý kiêncủa. các thầy cd giáo, các nhà nghiên cứu Xác suất - hông kê , nghiêncứu y ĐỂ vị <small>vac dou gia quan tam tới luận van này,</small>

<small>Hà Nội, ngày 12 tháng 1 năin 2012</small>

Học viên: Nguyễn Huyền Trang

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

Chương 1

Phương pháp phân tích hồi quy

<small>Trong nghiên cứu y khoa, va khoa. học thực nghiệm nói chung thường</small>

06 nhu cầu phâu tích mỗi quan hệ giữa một (hay nhiều ) yến tô nguy, cơ

và khả năng xảy ra một sự cỗ(biến cố) nào đó, chang hạn như đối với

một nghiện cứu về mdi quan hệ giữa thói quen hút thuốc lá và ung thư

phối, thì yêu tố nguy cơ ở đây là thói quen hút thuốc lá và sự cỗ cần

quan tam là hiện tượng bệnh ung thư phổi. lIrong các nghiên oứu này.

đối tượng. phân tích thường được thể hiện qua các biên số nhị phân, tức

<small>là 06/ không, mắc bệnh/ không mao bệnh, chét/ sông, ... .Yêu bô nguy,</small>

cơ có thé là cáo biến số liên tục, các biến nhị phân hay cáo biển mang

<small>đặc tính thứ bậc.</small>

Vấn đề đặt ra cho các nghiên cứu dang này là làm cách nào để ước

tính mức độ liêu quan giữa yêu tố nguy cơ và khả năng xay ra sự cd.

Oáoc phương pháp phân tích như mơ hình hồi quy tun tính khơng thé

ấp dụng được bới vì biên phụ thuộc không phải là biến liên tục ma là,

biễn nhị phan. Phương pháp pho biên nhất sử dụng để phân tích cáo dữ

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

liệu với cáo biên phan ứng lưỡng phân là hồi quy, Logistic.

1.1 Số chênh và tý số chênh

Trong nghiên cứu dịch tễ người ta thường so sánh tan suất mic bệnh

giữa hai tong thé “ phơi nhiễm” (thử) và “ khơng phơi nhiễm” (chứng).

Ví dụ: Khi nghiên cứu bệnh phổi, cần so sánh tau suất mắc bệnh phổi

cla nhóm người hút tho lá và nhóm người không hút thuốc lá.

Khi tần suất đang xét là lớn 06 thé xem xót hiệu của hai tần suất.Nếu hiệu số đó khác 0 06 ý nghĩa thì có thể kết luận tần suất của nhow.

thử kháo tần suất của nhóm chứng.

Tuy nhiên khi hai tần suất rất nhỏ thì viéo so sánh hiệu của chúng<small>rat khó, cau so sánh bang thương (ty sô) giữa. hai tần suat. lý, số này.</small>được gọi lA ty số tan suat(| hay độ rủi ro tương đơi), Nếu ty số đó khác

1 v6 ý nghĩa thì có thể kết luận tần suất của nhóm thứ khác tần suất<small>của nhóm: chứng.</small>

Bên canh ty số tần suất oáo nhà, nghiện cứu thường dùng số chênh(odds)

và ty số chênh (odds ratio) để so sánh nhóm chứng. với nhóu: thử.

Số chênh cla một số sự kiện xây ra được định nghĩa. là ti số của. sốlần xảy ra sự kiện và số lần không xảy ra sự kiện.

Ly số chênh là tý số cúa hai số chênh. L số này gan 1 thì hai nhóm

khơng có sự kháo biệt. Ngược lại tý số chênh này càng. xa 1 thì càng thé

<small>hiện sự kháo biệt gitta hai nhóuh,</small>

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<small>Phơi nhiễm Không phơi nhiễm</small>

Mắc bệnh a bKhơng mắc bệnh G d

1.2 Hồi quy Logistic

<small>Phan tích hồi quy nghiên cứu mỗi quan hệ phụ thuộc ctta một bién</small>(gọi là biên phụ thuộc hoặc biên được giải thích) với một hay nhiều biênkhác (được gọi là biên độc lập hay biến giải thích). Ohtug ta sử dụng

<small>cáo ký hiệu sau;</small>

Y là biến phụ thuộc (hay biến được giải thích);X; là biến độc lập (hay, biến giải thích thứ i).

Một trong nhiều vấn đề ma phân tích hồi quy giải quyết là ước lượng:<small>giá. trị trung bình của. biễn phụ thuộc ứng với giá trị đã cho của. biên độc</small>

lập E(Y/Xi) .

<small>Nói chung, E(Y/X;) là một hàm cua X; sao cho:</small>

E(Y/X) = f(X,)

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

ƒ(X,) đượo gọi là hàm hồi quy tổng quát. Khi đó

+ Hàm hồi quy tống quát có một biến độc lập được gọi là hàm hồi

<small>quy. don.</small>

+ Nếu hàm hồi quy tổng quát v6 nhiều hơn một biến doo lập thi được

gọi là hàm hồi quy bội.

+ Nêu hàm hồi quy tổng quát có dạng ƒ(X;) = bo + 6X, trong đó

Bo, 8; là cáo hệ số chưa. biết, nhưng cơ định, thì f(X;) được gọi là hàmhồi quy tuyên tính đơn va Bo, đị gọi là hệ số hồi quy,

Mơ hình hồi quy Logistic khác với mơ hình hồi quy tuyến tính thơng:thường ở chỗ biên phụ thuộc của mơ hình Logistic là một biên lưỡng

phan wa không phải là biên định lượng liên tục. Dé thuận tiện trong

q. trình tính tốn ta thường ma hóa hai giá trị của biên phụ thuộc là,I và 0. Khi đó biến lưỡng phân được gọi là biéu nhị phân. Nếu khơngcó phi chú gì đặc biệt, trong luận văn này chúng ta luôn xét biên phụthuộc là biên nhị phan.

Hồi quy logistic la hồi quy phá tuyến trong đó biếu độc lập là định. tính,hoặc định lượng, biến phụ thuộc là thị phan.

Van đề được đặt ra là: “rong trường hợp biếu phụ thuộc là trhị phan

thi harm hot guy w(x) phat có dụng thư thế nào?”

Có nhiều dạng ham khác nhau da được nhiều tac giá đề xuất để xây,

<small>dựng mơ hình tốn học cho bài toán hồi quy này, lrong số các tác giả,</small>

đó, Oox (1970) da đưa ra haw logistio, O6 hai lý do để biện mình cho

việc chọn ham logisbio dua vào mơ hình hồi quy v6 biến phụ thuộc là nhị

<small>phan, đó là:</small>

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<small>- tính mềm déo tốn học, thuận tiện trong tính tốn;</small>

- Cung cấp được các giải thích đầy đủ về ý nghĩa sinh hoo của mô

Gia sử biên ngẫu nhiên Y là mot biến nhị phân, còn X là Immột biến

độc lập với các giá trị tất định được cho trước. Khi đó, để diễn ta môi

quan hệ giữa biến Y và biên X , cũng như đánh giá khá năng xuất hiện

cáo giá tri của biên Y theo các giá trị đã. biết của X , ta có thé đưa ra

một định nghĩa của mơ hình hồi quy logistic dạng đơn giản nhất như

<small>X là biến độc lập, Y là biên phụ thuộc.</small>

<small>ee — ePot Fix</small>

<small>1 — n(x)</small>

<small>10</small>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

Định nghĩa 2. Phép biên đổi sau được gọi là phép biên đổi logit:

<small>g(x) = In |———— (1.2.2)</small>

<small>Nhận xét:</small>

+ g(x) = 89 + Biz là hàm tuyến tính ctta x với z € (—oœo, +00).

<small>+ 0 < r(x) < 1 với moi gia trị cua x.</small>

+ Giả, sử giá, trị quan sát y của. biên phụ thuộc Y v6 dạng = a(x) +e

, trong đó e gọi là sai số (hiện giá trị quan sat và kì vọng điều kiệncủa biên phụ thuộc). Khi đó e nhận hai gia tri sau:

Nếu y = 1 thie = l1 — Z(z) với xáo suất 7(z).

Nếu y = 0 thì e = —Z(z) với xác suất 1 — r(x).

Từ đó, e vd phân phôi nhị thức với # (ec) = 0 và Var (e) = Var (Y) =

<small>7 (a). [1 — ()].</small>

1.3 Mô hình hồi quy Logistic

Xét biễn phụ thuộc là biến nhị phan Y và X1, Xo, ..., X; biên độc lập.Muốn dự đoán tan suất xuất hiện giá. trị 1 của biên Y theo các biên độc

lập, 06 thé lập phương trình hồi quy:

<small>lần suất = øIX+ + 62X¿ + --- + øyXy +D</small>

Hạn chế của. mơ hình trên: tan suat ở về trái chỉ nhận các giá trị lớn

hơn 0 nhó hơn T trong khi về phái có thể nhậu giá trị âm dương bat kì.

<small>lại</small>

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<small>Do đó phải lập mơ hình thích hợp hon:</small>

log [Tần suất/(1 - lần suất) | = đ@IX1 + d2Xa + --- + ayXy + Ù

Số chênh = exp(b). exp(ai X1). exp(aaX›)...exp(a„Xz)

1.3.1 Ước lượng các tham số của mơ hình hồi quy logistic

Để xác định được mơ hình ta can ước lượng cáo tham số của mơ hình

thong qua số liệu thu được trong mẫu quan sát. O6 nhiều phương phấpước lượng thai sô, ở đây chúng ta xét phương pháp ước lượng hợp lý

<small>cực đại. Gia sử mau có un quan sát độc lập (Z¡, y;),7 = 1,2,...,n, VỚI 1;</small>

là giá trị của biên phụ thuộc và z; là giá trị cla biên độc lập tai quansát thứ ¿. Việc ước lượng các tham số cia mơ hình bằng phương phap

<small>hợp lý cực đại được thực hiện theo quy trình như sau:</small>

<small>a. La cod P(Y = 1|z) = r(x), do đó P(Y =0|z) = 1— z(z). Nhu</small>

vậy Y nhậu giá tri 1 với xác suất bằng z(z;) và nhận giá trị 0 với xásuất bằng 1 — 7 (;),i = Ì,...,n.

<small>Với mỗi oặp (Z;, ¡),? = 1,2,...,n đặt</small>

£(z;) = x(z,){1 — x(,j)]**

<small>12</small>

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<small>b. Với mau n quan sat độc lập (z;,¡),? = 1,2,...,n ta thành lập</small>

<small>lượng hợp ly cực đại cua Ø.</small>

1.3.2 Kiểm định sự phù hợp của mơ hình hồi quy logistic

Việc kiếm định sự phù hợp của mơ hình, nhằm tra lời câu hoi: “Mo

hinh chứu biếu độc lập cho chứng ta thông tin vé biếu phụ thuộc thiêu

hon mot cách, đáng kể (có Ú ughia thông kô) so uới m6 hành, không chứu

<small>⁄- Ấ</small>

<small>buôn độc lập hay không?”</small>

<small>Kiếm định tý số hàm hợp ly</small>

Để đánh giá ý nghĩa sự có mat của biến độc lập trong mơ hình, ta cầnxót sự thay đổi độ lệch của hai m6 hình khi khơng có biên độc lập và

<small>13</small>

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<small>ham. hợp lí bao hoa</small>

<small>Ki hiệu 7; = 7(a;) va từ (1.3.3) ta thay (1.3.6) 06 dạng</small>

có biên độc lập được gọi là tiêu chuẩn tý lệ hợp lý, ký hiệu là G:

G —D (mô hành khơng có biến độc lập) — D (mơ hành có biếu độc lập).<small>Vì hai mơ hình này có chung ham hợp lý bao hịa nêu ta cd:</small>

hàm hợp lí logistic khơng có biến độc lập

<small>ham hợp lí logistic vé biên độc lap</small>

Tà, kiếm tra sự phù hợp của mơ hình hồi quy logistic đơn bằng cáckiếm định gid thuyết H: 6, = 0, với đối thuyết K: 6, # 0, tức là xét xem

biên độc lập X thực sự có tác động tới biên phụ thuộc Y hay không.

<small>Xét mẫu cO n quan sat, giái phương trình hợp lí khi mơ hình khơng</small>

có biến độc lập, tức là 6, = 0, ta v6:

By) =In » Yi Soa — 9)

<small>14</small>

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

Dinh lý 1. Khi giá thuyết 6, = 0 đứng thà tiêu chuẩn thong kê GŒ có

phéu phot tiệm cậu phân phối x? uới bậc tu do bằng 1.

Theo hiệu lực của định lý trên, để thực hiện kiếm định sự phù hợpcủa. mơ hình hồi quy logistic đơn ta có thể tiến hành ốc bude sau:

- Tính tiêu chuẩn ti lệ hợp lý G và giá. tri — 2logarit — hàm hợp lý a

mơ hình có đị #0, đặt giá trị ấy bằng —2/ .

- Với x (1) là biến ngẫu nhiên có phân phối Khi - bình phương motbậc tự do,tính xác suất ý nghĩa œ = P[y?(1) > —2l].

- So sánh œ với mức ý nghĩa a cho trước (thường được ân định bằng0.001 hoặc bằng, 0.05)

+ Nếu œ < ao , ta báo bó H (với mức ý nghĩa ag )

+ Nêu a > ap , ba chap nhận H (với mức độ tin cậy 100(1 — ao)%)

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<small>Kiếm định theo tiêu chuẩn Wald</small>

Bên canh phương pháp kiếm định tý lệ hàm hợp lý, ta có thé sử dung

phép kiểm định thông kê Wald.

Định nghĩa 5. Liêu chuẩn thông kê Wald là tý số

_ 8E(ñi)

Với 8, là giá trị ước lượng cửa tham số 6, theo phương pháp ước lượng

hợp lí cue đại, SE(ô,) là sai số chuẩn ctia ước lượng. đi.

Định nghĩa 6. Với giả thuyết đị = 0 thi tiêu chuẩn thơng kê W có

phân phối tiệm can chuẩn N(0.1).

Với định lí trêu phép kiểm định theo tiêu chuẩn Wald với giá thuyếtH: 6, = 0 và đôi thuyết K: đị # 0 có thể thực hiện theo cáo bước sau:

- Tính tiêu chuẩn thơng kê Wald

- Với ⁄ là biến ngẫu nhiên có phan phối chuẩn N(0,1) tính xác suất

<small>ý nghĩa a = P||Z| > W).</small>

<small>- So sánh œ với gia tri ap cho brước:</small>

+ Nếu a < ap ta bac bỏ H (với mức ý nghĩa. ag)

<small>+ Nếu a > ap ta chấp nhận H ( với độ tin vay, 100(1 — ap)%)</small>

1.4 Mơ hình hồi quy Logistic bội

Xét tập p biên độc lập X1, Xa,..., Xp. Ký hiệu veoto X = (X1, Xo, ..., Xp).Xáo suất điều kiện biên phụ thuộc Y theo các giá. tri của biên độc lập X

<small>16</small>

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

<small>có dang:</small>

<small>P(Y = 1/z) = m(z)</small>

<small>P(Y =0/r) =1—-7(2)</small>

Khi đó ham Logit ctia mơ hình hồi quy Logistio bội được biểu diễn qua

cáo biên độc lập bằng phương trình:

g(x) = Bot Bit, +--: + Bry

Trong đó, đ;, ý = 1,p là cáo hệ số chưa. biết còn 8 là hệ số chặn.

Định nghia7. Mơ hình hồi quy Logistic bội dạng:<small>e9 (x)</small>

n(x) = 1+ em

Trong một số trường hợp biến doo lập là rời rac hoặc là biên định tính

để đưa những biến này vào mơ hình ta sử dụng phương pháp thiết kế

biễn (hay lập biến gia).

Trong trường hợp tổng quát, khi biến độc lập có thể nhận k giá trị,

<small>thiệt kê k— 1 biến giá D;, Do,..., 2(k — 1), mỗi biên nhận giá. trị 0 hoặc</small>

I tùy thuộc vào giá. trị cu thé của biên độc lập ban đầu. La có cách wa

<small>hóa. lại như trong bằng sau:</small>

Bảng thiết ké bién gia đối với biên nhận nhiều giá trị

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

l Khi tương ứng với khá năng thứ nhất

mộ 0 Khi tương ứng với khả năng thứ nhất

<small>L Khi tương ứng với kha năng thứ hai</small>

0 Khi tương ứng với kha năng thứ hai

<small>L Khi tương ứng với khá năng thứ k — 1</small>

Thế 0 Khi tương ứng với kha năng thitk — 1

<small>Tương ứng với kha năng thứ k thì D; = 0 với ¡ = 1,...,k — 1. La</small>

<small>thường chọn kha năng thứ k tương ứng với nhóm chứng, là nhóm dùng</small>

làm chuẩn để so sánh với các nhóm cịn lại.

Trong một số trường hợp, chúng ta có thé xây dựng biên giả tit một

biên liên bục. Khi xây dựng biến giá từ một biến liên tục ta van cht ýmột số điều sau;

- Khoảng cach giữa. cáo nhóm là bằng nhan,<small>- Cỡ cáo nhóm là bằng nhan,</small>

- ân nhắc tới chú đề của. đối tượng phan nhóm.

Gia sử biến độc lập thứ ] là định tính có k; kha năng, khi đó v6 kj — 1

biến giá Dj, với u = 1,k; — 1. La gọi hệ số của. các biến giá này troug

mơ hình hồi quy là đ;„. La cd hàm Logit cửa mô hình hồi quy, Logistio

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

1.4.1 Ước lượng mơ hình hồi quy Logistic bội

Để ước lượng mơ hình hồi quy Logistic bội ta phai ước lượng veotơ hệ

<small>sô 8 = (8, Øi,..., đp). Luong tu như trong mô hình hồi quy Logistic đơn,</small>

<small>ta su dụng phương phấp ước lượng hợp lí cực đại. Gia sử (Z;, y;), #¡ =</small>

(ri1,---,in),2 = 1,p là mẫn gồm n quan sát độc lập. Quy, trình tiến

hành ước lượng vectơ hệ số của mơ hình được thực hiện như sau:

<small>a. Lập ham hợp lí va logarit ham hop lí của mau n có dang:</small>

<small>ư. Giải hệ phương trình hợp lí trên ta có nghiệm là ude lượng hợp lí cực</small>

đại của vecbơ hệ số đ = (9, 61,..., đ,), kí hiệu là B = (ñu,Ổi,..., Bp).

<small>Lay đạo hàm riêng cap hai logarit hàm hợp lí theo cáo đụ, 61,..., Bp ta</small>

AL (B Ni

i — =3 sim map“ Yo itiami(l ~ Ti)

<sub>i=l</sub>

<small>19</small>

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

<small>08:08, — a ¡11ipT¡ 4 wee OR = > ipTi </small><sup>i</sup>

Khi đó wa trận hiệp phương sai của hệ số ước lượng được xác định bởi

phương trình Ð3(đ) = I71(8), trong do:

ơ?(Ø) øơ(0i,6›) ... o(81, Bp)

S2) 0 (81, Ø›) a” (52) mee 7 (81, Bp)

0 (81, Bp) 0 (82, Bp) ao 0° (Bp)

Với ø?(,) là phương sai của 6;,7 = 1,p,ø(;, By) là hiệp phương sai

của, 8; va Bu với j,u = 1, p. ừ cdc công thức trên ta thay mwa tran hiệp

phương, sai Š(ô) là ước lượng của Šˆ(Ø) tại 3. Ước lượng này có dạng:

ơ(8I. Bp) ơ(8a, Bp) ste ơ”(8,)

Từ đó ước lượng các sai số chuẩn ctta cáo hệ số ước lượng bang:

<small>^ ^</small>

<small>.2/2 12</small>

$E(ô;) = [6°(3,)|

Ta sẽ sứ dung cáo kí hiệu này khi kiểm định sự phù hợp của. cáo hệ số

trong mô hình và xáo định khoảng ước lượng của cáo hệ số đó.

<small>20</small>

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

1.4.2 Kiểm định sự phù hợp của mơ hình hồi quy logistic bội

Để kiếm định sự phù hợp cia mơ hình hồi quy logistic bội, ta tiếnhành việc kiểm định giá thuyết H: 6, = By = --- By = 0 và đôi thuyét

<small>Dinh lý trên được gọt là Dinh lý Hosmer- Lemeshow, là md rộng cua</small>

<small>Định lý 1 và đã được chứng minh bằng phương pháp m6 phỏng.</small>

Theo hiệu lực của định lý trên, để thực hiện kiếm định sự phù hợp

của mơ hình hồi quy logistic bội ta có thé tiên hành vac bước như sau:- Tính tiêu chuẩn tỷ số hợp lý G và giá trị — 2logarit — hàm hợp lý

của. mơ hình ứng với đơi thuyết K. La gọi giá tri này là — 21.

<small>21</small>

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

- Với x? là biến ngẫu nhiên có phân phối Khi- bình phương, p bậc tự

do, tính xác suất ý nghĩa a = Ply? > —2l]

<small>- So sánh œ với Iuức ý nghĩa ap cho trước:</small>

+ Nếu a < ap ta báo bó H (với mức ý nghĩa. ag)

+ Nêu œ > ap ta chấp nhận H ( với độ tin cay, 100(1 — ap)%)

<small>Kiếm định theo tiêu chuan Wald</small>

Định nghĩa 8, Irong mơ hình hồi quy Logistio bội, tiêu chuẩn thơng

<small>kê Wald xáo định như sau:</small>

w=2[S (6| â=#(Yvx)i

<small>rong đó, ma tran X:</small>

<small>1 #11 +++ Up1 #21 %2sae p</small>

<small>1 fy... Lnp</small>

<small>Còn ma trận V;</small>

<small>V = điag[fñi(1 — 771), #2(T — âa),..., „(1 — Ần)]</small>

Định lí 3. h¿ giá thuyết H đáng thà thong bê W có phâu phốt tiệm can

uới phan phối y? uới p+1 bậc tự do.

Phép kiếm định theo tiêu chuẩn Wald trong mơ hình hồi quy Logistic

<small>bội được thực hiện theo vac bude sau:</small>

-ính tiêu chuẩn thơng kê Wald

- Với Z là biến ngẫu nhiêu có phân phối x7,¡ , tính xác suất ý nghĩa

<small>œ = P|Z > W]</small>

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

<small>- So sánh œ với mức ý nghĩa. ag cho trước:</small>

+ Nêu a < ap ta báo bó H (với mức ý nghĩa ag)

+ Nếu a > ap ta chấp nhận H ( với độ tin cay, 100(1 — œg)%)

1.5 Ý nghĩa hệ số của mơ hình hồi quy Logistic

Sau khi ước lượng và kiểm định sự phù hợp oủa mơ hình hồi quy

logistic, chúng ta di đánh giá ý nghĩa, tam quan trọng của cáo hệ sốtrong mơ hình, bức là chúng ta đi tra lời câu hoi: “Với cáo hệ sơ đã đượcước lượng thì biên độc lập tương ứng có tác động như thé nào tới mơ

<small>hình nghiên cứu?”</small>

Trước khi đi đánh giá ý nghĩa hệ số của m6 hình hồi quy chúng ta

giá sử mơ hình đã được ước lượng và kiểm định sự phù hợp. Đầu tiên

ta xáo định hàm của biên phụ thuộc cho bởi một hàm tuyên tính củabiên độc lập. Đối với một số md hình gần với m6 hình tuyến tính hamnày được gọi là hàm liên kết. Đối với mơ hình hồi quy tuyến tính ham<small>liêu kết cũng chính là ham hồi quy y—ax+b. Như vậy, khi biên độc lập</small>tăng thêm mot đơn vi thì biên phụ thuộc trong mơ hình tuyến tính tăngthêm a đơn vi. lrong mơ hình hồi quy logistio hàm liên kết là ham biên

doi logit g(a) = In Got — z(z)) = Bo + Øịz. Khi đó ta có hệ số dốo

<small>cua mơ hình 6; = g(a + 1) — g(z).</small>

Ý nghĩa của mỗi hệ số trong mộ hình logistic được lý giải tùy thuộc

kiểu của. biên độc lập tương ứng:

+ Mô hình có biến độc lập nhị phan

Trong khn khổ của luận văn này chí xem xét trudg hợp biến độc

<small>23</small>

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

<small>lập X lưỡng phân nhận hai giá trị 0 và 1, Khi đó ta v6 bang giá trị hồi</small>

<small>quy cửa. mơ hình như sau:</small>

Bang giá trị hồi quy Logistic với biên độc lập nhị phân

Lay, logarit của ty số chênh ta có log ty số chênh

<small>y=</small>

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

<small>Theo bang giá trị hồi quy. Logistic với biên độc lập nhị phan ta oó ty số</small>

<small>efo+8i 1</small>

<small>1 + cf+ơi 1 + cƯ ePot hi ;</small>

<small>= =e 1</small>

<small>obo 1 ePoT+ eo T+ e8o+ổi</small>

Từ đó log tý số chênh c6 dạng In = In(e”!) = beta; Như vậy log tý số

<small>chênh có dạng</small>

<small>chênh bằng, đị. La cd khoảng, ước lượng ctia đị với độ tin vay, 100(1— œ)%</small>

(ôi — Z„/2SE(Ơ1): By + Z„»ŠE(ơ1))

Do đó khoảng ước lượng. của ty số chênh với độ tin vay, 100(1 — a)% là<small>(eh: S00, cơ+Za,sŠE(i))</small>

+ Mơ hình có biến độc lập nhận nhiều giá trị.

Bang hệ số hồi quy logistic cho biên độc lập nhận nhiều giá tri

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

+ Mô hình có bién độc lập liên tục.

<small>Trong trường hợp biến độc lập X là liên tục, thì hàm logit g(r) =</small>Bo + Bix cũng là log tỷ số chênh của mơ hình. Lit đó ta có hệ số dốuđi = g(x +1)—g (2) với mọi giá trị cla x . Lức là khi biến độc lập thay.

doi 1 đơn vi thì ty số chênh sẽ thay, đổi exp (đ) đơn vi.

Log ty số chênh khi thay, đổi o đơn vị là. g (2 + c) — g (x) = hj, từ ty

sô chênh 4Ú (c) v (# + e,#) = e?”' ta 06 khoảng ước lượng. của. ty số chênh

<small>với độ tin vay, 100 (1 — a) % là</small>

(cere ZoyeeS PU), colt ZopaeS Un) )

<small>26</small>

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

<small>liệu được thu thập ở cao mức khac nhau cla đơn vị quan sat.Vi dụ cho</small>

cáo câu trúc thứ bac trong xã hội khá là phong pht. Ohẳng hạn, trong

cáo trường hoe, sinh viên được long nhóin trong cáo lớp và vac lớp đượclồng nhóm trong cáo trường, Hoặc trong điều tra về nhu cầu cham sócsức khỏe tại nhà, số liệu thu thập được ở từng nhóm thành viên trong.

gia đình, song kết luận có thé dua ra cho các khu vực xã, phường khác

Mơ hình nhiều mức đã được xây dựng và sử dụng rộng rãi để nghiên

cứu cáo sô liệu v6 cau trav lồng nhóm. Mơ hình nhiều miức đã cho thay,

nhiều ưu điểm so với các phương pháp phân tích truyền thống khác,

chẳng hạn nó khắc phụo được hạn chê của giá thiết về tính độc lập giữa

các quan sát và giá thiết phương sai không doi. Khi đó giá thiết về tínhđộc lập giữa cáo quan sát ma cáo phương pháp thơng kê vd diéu địi hỏi

<small>27</small>

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

có thé bị vi phạm, nhưng kết quả của phương pháp phân tích nhiều mức

khơng chịu anh hướng của. sự vi phạm đó. Sau đây ta xem xét một sd<small>mơ hình nhiều mite thường được sử dung.</small>

2.1 Mơ hình tun tính nhiều mức

Ta bắt đầu tit một mơ hình quen thuộc- mơ hình tun tính nhiều

mức. La tập trung vào một mơ hình cu thé wa cáo nhà xã hội học thường

sử dụng. Dang chung nhất của mơ hình tun tính nhiều mức từng đượcmơ ta bởi Mason và cáo đồng sự (1983), Goldstein (1987, 1995), và Bryk

<small>& Raudeubush (1992).</small>

<small>Đầu tiên, ta xem xét mơ hình 2 mức đơn gidu với một biến giải thích</small>

duy nhất. Thuật ngữ thông thường để ký hiệu mức thấp nhất cia thứ

bao là mức 1, mức thấp tiếp theo là mức 2,v.v. Mơ hình hồi quy nhiều

mức day, dir giá sử rằng có một bộ dữ liệu có thứ bậc với biên phụ thuộc

do đượo ở mức thấp nhất va một số biên dự báo (biến giải thích) do đượo

ở tat od cdc muito cúa, dữ liệu hiện có. Ou thé, mơ hình đó vd thé được

xem xét như một hệ thống có thứ bac cáo cơng thức hồi quy,

yij = Bo + đi + uj + Gụ (2.1.1)

trong đó, y;; là biéu kết quá cho đơn vị thứ i của mức 1 và đơn vịthứ ] của mức 2, Bo là hệ số chặn, z;; là biên giải thích, 6, là hệ số

dốo, u; là ảnh hướng ngẫu nhiên của những biến doi ngẫu nhiên ở mức

2 và e;; là anh hưởng ngẫu nhiên mức 1, Ode tham số cho ánh hưởng

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

trong cum hoặc trong nhóm sau khi kiểm sốt táo động của biến giáithích có thé thu được từ biểu thức ø = ø2/(ơ2 + 07) . Phương trình

(2.1.1) v6 thé được xem xét như mơ hình ánh hưởng ngẫu nhiên cho

dữ liệu điều khiến hoặc mơ hình đường cong tăng trưởng. lrong va 2trường hợp, i và ] tương ứng là chi số thời điểm và cá thể, và là hiệpbiên thay đổi theo thời gian. Một mơ hình tăng trướng tun tính địi

hỏi trong phương trình (2.1.1) phải có thành phần tuyến tính và wot

mơ hình tăng trưởng bac 2 địi hỏi bổ sung vào phương trình đó thành

phần bao 2.

Tà tiếp tục mở rộng mơ hình 2 mức đơn giản thành mơ hình 3 mứcvới hệ số ngẫu nhiêu,

Yijk = Bo + 1#jjk + 1/kÿk + VoR + Uojk + €0ijk (2.1.2)

lrong đó k chí số mức 3, vo, và uạọ;, là hệ số chặn ngẫu nhiện cho

mức 3 và Imức 2, tương ứng với z;;„¿ là biến giải thích được quan sát ở

<small>mức 1 và uj, là ánh hướng ngẫu nhiên cua z;;y ở mức 2. Oáoc thai</small>

sô khác trong mộ hình thỏa mãn E[vo,] = Eluo;g} = E[eu¿x] = 0,

0aT(0oy) = đo, 0aT(Uajy) = O29, 0dT(U1jy) = đi, 0@7(€ojjy) = 72 và

<small>CoU(gj; 17g) = Tul</small>

<small>Mơ hình này một lần nữa. giá định rằng cáo ảnh hướng ngẫu nhiên</small>

<small>trên các mức kháo nhau va các ảnh hưởng ngẫu nhiên trên cic cum khac</small>

<small>nham trong cùng mot ruức là không tương quan. Oac m6 hình phức tap</small>

hơn có thé được xây dựng bằng cách thêm cáo biển quan sát vào phương

<small>trình (2.1.2) và vac tương quan giữa. oấo mite.</small>

<small>Mơ hình nhiều mito khơng chi có cáo tham số hồi quy quen biết như</small>Bo và 6; mà con v6 oáo tham số ngẫu nhiên chua biết như Uojkr t1j„ Và

<small>20</small>

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

<small>vor . Khi xem xét mơ hình nhiều mức như là một trường hợp đặc biệt</small>của. mơ hình phức hợp, cáo nhà thống kê ước lượng, các tham sỐ cla wd

hình thơng qua phương pháp ước lượng bình phương bé nhất, cực tiểuhóa giá trị (ụ— X B)/V-1(y— XB). Tuy, nhiên do sự v6 mặt của cáo tham

số ngẫu nhiên ohưa biết trong V, trước đó người ta phái dùng phương

pháp hợp lí cue đại hoặc hợp lí cue đại hạn chế để ước lượng phương. saivà hiệp phương sai của u và e, với giả thiết chúng vd phân phối chuẩn.

2.2_ Mơ hình nhiều mức cho dữ liệu nhị phan

Mơ hình hồi quy cho dữ liệu nhị phan bao gồm hồi quy Logistio vàhồi quy. xác suat(probit) thường được cáo nhà xã hội học dùng làm công,cụ thống kê trong các nghiên cứu. lrước tiên chúng ta xem xét mơ hình2 mức với biên phụ thuộc nhị phan và một biến giải thích. Mơ hình này<small>tương tự mơ hình (2.1.1), chi khác ở chỗ biến phụ thuộc chí nhận hai giá</small>

<small>trị 0 và 1, Giá sử chúng ta có các học sinh (đơn vị mức 1) được nhóm</small>

<small>vào trong cấc trường (đơn vi mức 2).</small>

Xót giá trị của biên phụ thuộc nhị phan y;; ứng với học sinh i trongtrường ] và. gid trị cla biến giải thích z;; quan sát ở mức hoo sinh. La kí

hiệu xáo suất dé biên đáp ứng nhận giá trị 1 bằng pj; = Pr(yij = 1) và

pi; được mơ hình hóa bởi hàm liên kết logit. lrong thực tế, y;; thườngđược giá thiết có phân phối Bernoulli. Do đó, mơ hình hồi quy hai mức<small>cho biên phụ thuộc nhị phân được viết thành</small>

loglp¿/(1 — pij)] = Bo + Ôi#¡j + uj (2.2.3)

trong dou; là ánh hướng ngẫu nhiên ở mức 2. Nếu khơng có u;, (2.2.3)

<small>30</small>

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

<small>sẽ là mộ hình hoi quy, logistic thơng thường. rong mơ hình trên, ; và</small>y;; được giả định là độc lập với nhan. Oũng như trong mơ hình tuyến

tính nhiều mức, uj được giá thiết phan phối chuẩn với kì vọng 0 vàphương sai o? . Mơ hình (2.2.3) thường được mơ tả, dưới dạng khác của,

<small>mơ hình nhiều mức cho bởi phương trình (2.2.4) và (2.2.5) ,</small>

<small>Boj = Bo + uj; ( mơ hình mức 2) (2.2.5)</small>

Mơ hình nhiều mức cho biên phụ thuộc nhị phân cing có thể diễn giấi

thơng qua khái niệm biên an. Giá sử tồn tai một biến ấn 1ï; phụ thuộc

vào yi; wot cách liên tụo. La chi quan sat trực tiếp được biến phụ thuộc<small>nhị phan 1;; chứ không phải yj. luy, nhiên, ta biết yj; > 0 ueu ¿; = 1</small>và yi, < 0 nếu y;; #1. Mơ hình nhiền mức cho tương đương, với (2.2.3)

có thé viết như sau:

Yi; = Bot ƠiZ¡j + uj + ei; (2.2.6)

O6 định ánh hướng ngẫu nhiện uv; ở mức 2, phương trình (2.2.6) có thếsuy ra ttt mơ hình hồi quy, Logistic nhiều mức (2.2.3) hoặc mơ hìnhhồi quy probit nhiều mức tùy thude vào giả thiết e;; trong phương trình

(2.2.6) có phan phối logistic tiêu chuẩn hay phân bô chuẩn thông thường.

<small>Diễn giải trên minh họa cho mỗi liên hệ chặt chẽ giữa rơ hình nhiều</small>mức cho cáo dữ liệu định lượng liên tục và mô hình nhiều mức cho oấo

<small>dữ liệu nhị phan.</small>

Có định u; hoặc giá sử rằng u; đã quan sát được. Liv đó, hàm wat

độ có điều kiện trên cụm ] cla mơ hình (3) chính bằng ham wat độ v6

<small>31</small>

</div>

×