Tải bản đầy đủ (.pdf) (14 trang)

NGHIÊN CỨU KHOA HỌC NGÀNH Y - Bài 4 docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (630.63 KB, 14 trang )

Bài 4

NGHIÊN CỨU CẮT NGANG




TS. BS. Tăng Kim Hồng

I. GIỚI THIỆU:
1.1 Đònh nghóa: Nghiên cứu cắt ngang (cross-sectional study, prevalence study) là
loại nghiên cứu khảo sát mối liên quan giữa bệnh tật (hay vấn đề sức khỏe) và các đặc
điểm khác như chúng hiện có trong một cộng đồng xác đònh, cùng tại một thời điểm/
thời khoảng xác đònh.
1.2 Công dụng của nghiên cứu cắt ngang:
1. Đánh giá “sức khoẻ” của cộng đồng qua việc xác đònh tỉ suất hiện mắc
(prevalence) của 1 bệnh hay 1 vấn đề sức khoẻ => do đó được gọi là “prevalence
study”.
Ví dụ: Dùng nghiên cứu cắt ngang để khảo sát tỉ lệ trẻ suy dinh dưỡng < 5 tuổi trong
dân số hay tỉ lệ phụ nữ trong độ tuổi sinh đẻ có áp dụng các biện pháp ngừa thai.
2. Xác đònh sự liên quan giữa bệnh và các yếu tố khảo sát. Từ đó, phán đoán
xem các yếu tố khảo sát có phải là nguyên nhân của bệnh hay không.
Ví dụ: Một nghiên cứu cắt ngang được thực hiện để khảo sát các “yếu tố nguy cơ” của
bệnh lây truyền qua đường tình dục (STD) trong số các phụ nữ đến khám tại bệnh viên
da liễu. Nhà nghiên cứu hỏi tất cả phụ nữ về tiền sử sử dụng thuốc ngừa thai đồng thời
khám và làm phết tế bào âm đạo – cổ tử cung để xét nghiệm. Mục đích của nghiên
cứu này là nhằm trả lời cho câu hỏi: có mối liên quan giữa việc sử dụng thuốc ngừa
thai và viêm sinh dục do Chlamydia hay không.
3. Lượng giá một test mới hay ứng dụng mới của một test cũ
Ví dụ: Một nghiên cứu cắt ngang đã được thực hiện để so sánh hai phương pháp phát
hiện bệnh tắc tónh mạch chi dưới: một là dùng siêu âm Doppler và phương pháp kia là


dựa vào khám nghiệm trên lâm sàng (sưng, căng phù chi dưới). Chẩn đoán xác đònh
cho tình trạng tắc tónh mạch sâu được dựa vào X-Quang tónh mạch có cản quang hoặc
(với một số ít bệnh nhân) là dựa vào kết quả phẫu thuật hay tử thiết.
4. Lượng giá khả năng tiên đoán của các đặc điểm lâm sàng
Ví dụ: Mối tương quan giữa khám lâm sàng và nhiễm trùng huyết
Độ chính xác của thủ thuật thăm khám trực tràng trong chẩn đoán K tiền liệt
tuyến
Điểm cắt tối ưu của BMI và CVVE để tiên đốn nguy cơ tim mạch ở trẻ em
5. Sàng lọc và phân loại trước đối tượng nghiên cứu cho các nghiên cứu đoàn
hệ (giai đoạn đầu của nghiên cứu đoàn hệ)

18
II. CÁC VẤN ĐỀ TRONG THIẾT KẾ VÀ THỰC HIỆN NGHIÊN CỨU CẮT
NGANG
2.1 Tính cỡ mẫu: Nghiên cứu cắt ngang thướng được sử dụng để ước lượng một
số trung bình (biến số liên tục) hay một tỉ lệ (biến số rời) cho nghiên cứu cắt ngang
Công thức tính cở mẫu nhằm ước lượng:

- một số trung bình

trong đó
σ: độ lệch chuẩn


d: sai số biên của ước lượng
2
2
2
n
σ

α

=
2
/1
d
Z

- một tỉ lệ:
trong đó p: tỉ lệ ước tính của vấn đề cần khảo sát

d: sai số biên của ước lượng
2
2
2
)
Zn =

α
/1
1(
d
pp −

VD1: Cần phải có cở mẫu là bao nhiêu để xác định tỉ lệ đàn ơng Việt nam hút thuốc lá,
biết rằng kết quả từ một nghiên cứu trước đây cho thấy tỉ lệ này là 20% và chúng ta mong
muốn kết quả tìm thấy có giá trị nằm trong khoảng 5% giá trị thật
p = 0,2, 1-p = 0,8, Δ = 0,05
=> n = 1,96
2

x 0,2 x 0,8/ 0,05
2
= = 245,8 = 246 người
Lưu ý:
- Đây là cở mẫu được tính cho nghiên cứu KHƠNG sử dụng phương pháp chọn
mẫu cụm. Nếu chọn mẫu cụm => phải tính “hệ số thiết kế” (design effect)
- Đây là cở mẫu cần có để phân tích. Nếu tỉ lệ tham gia NC thấp, ví dụ chỉ 75% thì
cở mẫu cần có phải tăng lên = 246/0,75 = 328
- Nếu khơng có thơng tin gì về giá trị p, thì giá trị 0,5 có thể sử dụng để có cở mẫu
lớn nhất

VD2: Cần phải có cở mẫu là bao nhiêu để ước tính trung bình của trị số HATT của phụ
nữ Việt nam, biết rằng kết quả từ một nghiên cứu trước đây cho thấy độ lệch chuẩn là 20
và chúng ta mong muốn kết quả tìm thấy có giá trị nằm trong khoảng 10% giá trị thật
σ = 20, Δ = 0,1
=> n = 1,962 x 20/ 0,12 = 15,4 = 16 người
Nếu tỉ lệ tham gia NC chỉ 80% thì cở mẫu cần có phải tăng lên = 16/0,8 = 20 người

* Cách xác định “hệ số thiết kế”(design effect)
 Xác định bằng nghiên cứu pilot
 Nghiên cứu có từ trước có cùng cách chọn mẫu
 Tính bằng cơng thức: Design effect = 1 + (m-1) * δ
Trong đó:
- m: độ lớn trung bình của 1 cụm
- δ: hệ số tương quan (intra-class correlation coefficient)
Có thể là 1 con số âm rất nhỏ (khi cấu trúc trong từng cụm rất khác nhau) hoặc
=1 (khi cấu trúc trong từng cụm thuần nhất)

19
SỬ DỤNG PHẦN MỀM EPI-INFO 2002 ĐỂ TÍNH CỞ MẪU TRONG

NGHIÊN CỨU CẮT NGANG (NHẰM ƯỚC LƯỢNG MỘT TỈ LỆ)


Mở Epi-Info 2002, trên thanh menu chọn Utilities -> StatCal -> Nhấp chuột -> Hiện ra
cửa sổ StatCal.exe -> Chọn Sample size & power -> Chọn Population Survey -> OK



Khi cửa sổ StatCal được mở ra -> điền vào độ lớn của dân số mà từ đó mẫu được rút ra
(có thể chọn độ lớn của dân số là 999999 nếu độ lớn của dân số là vô hạn) -> Nhập giá trị
p -> Nhập giá trị lớn nhất (hay nhỏ nhất) có thể chấp nhận được (= p ± d) -> Bấm F4 để
tính


Có thể thay đổi các giá trị được nhập vào và tính lại (sử dụng phím F10). Sauk hi tính
xong, nhấn F10 để thoát

20
2.2 Chọn mẫu:
2.2.1 Chọn dân số nghiên cứu: Cần xác đònh dân số đích và dân số nghiên cứu
(dân số lấy mẫu) thích hợp để tránh sai lệch do chọn mẫu (selection bias).
Ví dụ: Thực hiện nghiên cứu cắt ngang với dân số nghiên cứu là bệnh nhân trong bệnh
viện sẽ không phản ánh chính xác được tỉ suất hiện mắc của bệnh (tỉ suất hiện mắc
thật sự có thể cao hơn hay thấp hơn)
2.2.2 Phương pháp chọn mẫu:
Do kết luận rút ra được từ mẫu khảo sát sẽ được dùng để suy luận cho dân số
(mà từ đó mẫu được lấy ra) nên mẫu được chọn cần phải đảm bảo tính đại diện, và vì
vậy cần phải được thực hiện theo các kỹ thuật thích hợp để tránh các sai lệch có thể
xảy ra.
Có 2 phương pháp chọn mẫu: chọn mẫu có xác suất (Probability sampling

method) và chọn mẫu không có xác suất (non-probability sampling method). Cách tốt
nhất để bảo đảm 1 mẫu sẽ cho ra các suy diễn chính xác và đáng tin cậy là dùng các
mẫu được chọn bằng phương pháp có xác suất.
Một mẫu (được chọn bằng phương pháp) có xác suất là 1 mẫu được rút ra từ
dân số theo cách mà tất cả các thành phần của dân số đều có 1 xác suất (đã biết
trước) được chọn vào mẫu.

Các phương pháp lấy mẫu có xác suất:


Chọn mẫu ngẫu nhiên đơn (simple random sampling)


Chọn mẫu ngẫu nhiên hệ thống (systematic random sampling)


Chọn mẫu phân tầng (stratified sampling)


Chọn mẫu cụm (cluster sampling)

2.2.2.1 Chọn mẫu ngẫu nhiên đơn (Simple random sampling - SRS)

Là phương pháp chọn mẫu mà mọi đơn vị lấy mẫu đều được chọn vào mẫu
nghiên cứu với xác suất bằng nhau và độc lập với việc chọn đơn vị lấy mẫu khác

Các bước cần thiết để chọn mẫu ngẫu nhiên đơn giản:
+ Lập danh sách chọn mẫu (khung chọn mẫu - sampling frame), trong đó các đối
tượng trong dân số đã được đánh số thứ tự.
+ Rút thăm các số nguyên ngẫu nhiên cho đủ cở mẫu bằng cách

- Dùng bảng số ngẫu nhiên sau khi đã xác đònh vò trí khởi đầu một cách ngẫu
nhiên trên bảng.
Hoặc - Dùng phím bấm số ngẫu nhiên trên các máy tính cầm tay
Hoặc - Dùng chương trình vi tính cho ra số lượng số ngẫu nhiên cần thiết.

21
Random Number Table
13962 70992 65172 28053 02190 83634 66012 70305 66761 88344
43905 46941 72300 11641 43548 30455 07686 31840 03261 89139
00504 48658 38051 59408 16508 82979 92002 63606 41078 86326
61274 57238 47267 35303 29066 02140 60867 39847 50968 96719
43753 21159 16239 50595 62509 61207 86816 29902 23395 72640
83503 51662 21636 68192 84294 38754 84755 34053 94582 29215
36807 71420 35804 44862 23577 79551 42003 58684 09271 68396
19110 55680 18792 41487 16614 83053 00812 16749 45347 88199
82615 86984 93290 87971 60022 35415 20852 02909 99476 45568
05621 26584 36493 63013 68181 57702 49510 75304 38724 15712
06936 37293 55875 71213 83025 46063 74665 12178 10741 58362
84981 60458 16194 92403 80951 80068 47076 23310 74899 87929
66354 88441 96191 04794 14714 64749 43097 83976 83281 72038
49602 94109 36460 62353 00721 66980 82554 90270 12312 56299
78430 72391 96973 70437 97803 78683 04670 70667 58912 21883
33331 51803 15934 75807 46561 80188 78984 29317 27971 16440
62843 84445 56652 91797 45284 25842 96246 73504 21631 81223
19528 15445 77764 33446 41204 70067 33354 70680 66664 75486
16737 01887 50934 43306 75190 86997 56561 79018 34273 25196
99389 06685 45945 62000 76228 60645 87750 46329 46544 95665


Ưu điểm của phương pháp chọn mẫu ngẫu nhiên đơn giản



Thực hiện đơn giản


Khuyết điểm


Có thể khơng có được danh sách các đơn vị lấy mẫu


Có thể tốn kém nhiều do mẫu nghiên cứu bị trải rộng


Có thể kém hiệu quả ở một số dân số nhất định
2.2 2.2. Chọn mẫu ngẫu nhiên hệ thống (Systematic randon sampling)

Là phương pháp chọn ngẫu nhiên một nhóm gồm nhiều đơn vị lấy mẫu cách nhau
một khoảng cách mẫu (k).

Các bước cần thiết để chọn mẫu ngẫu nhiên hệ thống:

+ Tính khoảng cách mẫu k = N/n
+ Chọn ngẫu nhiên một số i (số đầu tiên), 1 ≤ i ≤ k
+ Chọn một nhóm gồm các đơn vị lấy mẫu i, i+k, i+2k, v.v
2.2.2.3 Chọn mẫu Phân Tầng (Stratified sampling)

Là phương pháp chọn mẫu với nhều cá thể đại diện được chọn từ các tầng (strata)
riêng biệt của dân số.
 Sử dụng khi:



Các tầng có khác nhau về biến số quan tâm


Bản thân sự khác biệt này là mục tiêu của nghiên cứu

22


Yếu tố phân tầng thường là tuổi, phái tính, độ nặng của bệnh, tình trạng hút thuốc -
không hút thuốc v.v… Việc chọn mẫu phân tầng thường theo tỉ lệ tương xứng
(proportional stratified sampling) nhưng đôi khi có thể không tương xứng
(disproportional stratified sampling).


Ưu điểm của phương pháp chọn mẫu tầng


Mẫu đại diện hơn, chính xác hơn


Khuyết điểm


Trên thực tế đơi khi khơng tìm được tính chất để phân tầng


Về mặt kinh tế, cũng gây tốn kém tương đương với cách chọn mẫu ngẫu nhiên đơn
2.2.2.4 Chọn mẫu cụm (Cluster sampling)

L
à phương pháp chọn mẫu mà trong đó một hoặc nhiều đợn vị lấy mẫu (listing
units) được phối hợp sử dụng, nói cách khác đây là phương pháp chọn mẫu mà khung
chọn mẫu bao gồm nhiều cụm
, mỗi cụm gồm nhiều đối tượng trong một địa phương (hay
địa điểm) nhất định. Khác với
tầng
(bao gồm những đơn vị lấy mẫu thuần nhất về 1 tính
chất), cấu trúc của 1
cụm
càng phải nên đa dạng về tính chất.

Sử dụng khi:


Khơng thể có danh sách tất cả các đối tượng trong dân số


Muốn giảm chi phí tiếp cận đối tượng





23

Một số đặc tính quan trọng của chọn mẫu cụm

1) Tiến trình chọn mẫu theo từng bậc
(stepwise). Ví dụ nếu khu phố là cụm và hộ

gia đình là đơn vị lấy mẫu thì sẽ có 2 bước để chọn hộ gia đình: bước đầu tiên: chọn khu
phố, bước thứ 2: chọn hộ gia đình. Hai bước này được gọi là hai giai đoạn (stages). Vì
vậy trong cách chọn mẫu cụm sẽ có một số giai đoạn (stages) được thực hiện. Nếu trong
thiết kế chọn mẫu chúng ta thực hiện nhiều giai đoạn thì các đơn vị lấy mẫu ở giai đoạn
đầu tiên là đơn vị lấy mẫu nguyên phát (primary sampling units – PSUs)

2) Cụm có thể được chọn bằng nhiều kỹ thuật chọn mẫu khác nhau
. Chẳng hạn ta
có thể chọn cụm bằng cách chọn mẫu ngẫu nhiên đơn giản hay bằng cách chọn mẫu hệ
thống.
+ Nếu chọn cụm bằng phương pháp chọn mẫu ngẫu nhiên đơn giản => chọn mẫu cụm
đơn giản
- Nếu ta chỉ thực hiện 1 giai đoạn (Chọn ra một số cụm từ các cụm có sẵn, khảo sát
hết tất cả các cá thể trong 1 cụm) => Cụm 1 bậc đơn giản
- Nếu cụm được chọn ở giai đoạn 1 bằng phương pháp chọn mẫu ngẫu nhiên đơn giản
và ở giai đoạn 2 ta lại chọn ra một số đơn vị chọn mẫu từ các cụm có sẵn => Cụm 2 bậc
đơn giản. Trong trường hợp này, tỉ lệ của các đơn vị lấy mẫu được chọn ra ở giai đoạn 2
– từ các cụm đã được chọn ở giai đoạn 1 – là giống nhau. Phương pháp này được thực
hiện trên giả định là các cụm có số lượng đơn vị lấy mẫu bằng nhau.
+ Nếu chọn cụm không phải bằng phương pháp ngẫu nhiên đơn giản => chọn mẫu với
xác suất tỉ lệ với độ lớn của cụm (sampling with probability proportional to size)

3) Trong tiến trình chọn mẫu cụm, có thể sử dụng nhiều khung chọn mẫu khác
nhau
4) Sau khi thực hiện giai đoạn 1, khung chọn mẫu mới được tập hợp lại từ các
cụm được chọn


Ưu điểm của phương pháp chọn mẫu cụm
-

Khả thi, kinh tế hơn vì chỉ cần chuẩn bị danh sách chi tiết trong các cụm được chọn


Khuyết điểm
-
Các số ước lượng có thể không chính xác bằng chọn mẫu SRS, chọn mẫu tầng nếu
khảo sát trên cùng cở mẫu => Để tăng độ chính xác -> tăng cở mẫu
2.2.2.5 Choïn maãu nhiều bậc (nhiều giai đoạn) (Multi-stage sampling)
Chọn mẫu nhiều bậc (nhiều giai đoạn) là sự kết hợp nhiều phương pháp lấy mẫu.
Mỗi một phương pháp chọn mẫu được áp dụng là 1 bậc (giai đoạn)
Trên thực tế phương pháp thường được áp dụng nhất: chọn mẫu cụm nhiều bậc.
Phương pháp chọn mẫu cụm 2 bậc đơn giản được thực hiện trên giả định là các cụm có
số lượng đơn vị lấy mẫu bằng nhau. Tuy nhiên trên thực tế, các cụm hầu như không có
cùng độ lớn , vì vậy người ta sử dụng chọn mẫu với xác suất tỉ lệ với độ lớn của cụm
(sampling with probability proportional to size) – phương pháp chọn mẫu PPS
 Chọn mẫu PPS (probability proportionate to size) – chọn mẫu có xác suất tỉ lệ
với độ lớn của cụm
Bậc 1: Chọn ra n cụm từ tổng số N cụm bằng phương pháp chọn mẫu hệ thống:
+ Tính khoảng cách mẫu k = N/n
+ Chọn ngẫu nhiên một số i (số đầu tiên), 1 ≤ i ≤ k
+ Chọn một nhóm gồm các đơn vị lấy mẫu i, i+k, i+2k, v.v
Trong chương trình tiêm chủng mở rộng của TCYTTG, số cụm cần chọn là 30, do đó
khoảng cách mẫu là N/30

24
Bậc 2: Trong n cụm được đã chọn, chọn ra số đối tượng cần thiết (= cở mẫu / n cụm)
bằng phương pháp mẫu chọn ngẫu nhiên đơn giản hay chọn mẫu hệ thống
Trong chương trình EPI của TCYTTG, để chọn ra 7 nhà trong 1 cụm người ta chọn ra
nhà đầu tiên một cách ngẫu nhiên rồi sau đi các nhà tiếp theo - theo ngun tắc nhà liền
nhà





2.3 Thu thập số liệu: Thu thập đồng thời số liệu về tình trạng bệnh và tình trạng
tiếp xúc bằng các kỹ thuật và phương pháp đo lường thích hợp.
III. CÁC VẤN ĐỀ TRONG PHÂN TÍCH VÀ DIỄN GIẢI KẾT QUẢ CỦA
NGHIÊN CỨU CẮT NGANG
3.1 Phân tích kết quả:
Trong đa số trường hợp, nghiên cứu cắt ngang được sử dụng như một nghiên cứu
mô tả. Do đó, số liệu được phân tích bằng thống kê mô tả và được trình bày dưới dạng
các bảng, biểu. Tuy nhiên, trong một số trường hợp, nghiên cứu cắt ngang còn được
dùng để phân tích mối liên quan giữa bệnh và việc tiếp xúc với một yếu tố nguy cơ
nào đó. Trong trường hợp này, cần lập bảng chéo (cross tabulation) – phân nhóm
nghiên cứu theo các yếu tố nguy cơ cần khảo sát, và so sánh tỉ suất hiện mắc
(prevalence rates) trong từng nhóm.

25

Bệnh

Có Không

Tổng số

a b a + b

Tiếp xúc
Không
c d c + d


Tổng số
a + c b + d a + b + c + d
Prevalence của bệnh trong nhóm tiếp xúc = a/(a+b)
Prevalence của bệnh trong nhóm không tiếp xúc = c/(c+d)
Có thể dùng phép kiểm thống kê (chi bình phương) để xác đònh mối liên hệ. Độ mạnh
của sự phối hợp sẽ được tính bằng Prevalence Rate Ratio (PRR)
*

a/(a+b)
Prevalence Rate Ratio (PRR) =
c/(c+d)
3.2 Các sai số hệ thống (bias) thường gặp trong nghiên cứu cắt ngang
a- Volunteer bias (sai lệch do mẫu được chọn từ những người tình nguyện): có thể xảy
ra khi đối tượng tình nguyện tham gia vào nghiên cứu có những đặc điểm khác với
những người không tình nguyện tham gia nghiên cứu VD: tuổi, giới, dân tộc, trình
độ học vấn v.v… Hơn nữa, những người tình nguyện tham gia nghiên cứu thường là
những người khoẻ mạnh.
b- Survivor bias (sai lệch từ những trường hợp sống sót chọn lọc): Khi thực hiện
nghiên cứu cắt ngang, chúng ta chỉ có thể thu thập thông tin từ những người còn
sống. Nếu những người tiếp xúc với yếu tố nguy cơ đều đã chết trước khi nghiên
cứu bắt đầu thì có thể chúng ta chỉ thu thập được thông tin từ những người không
tiếp xúc với yếu tố nguy cơ và như vậy có thể sẽ cho kết luận sai lệch.
c- Non-response/participation bias (sai lệch do nhiều người không đáp ứng/không tham
gia vào nghiên cứu): Tỉ lệ người đáp ứng/tham gia vào nghiên cứu cần phải được
xem xét kỹ lưỡng trong nghiên cứu cắt ngang. Kết luận sai lệch có thể xảy ra nếu
những người không thể tham gia vào nghiên cứu có nhiều đặc điểm khác xa với
những người có thể tham gia vào nghiên cứu. VD: trong nghiên cứu về thói quen
uống rượu, những người thường xuyên uống rượu thường ít khi có mặt để trả lời câu
hỏi phỏng vấn v.v… Nếu tỉ lệ đáp ứng <70% thì cần phải xem xét lại giá trò của

nghiên cứu
IV. CÁC ƯU ĐIỂM VÀ HẠN CHẾ CỦA NGHIÊN CỨU CẮT NGANG
4.1 Ưu điểm:
- Cho kết quả nhanh, ít tốn kém, dễ thực hiện
- Cung cấp thông tin về tỉ suất hiện mắc bệnh (hay vấn đề sức khoẻ nào đó) =>
cung cấp tốt thông tin cho việc đánh giá tình hình sức khoẻ, bệnh tật.
- Là bước đầu tiên của nghiên cứu đoàn hệ
- Có thể chứng minh mối liên hệ của bệnh và nhiều yếu tố nguy cơ

*
Prevalence Odds Ratio (POR) cũng có thể được sử dụng trong nghiên cứu cắt ngang để tính độ mạnh
của sự phối hợp

26
4.2 Hạn chế:
- Đôi khi không thể kết luận được mối liên hệ nhân quả từ các số liệu thu thập được
trong nghiên cứu cắt ngang vì tình trạng tiếp xúc với yếu tố nguy cơ và bệnh được
đánh giá cùng một lúc.
Ví dụ: Trong 1 nghiên cứu cắt ngang cho thấy những người bò ung thư thì có mức
β
-
caroten (tiền vitamin A) trong máu thấp hơn người bình thường cùng tuổi, cùng giới
tính. Tuy nhiên, người ta không thể xác đònh được trong nghiên cứu này là do mức
β
-
caroten trong máu thấp đưa đến ung thư hay là mức
β
-caroten trong máu thấp thực sự
là kết quả của bệnh do những thay đổi trong chế độ ăn uống hay do những ảnh hưởng
của K gây ra tình trạng suy nhược chung.

- Do nghiên cứu cắt ngang chỉ thu thập thông tin về tình trạng bệnh và tiếp xúc với
yếu tố nguy cơ tại một thời điểm/ thời khoảng nhất đònh nên có thể đưa đến những
thông tin sai lệch.
Ví dụ: Các bác só lâm sàng thường tin rằng huyết áp tâm trương ở người già không tăng
do chỉ dựa trên những nghiên cứu cắt ngang trong đó thể hiện rằng số huyết áp tâm
trương trung bình ở mọi lứa tuổi chỉ xấp xỉ 80mmHg. Tuy nhiên, trong một nghiên cứu
đoàn hệ (nghiên cứu Framingham), người ta thấy rằng những bệnh nhân được theo dõi
sau nhiều năm có huyết áp tâm trương tăng khi về già.
- Khi nghiên cứu những bệnh hiếm, thực hiện nghiên cứu cắt ngang là không thực
tế.


TÀI LIỆU THAM KHẢO

1. David C., Ian G., Richard H. Epidemiology. Sidney, University of New South
Wales Press Ltd., 1994: 53 – 63.
2. Friedman G.D. Primer of epidemiology. Singapore, McGraw-Hill Book Co., 1994:
96 – 109.
3. Hulley S.B., Cummings S.R. Designing clinical research. Baltimore, Williams &
Wilkins, 1988: 75 – 78.
4. Jennifer L.K., Thompson W.D., Alfred S.E. Methods in observational
epidemiology. New York, Oxford University Press, 1986: 187 – 191.
5. Last J.M., Abramson J.H., Friedman G.D., Porta M., Spasoff R.A., Thuriaux M. A
dictionary of epidemiology. New York, Oxford University Press, 1995.
6. Lemeshow S. Hosmer D.W., Klar J., Lwanga S.K. Adequacy of sample size in
health studies. England, John Wiley & Sons Ltd., 1990.
7. Levy P.S., Lemeshow S. Sampling for health professionals. California, Lifetime
Learning Publications, 1980.
8. Stephen H.G. Interpreting the medical literature. Singapore, McGraw-Hill Book
Co., 1993: 55 – 66.



27
BÀI TẬP SỬ DỤNG STATA TRONG NGHIÊN CỨU CẮT NGANG

Tính với file số liệu
1) Sử dụng file “cc study“
Trong STATA, nếu nghiên cứu mà chúng ta đang phân tích là 1 survey trong đó có sử
dụng nhiều phương pháp chọn mẫu (cụm, tầng, nhiều bậc…) thì khi phân tích chúng ta
cần sử dụng lệnh “svy” – là lệnh dành riêng để phân tích survey.
Muốn sử dụng các lệnh “svy”, trước tiên cần “khai báo” về thiết kế chọn mẫu, biến số
nào là “tầng”, biến nào là “cụm” trong bộ dữ liệu => Sử dụng lệnh “svyset”
- Tìm lệnh để sử dụng trong STATA
Statistics -> Survey data analysis -> Setup and utilities -> Declare survey design for
dataset


Ví d
ụ: Trong điều tra cắt ngang thực hiện năm 2004 nhằm khảo sát tình trạng thừa cân-
béo phì ở trẻ vị thành niên nội thành TPHCM, các nhà nghiên cứu đã chọn mẫu từ 2
“tầng” (nội thành “giàu” và nội thành “nghèo”) trong mỗi “tầng” chọn ra một số “cụm”
(trường) (bậc 1), sau đó, trong các trường được chọn lại chọn ra một số lớp thuộc khối
(grade) 6-7 và một số lớp thuộc khối 8-9 (bậc 2). Với các lớp được chọn, khảo sát toàn
bộ học sinh trong lớp.
Lệnh “svyset” được thực hiện như sau:

svyset school [pw=pw], strata(strata) fpc(Nschool) || grade,
fpc(Nclass)

28


Sau khi khai báo rồi thì từ đây, muốn tính trung bình, hay tỉ lệ của vấn đề cần khảo sát
lệnh sử dụng luôn luôn có “svy”
- Lệnh sử dụng để tính trung bình BMI:
Statistics -> Survey data analysis -> Means, proportions, ratio, totals -> Means -> Cửa
sổ svy: mean sẽ hiện ra -> nhập biến số cần tính mean vào (Ví dụ biến số BMI)
. svy linearized : mean BMI
(running mean on estimation sample)
Survey: Mean estimation

Number of strata = 2 Number of obs = 2684
Number of PSUs = 31 Population size = 2670.2
Design df = 29


| Linearized
| Mean Std. Err. [95% Conf. Interval]
+
BMI | 18.62681 .1246661 18.37184 18.88178

Kết quả này cho chúng ta thấy số liệu được phân tích trên 2684 cá thể được chọn từ 2
tầng, 31 cụm và trung bình BMI là 18,6 (18,4, 18,9).
Kết quả này tương tự như kết quả ta phân tích không sử dụng lệnh “svy” nhưng khoảng
tin cậy khi sử dụng lệnh “svy” hẹp hơn
. mean BMI
Mean estimation Number of obs = 2684



| Mean Std. Err. [95% Conf. Interval]

+
BMI | 18.80199 .0630647 18.67833 18.92565


29

- Lệnh sử dụng để tính tỉ lệ:
Statistics -> Survey data analysis -> Means, proportions, ratio, totals -> Proportions ->
Cửa sổ svy: proportion sẽ hiện ra -> nhập biến số cần tính proportion vào (Ví dụ biến số
BMIc)

- Ngoài ra, ta cũng có thể lập bảng 1 chiều, 2 chiều với lệnh svy
Statistics -> Survey data analysis -> Tables -> One-way tables (hoặc Two-way tables) ->
Cửa sổ svy: tabulate sẽ hiện ra -> nhập biến số cần xử lý vào

30

31
- Muốn tính design-effect (DEFT) từ số liệu của nghiên cứu có áp dụng phương pháp
chọn mẫu cụm (để sử dụng cho việc tính cở mẫu của nghiên cứu sắp tới) sử dụng lệnh
như sau:
Statistics -> Survey data analysis -> DEFF, MEFF and other statistics -> Cửa sổ estat
sẽ hiện ra -> Chọn DEFF, MEFF for point estimates (effect) -> Chọn report DEFT
Lưu ý: Trước khi sử dụng lệnh này cần phải chạy lệnh tính trung bình hay tỉ lệ của 1 biến
số nào đó, rồi mới dùng lệnh này để ước tính design effect
. estat effects, deft

| Linearized
| Mean Std. Err. DEFT
+

BMI | 18.62681 .1246661 2.01635


. estat effects, deft
_prop_1: BMIc = Normal wt

| Linearized
| Proportion Std. Err. DEFT
+
BMIc |
_prop_1 | .8626844 .0091192 1.37239
Overweight | .1169325 .0080314 1.2946
Obese | .0203831 .0025456 .93312

- Trong nghiên cứu cắt ngang, ta cũng có thể xác định mối liên quan giữa 2 biến số bằng
phép kiểm chi bình phương hoặc Fisher exact test.
Statistics -> Summaries, tables and tests -> Tables -> Two-way tables with measures of
association -> Cửa tabulate2 sẽ hiện ra -> nhập biến số cần xử lý vào -> Chọn phép
kiểm cần sử dụng

×