Tải bản đầy đủ (.doc) (88 trang)

Các khái niệm lấy cỡ mẫu cơ bản

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (369.75 KB, 88 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>Các Khái niệm lấy mẫu cơ bản</b>

Trong chương nầy chúng tơi trình bày ngắn gọc các chiến lược lấy mẫu cơ bản từ một quần thể là một cộng đồng người. Độc goiả quan tâm sâu hơn về các lý thuyết, cứ liệu thống kê về lấy mẫu có thể tìm đọc các sàch về lý thuyết lấy mẫu.

<b> Phương pháp lầy mẫu ngẫu nhiên đơn:</b>

Hình 1:

Trong một nghiên cứu muốn xác định tỷ lệ một đặc trưng Y trong một dân số, hay một số trung bình cuả một đặc trưng Z trong dân số. Theo qui ước chung tỷ lệ trên quần thể được ký hiệu là P và số trung bình trên quần thể được ký hiệu là , và phương sai trên quần thể được ký hiệu la 2. Do nhiều lý do, nhà nghiên cứu không khảo sát trên quần thể, mà chỉ khảo sát trên 1 mẫu với kích thước n để ước lượng tỷ lệ ( p), số trung bình x, phuơng sai s2 nhằm ước lượng tỷ lệ P, số trung bình  và phương sai 2 trên quần thể. Nếu mẫu được lấy ngẫu nhiên từ quần thể thì các trị số ước lượng nầy sẽ khơng có sai lệch hệ thống các trị số trên quần thể.

Trong chiến lược lấy mẫu xác suất có 4 phương pháp lấy mẫu cơ bản là ngẫu nhiên đơn, ngẫu nhiên hệ thống, phân tầng và lấy mẫu cụm.

1. Lầy mẫu ngẫn nhiên đơn ( Simple random sampling)

Chúng ta biết số mẫu kích thước n có thể được lấy ra từ một quần thể có kích thước N, được xác địng bằng cơng thức N c n = N!/ n!(N-n)!. Thí dụ nếu N= 25, n = 5 thì số mẫu có thể được lấy ra là 25C5 = 53.130 mẫu.

Do đó nếu p, x, 2

<b>TRƯỜNG HỢP MỘT MẪU</b>

<b>Ước lượng một tỷ lệ trong quần thể với một độ chính xác tuyệt đối</b>

<small>Ký hiệu và các</small>

<small>thơng tin cần có</small> (a) Tỷ lệ ước tính trong quần thể P (b) Độ tin cậy 100 (1 - )% (c) Độ chính xác tuyệt đối mong muốn tính theo một biên (trong hai biên)

của tỷ lệ (tính theo đơn vị phần trăm) d

Để tính được cỡ mẫu thường phải ước lượng trước trị số trong quần thể. Nếu khơng thể ước lượng được P, thì lấy trị số P = 0,5 (xem thí dụ 2) để tính. Đó là trị số an tồn nhất để tính cỡ mẫu trong ước lượng một tỷ lệ trong quần thể bởi vì khi đó cỡ mẫu sẽ lớn nhất. Nếu tỷ lệ ước tính trong quần thể được biết là một biên độ thì giá trị của biên nào gần nhất với 0, 5 được dùng để tính cỡ mẫu.

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

Trong điều tra trên thực địa thì phương pháp lấy mẫu theo kiểu ngẫu nhiên đơn hầu như ít khi được dùng. Nếu dùng kiểu khác để lấy mẫu thì do ảnh hưởng của thiết kế (design effect) nên chắc chắn cần một cỡ mẫu lớn hơn. Thí dụ, với phương pháp chọn mẫu theo cụm thì ảnh hưởng của thiết kế được ước lượng bằng 2. Điều này có nghĩa là, để có độ chính xác như trong phương pháp chọn mẫu theo kiểu ngẫu nhiên đơn thì cỡ mẫu phải tăng lên gấp 2 lần. Xem thí dụ 2, trong trường hợp này cỡ mẫu sẽ là 192 (96x2).

Phòng y tế địa phương muốn ước lượng tỷ lệ toàn bộ bệnh lao ở trẻ em dưới 5 tuổi tại địa phương họ. Cỡ mẫu là bao nhiêu để tỷ lệ bệnh toàn bộ ước lượng lao động trong khoảng 5% về mỗi bên (trong hai biên) của trị số thật với độ tin cậy 95%, nếu phịng y tế dự đốn rằng tỷ lệ bệnh thật không vượt quá 20%.

(a) Tỷ lệ bệnh ước tính trong quần thể P = 20% (b) Độ tin cậy 95% (c) Độ chính xác tuyệt đối (15-25%) d = 5% Bảng 1a (trang ??? ) cho thấy với P = 0,20 và d = 0,05 thì cỡ mẫu là 246 trẻ dưới 5 tuổi.

Trong thực tế, để khảo sát đủ 246 trẻ đòi hỏi đủ kinh phí và thời gian. Do vậy, nhà nghiên cứu có thể giảm cỡ mẫu xuống bằng cách giảm độ tin cậy xuống.

Thí dụ, độ tin cậy giảm xuống 90% thì cỡ mẫu sẽ giảm xuống cịn 173 trẻ em dưới 5 tuổi (Bảng 1b, trang ??? ).

Một nhà nghiên cứu làm việc cho chương trình tiêm chủng quốc gia muốn xác định tỷ lệ trẻ em được chủng ngừa theo lịch tại địa phương. Cỡ mẫu là bao nhiêu nếu tỷ lệ trẻ em được chủng ngừa dao động trong phạm vi 10% về mỗi biên (trong hai biên) của tỷ lệ tiêm chủng thực sự, ở độ tin cậy 95% (Nhà nghiên cứu không thể giả định được trước tỷ lệ tiêm chủng).

(a) Tỷ lệ dự tính trước trong quần thể

(do P khơng biết nên chọn trị số an tồn nhất) 50% (b) Độ tin cậy 95% (c) Độ chính xác tuyệt đối (40-60%) 10%

Bảng 1a (trang ??? ) cho thấy với P = 0,5 d = 0,10 thì cỡ mẫu là 96 trẻ em.

<b>Cỡ mẫu để ước lượng một tỷ lệ trong quần thể với độ chính xác tương</b>

2

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<small>Ký hiệu và cácthơng tin cần có</small>

<small>Thí dụ 3</small>

<b><small>Bài giải</small></b>

<small>Thí dụ 4.</small>

<b><small>Bài giải</small></b>

(a) Tỷ lệ ước tính trong quần thể P (b) Độ tin cậy 100 (1 - )% (c) Độ chính xác tương đối 

Việc chọn lựa giá trị của P để tính cỡ mẫu nên chọn trị số P nhỏ vì P càng nhỏ thì cỡ mẫu tối thiểu càng lớn.

Bảng 2a và 2b (trang ??? ) cho biết cỡ mẫu tối thiểu ứng với độ tin cậy 95% và 90%.

Một nhà nghiên cứu làm việc cho chương trình tiêm chủng quốc gia muốn xác định tỷ lệ trẻ em được chủng ngừa theo lịch tại địa phương. Cỡ mẫu là bao nhiêu nếu ước lượng kết quả dao động về mỗi biên (trong hai biên) của trị số thực một giá trị bằng 10% của tỷ lệ tiêm chủng thực (khác với 10% về mỗi biên (trong hai biên) của trị số thực) ở độ tin cậy 95% (tỷ lệ tiêm chủng không dưới 50%).

(a) Tỷ lệ trong quần thể ước tính 50% (chọn giá trị P nhỏ vì P dự tính  50%)

(b) Độ tin cậy 95% (c) Độ chính xác tương đối (45-55%) 10% (của 50%)

Bảng 2a (trang ??? ) cho biết với P = 0,50 và  = 0,10 thì cỡ mẫu là 384. Trong thực tế, do thiếu thời gian và kinh phí nên khơng thể điều tra đủ 384 trẻ. Khi đó người điều tra có thể làm giảm cỡ mẫu bằng cách giảm độ tin cậy xuống 90%. Bảng 2b (trang ??? ) cho thấy trường hợp này cỡ mẫu giảm xuống còn 271.

Trong điều tra trên thực địa, phương pháp chọn mẫu ngẫu nhiên đơn hầu như ít được dùng. Nếu dùng phương pháp khác để lấy mẫu thì do ảnh hưởng của thiết kế nên cần tăng cỡ mẫu lên. Thí dụ, với phương pháp chọn mẫu theo cụm thì ảnh hưởng thiết kế được ước lượng bằng 2. Điều này có nghĩa là để đạt được cùng độ chính xác như phương pháp chọn ngẫu nhiên đơn thì cỡ mẫu phải tăng lên gấp 2 lần so với phương pháp chọn mẫu ngẫu nhiên đơn. Do đó, trong thí dụ này với độ tin cậy là 95% thì cỡ mẫu sẽ là 768.

Cỡ mẫu tối thiểu là bao nhiêu để ước lượng tỷ lệ phụ nữ mang thai trong quần thể đi khám thai trong 3 tháng đầu của thai kỳ, trong phạm vi 5% của tỷ lệthật với độ tin cậy là 95%? Người ta dự tính tỷ lệ khám thai trong giai đoạn này khoảng từ 25% - 40%.

(a) Tỷ lệ trong quần thể ước tính 25 -40%

3

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

(b) Độ tin cậy 95%

(c) Độ chính xác tương đối 5% (của 25 -40%) Bảng 2a (trang ???) cho biết các cỡ mẫu ứng với  = 0,05 và các tỷ lệ dự tính trong quần thể trong khoảng từ 25 - 40% như sau:

Do đó, để đạt được mục tiêu nghiên cứu cần khảo sát 4610 phụ nữ mang thai. Nếu cần, với P = 0,25 cũng có thể chọn cỡ mẫu nhỏ hơn nhưng điều đó có nghĩa là hoặc làm giảm độ chính xác, hoặc làm giảm độ tin cậy hoặc làm giảm cả hai. <b>Kiểm định giả thuyết về một tỷ lệ trong quần thể.</b> Phần này áp dụng cho các nghiên cứu được thiết kế để kiểm định giả thuyết về tỷ lệ các thành viên trong một quần thể cùng mang một đặc trưng nào đấy có bằng với một trị số nhất định hay khơng. <small>Ký hiệu và cácthơng tin cần cóThí dụ 5</small> (a) Tỷ lệ trong quần thể theo giả thuyết "không" (Ho) cần kiểm định Po (b) Tỷ lệ ước tính trước trong quần thể Pa (c) Mức ý nghĩa 100% (d) Lực của test 100(1 - )% (e) Giả thuyết có (H<small>A</small>) hoặc Pa>Po hoặc Pa<Po (kiểm định một phía) hoặc Pa  Po (kiểm định 2 phiá)

Bảng 3a-d (trang ??? ) cho biết cỡ mẫu tối thiểu ứng với m ý nghĩa 5%, lực của test là 90% và 80%, kiểm định một phiá và 2 phiá. Đối với bảng 3c và 3d, các giá trị bổ sung của Po ở hàng cột nên dùng đến khi nào trị số của Pa>0,5.

Theo y văn, tỷ lệ chữa khỏi một thể bệnh ung thư nào đấy trong 5 năm là 50% (tỷ lệ bệnh nhân không tái phát ung thư trong 5 năm sau khi điều trị). Một nhà nghiên cứu muốn kiểm định giả thuyết là tỷ lệ chữa khỏi thể bệnh ung thư này tại y tế tuyến huyện cũng là 50%. Vì vậy, cỡ mẫu tối thiểu là bao nhiêu để nhà nghiên cứu loại bỏ giả thuyết không (Ho): Tỷ lệ chữa khỏi tại y tế tuyến huyện là dưới 50% với ước muốn chắc chắn đến 9% phát hiện ra tỷ lệ chữa khỏi sthật sự tại tuyến huyện là 40% ở mức ý nghĩa 5%.

4

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

(a) Tỷ lệ chữa khỏi cần kiểm định 50%

(b) Tỷ lệ chữa khỏi dự tính trước 40% Kết quả các cuộc điều tra trước đây cho thấy tỷ lệ toàn bộ bệnh sâu răng trong học sinh tại một cộng đồng vào khoảng 25%. Khi thiết kế một cuộc điều tra mới, thì cỡ mẫu là bao nhiêu để kiểm định giả thuyết là tỷ lệ toàn bộ bệnh sâu răng đã giảm, nếu người điều tra muốn chắc chắn 90% phát hiện được tỷ lệ sâu răng thực sự là 20% ở mức ý nghĩa 5%. (a) Tỷ lệ chữa khỏi cần kiểm định 25%

(b) Tỷ lệ chữa khỏi dự tính trước 20%

(c) Mức y nghĩa 5%

(d) Lực của test 90%

(e) Giả thuyết có (kiểm định một phia)ù tỷ lệ sâu răng < 25% Bảng 3a (trang ??? ) cho thấy với Po = 0,25, Pa = 0,20 thì cỡ mẫu tối thiểu là 601. Khi người điều tra dùng cỡ mẫu này cho nghiên cứu của họ và nếu tìm thấy tỷ lệ sâu răng thực sự thấp hớn 20% thì lực của test sẽ lớn hơn 90%, có nghĩa là các nghiên cứu chắc chăn trên 90% phát hiện được tỷ lệ này. Theo y văn, tỷ lệ thành công của phương pháp điều trị ngoại khoa đối với một loại bệnh tim là 70%. Một phương pháp điều trị nội khoa được đề nghị trị liệu cho bệnh này được tin là cũng có tỷ lệ thành công như ngoại khoa. Tại một bệnh viện không có đủ phương tiện và nhân viên y tế để tiến hành phẫu thuật đã quyết định dùng phương pháp điều trị nội khoa cho tất cả các bệnh nhân của họ mắc loại bệnh này. Cỡ mẫu là bao nhiêu để kiểm định giả thuyết là tỷ lệ thành công của phương pháp điều trị nội khoa cũng là 70% tương ứng với giả thuyết có là khơng phải 70% ở mức ý nghĩa 5%? Các nhà nghiên cứu muốn rằng test có sức mạnh đến 90% phát hiện ra sự khác biệt giữa tỷ lệ thành công của 2 phương pháp là từ 10% trở lên về mỗi biên. (a) Tỷ lệ thành công cần kiểm định 70%

(b) Tỷ lệ thành công dự tính trước 80% hay 60% (c) Mức y nghĩa 5%

(d) Lực của test 90%

5

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<small>Thí dụ 8</small>

<b><small>Bài giải</small></b>

(e) Giả thuyết có (kiểm định 2 phia)ù tỷ lệ thành công  70%

Bảng 3a (trang ??? ) cho thấy với (1 - Po) = 0,30 và |Pa - Po| = 0,10 thì cỡ mẫu tối thiểu là 233.

Tại một tỉnh, theo Sở y tế tỷ lệ phụ nữ có thai được khám thai trong 3 tháng đầu của thai kỳ vào khoảng 40%. Ban Giám đốc Sở y tế một tỉnh khác muốn so sánh tỷ lệ khám thai của tỉnh họ với tỉnh kia. Cỡ mẫu là bao nhiêu để kiểm định giả thuyết có là tỷ lệ khám thai ở tỉnh thứ hai khơng bằng 40%? Nhóm nghiên cứu muốn chắc chắn đến 90% phát hiện ra sự khác biệt về tỷ lệ khám thai giữa 2 tỉnh này là - 5% hoặc lớn hơn ở mức ý nghĩa là 5%.

(a) Tỷ lệ khám thai cần kiểm định 40% (b) Tỷ lệ khám thai dự tính trước 35% hoặc 45%

<b>TRƯỜNG HỢP HAI MẪU</b>

<b>Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chínhxác tuyệt đối</b>

6

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<small>Ký hiệu và các</small>

<small>thông tin cần có</small> (a) Hai tỷ lệ trong quần thể ước tính P<small>1</small> và P<small>2</small>

(b) Độ tin cậy 100 (1 - )% (c) Độ chính xác tuyệt đối về mỗi biên của hiệu số thực giữa 2 tỷ lệ trong

quần thể (tính theo đơn vị phần trăm) d (d) Trị số trung gian V = P<small>1 </small>(1- P<small>1</small>) + P<small>2</small>(1- P<small>2</small>)

<small>Thí dụ 9</small>

<b><small>Bài giải</small></b>

<small>Thí dụ 10</small>

Đối với bất kỳ trị số d nào, cỡ mẫu cũng sẽ lớn nhất khi P<small>1</small> và P<small>2</small> đều bằng 50% do đó nếu khơng ước tính được tỷ lệ trong quần thể thì giải pháp an tồn nhất là chọn cả 2 tỷ lệ đều bằng 0,5.

Trị số V có thể tìm thấy sẵn ở bảng 4a (trang ??? ) từ điểm giao giữa cột ứng với P<small>2</small> (hoặc trị số bổ sung của P<small>2</small> và dòng ứng với P<small>1</small> (hoặc các trị số bổ sung của P<small>1</small>).

Bảng 4b và 4c (trang ??? - ???) cho biết cỡ mẫu tối thiểu ở độ tin cậy 95% và 90%.

Cỡ mẫu là bao nhiêu cho mỗi nhóm để ước lươạng sự khác biệt nguy cơ trong phạm vi 5% về mỗi biên ở độ tin cậy 95% khi không có cơ sở nào ước tính được trị số P<small>1</small> và P<small>2</small>.

(a) Các tỷ lệ trong quần thể ước tính:

(chọn giải pháp an toàn) 50%, 50% (b) Độ tin cậy 95% (c) Độ chính xác tuyệt đối 5% (d) Trị số trung gian 0,50

Bảng 4b (trang ??? ) cho thấy với d = 0,50 và V = 0,50 thì cỡ mẫu tối thiểu của mỗi nhóm sẽ là 769.

Trong một nghiên cứu thăm dị trên 50 nông dân làm công tác thuỷ lợi cho thấy có 40% mắc bệnh sán máng tiến triển. Một nghiên cứu thăm dị khác cũng trên 50 nơng dân nhưng không làm thuỷ lợi cho thấy tỷ lệ này là 32%. Nếu nhà dịch tễ muốn thực hiện một nghiên cứu có qui mơ lớn hơn để ước lượng sự khác biệt nguy cơ mắc bệnh sán máng trong phạm vi 5% về mỗi biên của hiệu số giữa hai tỷ lệ mắc bệnh thật ở độ tin cậy 95% thì cỡ mẫu cho mỗi nhóm là bao nhiêu?

<b><small>Bài giải</small></b> (a) Các tỷ lệ trong quần thể ước tính 40%, 32% (b) Độ tin cậy 95%

(c) Độ chính xác tuyệt đối 5% (d) Trị số trung gian 0,46

Bảng 4b (trang ??? ) cho thấy với d = 0,50 và V = 0,46 thì cỡ mẫu tối thiểu của mỗi nhóm sẽ là 707.

7

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<b>Kiểm định giả thuyết về 2 tỷ lệ trong quần thể</b>

Phần này áp dụng cho các nghiên cứu được thiết kế để kiểm định giả thuyết là 2 tỷ lệ trong quần thể thì bằng nhau. Đối với các nghiên cứu mà các tỷ lệ trong quần thể rất bé, xin xem thí dụ 13.

<small>Ký hiệu và các</small>

<small>thơng tin cần có</small> (a) Trị số của sự khác biệt giữa 2 tỷ lệ trong quần thể (theo giả thuyết không) cần kiểm định P<small>1</small> - P<small>2</small> = 0 (b) Các tỷ lệ trong quần thể ước tính P<small>1</small> và P<small>2</small>

(c) Mức ý nghĩa 100 % (d) Lực của test 100 (1 - )% (e) Giả thuyết có hoặc P<small>1</small> - P<small>2</small>>0 hoặc P<small>1</small> - P<small>2</small><0 (kiểm định một phiá) hoặc P<small>1</small> - P<small>2</small>  0 (kiểm định 2 phiá)

<small>Thí dụ 11</small>

<b><small>Bài giải</small></b>

Các bảng 5a-h (trang ??? ) cho biết cỡ mẫu tối thiểu ở mức ý nghĩa 5%, lực của test là 90% và 80%, kiểm định một phía và cả 2 phiá, kể cả trường hợp đặc biệt khi các tỷ lệ rất bé. Các bảng 5e-h nên dùng khi tỷ lệ dưới 5% <small>(2)</small>. Người ta tin rằng tỷ lệ bệnh nhân bị biến chứng do một phương pháp phẫu thuật là 5% trong khi tỷlệ bệnh nhân bị biến chứng do phương pháp phẫu thuật thứ hai là 15% trong khi tỷ lệ bệnh nhân bị biến chứng do phương pháp phẫu thuật thứ hai là 15%. Cỡ mẫu trong mỗi nhóm bệnh nhân là bao nhiêu nếu ngườinghiên cứu muốn lực phát hiện ra tỷ lệ biến chứng do phương pháp thứ hai cao hơn có ý nghĩa so với phương pháp thứ nhất là 90% ở mức ý nghĩa là 5%.

(a) Sự khác biệt tỷ lệ biến chứng của 2 phương pháp cần kiểm định 0% (b) Các tỷ lệ biến chứng ước tính 5%, 15% (c) Mức ý nghĩa 5% (d) Giả thuyết có sự khác biệt nguy cơ (P<small>1</small> - P<small>2</small>) <0%

(kiểm định một phiá)

<small>Thí dụ 12</small>

Bảng 5a (trang ??? ) cho thấy với P<small>1</small> = 0,05 và P<small>2</small> = 0,15 thì cỡ mẫu tối thiểu Bảng 5a (trang ) cho thấy với P<small>1</small> = 0,05 và P<small>2</small> = 0,15 thì cỡ mẫu tối thiểu cho mỗi nhóùm là 153.

<small>(2) Để biết sâu hơn về các tỷ lệ nhớ tìm đọc Lemeshow, S et al, …..Adeauacy of sample size inhealth studies (Chicheste, John Wiley, 1990; Tổ Chức Y Tế Thế Giới bảo trợ).</small>

Trong một điều tra thăm dò tại một nước đang phát triển, nhà dịch tễ so sánh 1 mẫu 50 người lớn mắc một chứng bệnh thần kinh với một mẫu 50 người là những người không mắc bệnh. 30 người lớn trong nhóùm mắc bệnh (60%) và 25 người trong nhóm khơng mắc bệnh (50%) làm các nghề có liên quan đến việc đánh bắt cá. Nếu tỷ lệ người dân làm các nghề có liên quan đến việc đánh bắt cá trên toàn bộ quần thể bằng với tỷ lệ trong cuộc thăm dị trên mẫu này, thì cỡ mẫu sẽ là bao nhiêu cho mỗi nhóm trong một nghiên cứu có qui mơ lớn hơn, khi mà dịch tễ muốn chắc chắn đến 90% pháthiện ra sự khác

8

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<b><small>Bài giải</small></b>

<b>Bài giải</b>

biệt thật sự giữa 2 nhóm ở mức ý nghĩa 5%?

<small>(a) </small>Sai biệt giữa 2 tỷ lệ làm các nghề liên quan đến đánh bắt cá cần kiểm

Bảng 5c (trang ??? ) cho thấy cỡ mẫu là điểm giao giữa cột có chứa các trị số nhỏ nhất của P<small>1, </small>P<small>2</small>, các trị số bổ sung của P<small>1, </small>P<small>2</small> và dịng có chứa các trị số của |P<small>2</small> - P<small>1</small>|. Trong trường hợp này, với 1 - P<small>1</small> = 0,4 và |P<small>2</small> - P<small>1</small>| = 0,10 thì cỡ mẫu tối thiểu là 519 cho mỗi nhóm.

Hai cộng đồng tham gia vào một nghiên cứu đánh giá một chương trình sàng lọc nhằm phát hiện sớm một loại bệnh ung thư. Ở cộng đồng thứ nhất, chương trình sàng lọc bệnh tiến hành trên tất cả mọi người có độ tuổi trên 35, trong khi cộng đồng thứ hai không tiế hành sàng lọc bệnh. Tỷ lệ bệnh ung thư mới mắc hàng năm ở cộng đồng không qua sàng lọc là 50/100.000 (=0,0005). Nếu tỷ lệ này giảm xuống còn 20/100.000 (=0.0002) ở dân số qua chương trình sàng lọc thì đó là cơ sở để triển khai đại trà chương trình sàng lọc. Cỡ mẫu là bao nhiêu cho mỗi cộng đồng nếu người nghiên ứu muốn có đến 80% cơ hội để phát hiện ra việc giảm tỷ lệ bệnh mới ở mức này, ở mức ý nghĩa 5%?

(a) Sự khác biệt giữa 2 tỷ lệ bệnh ung thư cần kiểm định 0% (b) Các tỷ lệ bệnh ung thư dự tính 0,05%: 0,02ø% (c) Mức ý nghĩa 5% (d) Lực của test 80% (e) Giả thuyết có sự sai biệt giữa 2 tỷ lệ (kiểm định 1 phiá) (P<small>1 </small>- P<small>2</small>) > 0% Bảng 5f (trang ??? ) cho thấy với P<small>1</small> = 0,0005 và P<small>2</small> = 0,0002 thì cỡ mẫu tối thiểu cho mỗi nhóm là 45.770.

<b>CÁC NGHIÊN CỨU BỆNH – CHỨNG</b>

Các thí dụ 14 và 15 liên quan đến tỷ số chênh (OR) là tỷ số giữa độ chênh của một biến số xảy ra trong cùng một hoàn cảnh và độ chênh cũng của biến

9

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

cố đó nhưng xảy ra trong hồn cảnh khác. Thí dụ, nếu biến cố đó là một bệnh thì số mắc bệnh và số khơng mắc bệnh có thể được xếp theo sự tiếp xúc với yếu tố nguy cơ nào đó như sau:

Tiếp xúc Không tiếp xúc Mắc bệnh a b Không mắc bệnh c d

Như vậy tỷ số chênh sẽ là ad/bc <small>(3)</small>

<b>Ước lượng tỷ số chênh với một độ chính xác tương đối</b>

<small>Ký hiệu và cácthơng tin cần có</small>

<small>Thí dụ 14</small>

(a) Hai trong ba trị số cần biết

<small></small> Xác xuất tiếp xúc ở nhóm bệnh

(ước tính) c/(a+b) P<small>1</small>

<small></small> Xác xuất tiếp xúc ở nhóm chứng

(ước tính) c/(a+d) P<small>2</small>

<small></small> Tỷ số chênh (ước tính) OR (b) Độ tin cậy 100 (1 - )% (c) Độ chính xác tương đối 

Khi số mắc bệnh trong quần thể tương đối ít so với người khơng mắc bệnh thì:

c  (a + c) Và

c  (b + d)

Trong trường hợp này thì xác xuất tiếp xúc với yếu tố nguy cơ ở nhóm khơng bị bệnh (P<small>2</small>) gần bằng với tỷ lệ tiếp xúc toàn bộ trong dân số. <small>(3)</small>

Bảng 6a-h (trang ??? ) cho biết cỡ mẫu tối thiểu ở độ tin cậy 95% và 90%, độ chính xác tương đối 10%, 20%, 25% và 50%.

Để xác định được cỡ mẫu ở bảng 6 khi OR  1, thì các trị số P<small>2</small> và OR đều phải có. Khi cần, các trị số này có thể tính được.

Khi biết trị số P<small>1</small><sup>*</sup>: OR = P<small>1</small><sup>*</sup>/ (1 - P<small>1</small><sup>*</sup>) / P<small>1</small><sup>*</sup> / (1 - P<small>2</small><sup>*</sup>) P<small>2</small><sup>* </sup>= P<small>1</small><sup>*</sup>/ OR (1 - P<small>1</small><sup>*</sup>) + P<small>1</small><sup>*</sup>

Nếu OR < thì trị số P<small>1</small><sup>*</sup> và 1/ OR được dùng thay thế

<small>(3) Để có thể rõ hơn có thể tìm đọc Dịch tễ học cơ bản của Lê Hoàng Ninh và NuyễnVăn Truyền chủ biên, NXB Y học 1995.</small>

Tại một vùng mà bệnh tả là vấn đề y tế công cộng hàng đầu, với khoảng 30% dân số dùng nguồn nước bị nhiễm bẩn. Một nghiên cứu bệnh chứng về sự liên quan giữa bệnh tả và sự tiếp xúc với nguồn nước nhiễm bẩn được tiến hành tại vùng này để ước lượng tỷ số chênh với độ chính xác tương đối bằng 25% của trị số chênh thật sự mà trị số này ước tính gần bằng 2 với độ

10

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

tin cậy bằng 95%. Cỡ mẫu tối thiểu là bao nhiêu cho mỗi nhóm bệnh và nhóm chứng.

<b><small>Bài giải</small></b> (a) Xác xuất tiếp xúc ở nhóm bệnh (ước tính) Xác xuất tiếp xúc ở nhóm chứng (ước tính)

(gần bằng với tỷ lệ tiếp xúc toàn bộ trong quần thể) 30%

Tỷ số chênh (ước tính) 2 (b) Độ tin cậy 95% (c) Độ chính xác tương đối 25%

Bảng 6C (trang 44) cho biết với OR = 2 và P<small>2</small><sup>*</sup> = 0,3 thì cỡ mẫu cho mỗi nhóm là 408.

<b>Kiểm định giả thuyết về tỷ số chênh (OR)</b>

Phần này trình bày điểm chính cách xác định cỡ mẫu tối thiểu để kiểm định giả thuyết là tỷ số chênh trong quần thể bằng 1.

(a) Tỷø số chênh theo giả thuyết không (Ho) cần kiểm định OR<small>o</small> = 1 (b) Hai trong 3 trị số sau đây cần phải biết:

<small></small> Xác xuất tiếp xúc ở nhóm bệnh (ước tính) : a/(a+b) P<small>1</small><sup>*</sup>

<small></small> Xác xuất tiếp xúc ở nhóm chứng (ước tính): c/(a+d) P<small>2</small><sup>*</sup>

<small></small> Tỷ số chênh (ước tính) OR<small>a</small>

(c) Mức ý nghĩa 100 % (d) Lực của test 100 (1 - )% (e) Giả thuyết có (H<small>A</small>)

(kiểm định 2 phiá) OR+<small>a</small>  OR<small>o</small>

<small>Thí dụ 15</small>

Các bảng 7a và 7b (trang ??? ) cho biết cỡ mẫu tối thiểu ở mức ý nghĩa 5%, lực của test là 90% và 80%, kiểm định về 2 phiá.

Để xác định cỡ mẫu trong bảng 7 khi OR<small>a</small> > 1 thì cả hai trị số của P<small>2</small><sup>*</sup> và OR cần phải biết. Khi cần, các trị số này có thể tính được nếu biết P<small>1</small><sup>*</sup>.

OR<small>a</small> = P<small>1</small><sup>*</sup>/ (1 - P<small>1</small><sup>*</sup>) / P<small>2</small><sup>*</sup> / (1 - P<small>2</small><sup>*</sup>) và

P<small>2</small><sup>* </sup>= P<small>1</small><sup>*</sup>/ OR<small>a</small> (1 - P<small>1</small><sup>*</sup>) + P<small>1</small><sup>*</sup> Nếu OR<small>a</small> < 1 thì trị số P<small>1</small> và 1/OR<small>a</small> được dùng thay thế

Hiệu lực vaccin BCG trong phòng lao ở trẻ em còn bị nghi ngờ nên một nghiên cứu được thiết kế để so sánh tỷ lệ chủng ngừa lao ở nhóm bệnh lao

11

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<b><small>Bài giải</small></b>

và nhóm chứng. Các thơng tin hiện có cho thấy khoảng 30% trẻ trong nhóm chứng khơng chủng ngừa BCG. Các nhà nghiên cứu muốn có đến 80% cơ hội phát hiện ra tỷ số chênh không bằng 1 ở mức ý nghĩa 5%. Nếu tỷ số chênh bằng 2 được coi như tỷ lệ chủng ngừa BCG ở 2 nhóm bệnh và chứng khác biệt có ý nghĩa thì cỡ mẫu tối thiểu cho mỗi nhóm là bao nhiêu?

(a) Tỷ số chênh cần kiểm định 1

(b) Xác xuất tiếp xúc ở nhóm bệnh (ước tính) ?

Xác xuất tiếp xúc ở nhóm chứng (ước tính) 30%

Tỷ số chênh (ước tính) 2

(c) Mức ý nghĩa 5%

(d) Lực của test 80% (e) Giả thuyết có (H<small>A</small>) tỷ số chênh  1

Bảng 7b (trang ??? ) cho thấy với OR = 2 và P<small>2</small><sup>*</sup> = 0,3 thì cỡ mẫu tối thiểu cho mỗi nhóm là 130.

<b>CÁC NGHIÊN CỨU ĐOÀN HỆ (COHORT)</b>

<b>Ước lượng nguy cơ tương đối với độ chính xác tương đối</b>

12

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<small>Ký hiệu và các</small>

<small>thơng tin cần cóù</small> (a) Hai trong các trị số cần có:

<small></small> Xác xuất mắc bệnh ở nhóm tiếp xúc

với yếu tố nguy cơ (ước tính) P<small>1</small>

<small></small> Xác xuất mắc bệnh ở nhóm khơng tiếp xúc (ước tính) P<small>2</small>

<small></small> Nguy cơ tương đối (ước tính) RR (b) Độ tin cậy 100 (1 - )% (c) Độ chính xác tương đối 

<small>Thí dụ 16</small>

<b>Bài giải</b>

Các bảng 8a-h (trang ??? ) trình bày cỡ mẫu tối thiểu ứng với các độ tin cậy 95%, 90% và các độ chính xác tương đối 10%, 20%, 25% và 50%.

Để xác định cỡ mẫu trong bảng 8 khi R  1 thì các trị số của P<small>2</small> và RR cần phải biết. Khi cần thiết, có thể tính được các trị số này nếu biết P<small>1</small>:

RR = P<small>1</small>/ P<small>2</small>

P<small>2</small>= P<small>1</small>/RR

Nếu RR < 1, các trị số của P<small>1</small> và 1/RR được dùng thay thế.

Một nhà dịch tễ thiết kế một nghiên cứu để điều tra mối quan hệ giữa một chất gây ô nhiễm khơng khí mới được xác nhận gần đây với một loại bệnh phổi. Cỡ mẫu tối thiểu cho mỗi nhóm tiếp xúc và không tiếp xúc là bao nhiêu nếu dịch tễ muốn ước lượng nguy cơ tương đối trong phạm vi 50% của trị số thật (mà trị số này ước tính gần bằng 2) với độ tin cậy 95%? Biết rằng tỷ lệ bệnh ở nhóm khơng tiếp xúc với chất ơ nhiễm khơng khí là20%.

(a) Xác xuất mắc bệnh ở nhóm tiếp xúc (ước tính) ? Xác xuất mắc bệnh ở nhóm khơng tiếp xúc (ước tính) 20% Nguy cơ tương đối (ước tính)

(b) Độ tin cậy 95% (c) Độ chính xác tương đối 50%

Bảng 8d (trang ??? ) cho thấy với RR = 2 và P<small>2</small> = 0,20 thì cỡ mẫu tối thiểu cho mỗi nhóm là 44.

<b>Kiểm định giả thuyết về nguy cơ tương đối.</b>

Phần này nêu những điểm chính, cách xác định cỡ mẫu tối thiểu để kiểm định giả thuyết là nguy cơ tương đối trong quần thể bằng 1.

<small>Ký hiệu và các</small>

<small>thông tin cần có</small> (a) Nguy cơ tương đối theo giả thuyết không cần kiểm định Ro =1

(b) Hai trong các trị số sau đây cần có:

13

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<small></small> Xác xuất mắc bệnh ở nhóm tiếp xúc (ước tính) P<small>1</small>

<small></small> Xác xuất mắc bệnh ở nhóm khơng P<small>2</small>

(c) Mức ý nghĩa 100% (d) Lực của test 100 (1-) %

(e) Giả thuyết có (H<small>A</small>) RR<small>A</small>  RR<small>o</small>

(e) Giả thuyết có RR<small>a </small> (kiểm định 2 phía)

Các bảng 9a-c (trang ??? ) cho biết rõ cỡ mẫu ở mức ý nghĩa 5% và lực của test là 90%, 80% và 50% kiểm định về 2 phiá.

<small>Thí dụ 17</small>

<b><small>Bài giải</small></b>

Để xác định cỡ mẫu trong bảng 9 khi RR<small>a</small> > 1 thì các trị số của P<small>2</small> và RR<small>a</small> cần phải biết. Nếu cần, các trị số này có thể tính được nếu biết P<small>1</small> :

RR<small>a</small> = P<small>1</small>/P<small>2</small>

P<small>2</small> = P<small>1</small>/ RR<small>a</small>

Nếu RR<small>a</small> < 1, các trị số của P<small>1</small> và 1/ RR<small>a </small>được dùng thay thế.

Hai phương pháp điều trị một loại bệnh ung thư được đánh giá theo kiểu nghiên cứu đoàn hệ trong một thử nghiệm lâm sàng tại nhiều trung tâm. Các bệnh nhân được phân phối ngẫu nhiên để nhận hoặc liệu pháp A hoặc liệu pháp B và được theo dõi nguy cơ tái phát bệnh trong 5 năm sau khi điều trị. Liệu pháp A là phương pháp mới sẽ được triển khai đại trà nếu biện pháp này chứng tỏ cho thấy nguy cơ tái phát bệnh trong 5 năm đầu sau điều trị giảm một nửa (RR<small>a</small> = 0,5), trong khi nguy cơ tái phát ở những bệnh nhân điều trị phương pháp B là 35%. Cỡ mẫu trong mỗi nhóm là bao nhiêu nếu nhóm nghiên cứu muốn chắc chắn đến 90% loại bỏ giả thuyết không (RR<small>o</small> = 1) nếu giả thuyết này sai và test được thực hiện ở mức ý nghĩa 5%?

(a) Nguy cơ tương đối cần kiểm định 1 (b) Xác xuất tái phát của liệu pháp A (ước tính) ?

Xác xuất tái phát của liệu pháp B (ước tính) 35% Nguy cơ tương đối (ước tính) 0,5 (c) Mức ý nghĩa 5% (d) Lực của test 90% (e) Giả thuyết có (H<small>A</small>) nguy cơ tương đối  1

Bảng 9a (trang ) cho thấy với RRa = 0,5 (1/RRa = 2) và P<small>2</small>= 0,35 (P<small>1</small> = 0,175) thì cỡ mẫu tối thiểu cho mỗi nhóm là 135 (số này có được qi tắc nội suy, con số chính xác qua tính tốn là 131).

14

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<b>LẤY MẪU BẢO ĐẢM CHẤT LƯỢNG MỘT LƠ</b>

Chấp nhận tỷ lệ bệnh tồn bộ trong quần thể không lớn hơn một trị số nào đấy

Phần này nêu những điểm chính, cách xác định cỡ mẫu tối thiểu cần chọn ra từ một quần thể định sẵn để mà, nếu như khi khảo sát trên mẫu thấy một đặc trưng đang nghiên cứu không lớn hơn một trị số nhất định nào đấy, thì tỷ lệ toàn bộ của đặc trưng này trên quần thể cũng không lớn hơn một trị số nào đấy.

<small>Ký hiệu và các</small>

<small>thơng tin cần có</small> (a) Tỷ lệ tồn bộ trong quần thể (ước tính) P (b) Kích thước quần thể N (c) Số tối đa các cá thể trong mẫu có đặc trưng đang nghiên cứu d<small>*</small>

(d) Độ tin cậy 100 (1 - )%

<small>Thí dụ 18</small>

<b><small>Bài giải</small></b>

<small>Ký hiệu và các</small>

Các bảng 10a-j (trang ??? ) trình bày cỡ mẫu tối thiểu ứng với độ tin cậy 95% và 90% và trị số của d<small>*</small>từ 0 tới 4.

Tại một trường có 2500 học sinh, cỡ mẫu là bao nhiêu nếu khi khảo sát trên mẫu thấy khơng q 2 em có ký sinh trùng sốt rét trong máu thì cho phép kết luận rằng tỷ lệ tồn bộ bệnh sốt rét tại trường này khơng vượt quá 10% với độ tin cậy 95%?

(a) Tỷ lệ tồn bộ trong quần thể (ước tính) 10%

(b) Kích thước quần thể 2500

(c) Số tối đa cá thể trong mẫu mắc bệnh sốt rét 2

(d) Độ tin cậy 95%

Bảng 10 c (trang ??? ) cho thấy với P = 0,10 và N = 2500 thì cỡ mẫu tối thiểu là 61 trẻ em.

<b>Nguyên tắc quyết định "loại bỏ một lô"</b>

Phần này được áp dụng cho những nghiên cứu được thiết kế để kiểm định một lô (quần thể mà từ đó mẫu được lấy ra) có cùng đạt một chuẩn mực hay không. Giả thuyết không trong trường hợp này là tỷ lệ cá thể trong quần thể cùng có một đặc trưng đang nghiên cứu thì bằng với một trị số định trước và việc kiểm định được thực hiện về một phiá nhằm xác định lô được chấp nhận là cùng một chuẩn mực , nếu giả thuyết không bị loại bỏ.

Để làm được điều này, trị số ngưỡng các cá thể mang đặc trưng này cần được tính tốn để làm cơ sở cho việc ra quyết định:

Nếu số cá thể trong mẫu có mang đặc trưng nghiên cứu khơng vượt qua ngưỡng thì giả thuyết không bị loại bỏ (và lô được chấp nhận). Ngược lại, nếu vượt qua ngưỡng thì lơ bị loại bỏ.

15

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

<small>thơng tin cần có</small> a) Tỷ lệ trong quần thể theo giả thuyết "không" cần kiểm định Po (b) Tỷ lệ trong quần thể (ước định) Pa Các bảng 11a-c (trang ??? ) trình bày cỡ mẫu tối thiểu ứng với mức ý nghĩa 5%, lực của test 90% và 80% kiểm định về 1 phiá. Lãnh đạo Sở Y tế một thành phố lớn đề ra mục tiêu chủng ngừa đạt tỷ lệ 90% cho tất cả các trẻ em trong diện tiêm. Nhằm đối phó với quản ngại rằng một vài loại bệnh ở trẻ em có thể bùng phát thành dịch tại một số khu vực của thành phố. Nhóm nghiên cứu của Sở đang thiết kế một cuộc điều tra để xác định các khu vực có tỷ lệ tiêm chủng bằng hoặc thấp hơn 50% để có biện pháp can thiệp thích ứng . Cỡ mẫu tối thiểu tại mỗi khu vực và trị số ngưỡng nên chọn là bao nhiêu để kiểm định giả thuyết. Tỷ lệ trẻ em không chủng ngừa là từ 50% trở lên, ở mức ý nghĩa 5%? Nhóm nghiên cứu muốn chắc chắn đến 90% tìm ra các khu vực có tỷ lệ chủng ngừa đạt mục tiêu đề ra của Sở. (Nghĩa là tại các khu vực đó chỉ có 10% trẻ không được chủng ngừa đầy đủ). (a) Tỷ lệ trong quần thể cần kiểm định 50%

(b) Tỷ lệ trong quần thể (ước định) 10%

(c) Mức định nghĩa 5%

(d) Lực của test 90%

Do nhầm lẫn tai hại ở những nhóm trẻ được xem là chủng ngừa đạt mục tiêu thì tỷ lệ tiêm chủng thực sự chỉ bằng hoặc thấp hơn 50%, Po = 0,50 và Pa = 0,10. Bảng 11a (trang ??? ) cho thấy trong trường hợp này cỡ mẫu là 10 và vị trí số ngưỡng là 2.

Do đó, tại mỗi khu vực một mẫu 10 trẻ sẽ được điều tra. Nếu có hơn 2 trẻ trong mẫu khơng được chủng ngừa thì cả lơ (tức quần

thể mà từ đó mẫu được lấy ra) sẽ bị loại, và lãnh đạo Sở sẽ tiến hành các bước can thiệp thích hợp để nâng cao tỷ lệ chủng ngừa tại khu vực này. Tuy nhiên nếu chỉ phát hiện ít hơn hoặc bằng 2 trẻ khơng được chủng ngừa thì giả thuyết "khơng" bị loại bỏ và nhóùm trẻ tại khu vực này khơng được xem là nhóm trẻ ưu tiên trong chiến dịch chủng ngừa bổ sung.

16

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<b>CÁC NGHIÊN CỨU VỀ TỶ LỆ BỆNH MỚIƯớc lượng tỷ lệ bệnh mới với độ chính xác tương đối.</b>

<small>Ký hiệu và các</small>

<small>thơng tin cần có</small> (a) Độ chính xác tương đối  (b) Độ tin cậy 100 (1 - )%

<small>Thí dụ 20</small>

<small>Bài giải</small>

Bảng 12 (trang ??? ) trình bày cỡ mẫu tối thiểu ứng với các độ tin cậy 99%, 95% và 90%.

Cỡ mẫu là bao nhiêu người cần theo dõi nếu người nghiên cứu muốn ước lượng tỷ lệ bệnh mới trong phạm vi 10% của tỷ lệ bệnh mới thật sự với sộ tin cậy 95%.

(a) Độ chính xác tương đối 10% (b) Độ tin cậy 95%

Bảng 12 cho thấy với  = 0,10 và độ tin cậy bằng 95% thì cỡ mẫu tối thiểu là 385.

<b>Kiểm định giả thuyết về tỷ lệ bênh mới</b>

Phần này áp dụng cho các nghiên cứu được thiết kế nhằm kiểm định giả thuyết là tỷ lệ bệnh mới (hay một hệ quả) thì bằng với một trị số nào đấy.

<small>Ký hiệu và các</small>

<small>thơng tin cần có</small> (a) Tỷ lệ bệnh mới trong quần thể theo giả thuyết

"không" cần kiểm định <small>o</small>

(b) Tỷ lệ bệnh mới trong quần thể (ước tính) <small>a</small>

(c) Mức ý nghĩa 100 % (d) Lực của test 100 (1 - )% (e) Giả thuyết có (HA) hoặc <small>a</small> > <small>o</small> hoặc <small>a</small> < <small>o</small>

(kiểm định 1 phiá) hoặc <small>a </small> <small>o</small> (kiểm định 2 phiá) Các bảng 13a-d (trang ??? ) trình bày các cỡ mẫu tối thiểu ứng với mức ý nghĩa 5%, lực của test 90% và 80% kiểm định về 1 phiá và 2 phiá.

<small>Thí dụ 21</small> Một nghiên cứu đồn hệ theo dõi trong 5 năm trên 1 số ít ngưới dân cho thấy tỷ lệ bệnh mới hằng năm của 1 bệnh là 40%. Cỡ mẫu tối thiểu là bao nhiêu để kiểm định giả thuyết. Tỷ lệ bệnh mới trong quần thể là 40% ở mức ý nghĩa 5%? Nhà nghiên cứu muốn rằng test có sức mạnh đến 90% cơ hội phát hiện ra tỷ lệ bệnh mới thực sự hàng năm là 40% và loại bỏ giả thuyết "không" nếu tỷ lệ bệnh thật lớn hơn 40%.

17

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

<b><small>Bài giải</small></b> (a) Tỷ lệ bệnh mới cần kiểm định 40%

(b) Tỷ lệ bệnh mới ước tính 50%

(c) Mức ý nghĩa 5%

(d) Lực của test 90%

(e) Giả thuyết "có" (kiểm định 1 phiá) tỷ lệ bệnh mới > 40% Bảng 13a (trang ??? ) cho thấy với <small>o</small> = 0,40 và <small>a</small> = 0,05 thì cỡ mẫu tối thiểu là 169 <b>Kiểm định giả thuyết về 2 tỷ lệ bệnh mới trong các nghiên cứu đoàn hệ.</b> Phần nay áp dụng cho nghiên cứu được thiết kế để kiểm định giả thuyết là các tỷ lệ bệnh mới (hay một hệ quả, một đặc trưng nào đó ở 2 nhóm thì bằng nhau. Các đối tượng hoặc được đưa vào các nhóm nghiên cứu cùng một lúc và được theo dõi cho đến khi hệ quả đang nghiên cứu xảy ra hay không thể theo dõi được nữa (xem thí dụ 22), hoặc được quy vào các nhóm nghiên cứu khi thời điểm tiếp xúc xác định được và chỉ theo dõi đến một thời gian nhất định nào đó mà thơi (xem thí dụ 23). <small>Ký hiệu và cácthơng tin cần có</small> (a) Sự sai biệt giữa các tỷ lệ bệnh mới trong quần thể theo giả thuyết không cần kiểm định <small>1</small> - <small>2</small> = 0 (b) Các tỷ lệ bệnh mới (ước tính) <small>1</small> và <small>2 </small> (f) Thời khoảng nghiên cứu (nếu hằng định) T

Nếu một nghiên cứu kết thúc trước khi tất cả các đối tượng có đủ thời gian cần thiết để hệ quả bệnh tật có thể xảy ra, khi đó sự quan hệ quả bệnh tật trên mọi đối tượng bị hạn chế. Do đó cần hiệu chỉnh tỷ lệ mới  theo công thức sau:

f () = <small>3</small>T/(T - 1 + e<small>-</small><sub>T</sub>) như trong thí dụ 23

Các bảng 14a-d (trang ??? ) trình bày cỡ mẫu tối thiểu ứng với mức ý nghĩa 5%, lực của test là 90% và 80%, kiểm định về 1 phiá và cả 2 phiá, khi thời khoảng nghiên cứu không hằng định và cỡ mẫu ở 2 nhóm bằng nhau. Đối với các nghiên cứu hằng định thì ở đây khơng có bảng nào để ứng dụng vì có q nhiều tham số liên quan đến việc tính cỡ mẫu nên rất khó xếp vào bảng.

18

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

<small>Thí dụ 22</small>

<b>Bài giải</b>

<small>Thí dụ 23</small>

<b><small>Bài giải</small></b>

Nhà nghiên cứu thiết kế nghiên cứu để theo dõi một đoàn hệ cơng nhân được tuyển dụng vào Xí nghiệp có tiếng ồn cao trong suốt một thời khoảng nhất định để so sánh với một đồn hệ cơng nhân tương tự nhưng làm việc trong một Xí nghiệp khơng có tiếng ồn. Nghiên cứu này là một phần trong motä nghiên cứu về tác hại lâu dài của tiếng ồn trên sức khoẻ cơng nhân trong một xí nghiệp có mức độ tiếng ồn cao. Tất cả các đối tượng sẽ được theo dõi suốt cuộc đời họ hoặc cho đến khi thính lực bị giảm. Theo kết quả điều tra thăm dò trước đây trên một mẫu nhỏ cho thấy tỷ lệ giảm thính lực ở cơng nhân trong Xí nghiệp có tiếng ồn cao lên đến 25%. Cỡ mẫu cho mỗi nhóm là bao nhiêu (các nhóm đều có cỡ mẫu bằng nhau) để kiểm định giả thuyết là tỷ lệ giảm thính lục ở 2 nhóm thì bằng nhau, ở mức ý nghĩa 5% và lực của test là 80%? Giả thuyết có là tỷ lệ giảm thính lực hàng năm ở Xí nghiệp khơng có tiếng ồn thì khơng lớn hơn tỷ lệ trung bình trong cả nước là 10% (so với những người cùng độ tuổi), trong khi ở xí nghiệp có tiếng ồn cao khác với tỷ lệ này.

(a) Sự khác biệt giữa các tỷ lệ bệnh mới cần kiểm định 0 (b) Các tỷ lệ bệnh mới (ước định) 25%, 10% (c) Mức ý nghĩa 5% (d) Lực của test 80% (e) Giả thuyết có (kiểm định 2 phiá) <small>1</small>  <small>2</small>

(f) Thời khoảng nghiên cứu (không áp dụng)

Bảng 14d (trang 80) cho thấy với <small>1</small> = 0,25 và <small>2</small> = 0,10 thì cỡ mẫu tối thiểu cho mỗi nhóm cơng nhân là 23.

Một nghiên cứu có các điểm giống như trong thí dụ 22 cũng được tiến hành, nhưng có 1 điểm khác là thời khoảng nghiên cứu giới hạn trong 5 năm. Cỡ mẫu là bao nhiêu cho mỗi nhóm?

(a) Sự khác biệt giữa các tỷ lệ bệnh mới cần kiểm định 0 (b) Các tỷ lệ bệnh mới (ước định) 25%, 10% (c) Mức ý nghĩa 5% (d) Lực của test 80% (e) Giả thuyết có (kiểm định 2 phiá) <small>1</small>  <small>2</small>

(f) Thời khoảng nghiên cứu 5 năm

Trị số  cần chỉnh lý theo công thức đã nêu ở trang 18.

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

Trong đó k là tỷ số giữa cỡ mẫu trong nhóm thứ 2 (n<small>2</small>) và cỡ mẫu trong nhóm thứ (n<small>1</small>) (trong trường hợp này k = 1).

Do đó:

n<small>1</small> = 1,96 <small>[2(0,0918)]0,842(0,14560,0469</small><sup>2</sup>/(0,25 - 0,10)<small>2</small>

= 1,462/0,023 = 65,0

Như vậy cỡ mẫu tối thiểu cho mỗi nhóm là 65.

Khi kiểm định một phía, cơng thức để tính cỡ mẫu như sau:

n<small>1</small> = Z<small>1</small> -  <small>[(1</small><i><small>k</small></i><small>)</small><i><small>f</small></i><small>()]</small> + Z<small>1</small> - <small>[</small><i><small>kf</small></i><small>(</small><sub>1</sub><small>)</small> <i><small>f</small></i><small>(</small><sub>2</sub><small>)]</small><sup>2</sup>/(<small>1</small> <small>2</small>)<small>2</small>

20

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

<b>ĐỊNH NGHĨA CÁC THUẬT NGỮ THÔNG DỤNG</b>

<small>Lấy mẫu đảm Bảo chất lượng 1 lô</small>

Các định nghĩa ngắn gọn liệt kê ở đây nhằm lại cho độc giả. Các giải thích đầy đủ hơn về các thuật ngữ thống kê và các lý giải về lý thuyết thốâng kê dùng để tính cỡ mẫu được trình bày trong cuốn sách của Lemeshow, S và cộng sự, Adequacy of Samole size in health studies (Chichester, John Wiley, 1990 được xuất bản dưới sự bảo trợ của Tổ chức y tế thế giới.

Mức ý nghĩa của test: xác xuất để loại bỏ giả thuyết "không" khi giả thuyết này đúng (xác xuất sai lầm loại I).

Xác xuất chấp nhận giả thuyết "không" khi giả thuyết này sai (xác xuất sai lầm loại II).

Là nghiên cứu mà các đối tượng đưa vào nghiên cứu trên căn bản là chúng có mang một đặc trưng nào đó (như mắc một bệnh); nhóm bệnh gồm các cá thể có mang đặc trưng này (bệnh) và nhóm chứng khơng mang đặc trưng này (khơng bệnh). Cả hai nhóm đều được nghiên cứu để xác định tình hình tiếp xúc trước đây cũng như hiện nay với một yếu tố nguy cơ nào đấy nghi ngờ là nguyên nhân của bệnh.

Là kiểu lấy mẫu theo đơn vị, đơn vị này là các cụm hoặc các nhóm trong các đơn vị nghiên cứu.

Là nghiên cứu mà các đối tượng được chọn lựa đưa vào nghiên cứu dựa trên căn bản là có hay khơng có đặc trưng đó (thí dụ như có hoặc khơng có tiếp xúc với một yếu tố nguy cơ) bị nghi ngờ là có liên quan đến một hệ quả nào đó (như một bệnh chẳng hạn). Các đối tượng trong cả 2 nhóm (tiếp xúc và khơng tiếp xúc) đều được theo dõi để xem hệ quả xảy ra như thế nào.

Xác xuất để ước lượng một tham số trong quần thể thì nằm trong phạm vi các giá trị giới hạn của trị số thật,thường được ký hiệu"1-"

Trong cách chọn mẫu theo cụm, tác động thiết kế cho biết sai biệt do lấy mẫu theo cụm. Tác động thiết kế được ước lượng bằng tỷ số giữa phương sai khi chọn mẫu theo cụm và phương sai khi chọn mẫu theo kiểu ngẫu nhiên đơn.

Là số một biến cố nào đó (thí dụ như số ca mới mắc) tính trên một quần thể nhất định theo một đơn vị thời gian.

Là kỹ thuật lấy mẫu có nguồn gốc từ công nghiệp, kiểu lấy mẫu sao cho đảm bảo chắc chắn rằng lơ hàng mà từ đó mẫu lấy ra đạt các tiêu chuẩn chất

21

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

<small>Lot quality samplingGiả thuyết "không"</small>

Là một câu văn đề cập đến giá trị một thơng số trong quần thể. Đó là giả thuyết cần được kiểm định bằng một test ý nghĩa, thí dụ giả thuyết: sự khác biệt quan sát được hoàn toàn do sai lầm lấy mẫu.

Là tỷ số giữa số chênh của một biến cố xảy ra trong cùng một tình huống và số chênh cũng của biến cố đó nhưng xảy ra trong tình huống khác (đề cập lại ở trang ??? )

Dùng trong kiểm định giả thuyết, khi sự khác biệt được kiểm định về một phiá xác định trước (thí dụ, kiểm định giả thuyết không là (Ho): <small>1 2</small>, ngời nghiên cứu chỉ muốn kiểm định xem có đúng là <i><small>x</small></i><small>1 2</small>hay không, chứ không kiểm định <small>1 2</small>.

Tỷ lệ các cá thể trong quần thể có mang một đặc trưng nào đó.

Xác xuất để loại bỏ chính xác giả thuyết không khi giả thuyết này sai, thường được ký hiệu "1 - ".

Số đo sao cho ước lượng đúng trị số thật một tham số trong quần thể. Ta có thể ước lượng trị số thật theo độ chính xác tuyệt đối và tương đối.

Số ca hiện mắc bệnh (hoặc người mang một đặc trưng nào đó) trong quần thể tại tại một thời điểm nào đó.

Là tỷ lệ nguy cơ (xác xuất) một hệ quả (như mắc bệnh hay tử vong) ở nhóm tiếp xúc và nhóm khơng tiếp xúc với yếu tố nguy cơ.

Xem định nghĩa .

Là cách lấy mẫu mà từng đơn vị nghiên cứu (study unit) có cùng một cơ may được chọn lựa và từng mẫu đều có cùng một cơ may được chọn.

Các cá thể của một quần thể được chọn đo lường một số đặc trưng.

Dùng trong kiểm định giả thuyết, khi sự khác biệt được kiểm định khơng theo một hướng định trước (thí dụ, trong kiểm định không xác định <small>1 2</small> hay <small>1 2</small> mà chỉ xác định <small>1 2</small>.

Số sai chuẩn từ số trung bình <i><small>Z</small></i><small>1</small><sub></sub><sub></sub><small>, Z1-</small><sub></sub><small>/2</small>; là các hàm số của độ tin cậy và <small></small>

<small>1</small>

<i><small>Z</small></i> là hàm của lực của test.

<small>(4) Để rõ hơn có thể tìm đọc: Dịch tễ học cơ bản, Lê Hồng Ninh và Nguyễn Văn Truyền chủ biên, NXB Y học 1995.</small>

22

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

<small>(5) Tìm đọc tài liệu (in Roneo): Phương pháp chọn mẫu, kiểm định giả thuyết, Sự ước lượng do BS. Lê Hoàng Ninh biênsoạn dành cho hội thảo: Thống kê ứng dụng trong nghiên cứu dịch tễ tổ chức tại Viện VSYTCC Tp. Hồ Chí Minh1994.</small>

23

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

<b>Bảng 1a. Ước lượng một tỷ lệ trong quần thể với một độ chính xác tuyệt đối (1a) độ tin cậy 95%</b>

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

<b>Bảng 1b Ước lượng một tỷ lệ trong quần thể với một độ chính xác tuyệt đối (1b) Độ tin cậy 90%</b>

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

<b>Bảng 2a . Ước lượng một tỷ lệ quần thể với một độ chính xác tương đối</b>

<b>(2a) độ tin cậy 95%</b>

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

<b>Bảng 2b Ước lượng một tỷ lệ trong quần thể với một độ chính xác tương đối (2b) Độ tin cậy 90%</b>

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

<b>Bảng 3a. Kiểm định giả thuyết về một tỷ lệ trong quần thể</b>

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

<b>Bảng 3b. Kiểm định giả thuyết về một tỷ lệ trong quần thể(3b) Mức ý nghĩa 5%, lực của test 80%, kiểm định một phiá</b>

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

<b> Bảng 3c. Kiểm định giả thuyết về một tỷ lệ trong quần thể</b>

<b>(3c) Mức ý nghĩa 5%, lực của test 90%, kiểm định hai phiá</b>

* Cỡ mẫu nhỏ hơn 5

X là trị số nhỏ hơn của Po và (1-Po)

30

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

<b>Bảng 3. Kiểm định giả thuyết về một tỷ lệ trong quần thể(3d) Mức ý nghĩa 5%, lực của test 80%, kiểm định hai phiá</b>

Cỡ mẫu nhỏ hơn 5

X là trị số nhỏ hơn của Po và (1-Po )

31

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

<b>Bảng 4. Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối.</b>

</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">

<b>Bảng 4a (tiếp theo). Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối.</b>

X là trị số nhỏ hơn của P<small>2 </small> và (1–P<small>2</small>) Y là trị số nhỏ hơn của P<small>1 </small> và (1–P<small>1</small>)

33

</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">

<b>Bảng 4b. Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối.(4b) Cỡ mẫu ở độ tin cậy 95%</b>

</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">

<small>* Cỡ mẫu nhỏ hơn 5</small>

35

</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">

<b>Bảng 4c. Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối. Cỡ mẫu ở độ tin cậy 90%</b>

</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">

<b>Bảng 5. Kiểm định giả thuyết về 2 tỷ lệ trong quần thể</b>

</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">

<b>Bảng 5b. Kiểm định giả thuyết về 2 tỷ lệ trong quần thể(5b) Mức ý nhgĩa 5%, lực của test 80%, kiểm định một phiá</b>

</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39">

<b>Bảng 5 c. Kiểm định giả thuyết về 2 tỷ lệ trong quần thể(5c) Mức ý nhgĩa 5%, lực của test 90%, kiểm định hai phiá</b>

</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">

<b>Bảng 5d. Kiểm định giả thuyết về 2 tỷ lệ trong quần thể(5d) Mức ý nghĩa 5%, lực của test 80%, kiểm định hai phiá</b>

</div>

×