Tải bản đầy đủ (.pdf) (113 trang)

Tổng quan hệ thống và phân tích gộp về hiệu quả điều trị helicobacter pylori của phác đồ bộ ba dùng các thuốc ức chế bơm proton liều cao so với liều chuẩn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.22 MB, 113 trang )



BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
TRƢỜNG ĐẠI HỌC DƢỢC HÀ NỘI



NGUYỄN THỊ MINH THƢ


TỔNG QUAN HỆ THỐNG VÀ PHÂN TÍCH GỘP
VỀ HIỆU QUẢ ĐIỀU TRỊ HELICOBACTER
PYLORI CỦA PHÁC ĐỒ BỘ BA DÙNG
CÁC THUỐC ỨC CHẾ BƠM PROTON
LIỀU CAO SO VỚI LIỀU CHUẨN


LUẬN VĂN THẠC SĨ DƢỢC HỌC


HÀ NỘI 2014




BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

TRƢỜNG ĐẠI HỌC DƢỢC HÀ NỘI






NGUYỄN THỊ MINH THƢ



TỔNG QUAN HỆ THỐNG VÀ PHÂN TÍCH GỘP
VỀ HIỆU QUẢ ĐIỀU TRỊ HELICOBACTER
PYLORI CỦA PHÁC ĐỒ BỘ BA DÙNG
CÁC THUỐC ỨC CHẾ BƠM PROTON
LIỀU CAO SO VỚI LIỀU CHUẨN


LUẬN VĂN THẠC SĨ DƢỢC HỌC


CHUYÊN NGÀNH: DƯỢC LÝ- DƯỢC LÂM SÀNG
MÃ SỐ: 60720405



Người hướng dẫn khoa học: TS.Vũ Đình Hòa



HÀ NỘI 2014






LỜI CẢM ƠN

Tôi xin trân trọng cảm ơn Ban giám hiệu, Phòng sau đại học, các Thầy
Cô giáo trường Đại học Dược Hà Nội đã quan tâm và tạo mọi điều kiện thuận
lợi cho tôi trong suốt quá trình học tập và làm luận văn tốt nghiệp.
Với tất cả sự kính trọng của mình, tôi xin gửi lời cảm ơn chân thành tới
TS. Vũ Đình Hòa- Giảng viên bộ môn Dược lâm sàng, người đã tận tình chỉ
bảo, hướng dẫn tôi trong suốt quá trình học tập và thực hiện luận văn này.
Tôi xin chân thành cảm ơn Lãnh đạo và các đồng nghiệp cơ quan Công
đoàn Y tế Việt Nam đã tạo mọi điều kiện về thời gian, giúp đỡ tôi trong công
tác, học tập và thực hiện đề tài nghiên cứu.
Tôi xin chân thành cảm ơn các Thầy Cô trong hội đồng thông qua đề
cương, các Thầy Cô trong hội đồng chấm luận văn tốt nghiệp đã đóng góp
cho tôi nhiều ý kiến quý báu trong quá trình hoàn thành luận văn này.
Cuối cùng, xin chân thành cảm ơn bạn bè luôn quan tâm, động viên và
giúp đỡ tôi trong học tập, công tác. Tôi xin cảm ơn Gia đình đã luôn sát cánh
bên tôi và là chỗ dựa tinh thần vô cùng to lớn cho tôi trong suốt quá trình học
tập và hoàn thành luận văn!
Hà Nội, tháng 08 năm 2014
DS. Nguyễn Thị Minh Thƣ










MỤC LỤC
ĐẶT VẤN ĐỀ 1
Chương 1: TỔNG QUAN 3
1.1. Tổng quan hệ thống 3
1.1.1. Khái niệm 3
1.1.2. Quy trình của tổng quan hệ thống 3
1.2. Phân tích gộp (meta-analysis) 5
1.2.1. Tại sao phải tiến hành phân tích gộp? 5
1.2.2. Khái niệm phân tích gộp 6
1.2.3. Các bước tiến hành phân tích gộp 6
1.2.4. Một số khái niệm trong phân tích gộp 8
1.2.5. Thiên vị xuất bản 12
1.2.6. Độ dị biệt giữa các nghiên cứu 13
1.2.7. Mô hình ảnh hưởng cố định (fixed effect model) và mô hình ảnh hưởng
biến thiên (random effect model) 15
1.3. Các thuốc ức chế bơm proton (proton pump inhibitors: PPIs) 17
1.3.1. Cơ chế tác dụng 17
1.3.2. Dược động học các thuốc ức chế bơm proton 18
1.3.3. Tương tác thuốc 18
1.3.4. Chế phẩm và liều dùng 19
1.4. Tổng quan về vi khuẩn Helicobacter pylori 19
1.4.1. Đặc điểm của vi khuẩn Helicobacter pylori 19
1.4.2. Cách xác định nhiễm Helicobacter pylori 20
1.4.3. Con đường lây nhiễm Helicobacter pylori 22
1.4.4. Các phác đồ điều trị Helicobacter pylori 22
1.4.5. Các giải pháp cải thiện hiệu quả điều trị H. pylori 25
1.5. Các nghiên cứu đã tiến hành ở Việt Nam và trên thế giới 25
2.1. Đối tượng nghiên cứu 27



2.1.1. Đối tượng nghiên cứu 27
2.1.2. Nguồn cơ sở tìm kiếm dữ liệu 27
2.1.3. Tiêu chuẩn lựa chọn và loại trừ các nghiên cứu 27
2.2. Phương pháp nghiên cứu 29
2.2.1. Phương pháp thu thập số liệu 29
2.2.2. Phương pháp xử lý số liệu 30
Chương 3: KẾT QUẢ NGHIÊN CỨU 33
3.1. Tổng quan hệ thống về hiệu quả diệt trừ Helicobacter pylori của phác đồ
bộ ba dùng các thuốc ức chế bơm proton liều cao. 33
3.2. Phân tích gộp về hiệu quả điều trị H. pylori của phác đồ bộ ba dùng các
thuốc ức chế bơm proton liều cao so với liều chuẩn 39
3.2.1. Lựa chọn các nghiên cứu để tiến hành phân tích gộp 39
3.2.2. Đánh giá chất lượng các nghiên cứu của phân tích gộp 40
3.2.3. Chiết xuất thông tin và số liệu từ các nghiên cứu lựa chọn để tiến hành
phân tích gộp 41
3.2.4. Hiệu quả diệt trừ H. pylori của phác đồ bộ ba dùng các PPI liều cao so
với liều chuẩn 48
Chương 4: BÀN LUẬN 59
4.1. Tổng quan hệ thống về hiệu quả điều trị H. pylori của phác đồ bộ ba dùng
các PPI liều cao 59
4.1.1. Tình hình nhiễm H. pylori trên thế giới và vai trò của H. pylori trong
các bệnh đường tiêu hóa 59
4.1.2. Vai trò của các thuốc ức chế bơm proton trong các phác đồ điều trị diệt
trừ Helicobacter pylori 60
4.1.3. Thực trạng kháng kháng sinh của H. pylori trên thế giới 62
4.1.4. Kết quả tổng quan hệ thống về hiệu quả điều trị của phác đồ bộ ba
dùng các PPI liều cao 63
4.2. Phân tích gộp về hiệu quả điều trị H. pylori của phác đồ bộ ba dùng liều
cao các PPI so với liều chuẩn 68



4.2.1. Kết quả nghiên cứu trong phân tích ITT và PP 68
4.2.2. Các kết quả phân tích dưới nhóm 72
4.2.3. Một số hạn chế của nghiên cứu 76
KẾT LUẬN VÀ ĐỀ XUẤT 77
1. Kết luận 77
1.1. Tổng quan hệ thống về hiệu quả điều trị H. pylori của phác đồ bộ ba dùng
các PPI liều cao 77
1.2. Phân tích gộp về hiệu quả điều trị H. pylori của phác đồ bộ ba dùng liều
cao các PPI so với liều chuẩn 77
2. Đề xuất 78
TÀI LIỆU THAM KHẢO
PHỤ LỤC



















DANH MỤC CÁC CHỮ VIẾT TẮT

AUC: Diện tích dưới đường cong
b.d: 2 lần/ngày
BN: Bệnh nhân
CYP450: Cytocrom P450
ES: Mức độ ảnh hưởng
HomEM: Chuyển hóa nhanh đồng
hợp tử
HetEM: Chuyển hóa nhanh dị hợp tử
H. pylori: Helicobacter pylori
ITT: Dự định điều trị
o.d: 1 lần/ngày
OR: Odds ratio
IL: Interleukin

PCR: Phản ứng khuyếch đại gen
PM: Chuyển hóa kém
PP: Đề cương nghiên cứu
PPI: Thuốc ức chế bơm proton
q.i.d: 4 lần/ngày
RCT: Randomized controled trial
RD: Khác biệt nguy cơ
RR: Nguy cơ tương đối
RUT: Xét nghiệm urease nhanh
SAT: Xét nghiệm kháng nguyên phân
UBT: Xét nghiệm urease hơi thở
TT: Thứ tự
t.d.s: 3 lần/ngày

95% CI: Khoảng tin cậy 95%












DANH MỤC CÁC BẢNG
Bảng 1.1: Các thông số dược động học của PPI 18
Bảng 1.2. Các cách xác định nhiễm Helicobacter pylori 20
Bảng 1.3: Các phác đồ điều trị H. pylori 23
Bảng 3.1: Thông tin và kết quả các nghiên cứu đạt tiêu chuẩn của tổng quan
hệ thống 35
Bảng 3.2: Đánh giá chất lượng các nghiên cứu trong phân tích gộp theo thang
điểm Jadah 40
Bảng 3.3: Thông tin chung của các nghiên cứu đạt tiêu chuẩn của phân tích
gộp 41
Bảng 3.4: Các phác đồ điều trị và kết quả thu được trong các nghiên cứu đạt
tiêu chuẩn của phân tích gộp 45


















DANH MỤC CÁC HÌNH
Hình 1.1: Thiên vị xuất bản trong biểu đồ funnel 13
Hình 3.1: Quy trình lựa chọn các nghiên cứu để tổng quan và phân tích gộp
………………………………………………………………………………34
Hình 3.2: Biều đồ forest- Phân tích ITT so sánh hiệu quả diệt trừ H. pylori của
phác đồ bộ ba dùng các PPI liều cao so với liều chuẩn 49
Hình 3.3: Biểu đồ forest- Phân tích ITT so sánh hiệu quả diệt trừ H. pylori của
phác đồ bộ ba dùng các PPI liều cao so với liều chuẩn (loại bỏ nghiên cứu
Anagnostopolous) 50
Hình 3.4: Biểu đồ funnel- Phân tích ITT so sánh hiệu quả diệt trừ H. pylori
của phác đồ bộ ba dùng các PPI liều cao so với liều chuẩn 51
Hình 3.5: Biểu đồ forest- Phân tích PP so sánh hiệu quả diệt trừ H. pylori của
phác đồ bộ ba dùng liều cao các PPI so với liều chuẩn 52
Hình 3.6: Biểu đồ funnel- Phân tích PP so sánh hiệu quả diệt trừ H. pylori của
phác đồ bộ ba dùng các PPI liều cao so với liều chuẩn 53
Hình 3.7: Biểu đồ forest của các phân tích ITT so sánh hiệu quả điều trị H.
pylori của phác đồ bộ ba dùng liều cao so với liều chuẩn các PPI ở hai thế hệ
khác nhau 54

Hình 3.8: Biểu đồ funnel của các phân tích ITT so sánh hiệu quả điều trị H.
pylori của phác đồ bộ ba dùng liều cao so với liều chuẩn các PPI ở hai thế hệ
khác nhau 54
Hình 3.9: Biểu đồ forest của các phân tích ITT so sánh hiệu quả điều trị H.
pylori của phác đồ bộ ba dùng liều cao so với liều chuẩn các PPI trong cùng
một thế hệ 55
Hình 3.10: Biểu đồ funnel của các phân tích ITT so sánh hiệu quả điều trị H.
pylori của phác đồ bộ ba dùng liều cao so với liều chuẩn các PPI trong cùng
một thế hệ 56


Hình 3.11: Biểu đồ forest của các phân tích ITT so sánh hiệu quả điều trị H.
pylori của phác đồ bộ ba dùng liều cao các PPI so với liều chuẩn ở các nghiên
cứu có chất lượng cao hơn 57
Hình 3.12: Biểu đồ funnel của các phân tích ITT so sánh hiệu quả điều trị H.
pylori của phác đồ bộ ba dùng liều cao các PPI so với liều chuẩn ở các nghiên
cứu có chất lượng cao hơn 57
Hình 3.13: Biểu đồ forest biểu diễn tác dụng phụ gặp phải giữa phác đồ bộ ba
dùng liều cao các PPI so với liều chuẩn 58
1

ĐẶT VẤN ĐỀ
Nhiều công trình nghiên cứu trên thế giới cho thấy có hơn 80% các
trường hợp loét dạ dày và 95% các trường hợp loét tá tràng có sự hiện diện
của Helicobacter pylori (H. pylori) nơi ổ loét [63]. Bên cạnh đó, kể từ năm
1994, căn cứ vào kết quả trên những nghiên cứu dịch tễ học, Tổ chức Y tế thế
giới (WHO) đã xếp H. pylori vào nhóm số một các yếu tố nguy cơ gây ung
thư dạ dày [59]. Chính vì vậy việc điều trị triệt để H. pylori trong viêm loét dạ
dày-tá tràng vẫn là vấn đề có tính thời sự.
Các phác đồ bộ ba kinh điển phối hợp một thuốc ức chế bơm proton

(PPI) và hai kháng sinh đã được nhiều hội đồng đồng thuận đề xuất là lựa
chọn hàng đầu trong điều trị H. pylori [67], [52]. Phác đồ này đã từng đem lại
hiệu quả điều trị rất cao. Nghiên cứu của Lind và cộng sự cho thấy, sử dụng
phác đồ bộ ba gồm omeprazol kết hợp với amoxicillin và clarithromycin cho
tỉ lệ diệt trừ H. pylori theo đề cương nghiên cứu (PP) và dự định điều trị (ITT)
đạt tới 95% và 94%; và khi sử dụng phác đồ bộ ba gồm omeprazol kết hợp
với clarithromycin và metronidazol thì tỉ lệ diệt trừ H. pylori theo đề cương
nghiên cứu và dự định điều trị cũng rất cao (tương ứng là 91% và 87%) [65].
Tuy nhiên, hiệu quả điều trị H. pylori bằng phác đồ bộ ba kinh điển
ngày càng giảm [37]. Các báo cáo cho thấy tỉ lệ diệt trừ H. pylori trong nhiều
thử nghiệm thấp hơn 75% và thậm chí có một số trường hợp tỉ lệ này còn
dưới 50% [24], [41], [89].
Tình trạng kháng kháng sinh được cho là nguyên nhân chính dẫn đến
thất bại điều trị H. pylori của các phác đồ bộ ba kinh điển. Ở nhiều nước, tình
trạng kháng thuốc, đặc biệt là đối với clarithromycin đã lên đến mức báo động
khiến việc điều trị bằng phác đồ bộ ba đến nay không còn phù hợp [75].
Theo quan điểm hiện nay, khi thất bại trong điều trị lần đầu với các
phác đồ bộ ba, có thể kéo dài thời gian điều trị của các phác đồ này từ 7 ngày
lên 14 ngày [68]. Tuy nhiên phương pháp này chỉ thu được những thành công
2

hạn chế, chi phí điều trị tốn kém cho các bệnh nhân cũng là vấn đề cần phải
cân nhắc [14].
Hiện nay, thuốc ức chế tiết acid được xem là chìa khóa đối với phác đồ
diệt H. pylori. Nhiều nghiên cứu cho thấy khả năng tiêu diệt vi khuẩn H.
pylori của các phác đồ điều trị có liên quan chặt chẽ với pH dạ dày mà ở đó
pH dạ dày tăng sẽ làm tăng tỉ lệ diệt H. pylori [65], [94].
Câu hỏi đặt ra là liệu việc sử dụng PPI liều cao trong các phác đồ bộ ba
kinh điển có thực sự đem lại hiệu quả trong điều trị tiêu diệt H. pylori hay
không? Do đó, chúng tôi tiến hành “Tổng quan hệ thống và phân tích gộp

về hiệu quả điều trị Helicobacter pylori của phác đồ bộ ba dùng các thuốc
ức chế bơm proton liều cao so với liều chuẩn” với mục tiêu:
- Tổng quan hệ thống về hiệu quả diệt trừ Helicobacter pylori của phác đồ
bộ ba dùng các thuốc ức chế bơm proton liều cao.
- Phân tích gộp về hiệu quả diệt trừ Helicobacter pylori của phác đồ bộ ba
dùng các thuốc ức chế bơm proton liều cao so với liều chuẩn.













3

Chƣơng 1: TỔNG QUAN
1.1. Tổng quan hệ thống
1.1.1. Khái niệm
Tổng quan hệ thống là quá trình tìm kiếm, tập hợp, đánh giá và đối
chiếu tất cả các bằng chứng thực tế phù hợp với tiêu chuẩn lựa chọn đã được
định trước để trả lời một câu hỏi nghiên cứu cụ thể. Tổng quan hệ thống sử
dụng các phương pháp rõ ràng, có hệ thống đã được lựa chọn sẵn để hạn chế
sai lệch, từ đó có thể đưa ra bằng chứng đáng tin cậy cho các quyết định hoặc
các kết luận.

Những đặc tính chủ yếu của tổng quan hệ thống bao gồm:
- Một mục tiêu rõ ràng với các tiêu chuẩn lựa chọn nghiên cứu được cụ
thể hóa trước.
- Một phương pháp rõ ràng có thể lặp lại được.
- Tìm kiếm tài liệu một cách hệ thống, cố gắng xác định tất cả những
nghiên cứu đáp ứng tiêu chuẩn lựa chọn.
- Đánh giá độ tin cậy của các nghiên cứu lựa chọn (ví dụ: đánh giá
thiên vị xuất bản) đồng thời tổng hợp, trình bày đặc điểm và kết quả của các
nghiên cứu lựa chọn theo cách có hệ thống [48].
1.1.2. Quy trình của tổng quan hệ thống
Tổng quan hệ thống được tiến hành theo 5 bước cơ bản sau [61]:
Bước 1: Thiết lập câu hỏi nghiên cứu
Vấn đề cần giải quyết trong tổng quan hệ thống thường được cụ thể hóa
bằng câu hỏi rõ ràng trước khi tiến hành tổng quan. Câu hỏi nghiên cứu có thể
được diễn đạt dưới dạng một câu hỏi tự do hoặc được các nhà nghiên cứu cụ
thể hóa dưới dạng cấu trúc PICOS (Population- Quần thể nghiên cứu,
Intervention- Yếu tố can thiệp, Control: Đối chứng, Outcome: Tiêu chí đầu ra
và Study design: Thiết kế nghiên cứu). Tuy nhiên, không phải vấn đề nghiên
4

cứu nào cũng được định sẵn đầy đủ các yếu tố theo cấu trúc. Câu hỏi nghiên
cứu giúp xác định rõ ràng mục tiêu nghiên cứu.
Bước 2: Tìm kiếm và lựa chọn các nghiên cứu liên quan
Các nhà nghiên cứu tiến hành tìm kiếm các nghiên cứu dựa trên nhiều
nguồn, bao gồm cả nguồn thông tin điện tử và bản in, không giới hạn ngôn
ngữ với mục đích tìm được tất cả các bằng chứng có liên quan. Tiêu chuẩn
lựa chọn xuất phát trực tiếp từ câu hỏi nghiên cứu và được cụ thể hóa, lý do
lựa chọn và loại trừ được ghi chép lại.
Bước 3: Đánh giá chất lượng nghiên cứu
Đánh giá chất lượng các nghiên cứu có liên quan mật thiết với các bước

khác của tổng quan và đóng vai trò hết sức quan trọng. Lựa chọn nghiên cứu,
đánh giá mức độ đồng nhất của các nghiên cứu để tiến hành phân tích gộp,
hay đánh giá độ mạnh của kết luận cuối cùng phụ thuộc rất lớn vào các bước
đánh giá này.
Bước 4: Tóm tắt và tổng hợp kết quả
Ở bước này, các nhà nghiên cứu tổng hợp dữ liệu từ các nghiên cứu,
khảo sát sự khác biệt giữa các nghiên cứu và nếu có thể, tiến hành gộp các
nghiên cứu lại trong phân tích gộp (meta-analysis). Phân tích gộp là một phần
không bắt buộc phải có trong tổng quan hệ thống. Trong trường hợp có sự
khác biệt quá lớn giữa các nghiên cứu thì không thể gộp chung các nghiên
cứu với nhau được. Do đó, có nhiều nghiên cứu chỉ báo cáo tổng quan hệ
thống mà không tiến hành phân tích gộp.
Bước 5: Phiên giải những phát hiện của nghiên cứu
Đây là bước cuối cùng trong tổng quan hệ thống. Bước này giúp phiên
giải ý nghĩa và đưa ra kết luận của tổng quan. Các nhà nghiên cứu cần xem
xét tất cả các nguy cơ sai số liên quan (ví dụ: thiên vị xuất bản).
Đánh giá độ dị biệt giữa các nghiên cứu giúp quyết định thông tin tổng
hợp có đáng tin cậy không? Nếu không, sử dụng bằng chứng được ghi nhận
5

từ những nghiên cứu chất lượng cao để đưa ra kết luận. Bất kỳ khuyến cáo
nào được đưa ra cũng nên tính điểm độ mạnh bằng chứng.
1.2. Phân tích gộp (meta-analysis)
1.2.1. Tại sao phải tiến hành phân tích gộp?
Trong các nghiên cứu y sinh hiện nay, câu hỏi luôn được quan tâm là
liệu kết quả nghiên cứu liệu có thể hiện được một sự khác biệt có ý nghĩa hay
không? Với các kiến thức thống kê hiện nay, chúng ta thường nhận định kết
quả của mỗi nghiên cứu đơn lẻ dựa vào giá trị p hoặc dựa vào khoảng tin cậy
95% (với giả định sai số loại I- type I error, là 0,05). Thông thường, các nhà
nghiên cứu hiểu rằng một kết quả không cho thấy sự khác biệt ―có ý nghĩa

thống kê‖ hoặc sự khác biệt có ý nghĩa lâm sàng khi so sánh với phương pháp
chuẩn sẽ là một kết quả mang tính ―âm tính‖ (ví dụ như phương pháp điều trị
không có tác dụng).
Trong nghiên cứu khoa học nói chung và nghiên cứu y sinh nói riêng,
các nghiên cứu trên cùng một lĩnh vực có thể kết quả ―dương tính‖ (positive
result) trong khi một số nghiên cứu tương tự khác lại cho kết quả ―âm tính‖
hoặc thậm chí là có kết quả ngược hẳn. Các nhà nghiên cứu thường coi các
kết quả này là mâu thuẫn nhau. Tuy nhiên, sự mâu thuẫn trong các kết quả
nghiên cứu có thể do nhiều yếu tố khác nhau. Thứ nhất, kết quả trong các
nghiên cứu đó thực sự khác nhau do sự khác biệt về đối tượng nghiên cứu,
phương pháp nghiên cứu hoặc chất lượng nghiên cứu. Thứ hai, một kết quả
cho thấy sự khác biệt có ý nghĩa thống kê hay không lại còn phụ thuộc vào cỡ
mẫu trong nghiên cứu. Do đó, 1 kết quả ―âm tính‖ về mặt ý nghĩa thống kê
không có nghĩa là giả thiết nghiên cứu sai mà đó có thể là tín hiệu cho thấy cỡ
mẫu chưa đủ hiệu lực thống kê để đi đến một kết luận đáng tin cậy [3]. Nói
cách khác, kết quả của nghiên cứu có thể được rút ra từ suy luận thống kê bị
mắc sai số loại II (type II error).
6

Việc lấy cỡ mẫu khác nhau có thể làm cho sai số ước lượng kết quả
điều trị rất khác nhau mặc dù các nghiên cứu tiến hành phương pháp như
nhau trong các quần thể giống nhau. Nhiều nghiên cứu, nhất là các nghiên
cứu mang tính thăm dò, có số lượng bệnh nhân không đủ để phát hiện sự khác
biệt giữa hai phương pháp điều trị. Vì vậy, việc căn cứ vào một nghiên cứu
đơn lẻ có thể không phát hiện được sự khác biệt tuy ―khiêm tốn‖ nhưng vẫn
đủ quan trọng, hay nói cách khác là vẫn có ý nghĩa lâm sàng, giữa hai phương
pháp điều trị. Việc áp dụng phân tích gộp vào tìm kiếm câu trả lời cho một
câu hỏi từ lâm sàng sẽ là sự thay thế hấp dẫn cho các nghiên cứu đơn lẻ trong
các trường hợp giả thiết thống kê đòi hỏi cỡ mẫu lớn. Số lượng bệnh nhân đạt
được trong phân tích gộp có thể đủ lớn để phát hiện những khác biệt ―khiêm

tốn‖ này một cách đáng tin cậy [11].
1.2.2. Khái niệm phân tích gộp
Glass đưa ra khái niệm phân tích gộp lần đầu tiên vào năm 1976. Phân
tích gộp là một phân tích thống kê nhằm kết hợp kết quả của nhiều nghiên
cứu riêng lẻ được tiến hành trước đó [38].
Phân tích gộp đóng góp vào nhiều khía cạnh của nghiên cứu lâm sàng
đặc biệt là tăng hiệu lực thống kê của một nghiên cứu so sánh, cải thiện ước
đoán về hiệu quả của phương pháp điều trị, kết hợp kết quả trái ngược của các
nghiên cứu khác nhau, trả lời cho câu hỏi nghiên cứu mới, thực hiện các phân
tích dưới nhóm, phân tích xu hướng, xác định những lĩnh vực tiềm năng cho
các nghiên cứu khác trong tương lai, v.v…[64].
1.2.3. Các bước tiến hành phân tích gộp
Phân tích gộp là một phần không bắt buộc của tổng quan hệ thống (có
thể được thực hiện ở bước 4 của tổng quan hệ thống).
Một số điều cần lưu ý khi tiến hành phân tích gộp, bao gồm [64]:
* Xác định các tiêu chí
7

Đây là bước rất quan trọng của phân tích gộp. Cần phải xác định một
tiêu chí chính được rút ra từ tất cả các nghiên cứu lựa chọn (ví dụ: tỉ lệ tử
vong, hiệu quả của một phương pháp điều trị). Sau đó xác định một hoặc
nhiều tiêu chí phụ để trả lời cho những câu hỏi cụ thể mà không cần thiết phải
chiết ra từ tất cả các nghiên cứu (ví dụ: tác dụng phụ).
* Lựa chọn các nghiên cứu
Trong bước này, cần phải tìm kiếm nghiên cứu với số lượng lớn nhất
có thể. Xác định chiến lược tìm kiếm: tìm kiếm thử nghiệm ở đâu và như thế
nào? Để việc tìm kiếm có hiệu quả, điều quan trọng là phải xác định từ khóa
chính xác.
Khi quá trình tìm kiếm đã hoàn thành, nên kiểm tra lại các tài liệu tham
khảo trích dẫn trong mỗi bài báo và bắt đầu các tìm kiếm mới dựa trên cơ sở

này. Nên có hai người khác nhau cùng tiến hành tìm kiếm. Tất cả các quá
trình tiến hành phải được mô tả chi tiết vì nó chính là một phần cơ bản của
phương pháp nghiên cứu.
* Thu thập thông tin từ các nghiên cứu
Đọc cẩn thận tất cả các bài báo. Các thông tin sau đây nên được chiết
xuất từ các bài báo:
- Thông tin chung: Bao gồm thông tin về tên tác giả đầu tiên, năm, tên
tạp chí và loại ấn phẩm.
- Thiết kế thử nghiệm lâm sàng: Bao gồm các thông tin về thiết kế (ví
dụ: mù đôi, thử nghiệm mở, ngẫu nhiên, quá trình theo dõi và tất cả các đặc
tính khác của nghiên cứu). Việc thu thập thông tin này cần phải được tiến
hành cẩn thận và chính xác bởi vì thông thường sự khác biệt trong thiết kế
nghiên cứu có thể gây ra các kết quả khác biệt.
- Thông tin về phác đồ của nhóm nghiên cứu và nhóm chứng (ví dụ
nhóm dùng thuốc và nhóm dùng giả dược hoặc nhóm dùng thuốc mới và
nhóm dùng thuốc cũ); thông tin về liều dùng và thời gian điều trị.
8

- Số bệnh nhân gặp biến cố, số bệnh nhân gặp tác dụng phụ ở hai nhóm,
và các kết quả khác chính là cơ sở của tính toán trong phân tích gộp. Cần thu
thập thông tin về số lượng bệnh nhân ngừng điều trị để tiến hành cả phân tích
theo dự định điều trị (ITT) và phân tích theo đề cương nghiên cứu (PP).
* Đánh giá chất lượng các nghiên cứu
Các nghiên cứu cần phải được đánh giá chất lượng trước khi tiến hành
phân tích gộp. Việc đánh giá chất lượng nghiên cứu có thể dựa vào 1 vài
―marker‖ để tính điểm, ví dụ như: mù đôi (2 điểm), mù đơn (1 điểm),
v.v…Tuy nhiên, các đề xuất đánh giá chất lượng nghiên cứu rất khác nhau tùy
thuộc vào từng tác giả, mỗi đề xuất có những ưu điểm riêng vì thế không có
một đề xuất đánh giá tiêu chuẩn sẵn có nào.
* Xử lý số liệu

Phân tích gộp là một phương pháp tổng hợp kết quả của nhiều thử
nghiệm khác nhau. Có 2 mô hình để tiến hành phân tích gộp đó là mô hình
ảnh hưởng cố định (fixed effect model) và mô hình ảnh hưởng biến thiên
(random effect model). Hai mô hình này sẽ được trình bày cụ thể ở phần sau.
* Phiên giải các kết quả
Việc phiên giải kết quả phân tích gộp bao gồm: Đánh giá kết quả thu
được, các nguyên nhân gây ra độ dị biệt, đánh giá tính ổn định của kết quả
(kết quả liệu có thay đổi không khi thêm vào các nghiên cứu mới), v.v…
1.2.4. Một số khái niệm trong phân tích gộp
* Mức độ ảnh hưởng (ES: effect size)
Mức độ ảnh hưởng là phép đo độ lớn và xu hướng của mối liên hệ giữa
các biến. Có 3 loại mức độ ảnh hưởng, bao gồm tỉ lệ, giá trị trung bình và hệ
số tương quan. Việc sử dụng loại mức độ ảnh hưởng nào phụ thuộc vào mục
đích, thiết kế nghiên cứu và loại dữ liệu. Chẳng hạn, các nghiên cứu trong đó
kết quả phản ánh sự khác biệt giữa trước và sau khi điều trị hoặc giữa nhóm
9

được và không được điều trị thường dùng tỉ lệ hoặc giá trị trung bình. Sự khác
biệt được đo lường bằng biến số liên tục thường được biểu diễn thông qua giá
trị trung bình. Nếu sự khác biệt được đo lường thông qua các biến nhị phân
thì các chỉ số được sử dụng thường là tỉ số Odds (OR, odds ratio) hoặc nguy
cơ tương đối (RR, relative risk). Các nghiên cứu tìm hiểu mối quan hệ giữa
các biến số thì đánh giá hệ số tương quan.
Trong phạm vi đề tài này chúng tôi chỉ đề cập đến mức độ ảnh hưởng
áp dụng cho các biến số nhị phân mà phổ biến nhất là chỉ số RR và OR. Có
thể nói rằng biến số nhị phân là một loại biến số phổ biến nhất trong các
nghiên cứu y sinh. Các biến nhị phân được dùng để chỉ sự có mặt hoặc vắng
mặt của một đặc tính hoặc biến cố nào đó [66]. Ví dụ: dùng thuốc (nhận hai
giá trị là có dùng thuốc-không dùng thuốc), tác dụng (nhận hai giá trị là có tác
dụng- không có tác dụng), v.v….

* Tỉ số nguy cơ tương đối (RR) và tỉ số odds (OR)
Trong các y văn, hai chỉ số để đánh giá mức độ ảnh hưởng phổ biến
nhất đối với dữ liệu nhị phân là: tỉ số odds (odds ratio- viết tắt là OR) và nguy
cơ tương đối (risk ratio hay relative risk- viết tắt là RR). OR và RR được tính
toán như sau:
Giả sử có một nghiên cứu ngẫu nhiên được tiến hành trên hai nhóm với
n
1
là số bệnh nhân ở nhóm điều trị (nhóm 1) và n
2
là số bệnh nhân ở nhóm
chứng (nhóm 2). Sau khi kết thúc quá trình nghiên cứu, nếu nhóm 1 có a bệnh
nhân gặp biến cố (tức là sẽ có n
1
-a bệnh nhân không gặp biến cố) và nhóm 2
có b bệnh nhân gặp biến cố (tức là sẽ có n
2
-b bệnh nhân không gặp biến cố)
thì khi đó:
RR=
a/n
1

OR=
a/(n
1
- a)
b/n
2
b/(n

2
-b)
Khi sử dụng hai chỉ số này người ta chuyển sang thang logarit, sau khi
tính toán xong sẽ chuyển sang thang tỉ lệ để báo cáo kết quả.
10

Về cơ bản, OR và RR đều so sánh khả năng gặp biến cố ở nhóm này so
với nhóm kia. Tuy nhiên, hai chỉ số này khác nhau về mặt thống kê. Sự khác
biệt giữa OR và RR là nhỏ khi biến cố ít gặp và lớn hơn khi biến cố phổ biến
hơn. Các nghiên cứu bệnh chứng chỉ có thể cung cấp OR, còn các nghiên cứu
cắt ngang, nghiên cứu thuần tập hoặc các thử nghiệm lâm sàng có đối chứng
thì có thể cung cấp cả OR và RR. RR là chỉ số có ý nghĩa và dễ diễn dịch
nhưng RR lại không có tính nhất quán như OR [3], [66] .
* Phân tích theo dự định điều trị và phân tích theo đề cương nghiên cứu
Mặc dù kết quả từ các nghiên cứu quan sát (observational studies) cũng
có thể được đưa vào phân tích gộp, nhưng để đảm bảo sự thống nhất của các
số liệu thì các thử nghiệm lâm sàng ngẫu nhiên có đối chứng (randomized
controlled trials, RCT) thường là đối tượng được ưu tiên lựa chọn. Trong các
thử nghiệm lâm sàng ngẫu nhiên có đối chứng có hai loại phân tích số liệu
phổ biến nhất hay sử dụng bao gồm phân tích theo dự định điều trị (phân tích
ITT: Intention to treat analysis) và phân tích theo đề cương nghiên cứu (phân
tích PP: Per-protocol analysis)
- Phân tích theo dự định điều trị (phân tích ITT): là phân tích bao
gồm tất cả các bệnh nhân đã được tham gia quá trình ngẫu nhiên hóa vào các
nhóm điều trị, không quan tâm tiêu chuẩn lựa chọn, phác đồ điều trị, không
loại trừ những bệnh nhân ngừng điều trị hoặc không tuân thủ đề cương nghiên
cứu hay bất cứ trường hợp nào xảy ra sau quá trình phân nhóm ngẫu nhiên.
Phương pháp phân tích theo dự định điều trị có 1 số ưu điểm sau:
+ Phản ánh thực tế lâm sàng vì nó thừa nhận các trường hợp ngừng
điều trị hoặc không tuân thủ đề cương nghiên cứu.

+ Duy trì cân bằng tiên lượng phát sinh từ phân bổ điều trị ngẫu nhiên
ban đầu. Bởi nếu như các trường hợp ngừng điều trị hoặc không tuân thủ đề
cương bị loại ra khỏi phân tích cuối cùng thì nó có thể tạo ra những khác biệt
11

tiên lượng quan trọng giữa các nhóm nghiên cứu. Hơn nữa, các trường hợp
ngừng điều trị hoặc không tuân thủ có thể là do đáp ứng với phác đồ điều trị.
+ Đảm bảo cỡ mẫu nghiên cứu bởi vì nếu như các trường hợp không
tuân thủ hoặc ngừng điều trị bị loại khỏi phân tích cuối cùng, cỡ mẫu nghiên
cứu sẽ bị giảm do đó làm giảm hiệu lực thống kê.
+ Hạn chế những suy luận căn cứ vào phân nhóm bệnh nhân và nhấn
mạnh vào những suy luận dựa trên toàn bộ bệnh nhân tham gia nghiên cứu.
Ngoài ra, nó cũng giảm thiểu tối đa sai sót loại I (dương tính giả) do cách tiếp
cận thận trọng và cho phép khả năng khái quát cao nhất của nghiên cứu.
Tuy nhiên, phương pháp phân tích này cũng có một số nhược điểm sau:
+ Nhìn chung, ước tính hiệu quả điều trị thường giảm do phân tích tính
cả các trường hợp không tuân thủ điều trị.
+ Xuất hiện sự bất đồng nhất trong phân tích cuối cùng bởi nó bao gồm
cả trường hợp tuân thủ điều trị và các trường hợp không tuân thủ hoặc ngừng
điều trị.
+ Dữ liệu kết thúc có sự khác biệt đáng kể giữa các trường hợp tuân thủ
điều trị, không tuân thủ điều trị hoặc ngừng điều trị, và sẽ rất khó giải thích
kết quả nếu như phần lớn các thành phần trên lại nằm trên các nhánh điều trị
trái ngược.
+ Có thể mắc sai sót loại II (âm tính giả) do cách tiếp cận quá thận
trọng [43].
- Phân tích theo đề cƣơng nghiên cứu (phân tích PP): là phân tích
loại trừ các trường hợp không tuân thủ đề cương nghiên cứu bao gồm các
trường hợp không tuân thủ điều trị, chuyển nhóm hoặc không có kết quả điều
trị. Nhược điểm của phương pháp này là tạo ra sai lệch do loại trừ bệnh nhân

khỏi phân tích cuối cùng. Do đó, phân tích ITT cần được cân nhắc là phân
tích lý tưởng ban đầu và có thể được bổ sung bằng phân tích thứ cấp PP [43],
[46].
12

1.2.5. Thiên vị xuất bản
Thiên vị xuất bản là một mối đe dọa tiềm ẩn đối với kết quả của phân
tích gộp và cần được xem xét một cách cẩn thận trong việc phân tích và giải
thích kết quả.
Thiên vị xuất bản xảy ra làm cho kết quả phân tích gộp không phải là
đại diện kết quả của tất cả các nghiên cứu đã hoàn thành. Thông thường, chỉ
các nghiên cứu có sự khác biệt có ý nghĩa mới được công bố hoặc xuất bản.
Điều này có nghĩa là, một vài nghiên cứu đã hoàn thành nhưng không được
xuất bản và bởi vậy nó không được đưa vào phân tích gộp. Các nghiên cứu
này có thể cho kết quả trái ngược so với các nghiên cứu đã được xuất bản. Do
đó, ước tính của một phân tích gộp có khả năng thiếu khách quan vì chưa xem
xét đầy đủ đến các nghiên cứu chưa bao giờ được công bố.
Có 3 nguyên nhân gây ra thiên vị xuất bản bao gồm: tác giả, nhà tài trợ
của các thử nghiệm, và chính sách biên tập của các tạp chí. Cả tác giả và ban
biên tập của các tạp chí thường ít quan tâm đến việc xuất bản một bài báo với
kết quả âm tính. Còn các nhà tài trợ của nghiên cứu thường không hài lòng
với kết quả mà không xác nhận tính hiệu quả của can thiệp hoặc một loại
thuốc mới.
Có một số cách để đánh giá thiên vị xuất bản, bởi vì ảnh hưởng của
thiên vị xuất bản không thể loại bỏ được. Trong phạm vi đề tài này, chúng tôi
xin được đề cập đến phương pháp phổ biến nhất hiện nay để đánh giá thiên vị
xuất bản đó là biểu đồ phễu (funnel plot) [3], [64], [66].
Biểu đồ funnel là biểu đồ phân tán đơn giản biểu thị các ảnh hưởng
điều trị từ các nghiên cứu riêng lẻ so với cỡ mẫu nghiên cứu. Độ chính xác
của ảnh hưởng điều trị sẽ tăng lên khi cỡ mẫu của các nghiên cứu thành phần

tăng. Do đó, các nghiên cứu cỡ mẫu nhỏ sẽ phân tán rộng ở phần đáy biểu đồ
còn những nghiên cứu có cỡ mẫu lớn hơn (có độ chính xác cao hơn) sẽ nằm ở
phía đỉnh của biểu đồ.
13

Khi không có thiên vị, biểu đồ sẽ có dạng phễu ngược và đối xứng
(xem hình 1.1- trái). Sự dao động của các điểm quanh đường trung bình phản
ánh sự dao động ngẫu nhiên giữa các nghiên cứu do sai số chọn mẫu. Thiên vị
xuất bản sẽ gây ra sự mất cân đối của biểu đồ, bởi vì những nghiên cứu với
ảnh hưởng theo hướng mong muốn sẽ có sẵn còn những nghiên cứu cho kết
quả âm tính hoặc trái ngược sẽ bị thiếu. Khi đó sẽ tạo ra một không gian hổng
trên biểu đồ (xem hình 1.1- phải) [66],[92].
Biểu đồ funnel bao gồm hai trục X và Y. Trong đó, trục X (trục hoành)
có thể biểu thị mức độ ảnh hưởng, tỉ số nguy cơ (RR), tỉ số odd (OR), hoặc sự
khác biệt nguy cơ (RD: Risk difference), còn trục Y (trục tung) có thể biểu thị
cỡ mẫu thử nghiệm, độ chính xác (nghịch đảo của sai số chuẩn 1/SE) hoặc
phương sai, v.v… [64].


Hình 1.1: Thiên vị xuất bản trong biểu đồ funnel
Chú thích: Hình trái: Không có thiên vị xuất bản; Hình phải: Có thiên vị xuất
bản. Các vòng tròn màu trắng biểu diễn các nghiên cứu có kết quả “âm tính”
1.2.6. Độ dị biệt giữa các nghiên cứu
Tổng quan hệ thống và phân tích gộp có thể cung cấp những bằng
chứng thuyết phục và tin cậy liên quan đến nhiều khía cạnh của y học và
chăm sóc sức khỏe. Kết luận của phân tích gộp thường rất rõ ràng khi kết quả
của các nghiên cứu thành phần chỉ ra các ảnh hưởng lâm sàng quan trọng
14

tương tự nhau. Tuy nhiên, khi các nghiên cứu thành phần cho kết quả khác

nhau thì việc kết luận lại không rõ ràng. Do đó, trong phân tích gộp thường có
kiểm định thống kê về độ dị biệt (tính bất đồng nhất) giữa các nghiên cứu.
Đây là kiểm định rất quan trọng, bởi vì nếu chúng ta không xác định mức độ
đồng nhất giữa các nghiên cứu thì chúng ta khó có thể khái quát hóa được kết
quả của phân tích gộp [47].
Về cơ bản, có hai loại khác biệt gây nên sự bất đồng nhất giữa các
nghiên cứu trong phân tích gộp. Một là sự khác biệt do sai số chọn mẫu
(sampling error), hay còn gọi là khác biệt bên trong nghiên cứu (within-study
variability). Do không có nghiên cứu nào tiến hành trên cả quần thể nghiên
cứu nên luôn luôn tồn tại sự khác biệt do sai số chọn mẫu. Hai là khác biệt
giữa các nghiên cứu (between studies variability), hay còn gọi là khác biệt
thực sự (true heterogeneity). Khác biệt này gây ra bởi một số đặc tính khác
nhau giữa các nghiên cứu như khác biệt trong điều trị, khác biệt trong chất
lượng thiết kế nghiên cứu, khác biệt trong các đặc tính của mẫu, v.v…. Khi
nói về độ dị biệt giữa các nghiên cứu chính là nói đến sự khác biệt thực sự
giữa các nghiên cứu.
Đánh giá độ dị biệt giữa các nghiên cứu là rất quan trọng bởi vì nó giúp
định hướng việc lựa chọn mô hình trong phân tích gộp. Nếu như kết quả giữa
các nghiên cứu có xu hướng chỉ khác nhau do sai số chọn mẫu (trường hợp
này các nghiên cứu được coi là đồng nhất) thì sử dụng mô hình ảnh hưởng cố
định để phân tích dữ liệu. Ngược lại, nếu kết quả giữa các nghiên cứu khác
nhau do nguyên nhân khác ngoài sai số mẫu (trường hợp này các nghiên cứu
được coi là bất đồng nhất) thì nên sử dụng mô hình ảnh hưởng biến thiên để
phân tích dữ liệu [56].
Có một vài cách kiểm định độ dị biệt giữa các nghiên cứu:
- Chỉ số Q: Dùng để xác định có hay không sự bất đồng nhất giữa các
nghiên cứu. Với giả thiết vô hiệu cho rằng tất cả các nghiên cứu có cùng mức
15

độ ảnh hưởng (các nghiên cứu đồng nhất), Q có độ phân phối tuân theo luật


2
(Chi-square) với k-1 là bậc tự do trong đó k là số nghiên cứu. Nhược điểm
của chỉ số Q là hiệu lực thống kê thấp khi phân tích gộp có ít các nghiên cứu
thành phần đồng thời chỉ số Q không cho biết mức độ khác biệt thực sự giữa
các nghiên cứu mà chỉ cho biết sự bất đồng nhất giữa các nghiên cứu ―có ý
nghĩa thống kê‖ mà thôi.
Giá trị p của kiểm định cho biết sự khác biệt giữa các nghiên cứu có ý
nghĩa thống kê hay không. Thông thường, phân tích gộp thường có ít các
nghiên cứu thành phần nên hiệu lực thống kê của kiểm định này thấp. Do đó
việc lựa chọn giá trị ngưỡng cho chỉ số p có ý nghĩa quan trọng. Giá trị
ngưỡng lựa chọn cho p có thể là 10% thay vì 5% tức là khi p < 0,1 thì coi là
có sự khác biệt giữa các nghiên cứu trong phân tích gộp [3],[47], [56].
- Chỉ số I
2
: Chỉ số này khắc phục được nhược điểm của chỉ số Q, nó
không phụ thuộc vào số lượng nghiên cứu trong phân tích gộp. I
2
không chỉ
cho biết có hay không sự bất đồng nhất mà còn chỉ ra mức độ bất đồng nhất
giữa các nghiên cứu. I
2
có giá trị từ 0% đến 100% (nếu I
2
<0 thì coi như bằng
0). I
2
biểu thị phần trăm khác biệt thực sự giữa các nghiên cứu chứ không phải
khác biệt do sai số mẫu. Ví dụ, nếu phân tích gộp có I
2

=0% có nghĩa là tất cả
các khác biệt giữa các mức độ ảnh hưởng là do sai số mẫu bên trong các
nghiên cứu. Còn nếu I
2
=50% có thể phiên giải là một nửa khác biệt giữa các
ES là do tính bất đồng nhất giữa các nghiên cứu (khác biệt giữa các nghiên
cứu) gây ra. Theo một số tác giả thì chỉ số I
2
là 25%, 50% và 75% thì mức độ
khác biệt tương ứng là thấp, trung bình và cao [56], [66].
1.2.7. Mô hình ảnh hưởng cố định (fixed effect model) và mô hình ảnh
hưởng biến thiên (random effect model)
Mô hình ảnh hưởng cố định và mô hình ảnh hưởng biến thiên là hai
phương pháp chính để ước tính ảnh hưởng trung bình trong phân tích gộp.

×