Tải bản đầy đủ (.pdf) (36 trang)

Nghiên cứu y học ở Việt Nam: Đặc điểm, thiếu sót, và sai sót potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (353.92 KB, 36 trang )

Nghiên cứu y học ở Việt Nam: Đặc
điểm, thiếu sót, và sai sót
Nguyễn Văn Tuấn
Sự có mặt của y học Việt Nam trên trường quốc tế còn rất khiêm tốn, bởi
vì phần lớn các nghiên cứu y học ở Việt Nam được công bố trong các tạp
chí y học trong nước. Trong một phân tích tổng hợp gần đây của tác giả
Phạm Duy Hiển, trong thời gian 1995 đến 2004, trung bình hàng năm giới
nghiên cứu y khoa Việt Nam công bố khoảng 1000 bài báo y sinh học
trong các tập san y học trong và ngoài nước; trong số này chỉ có 5 bài
trong các tập san y học quốc tế [1]. Nói cách khác, chỉ có khoảng 0,5%
nghiên cứu y học từ Việt Nam có mặt trên các diễn đàn y học quốc tế. Con
số này còn rất khiêm tốn nếu so với các nước lân cận như Thái Lan hay
Mã Lai.
Có nhiều lí do tại sao các nghiên cứu chỉ công bố trên các tạp chí địa
phương, kể cả sự liên quan của nghiên cứu đối với tình hình và bối cảnh
Việt Nam, soạn thảo bằng tiếng Việt, hay không được chấp nhận cho công
bố trên các tập san quốc tế. Nhưng hoạt động khoa học là một lĩnh vực phi
biên giới, cho nên dù là nghiên cứu từ Việt Nam, nhưng nếu các nghiên
cứu có chất lượng tốt (như ý tưởng mới hay phương pháp nghiên cứu
đúng tiêu chuẩn khoa học) thì các nghiên cứu đó vẫn có giá trị khoa học,
và vẫn có thể xuất hiện trong các tập san y học quốc tế. Do đó, vấn đề
chất lượng các nghiên cứu đã công bố trong các tạp chí y học ở Việt Nam
cần được đặt ra để tìm một hướng đi tích cực hơn.
Người viết bài này đã điểm qua một số bài báo khoa học xuất hiện trong
các tạp chí y học thuộc trường Đại học Y Hà Nội, Đại học Y Dược Thành
phố Hồ Chí Minh, Tạp chí Y học thực hành, Tạp chí Nghiên cứu Y học, và
Tạp chí Dược học. Các bài báo này được công bố trong khoảng thời gian
từ 2001 đến 2006. Trong mỗi số và mỗi tạp chí, tôi ngẫu nhiên chọn ra 3
bài ở mục “nghiên cứu y học” (hay tương tự). Tất cả có 56 bài được chọn,
và tôi đọc tất cả và ghi chú những điểm cần lưu ý về ý tưởng, phương
pháp và cách trình bày kết quả nghiên cứu.


Điểm qua các bài báo này, tôi thấy các nhiều nhà nghiên cứu trong nước
đã có những công trình nghiên cứu có ích với ý tưởng hay, có thể ứng
dụng vào việc chăm sóc bệnh nhân. Chẳng hạn như những công trình
nghiên cứu về HIV và so sánh phương pháp xét nghiệm sinh hóa (do các
nhà nghiên cứu thuộc Đại học Y Dược TPHCM tiến hành) hay nghiên cứu
về độ tuổi mãn kinh và các yếu tố liên quan đến mãn kinh (Đại học Y Hà
Nội) mà kết quả rất thú vị và có thể khai triển thêm thành một nghiên cứu
có ích cho bệnh nhân. Ngoài ra, còn có một số nghiên cứu mang tính phát
triển phương pháp xét nghiệm và chẩn đoán mới với kết quả rất đáng
khích lệ. Trong điều kiện hạn hẹp kinh phí và cơ sở vật chất mà các đồng
nghiệp trong nước đã tiến hành những nghiên cứu qui mô lớn và công phu
như thế quả là một nỗ lực đáng trân trọng. Tôi thiết nghĩ những công trình
như thế đáng lẽ phải có mặt trong các tập san y học uy tín trên thế giới,
nhưng rất tiếc điều đó chưa xảy ra.
Vấn đề đặt ra là tại sao các nghiên cứu như thế không có mặt trên các
diễn đàn y học quốc tế? Điểm qua các nghiên cứu này một cách cẩn thận,
tôi cho rằng nguyên nhân là do thiết kế nghiên cứu chưa được thỏa đáng
và chưa có hệ thống. Ngoài ra, còn có rất nhiều nghiên cứu với khá nhiều
thiếu sót và sai lầm, vì khiếm khuyết trong phương pháp nghiên cứu và do
đó chất lượng không mấy cao. Có khi những thiếu sót và sai lầm này rất
nghiêm trọng đến độ kết quả nghiên cứu rất khó diễn dịch, và có thể nói là
không có giá trị khoa học gì cả. Trong bài viết này, tôi sẽ nêu lên một số
thiếu sót phổ biến nhất và sẽ đưa ra một số đề nghị để nâng cao chất
lượng nghiên cứu y học ở trong nước.
Ý tưởng: thiếu cái mới
Giá trị một nghiên cứu y học có thể đánh giá qua bốn câu hỏi chính: tại
sao nghiên cứu (ý tưởng hay vấn đề nghiên cứu), đã làm gì (phương
pháp), phát hiện cái gì (kết quả), và kết quả đó có ý nghĩa gì (thảo luận về
kết quả). Về phần ý tưởng nghiên cứu, có thể nói ngắn gọn rằng gần như
tất cả các nghiên cứu xuất hiện trong các tập san y học trong nước xoay

quanh 4 chủ đề chính như sau:
 Nghiên cứu mô tả thuần túy ở một nhóm bệnh nhân hay quần thể,
như chỉ số sinh hóa ở bệnh nhân tai biến mạch máu não, chỉ số lipid
ở bệnh nhân cao huyết áp, tế bào lymphô và CD4 ở bệnh nhân
AIDS/HIV, mật độ xương ở đàn ông, v.v… Vì tính chất mô tả, cho
nên các nghiên cứu này chưa thể đào sâu và phân tích các vấn đề
bệnh lí, lâm sàng.
 Nghiên cứu tìm hiểu các yếu tố nguy cơ cũng chiếm một phần khá
lớn trong các nghiên cứu lâm sàng ở Việt Nam. Các nghiên cứu này
có mục tiêu chính là phát hiện các yếu tố có thể liên quan đến bệnh.
Một số nghiên cứu tiêu biểu như yếu tố miễn dịch ở bệnh nhân viêm
cầu thận, nguyên nhân của tình trạng thiếu máu ở trẻ em, mối liên
hệ giữa homocysteine và nhồi máu não, yếu tố dự đoán phù não tử
vong, v.v… Nhưng các nghiên cứu này đáng lẽ phải được tiến hành
theo thời gian (tức theo dõi đối tượng một thời gian để xác định các
yếu tố nguy cơ ban đầu và phát triển bệnh về sau), nhưng rất tiếc
các nghiên cứu ở Việt Nam chỉ giới hạn ở dạng “cắt ngang”, thành
ra, giá trị khoa học không cao; thậm chí, mục tiêu đề ra cũng không
đạt được. Một số nghiên cứu, tuy mục đích là tìm “nguyên nhân” của
bệnh, nhưng vì cách thiết kế, cho nên tác giả báo chỉ có thể kết luận
là “yếu tố nguy cơ” chứ không thể là “nguyên nhân” được.
 Nghiên cứu về chẩn đoán như tiêu chuẩn chẩn đoán ung thư phế
quản bằng cách sử dụng tế bào học, chẩn đoán màng não trẻ em
bằng kĩ thuật PCR, so sánh kết quả chẩn đoán, hay giá trị chẩn
đoán của siêu âm ở các bệnh nhân với sỏi đường mật. Đọc qua các
nghiên cứu này, tôi thấy rất nhiều tác giả hiểu không đúng (hoặc
quá đơn giản) về giá trị chẩn đoán, cho nên có những kết luận quá
lạc quan. Thật ra, phần lớn nghiên cứu đều khó mà ứng dụng trong
thực tế lâm sàng, bởi vì phương án nghiên cứu chỉ, một lần nữa,
dừng lại ở dạng “nghiên cứu cắt ngang”. Đáng lẽ ra, các nghiên cứu

này phải là những nghiên cứu theo thời gian (prospective study) để
kết quả có thể ứng dụng trong việc tiên đoán bệnh tật cho một cá
nhân.
 Nghiên cứu dược thảo thường tập trung vào các phân tích sinh hóa
và độc tính của một số dược thảo như độc tính của cây trâm bầu.
Các nghiên cứu này nói chung là khá đơn giản về kĩ thuật, và vì
cách mô tả nghiên cứu không rõ ràng nên rất khó đánh giá giá trị
khoa học của chúng.
Đại đa số các nghiên cứu trên cũng chỉ dừng lại ở mức độ đơn giản, chứ
chưa đi sâu vào lĩnh vực phân tích (analytical research). Phần lớn các
nghiên cứu chỉ giải quyết các vấn đề mang tính địa phương, những vấn đề
mang tính vi mô, chứ chưa nhằm trả lời những câu hỏi lớn của y học. Một
số lớn nghiên cứu mang tính [mà tiếng Anh hay gọi là] “me too”, tức là
nghiên cứu lặp lại ý tưởng của người khác, hoàn toàn không có một phát
kiến gì mới. (Xin nói thêm, đó chỉ là một nhận xét thực tế, chứ không phải
một phê phán).
Giá trị khoa học: dưới trung bình
Ngoài ý tưởng mới, giá trị khoa học của một nghiên cứu y học thường
được đánh giá qua phương pháp, nhất là phương pháp thiết kế và thu
thập dữ liệu. Theo y học thực chứng, có 7 loại thiết kế nghiên cứu chính
như sau (xếp theo thứ bậc giá trị khoa học từ thấp nhất đến cao nhất):
 Nghiên cứu cơ bản trên chuột và động vật cấp thấp trong phòng thí
nghiệm về một phân tử hay tác nhân cụ thể;
 Báo cáo lâm sàng (case reports) trong thực tế là những kinh nghiệm
điều trị về một hay vài trường hợp lâm sàng đặc biệt và hiếm thấy;
 Nghiên cứu đối chứng (case-control study) là những nghiên cứu
nhằm mục đích tìm hiểu mối liên hệ giữa một yếu tố nguy cơ và
bệnh tật bằng cách xem xét và so sánh sự phân phối một yếu tố
nguy cơ giữa nhóm bệnh nhân và nhóm không mắc bệnh (đối
chứng);

 Nghiên cứu tiêu biểu tại một thời điểm (cross-sectional study) là
những nghiên cứu cắt ngang, mà mục đích thường là ước tính tỉ lệ
hiện hành của bệnh (prevelance) và các yếu tố liên quan đến bệnh
trong một quần thể;
 Nghiên cứu theo thời gian (prospective / longitudinal study) là những
nghiên cứu theo dõi một nhóm đối tượng, kể cả bệnh nhân, một thời
gian nhằm ước tính tỉ lệ phát sinh của bệnh (incidence) và các yếu
tố liên quan đến bệnh trong một quần thể;
 Thử nghiệm lâm sàng đối chứng ngẫu nhiên (randomized controlled
clinical trial - RCT) là những thí nghiệm công phu hơn thường được
sử dụng trong việc thẩm định mức độ hiệu nghiệm của một thuật
điều trị lâm sàng trong một nhóm đối tượng cụ thể; và
 Phân tích tổng hợp (meta-analysis), như tên gọi, là những nghiên
cứu tổng hợp các kết quả nghiên cứu RCT, cross-section,
longitudinal và case-control để đi đến một kết luận chính xác và
đáng tin cậy hơn.
Đại đa số các nghiên cứu y học công bố trong các tạp chí y học ở Việt
Nam là những nghiên cứu đối chứng và nghiên cứu cắt ngang. Chưa thấy
một nghiên cứu cơ bản, RCT hay một phân tích tổng hợp nào trong các
tạp chí ở Việt Nam. Như vậy, các tạp chí y học ở trong nước chỉ công bố
những công trình nghiên cứu có giá trị khoa học thấp dưới trung bình.
Ngay cả những nghiên cứu đối chứng và nghiên cứu cắt ngang, các đối
tượng thường là bệnh nhân trong các bệnh viện, chứ không được tiến
hành trong một quần thể dân số được lấy mẫu một cách có hệ thống. Một
ví dụ tiêu biểu là nghiên cứu về mối liên hệ giữa homocysteine huyết
tương và chứng nhồi máu não được tiến hành bằng cách so sánh một
nhóm bệnh nhân nhồi máu não với một nhóm bệnh nhân ngoại trú. Vì
cách chọn đối tượng nghiên cứu từ bệnh viện (tức là những người đã có
nguy cơ bệnh cao) cho nên kết quả không mang tính khách quan cao, và
rất khó mà ứng dụng cho một quần thể lớn hơn.

Có một số nghiên cứu nhằm mục đích chẩn đoán bệnh, nhưng vì chủ yếu
là nghiên cứu cắt ngang hay nghiên cứu đối chứng (mà đối tượng thường
là bệnh nhân từ bệnh viện), cho nên kết quả rất khó diễn dịch, nếu không
muốn nói là chẳng áp dụng vào thực hành lâm sàng được. Tiêu biểu cho
nghiên cứu dạng này là một nghiên cứu thẩm định giá trị siêu âm trong
việc chẩn đoán sỏi đường mật, các nhà nghiên cứu chỉ xem xét các nhân
đã được giải phẫu mà không có nhóm đối chứng (không bệnh), cho nên
kết quả chẳng có ý nghĩa gì dù các tác giả kết luận rằng “Siêu âm là một
phương pháp hữu hiệu trong chẩn đoán sỏi đường mật chính nói chung
Sn=95,9%.” (Chú ý Sn là tỉ lệ dương tính thật). Nhưng tác giả “quên” đề
cập tỉ lệ âm tính thật, bởi vì tỉ lệ này không thể ước tính được!
Một số nghiên cứu nhằm mục đích phát triển chẩn đoán nhưng vì thiết kế
không phù hợp (như nghiên cứu cắt ngang, hay dựa vào bệnh nhân nội
trú), cho nên các kết quả và kết luận chẳng có ý nghĩa gì và chẳng đáp
ứng được mục đích đặt ra.
Một nghiên cứu có giá trị khoa học phải được thiết kế sao cho tuân thủ ba
nguyên tắc: ngẫu nhiên hóa (randomization), có nhóm đối chứng (control),
lặp lại nhiều lần (replication) hoặc phân nhóm (blocking). Một số lớn
nghiên cứu trong bệnh viện thậm chí không có nhóm đối chứng (một “vi
phạm” cơ bản trong phương pháp nghiên cứu), cho nên kết quả dù được
trình bày ở dạng nào vẫn rất khó diễn dịch và chẳng có giá trị khoa học gì
đáng kể.
Phương pháp nghiên cứu: quá nhiều sai sót
Một công trình nghiên cứu y học được xem là một cống hiến mới nếu công
trình đó nêu lên được một vấn đề mới, một ý tưởng mới, hay sử dụng một
phương pháp mới cho một vấn đề cũ. Do đó, phương pháp nghiên cứu
đóng một vai trò then chốt về chất lượng của một nghiên cứu. Phương
pháp ở đây là cách thiết kế nghiên cứu, phương pháp phân tích vấn đề, kể
cả phân tích số liệu, và phương pháp đo lường hay thu thập dữ liệu.
Theo một thống kê những nguyên nhân mà các bài báo không được chấp

nhận cho công bố trên các tạp chí y học quốc tế, 70% là do có vấn đề về
phương pháp, và trong số này hơn 50% là do phân tích số liệu sai phương
pháp, và phần còn lại là vấn đề đo lường. Những ai có kinh nghiệm nghiên
cứu khoa học đều có thể đánh giá giá trị của một bài báo qua phần
phương pháp.
Phân tích dữ liệu bằng các mô hình thống kê đóng một vai trò then chốt
trong các nghiên cứu y khoa. Thống kê cung cấp cho nhà nghiên cứu một
cách suy nghĩ về dữ liệu, để hiểu và diễn dịch ý nghĩa của dữ kiện. Giá trị
khoa học của kết luận từ một nghiên cứu không chỉ tùy thuộc vào phương
án (thiết kế) của nghiên cứu mà còn tùy thuộc một phần lớn vào việc áp
dụng đúng phương pháp thống kê. Để áp dụng đúng phương pháp thống
kê, người phân tích chẳng những phải hiểu rõ các giả định đằng sau
những phương pháp này, mà còn phải nắm vững mục đích nghiên cứu,
am hiểu phương pháp đo lường và cách thu thập dữ liệu. Chẳng hạn như
kiểm định t hay phân tích phương sai (analysis of variance) chỉ có thể áp
dụng phân tích các biến số tuân theo luật phân phối chuẩn (normal
distribution); nhưng nếu các phương pháp này được ứng dụng cho các
biến số không theo phân phối chuẩn hay các biến số không liên tục
(discrete variable) thì kết quả sẽ trở nên vô nghĩa và kết luận cũng sai.
Các nghiên cứu y học xuất hiện trong các tạp chí y học trong nước có quá
nhiều sai sót về phương pháp phân tích. Có thể nói không ngoa rằng
100% các bài báo mà tôi đọc qua đều có ít nhất là một sai sót, một sai lầm
về phương pháp phân tích số liệu. Có khi sai sót rất nghiêm trọng, có lẽ
xuất phát từ việc hiểu sai mô hình thống kê, cho nên kết quả và kết luận
sai. Những sai sót trong phần này có thể chia thành 5 nhóm sau đây:
Ứng dụng sai phương pháp. Như đề cập trên, mỗi phương pháp phân
tích thống kê đều có những giả định đằng sau và chỉ thích hợp cho một số
dạng nghiên cứu hay một số loại số liệu cụ thể. Chẳng hạn như phương
pháp kiểm định thống kê cho các “nghiên cứu trước – sau” (before-after
study, tức các nghiên cứu mà một nhóm đối tượng được thẩm định trước

và sau khi điều trị) không thể áp dụng để so sánh hai nhóm bệnh nhân độc
lập.
Trong một nghiên cứu về tác dụng điều trị viêm dạ dày, các tác giả so
sánh tình trạng viêm (5 thứ bậc: viêm nông, viêm teo nhẹ, viêm teo vừa,
viêm teo nặng, và niêm mạc bình thường) trong một nhóm bệnh nhân
trước và sau điều trị. Kết quả nghiên cứu được phân tích bằng kiểm định
Chi bình phương (Chi square test) với 3 bậc tự do (degrees of freedom).
Ứng dụng phương pháp phân tích Chi bình phương rất sai trong dạng
nghiên cứu này, bởi vì số liệu thu thập trước và sau điều trị không độc lập
với nhau. Con số bậc tự do cũng sai!
Vi phạm và bất chấp giả định. Các phương pháp kiểm định thông
thường nhất như kiểm định t (t-test) tuy rất dễ tính toán, nhưng kết quả có
khi cũng rất dễ sai lầm nếu không xem xét đến sự phân phối của số liệu.
Nếu hai biến không có cùng phương sai thì kiểm định t không thể áp dụng.
Ấy thế mà nhầm lẫn này thường rất phổ biến trong các nghiên cứu y học
từ Việt Nam. Một ví dụ về sai lầm tiêu biểu là trong một nghiên cứu mô tả
về bệnh AIDS, các tác giả viết “số lượng tuyệt đối tế bào CD4 của các
bệnh nhân AIDS là 229 ± 35 tb/ml so với số TCD4 ở nhóm người bình
thường khỏe mạnh là 879 ± 232 tb/ml … giảm có ý nghĩa thống kê với
p<0,001”! Tuy tác giả không cho biết con số đằng sau dấu “±” là gì, nhưng
chắc chắn đó là chỉ số phản ánh độ dao động của số lượng tế bào CD4,
và qua báo cáo trên, có thể thấy rằng nhóm đối tượng bình thường có độ
dao động rất cao so với nhóm bệnh nhân (232 so với 35 tb/ml), và do đó
hai nhóm này không có cùng dạng phân phối, cho nên kết quả từ kiểm
định t có vấn đề.
Nhưng cũng có trường hợp tác giả biến đổi số liệu một cách vô lí do.
Chẳng hạn như một nghiên cứu về homocysteine (một loại axít trong máu
nghi ngờ là có liên hệ đến bệnh tim), các nhà nghiên cứu biến đổi đo
lường homocysteine qua đơn vị logarít: “Do homocysteine huyết tương có
độ lệch là 1,11 nên tính biến đổi log và trung vị”. Nhưng khi đọc kĩ bài báo,

tôi thấy độ homocysteine trung bình là 9,67 mmol/L và độ lệch chuẩn là
3,07 mmol/L (chứ không phải 1,1 mmol/L), và nhìn vào biểu đồ phân phối
của homocysteine tôi thấy việc biến đổi số liệu này không cần thiết, nếu
không muốn nói là làm cho kết quả khó hiểu hơn (một người bình thường
đã khó hiểu đơn vị mmol/L, và càng cảm thấy rối rắm hơn trước đơn vị
như log của mmol/L!)
Phân nhóm tùy tiện. Trong phần lớn các bài báo khoa học, các tác giả có
xu hướng chia một biến số liên tục (như độ tuổi, lymphocyte, thời gian,
v.v…) thành nhiều nhóm một cách cực kì tùy tiện. Chẳng hạn như có tác
giả chi độ tuổi thành từng nhóm theo 10-tuổi như 40 đến 49, 50 đến 59, và
60 đến 70, nhưng một nghiên cứu khác có tác giả chia thành nhóm tuổi lẻ
như 35 đến 45, 46 đến 55, và trên 55! Có khi ngay trong một nghiên cứu,
tác giả lại tự mình mâu thuẫn: lúc đầu thì chia thành 4 nhóm độ tuổi (1 đến
12 tháng, 1 - 5 tuổi, 6-10, 10-15) nhưng ngay sau đó lại chia thành 3 nhóm
(1 – 12 tháng, 13 tháng đến 5 tuổi, và 6 đến 15 tuổi)! Ngay cả các biến
như huyết áp cũng bị cắt thành từng nhóm như thế, và cách chia cắt đó
hoàn toàn không có một lí do lâm sàng nào.
Đứng trên phương diện lí thuyết đo lường và phân tích thống kê, việc biến
đổi một một biến số liên tục thành một biến số không liên tục (như cách
chia cắt trên) là một sai sót, bởi vì việc biến đổi đó làm cho thông tin bị mất
(loss of information) của biến. Chẳng hạn như một phân tích tiên đoán xác
suất mắc bệnh dựa vào hai biến liên tục như độ tuổi và trọng lượng của
bệnh nhân lúc nào cũng cần ít thông số hơn là một phân tích dựa vào
nhóm tuổi và nhóm trọng lượng.
Ngoài ra, đứng trên phương diện logic và thực tế lâm sàng, không có lí do
gì để chia hai bệnh nhân với áp suất máu 110 mmHg và 111 mmHg thành
hai nhóm khác nhau cả. Chính vì thế mà các tập san y khoa và nhà thống
kê khuyến cáo nên tránh cách phân chia một biến số liên tục một cách tùy
tiện.
Phân tích theo kiểu “câu cá”, thiếu kế hoạch. Cũng như người câu cá,

nếu chịu khó kiên trì câu cá hết nơi này sang nơi khác và tháng này sang
tháng nọ, thì thể nào cũng câu được một con cá (dù con cá này không
nằm trong dự tính ban đầu), nhà nghiên cứu cũng có thể kiên trì tìm cách
phân tích hết nhóm này sang nhóm nọ đến khi “phát hiện” được một khác
biệt nào đó mà nhà nghiên cứu không nghĩ đến lúc khởi đầu nghiên cứu.
Đó là những phát hiện mà giới khoa học gọi là “fishing expedition” (chuyến
câu cá). Một công trình nghiên cứu thông thường đo lường nhiều biến số
phản ánh tình trạng của bệnh nhân. Với nhiều biến số như thế và nhiều
cách phân nhóm bệnh nhân theo giới tính, độ tuổi hay các chỉ tiêu lâm
sàng khác, nhà nghiên cứu có thể có hàng trăm, thậm chí hàng ngàn,
nhóm nhỏ đối tượng để phân tích. Trong trường hợp đó, một số kết quả
phân tích sẽ có “ý nghĩa thống kê” chỉ vì yếu tố ngẫu nhiên mà chẳng có ý
nghĩa sinh học nào cả.
Rất nhiều nghiên cứu y khoa từ Việt Nam mà tôi đọc qua mang tính câu cá
như mô tả trên. Chẳng hạn như một nghiên cứu về mối liên hệ giữa lipid
và chứng cao huyết áp, các nhà nghiên cứu đo lường 4 chỉ số lipid như
tổng số cholesterol, LDL cholesterol, HDL cholesterol, và triglycerides
trong hai nhóm đối tượng nam và nữ (nhóm cao huyết áp và nhóm bình
thường) tuổi từ 40 đến 70 tuổi. Họ chia các đối tượng thành 3 nhóm tuổi
theo giới, cộng với hai nhóm đối tượng, các nhà nghiên cứu có đến 12
nhóm nhỏ khác nhau. Với 12 nhóm nhỏ, các nhà nghiên cứu có thể làm 66
phân tích so sánh. Và, mỗi so sánh, họ có thể lặp lại 4 lần (cho 4 chỉ số
lipid). Sau khi phân tích nhiều như thế, các nhà nghiên cứu phát hiện rằng
chỉ có triglycerides là khác biệt giữa nam và nữ, và sự khác biệt này chỉ
tìm thấy trong nhóm đối tượng tuổi từ 40 đến 49 và chỉ trong nữ giới thuộc
nhóm bình thường. Nói cách khác, các nhà nghiên cứu đã đi ra ngoài mục
đích ban đầu của nghiên cứu, và phát hiện được một khác biệt mà câu hỏi
“tại sao” vẫn chưa thể trả lời bằng lí giải sinh học.
Để cho máy tính làm việc. Ngày nay, rất nhiều phần mềm cho phân tích
thống kê được phát triển, giúp cho nhà nghiên cứu có thể tiến hành những

phân tích phức tạp một cách nhanh gọn và hữu hiệu. Nhiều mô hình phân
tích mà chỉ vài thập niên trước đây không ai dám mơ đến (vì có thể tốn
đến hàng tháng, hay thậm chí bất khả thi) nay có thể thực hiện trong vòng
vài phút. Nhưng các phần mềm này là những con dao hai lưỡi: một mặt,
chúng giúp cho nhà nghiên cứu giải quyết vấn đề tính toán; mặt khác,
chúng có thể bị lạm dụng để tiến hành những phân tích sai, vô duyên, vô ý
thức và vô nguyên tắc. Người ta có thể sử dụng các phần mềm này để
tính số trung bình của hàng triệu số điện thoại, nhưng tất nhiên kết quả đó
vẫn chỉ là một con số ngẫu nhiên, chẳng có ý nghĩa gì trong thực tế.
Tiêu biểu tình trạng này là để cho các phần mềm phân tích thống kê làm
cái việc mà đáng lẽ nhà nghiên cứu phải làm: phân tích và suy nghĩ.
Trong một nghiên cứu về mối liên hệ giữa homocysteine và chứng nhồi
máu não, các nhà nghiên cứu viết: “Phương trình hồi qui bội log được xây
dựng nhồi máu não như biến phụ thuộc, homocysteine và các yếu tố nguy
cơ như biến độc lập. Bằng phương pháp loại dần, kết quả các biến dự
đoán quan trọng nguy cơ nhồi máu não gồm: homocysteine, cao huyết áp,
và hút thuốc lá”. Nhưng khi xem kĩ bảng kết quả phân tích dưới đây thì
người đọc sẽ có một “bức tranh” rất khác với nhận xét đó:
Yếu tố Hệ số β

Hệ số
tương quan

Sai số P
Homocysteine>15
mmol/L
1,66 -0,19 0,40 <0,001
Cao huyết áp -1,84 -0,42 0,22 <0,001
Hút thuốc -1,11 -0,92 0,43 0,01
Nhồi máu não 1,92 1,00 0,46 <0,001

Theo bảng kết quả này (dù tác giả không giải thích “hệ số β” là gì, nhưng
tôi có thể biết được ý nghĩa của nó), thì quả là những ai với độ
homocysteine cao có nguy cơ bị chứng nhồi máu não gia tăng, nhưng
điều lạ lùng là kết quả trên còn cho thấy người với cao huyết áp và hút
thuốc lá có nguy cơ nhồi máu não thấp! (Bảng số liệu này còn có một vấn
đề khác: đó là cột “Hệ số tương quan”, không rõ tác giả ước tính hệ số
tương quan giữa cao huyết áp và nhồi máu não bằng cách nào, bởi vì nhồi
máu não là một biến thể loại, làm sao ước tính tương quan với một biến
liên tục như cao huyết áp? Ngay cả việc trình bày trong một bảng số cũng
gây ra không ít lẫn lộn!)
Thật ra, đây là một sai sót rất phổ biến trong phân tích thống kê đa biến
mà nếu người phân tích không chịu khó suy nghĩ rất dễ bị sai lầm. Trong
trường hợp mà các biến độc lập có tương quan (correlation) với nhau, và
khi các biến này được phân tích trong một mô hình, tình trạng đa tương
quan (multicollinearity) sẽ xảy ra, và các thông số từ mô hình này có thể
không còn ý nghĩa thực tế nữa.
Trong nhiều nghiên cứu với mục đích tiên đoán khả năng mắc bệnh, việc
xây dựng một mô hình tiên đoán bằng thống kê rất phức tạp. Trong hàng
chục, thậm chí hàng trăm, yếu tố lâm sàng, vấn đề đặt ra là yếu tố nào có
liên quan đến khả năng mắc bệnh. Để trả lời câu hỏi này nhà nghiên cứu
phải xây dựng một mô hình tiên đoán (predictive model) đơn giản nhưng
chính xác dựa vào các yếu tố nguy cơ. Vì có nhiều yếu tố nguy cơ, cho
nên con số mô hình tiên đoán có thể lên đến hàng ngàn, thậm chí hàng
triệu mô hình, và chọn mô hình nào tối ưu nhất là một việc làm không đơn
giản chút nào. Khoa học thống kê cung cấp nhiều mô hình để giải quyết
vấn đề, nhưng nó đòi hỏi nhà nghiên cứu phải am hiểu mô hình, chứ
không phải để cho máy tính quyết định mô hình.
Có thể nói rằng không có một nghiên cứu nào mà người viết đọc qua ứng
dụng các mô hình phân tích đa biến đúng cả. Các nhà nghiên cứu Việt
Nam vẫn còn quá tùy thuộc vào phần mềm phân tích thống kê và để cho

các phần mềm này “chỉ thị”. Đó là một điều rất đáng tiếc, vì rất dễ dẫn đến
sai lầm nghiêm trọng trong kết quả nghiên cứu. Chẳng hạn như một
nghiên cứu nhằm tìm các yếu tố nguy cơ (risk factors) để dự đoán khả
năng phù não tử vong ở các bệnh nhân nhồi máu não, và tác giả viết như
sau: “Các biến có liên quan với tử vong do thần kinh trong phân tích đơn
biến với mức ý nghĩa p<0,05 sẽ được đưa vào phân tích hồi qui đa biến
logistic”. Nói cách khác, các tác giả tiến hành phân tích hai giai đoạn: giai
đoạn 1 họ phân tích từng biến một và chỉ lưu lại các biến nào có ý nghĩa
thống kê (p<0,05); trong giai đoạn 2, tất cả các biến có ý nghĩa thống kê
trong giai đoạn 1 được đưa vào phân tích đa biến. Đây cũng là một sai
lầm khá phổ biến, không những trong các nghiên cứu ở Việt Nam mà còn
ở nước ngoài, vì cách phân tích như thế sẽ loại bỏ các biến có thể có liên
quan đến phù não tử vong tuy không có ý nghĩa thống kê trong giai đoạn 1
nhưng lại có ý nghĩa thống kê trong giai đoạn 2 khi mà các biến được xem
xét cùng một lúc trong một mô hình. Sai lầm này có lẽ phản ánh sự thiếu
am hiểu về mô hình hồi qui logistic và phương pháp xây dựng mô hình
trong thống kê học.
Hiểu sai khái niệm. Trong một nghiên cứu khác, tác giả tỏ ra chưa am
hiểu các khái niệm về đo lường trong chẩn đoán y khoa nên viết: “Kết quả
siêu âm được đối chiếu với kết quả phẫu thuật và rút ra 4 khả năng có thể
xảy ra của từng dấu hiệu trên siêu âm: dương tính thật, dương tính giả, âm
tính thật, âm tính giả. Từ đó tính các giá trị: độ nhạy, độ đặc hiệu, giá trị dự
báo dương tính, giá trị dự báo âm tính.” Thật ra, không có chuyện tính toán
độ nhạy, độ đặc hiệu từ các giá trị dương tính thật hay âm tính thật, bởi vì
độ nhạy (sensitivity) chính là dương tính thật, và độ đặc hiệu (specificity)
chính là âm tính thật! Còn các giá trị dự báo dương tính và giá trị dự báo
âm tính cũng sai, vì thiết kế nghiên cứu không cho phép tác giả ước tính
các chỉ số này.
Một nghiên cứu về mối tương quan giữa tế bào lymphocyte và CD4 ở các
bệnh nhân AIDS kết luận rằng “môi tương quan giữa tế bào lympho T

CD4+ và tế bào lympho toàn phần ở 517 bệnh nhân ngoại trú cho thấy mối
tương quan này theo tỉ lệ thuận với hệ số tương quan r=0.66 (p<0,001).
Tương quan này yếu đi khi phân tầng theo tế bào lympho”. Phát biểu trên
khá khó hiểu, nhưng thật ra bảng thống kê số 5 của bài báo cho thấy kết
quả rõ hơn:
Lymphocyte N Hệ số tương
quan lympho
CD4
P
Tất cả bệnh nhân 517 0,66 <0,001
<1000 60 0,36 0,005
1000 – 2000 208 0,49 <0,001
>5000 249 0,35 <0,001
(Một lần nữa, tác giả không giải thích “N” là gì, và trị số P đề cập đến cái
gì! Tuy nhiên những ai có kinh nghiệm nghiên cứu có thể đoán biết N là số
đối tượng và trị số P đề cập đến ý nghĩa thống kê của hệ số tương quan.)
Vấn đề đặt ra là tại sao hệ số tương quan của cả nhóm (517 bệnh nhân) là
0,66, nhưng khi phân từng nhóm nhỏ thì các hệ số tương quan chỉ dao
động từ 0,35 đến 0,49 ? Tác giả không giải thích, mà còn xem đó là một
phát hiện y học! Thật ra, đây là một sai lầm khá phổ biến trong các phân
tích tương quan khi một biến số bị chia cắt thành từng mảnh nhỏ. Bởi vì
khi một biến được chia thành từng nhóm thì toàn cự của dãy số (range)
trong từng nhóm nhỏ bị hạn chế, và phương sai (variance) trở nên thấp,
và hệ quả của phương sai thấp là hệ số tương quan trong các nhóm nhỏ
này cũng giảm. Hệ số tương quan tính toán trong từng nhóm nhỏ như thế
không phản ánh chính xác độ tương quan của một quần thể. Đây là một
hiện tượng số học, chứ chẳng phải làm một phát hiện có ý nghĩa sinh học
gì cả.
Báo cáo: quá sơ sài và nhiều thiếu sót
Báo cáo khoa học (hay bài báo khoa học – papers) là một “sản phẩm” của

nghiên cứu khoa học, một loại “tiền tệ” trong hoạt động khoa học, bởi vì
báo cáo khoa học không chỉ là một bản báo cáo về một công trình nghiên
cứu, mà còn là một đóng góp cho kho tàng tri thức của thế giới. Y học tiến
bộ cũng nhờ một phần lớn vào thông tin từ những bài báo khoa học, bởi vì
qua chúng mà các nhà khoa học có dịp trao đổi, chia sẻ và học hỏi kinh
nghiệm lẫn nhau. Chính vì tính trao đổi thông tin này, các báo cáo khoa
học phải tuân theo một cấu trúc đặc thù và được viết bằng một văn phong
ngắn gọn nhưng phải đầy đủ. Cấu trúc một bài báo khoa học thường là
cấu trúc IMRAD (Introduction – Dẫn nhập, Methods – Phương pháp,
Results – Kết quả, và Discussion – Thảo luận).
Một báo cáo khoa học hay có thể thu hút người đọc “nhập cuộc”. Do đó,
tác giả phải suy nghĩ rất cẩn thận (và có khi khá lâu – một bài báo khoa
học có khi viết đi viết lại đến 3 tháng trời). Nếu không tiếp cận vấn đề một
cách có việc hệ thống, tất cả những nỗ lực cho một bài báo khoa học có
thể trở nên vô dụng, thậm chí đem lại ảnh hưởng xấu vì một công trình
nghiên cứu sẽ không có cơ hội xuất hiện trên các tập san chuyên môn.
Mặc dù ở các nước phương Tây, người ta đã có nhiều bài viết chỉ dẫn –
thậm chí cả sách dạy – cách viết một bài báo khoa học, nhưng ở nước ta,
hình như vẫn chưa có một tài liệu chỉ dẫn như thế. Có lẽ vì lí do này mà
rất nhiều bài báo khoa học tôi đọc qua đều có quá nhiều vấn đề về cách
trình bày cũng như văn phong rất khó hiểu (giống như thách đố người
đọc!) Không thể nêu tất cả các vấn đề ở đây, vì 100% những bài tôi đọc
qua thành thật mà nói, đều cần phải viết lại. Ở đây, tôi chỉ nêu các vấn đề
nổi cộm mà thôi:
Dẫn nhập: lí do mù mờ. Thông thường trong phần này, tác giả phải trả lời
cho được câu hỏi “Tại sao làm nghiên cứu này?” và để trả lời câu hỏi đó,
tác giả phải điểm qua các nghiên cứu liên quan trong quá khứ ở Việt Nam
và trên thế giới, chỉ ra những thiếu sót hay khía cạnh chưa giải quyết, và
nêu lên mục đích cụ thể của nghiên cứu của tác giả. Ngoài ra, tác giả còn
phải thuyết phục người đọc vấn đề mà tác giả quan tâm là một vấn đề lớn,

có ý nghĩa xã hội, có liên quan đến việc nâng cao chất lượng chăm sóc
bệnh nhân hay quần chúng. Nhưng rất tiếc, không có một bài báo nào tôi
đọc qua đáp ứng được các yêu cầu căn bản trên. Các tác giả Việt Nam
thường viết phần dẫn nhập rất ngắn (không đầy 1 phần tư trang giấy),
ngắn đến nổi người đọc không hiểu tác giả muốn làm gì, và công trình
nghiên cứu có xứng đáng hay không. Các tác giả có cố gắng điểm qua
các nghiên cứu trước, nhưng quá hạn chế (trung bình chỉ có 2 tài liệu
tham khảo). Thậm chí, có nhiều bài báo, tác giả chẳng điểm qua các
nghiên cứu trước!
Đối tượng nghiên cứu: mô tả quá sơ sài. Kết quả nghiên cứu có thể
khái quát hóa hay không tùy thuộc một phần lớn vào thành phần đối tượng
nghiên cứu. Chẳng hạn một nghiên cứu mà đối tượng là bệnh nhân nội trú
trong bệnh viện khó mà áp dụng cho các quần thể lớn hơn trong dân số.
Do đó, mô tả đặc tính các đối tượng nghiên cứu rất quan trọng để người
đọc có thể lượng xét giá trị khoa học của kết quả và kết luận. Rất tiếc là
trong các bài báo về nghiên cứu y khoa ở Việt Nam, các tác giả có vẻ
không coi trọng khía cạnh này. Phần lớn đối tượng nghiên cứu chỉ được
mô tả bằng một đoạn văn ngắn. Chẳng hạn như nghiên cứu về tình hình
suy dinh dưỡng, các tác giả viết vỏn vẹn một câu văn như sau: “Đối tượng
nghiên cứu là trẻ em dưới 5 tuổi sinh từ ngày 1/1/1996 đến 31/12/2000 tại
hai huyện Đông Sơn và Nga Sơn tỉnh Thanh Hóa”. Đáng lẽ ở đây, tác giả
nên cho người đọc và đồng nghiệp biết tại sao chọn hai huyện này, cách
tuyển chọn đối tượng ra sao, ai là người liên lạc, có kế hoạch lấy mẫu hay
không, v.v… nhưng rất tiếc các thông tin này không có, nên khó mà đánh
giá giá trị khoa học của nghiên cứu này.
Cở mẫu: thiếu lí do. Một nghiên cứu có hệ thống phải là một nghiên cứu
có kế hoạch và được tiến hành đúng với qui trình khoa học từ khâu phát
triển giả thiết, chọn phương án nghiên cứu, ước tính cỡ mẫu, đến phân
tích và diễn dịch. Trong các khâu này, ước tính cỡ mẫu (tức ước tính số
đối tượng cần thiết cho nghiên cứu) đóng vai trò rất quan trọng. Nếu số

lượng đối tượng quá ít, kết quả nghiên cứu sẽ không có giá trị gì và không
thể đi đến kết luận; ngược lại, nếu nghiên cứu có quá nhiều đối tượng hơn
cần thiết thì vi phạm y đức. Do đó, một báo cáo khoa học có giá trị phải
giải thích rõ tại sao nghiên cứu được tiến hành trên số đối tượng đã ấn
định. Nhưng tất cả các bài báo y học từ Việt Nam mà tôi xem qua hoàn
toàn không có một lời giải thích gì về cỡ mẫu. Do đó, rất khó mà hiểu các
nghiên cứu này có quả thật được lên kế hoạch và thiết kế nghiêm chỉnh,
hay chỉ là những nghiên cứu cho có bằng cách sử dụng bệnh nhân sẵn có
trong bệnh viện.
Phương pháp đo lường: quá tiết kiệm chữ nghĩa. Trong giới nghiên
cứu khoa học, người ta có câu “rác vào, ra rác” (garbage in, garbage out),
tức là nếu một nghiên cứu mà phương pháp đo lường thiếu chính xác,
không có độ tin cậy cao, thì kết quả của nghiên cứu đó cũng chỉ là một
khối rác con số. Do đó, kết quả của nghiên cứu tùy thuộc rất nhiều vào
phương pháp đo lường, và tác giả phải có trách nhiệm mô tả chi tiết về
các phương pháp thu thập số liệu, phân tích sinh hóa, đo lường các chỉ số
lâm sàng, v.v… trong một bài báo khoa học.
Điểm qua các nghiên cứu y học từ Việt Nam, tôi có thể nói đây là một
phần yếu nhất, mù mờ nhất. Không như các bài báo khoa học trên các tập
san y học quốc tế mà phần phương pháp chiếm một phần lớn của nội
dung bài báo, các bài báo y học từ Việt Nam rất “tiết kiệm” về phần này.
Hầu như nghiên cứu nào cũng mô tả phần phương pháp cực kì sơ sài, chỉ
trong vòng nửa trang giấy A4. Một số nghiên cứu mà các tác giả chỉ mô tả
chi tiết đo lường không đầy 50 chữ! Thậm chí còn có một số nghiên cứu
về huyết học, lipid mà các tác giả không có đến một chữ để mô tả phương
pháp đo lường cholesterol ra sao, hay không một chữ về các chi tiết phân
tích hồng cầu, bạch cầu và hematocrit!
Kết quả nghiên cứu: không theo sát mục đích. Thông thường trong
phần báo cáo kết quả, tác giả phải đi thẳng vào vấn đề nêu ra trong phần
dẫn nhập, tức phải trả lời cho được câu hỏi “Đã phát hiện cái gì?” Nhưng

các bài báo y học ở Việt Nam thường mang tính “vòng vo tam quốc” về đối
tượng nghiên cứu (mà đáng lẽ phải trình bày trong phần phương pháp) rồi
mới đi vào kết quả chính. Ngay cả báo cáo các kết quả chính, tác giả
không chịu theo sát mục đích đặt ra lúc ban đầu hay trong phần dẫn nhập.
Tiêu biểu cho tình trạng này là thay vì báo cáo kết quả toàn bộ đối tượng
nghiên cứu, tác giả lại nhấn mạnh đến các nhóm nhỏ mà kết quả có khi
chẳng có ý nghĩa gì đáng kể (nếu không muốn nói là kết quả ngẫu nhiên)!
Một xu hướng đáng chú ý khác là có rất nhiều tác giả thay vì chỉ trình bày
kết quả thì họ lại diễn dịch luôn kết quả (đáng lẽ phải dành cho phần thảo
luận). Có nhiều khi tác giả lặp lại những con số trong bảng số liệu và biểu
đồ, tức là một cách phí phạm chữ nghĩa. Cũng như phần dẫn nhập, nội
dung phần kết quả thường rất ngắn (trung bình là 2,5 đoạn văn, khoảng
1/4 trang giấy A4).
Trình bày số liệu: chính xác đến độ không cần thiết. Một trong những
xu hướng khá phổ biến trong các bài báo y học ở trong nước là các chỉ số
thống kê thường được trình bày với sự chính xác một cách thừa thải.
Chẳng hạn như một báo cáo mô tả về các đối tượng tham gia vào công
trình nghiên cứu, các tác giả viết: “Tuổi trung bình của 194 bệnh nhân là
47,89 tuổi (17,95). Số bệnh nhân nữ là 132 bệnh nhân (68,04%), số bệnh
nhân nam là 62 bệnh nhân (31,96%).” Chú ý con số trong ngoặc (17,95)
không rõ đó là con số gì? Có thể tác giả muốn đề cập đến độ lệch chuẩn
(standard deviation), nhưng cũng có thể là sai số chuẩn (standard error),
nhưng dù sao đi nữa, một cách viết như thế không thể chấp nhận trong
một bài báo khoa học.
Biểu đồ: nghèo nàn ý nghĩa. Yếu tố thị giác rất quan trọng. Người Trung
Hoa từng nói “Một biểu đồ có giá trị bằng một vạn chữ viết.” Mục đích của
biểu đồ là cung cấp một ấn tượng về phát hiện chính của công trình
nghiên cứu. Biểu đồ có khi được dùng làm tài liệu giảng dạy. Vì thế biểu
đồ là một phương tiện hữu hiệu nhất để nhấn mạnh thông điệp của bài
báo. Biểu đồ thường được sử dụng để thể hiện xu hướng và kết quả cho

từng nhóm, nhưng cũng có thể dùng để trình bày dữ kiện một cách gọn
gàng. Các biểu đồ dễ hiểu, nội dung phong phú là những phương tiện vô
giá. Do đó, nhà nghiên cứu cần phải suy nghĩ một cách sáng tạo cách thể
hiện số liệu quan trọng bằng biểu đồ.
Rất nhiều biểu đồ trong các bài báo y học ở Việt Nam chỉ xoay quanh các
biểu đồ mô tả như histogram, biều đồ pie, biểu đồ tần số. Rất hiếm thấy
các biểu đồ mang tính phân tích. Các biểu đồ mô tả cũng rất nghèo nàn về
ý nghĩa, đơn sơ trong trình bày chẳng khác gì cách vẽ biểu đồ trong các
bài tập dành cho sinh viên. Có nhiều biểu đồ lặp lại những gì trình bày
trong các bảng số liệu, tức là chẳng cung cấp thêm thông tin gì cho người
đọc, chẳng gây một ấn tượng gì đáng nhớ. Cách làm việc như thế cho
người đọc ấn tượng rằng tác giả hình như chưa đầu tư suy nghĩ về việc
trình bày kết quả sao cho có ý nghĩa và dễ hiểu.
Bảng số: khô khan và thiếu ý nghĩa. Trong một bài báo khoa học, các
bảng thống kê số liệu thường được dùng để trình bày những số liệu mang
tính trang trọng, tính chính xác cao, tính chính thức. Các bảng thống kê có
thể dùng để (a) mô tả bằng con số những đặc điểm chính của các đối
tượng nghiên cứu; (b) trình bày kết quả phân tích mối liên hệ giữa các yếu
tố trong nghiên cứu; và (c) so sánh giữa các nhóm bệnh và đối chứng.
Thiết kế một bảng thống kê có ý nghĩa không phải là việc làm đơn giản,
mà đòi hỏi kinh nghiệm và một chút “nghệ thuật” trong việc trình bày.
Rất tiếc là những bảng số liệu trong các bài báo khoa học từ Việt Nam
chẳng những không hấp dẫn mà còn chứa rất nhiều thiếu sót. Phần lớn
các bảng số này chỉ dừng lại ở tính mô tả, một phần nhỏ là những bảng
trình bày hệ số tương quan, thông số từ các phân tích hồi quy nhưng vì
chẳng có ghi chú cẩn thận, cho nên chẳng ai có thể hiểu nổi ý nghĩa của
những bảng số liệu này.
Điều đáng nói là có một số bài báo thậm chí chẳng có một bảng số liệu và
biểu đồ nào! Còn phần mô tả kết quả bằng chữ thì cũng rất khó theo dõi.
Thảo luận: quá chủ quan. Đối với phần lớn nhà nghiên cứu, đây là phần

khó viết nhất vì nó không có một cấu trúc cố định nào cả. Nói một cách
ngắn gọn, trong phần này, tác giả phải trả lời câu hỏi “Những kết quả này
có nghĩa gì?”. Tuy không phải theo cấu trúc cố định nào, tác giả có kinh
nghiệm thường viết thảo luận theo một cấu trúc như sau: (a) giải thích
những dữ kiện trong phần kết quả; (b) so sánh những kết quả này với các
nghiên cứu trước; (c) bàn về ý nghĩa của những kết quả; (d) chỉ ra những
ưu điểm và khuyết điểm của cuộc nghiên cứu; (e) và sau cùng là một kết
luận sao cho người đọc có thể lĩnh hội được một cách dễ dàng. Không
một bài báo y khoa từ Việt Nam mà tôi đọc qua viết theo cấu trúc như vừa
mô tả.
Tính trung bình, phần thảo luận của các bài báo y khoa mà tôi đọc qua
hàm chứa rất ít ý kiến. Tính trung bình phần này dài khoảng 1,5 trang, so
với [trung bình] 4 trang trong các bài báo ở nước ngoài. Tuy nhiên, vấn đề
dài ngắn không phải là điều thiết yếu, quan trọng là nội dung, và có thể nói
rằng nội dung thảo luận rất nghèo nàn. Có rất nhiều bài báo mà phần thảo
luận không thể xem là “thảo luận” bởi vì tác giả chỉ lặp lại những con số và
thay đổi vài câu chữ trong phần kết quả, hoàn toàn không có một giải thích
và phát kiến gì cả!
Có tác giả cũng cố gắng giải thích, hay đề nghị một mô hình giải thích, kết
quả nghiên cứu của họ, nhưng lại không kèm theo những chứng cớ khoa
học, nên rất khó mà nói cách giải thích đó thuyết phục hay không. Rất ít
khi nào các tác giả Việt Nam so sánh kết quả của họ với kết quả của
những nghiên cứu trước và giải thích tại sao chúng (những kết quả) khác
nhau, hay tại sao chúng lại giống nhau, và ý nghĩa của chúng là gì. Một
điều đáng nói khác là phần lớn các tác giả Việt Nam không chịu vạch ra
những thiếu sót, những trắc trở, khó khăn trong nghiên cứu, hay nêu được
những ưu điểm của cuộc nghiên cứu, cũng như đưa ra các giải pháp khắc
phục hay những đề xuất hướng nghiên cứu trong tương lai. Cách viết
phẩn thảo luận của các tác giả Việt Nam cho người đọc một ấn tượng về
một nghiên cứu hoàn hảo, không có vấn đề gì cả.

Tiếng Anh: quá nhiều sai sót. Trên thế giới ngày nay, tiếng Anh là một
ngôn ngữ quốc tế trong hoạt động khoa học. Vào thập niên 1980s, trên
60% các tập san khoa học trên thế giới sử dụng tiếng Anh. Hai mươi năm
sau, con số này là trên 80% [2]. Trong lĩnh vực y khoa và sinh học, hiện
nay hơn 90% các tập san sử dụng tiếng Anh. Ngay cả tập san khoa học
tại các nước không nói tiếng Anh như các nước Bắc Âu, Nhật, Thái Lan,
Trung Quốc cũng hoặc là sử dụng tiếng Anh làm phương tiện thông tin,
hoặc có phần tóm lược viết bằng tiếng Anh.
Các tạp chí y học Việt Nam trong mấy năm qua cũng cố gắng cung cấp
phần tóm lược bài báo khoa học bằng tiếng Anh. Nhưng rất tiếc là hầu
như bài báo nào (nếu không muốn nói là 100%) đều cũng có sai sót về
tiếng Anh, từ cú pháp, thuật ngữ, đến cách diễn đạt. Không thể kể hết tất
cả các sai sót ở đây, vì hầu như câu văn nào cũng có sai sót. Chẳng hạn
như trong một nghiên cứu về các chỉ số sinh hóa trong nhóm bệnh nhân
tai biến mạch máu não, tác giả viết trong phần kết quả: “There has no
differency in blood cell count, platelet count, hematocrit rate between
cerebral infarction and cerebral hemorrhage. However there is a little
different in some patients”. Một câu văn có quá nhiều sai sót về đánh vần,
văn phạm, và khái niệm. Một nghiên cứu khác về ứng dụng CT scan trong
việc chẩn đoán thuyên tắc phổi, tác giả kết luận bằng một câu văn với chữ
“efficacy” thành “efficacity”: “Chest helical CT scan is a useful tool in
pulmonary embolism diagnosis in Vietnam condition with good feasibility,
efficacity and some small disadvantages that could be resolved in the near
future.” Thật ra, chữ efficacy mà tác giả muốn nói đến trong kết luận không
thể dùng trong nghiên cứu này vì không thích hợp. Đây là một sai sót
mang tính học thuật, chứ không đơn giản là từ ngữ.
Có khi sai sót rất căn bản về khái niệm và thuật ngữ mà đáng lẽ không
nên có mặt trên mặt báo, như “Lipidemia is common in hypertensive
patients and their presentation increases cardiovascular risk”. Đáng lẽ là
hyperlipidemia (chứ không phải lipidemia) và cụm từ “cardiovascular risk”

đáng lẽ phải là “the risk of cardiovascular diseases”.
Vấn đề y đức. Một nguyên tắc số 1 (và bất di bất dịch) của y khoa là
không làm tổn hại đến bệnh nhân. Nghiên cứu y học cũng phải tuân thủ
theo nguyên tắc này. Trong nhiều nghiên cứu, nhất là nghiên cứu can
thiệp mà đối tượng nghiên cứu có khi phải kinh qua một thuật điều trị mới
hay một loại thuốc mới còn trong vòng thử nghiệm. Trong các trường hợp
này, bệnh nhân có thể hưởng lợi từ thuật điều trị, nhưng cũng có thể bệnh
nhân cũng chịu đựng một số biến chứng có khi nguy hiểm. Ngay cả trong
các nghiên cứu không can thiệp, đối tượng nghiên cứu có khi phải phơi
nhiễm những phương pháp đo lường (như X quang, hay lấy mẫu máu
chẳng hạn). Ngoài ra, các thông tin lâm sàng thu thập từ cá nhân đối
tượng nghiên cứu cần phải được giữ kín tuyệt đối, và danh tính bệnh nhân
dứt khoát không được tiết lộ trên bất cứ phương tiện truyền thông nào nếu
không có sự đồng ý của bệnh nhân. Đây là những khía cạnh mang tính
đạo đức khoa học, mà cụ thể trong y khoa là khía cạnh y đức (medical
ethics).
Ở các nước Tây phương, bất cứ trường đại học hay bệnh viện nào đều có
một ủy ban y đức (Ethics Committee hay Institutional Review Board) có
chức năng kiểm tra khía cạnh y đức trong tất cả các công trình nghiên cứu
y học. Ủy ban này gồm có đại diện từ giới nghiên cứu khoa học, bác sĩ,
thống kê, luật sư, tôn giáo, và quần chúng hay bệnh nhân. Ủy ban có
nhiệm vụ cụ thể là duyệt xét xem công trình nghiên cứu có đáp ứng các
yêu cầu y đức hay không, bảo đảm an toàn cho tình nguyện viên, kiểm tra
tính bảo mật, v.v… của dự án nghiên cứu. Chỉ khi nào các khía cạnh này
được giải quyết thỏa đáng, dự án mới được cho phép tiến hành.
Các tập san y học quốc tế có uy tín dứt khoát sẽ không công bố một công
trình nghiên cứu, bất kể công trình đó có giá trị khoa học cỡ nào, nếu công
trình đó chưa được sự phê chuẩn của ủy ban y đức địa phương. Do đó,
ban biên tập các tập san y học quốc tế thường yêu cầu tác giả phải kèm
theo một tuyên bố như “Công trình nghiên cứu này đã được ủy ban y đức

thuộc trường đại học ABC thông qua, và bệnh nhân đã đồng ý tham gia
vào nghiên cứu.” Không có tuyên bố này cũng có nghĩa là bài báo sẽ
không được bình duyệt (chứ chưa nói đến việc được chấp nhận cho xuất
bản hay không!)
Tuy nhiên, tất cả những bài báo y học mà tôi đọc qua trong các tập san y
học ở trong nước không có một giòng chữ nào nói đến y đức. Không một
bài báo nào cho biết bệnh nhân đã thỏa thuận tham gia vào nghiên cứu và
cho phép cung cấp thông tin! Có thể các công trình nghiên cứu đã được
thông qua, nhưng tác giả “quên” không cung cấp thông tin này?

×