Tải bản đầy đủ (.pdf) (24 trang)

Một số bất cập khi ứng dụng thống kê và tin học trong nghiên cứu y học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (775.25 KB, 24 trang )

1

MỘT SỐ BẤT CẬP KHI ỨNG DỤNG THỐNG KÊ VÀ TIN HỌC
TRONG NGHIÊN CỨU Y HỌC

Lưu Ngọc Hoạt
MỞ ĐẦU
Ngày nay với sự bùng nổ của khoa học, kỹ thuật và công nghệ trong khám chữa
bệnh, người thày thuốc trước khi ra quyết định chẩn đoán hoặc điều trị một bệnh nào
đó cần phải tổng hợp và cân nhắc các thông tin liên quan từ các nguồn khác nhau,
đặc biệt là từ các xét nghiệm, kết quả chẩn đoàn hình ảnh, thăm do chức năng, từ các
nghiên cứu, thử nghiệm lâm sàng, chứ không chỉ đơn thuần là các triệu chứng lâm
sàng như trước đây, do vậy khái niệm y học dựa vào kinh nghiệm lâm sàng của
người thày thuốc đã được thay thế bởi khái niệm y học dựa vào bằng chứng.
Với các nhà quản lý và hoạch định chính thì khái niệm lập kế hoạch, quản lý và
hoạch định chính sách dựa vào bằng chứng cũng đã trở nên rất phổ biến và ngày nay
ở các nước phát triển hầu hết các quyết định, chính sách đều phải xây dựng, triển
khai và đánh giá dựa theo một quy trình nghiêm ngặt, trong đó bằng chứng được
cung cấp từ nhiều nguồn khác nhau như trình bày trong sơ đồ dưới đây





















Sơ đồ 1: Vai trò của các nguồn thông tin khác nhau trong lập kế hoạch, quản lý
và hoạch định chính sách

Do vậy với xu thế phát triển của y học dựa vào bằng chứng, lập kế hoạch, quản lý và
hoạch định chính sách dựa vào bằng chứng hiện nay và trong tương lai, vai trò của

Các thông tin mà nhà quản lý cần
khi lập kế hoạch, quản lý hoặc hoạch
định chính sách:
o Thông tin y tế, sức khỏe
o Thông tin tài chính, kinh tế
o Thông tin về chính sách, văn
hóa, xã hội...
o Các thông tin khác
Các thông tin thiếu hụt cần
thu thập thêm:
o Từ thư viện, Internet
o Từ điều tra, nghiên
cứu bổ sung
So sánh
Bằng chứng cho
LKH và QL

Các thông tin có sẵn
tại địa phương
Tiêu chuẩn của thông tin
cho các nhà quản lý:
• Hấp dẫn, ngắn gọn,
chính xác
• Phải trình bày dưới
dạng các bằng chứng
2

thống kê, tin học ứng dụng ngày càng được mở rộng, không chỉ trong nghiên cứu
khoa học mà còn cả trong tìm kiếm, tham khảo tổng hợp, phân tích số liệu có sẵn và
các thông tin trên mạng. Bảng dưới đây có thể cho thấy thống kê và tin học ngày nay
khác gì với thống kê và tin học khi mà máy vi tính và phần mềm chưa được phổ cập:

Bảng 1: Các thao tác và kỹ năng mà người nghiên cứu cần học về thống kê và tin
học trước đây và ngày nay

Giai đoạn Thao tác của cán bộ
làm nghiên cứu
Kỹ năng sinh viên cần có sau khi
học môn thống kê-tin học
1. Trước khi có máy vi tính (computer)
 Thiết kế công cụ thu
thập số liệu, nhập
liệu
• Thủ công bằng viết
tay hay đánh máy;
• Cách thiết kế công cụ và lập bảng
tổng hợp nhập số liệu

 Tính cỡ mẫu, tổng
hợp số liệu, tính toán
các test thống kê
• Thủ công hoặc có sự
hỗ trợ của bàn tính,
máy tính tay
(calculator);
• Chọn đúng công thức và tính toán
theo các công thức
• Cách dùng bàn tính và máy tính tay
để tính toán
 Tham khảo thông tin: • Chủ yếu từ sách, tạp
chí, báo cáo được in
ấn và lưu dưới dạng
ấn phẩm (hard copy);
• Cách đọc, ghi chép, lưu giữ và sử
dụng các tài liệu tham khảo từ các
ấn phẩm;
 Trích dẫn và sắp xếp
tài liệu tham khảo
• Theo cách thủ công • Cách trích dẫn và sắp xếp tài liệu
tham khảo theo quy định
2. Khi máy vi tính và các phần mềm đã phổ biến
 Thiết kế công cụ thu
thập số liệu, nhập
liệu
• Sử dụng các phần
mềm thích hợp (EPI
Info, EPI Table...)
• Cách thiết kế, mã hóa công cụ, xử

lý và nhập liệu bằng phần mềm
máy vi tính;
 Tính cỡ mẫu, tổng
hợp số liệu, tính toán
các test thống kê
• Thông qua các phần
mềm như EPI Info,
STATA, SPSS...
• Cách chuyển dạng số liệu, tính cỡ
mẫu, tổng hợp, tính toán số liệu,
các test bằng phần mềm
 Tham khảo thông tin: • Từ các ấn phẩm trong
thư viện,
• Từ thư viện điện tử,
đĩa và đặc biệt là từ
Internet
• Cách tìm và lưu giữ thông tin từ ấn
phẩm vào máy tính hoặc phần mềm
• Cách tra cứu tài liệu trên Internet
• Tổng hợp số liệu có hệ thống
(Systermatic review, Meta-analysis)
 Trích dẫn và sắp xếp
tài liệu tham khảo
• Sử dụng các phần
mềm như Reference
Manager, Endnote...
• Cách sắp xếp tài liệu tham khảo;
• Cách sử dụng phần mềm để tìm
kiếm, lưu giữ và sắp xếp tài liệu
tham khảo

3

Với những lý do nêu trên, giảng dạy thống kê và tin học ứng dụng trong y sinh học
hiện nay trong các trường đại học y cần phải cập nhật và thay đổi.
Ngoài ra, do các cán bộ y tế và nhiều nhà nghiên cứu trong lĩnh vực y tế cũng chưa
được đào tạo, cập nhật về thống kê và tin học y học nên họ còn gặp nhiều khó khăn
và sai sót trong việc ứng dụng các kiến thức và kỹ năng về thống kê và tin học trong
nghiên cứu khoa học, đó cũng là một trong những lý do làm cho chất lượng của
nhiều nghiên cứu còn thấp và chưa có nhiều bài báo khoa học được đăng tải trên các
tạp chí thế giới.
Để tìm hiểu thực trạng của những bất cập trong ứng dụng thống kê và tin học y học
trong nghiên cứu khoa học, nhóm cán bộ giảng dạy của Bộ môn Thống kê, Tin học
Y học của Viện Đào tạo Y học Dự phòng và Y tế công cộng, Trường Đại học Y Hà
Nội đã triển khai một số nghiên cứu tìm hiểu các lỗi thường gặp khi cán bộ y tế áp
dụng thống kê, tin học trong nghiên cứu khoa học thông qua việc rà soát hàng trăm
bài báo đăng tải trong một số tạp chí có uy tín của Việt Nam (350 bài năm 2003 và
201 bài năm 2009) và thông qua xem xét các báo cáo thống kê, các luận văn, luận án
tốt nghiệp của sinh viên và học viên, các đề tài nghiên cứu các cấp. Kết quả nghiên
cứu cho thất các cán bộ y tế và nhà nghiên cứu y học Việt Nam thường gặp phải một
số lỗi sau đây:
1. Lỗi liên quan đến phần đại cương thống kê và biến số:
 Không phân biệt được thống kê mô tả và thống kê suy luận
 Không phân biệt được mối liên quan giữa tên đề tài, mục tiêu nghiên cứu và
biến số
 Xác định thừa hoặc thiếu biến số trong nghiên cứu
 Chuyển biến định lượng sang dạng định tính khi thiết kế công cụ thu thập số
liệu không đúng
 Không hiểu rõ về phân bố chuẩn và vai trò của phân bố chuẩn trong thống kê
 Chưa phân biệt được loại nghiên cứu độc lập và ghép cặp
 Những thông tin nào cần phải đề cập trong phần đối tượng và phương pháp

nghiên cứu?
2. Lỗi liên quan đến loại thiết kế nghiên cứu
 Chưa phân biệt được loại thiết kế nghiên cứu như nghiên cứu ngang và dọc; hồi
cứu hay tiến cứu; mô tả, phân tích hay can thiệp; định tính hay định lượng;
 Chưa phân biệt được nghiên cứu ngang (cross-sectional study) và điều tra cắt
ngang (cross-sectional survey);
 Chưa biết cách trình bày mục thiết kế nghiên cứu trong phần đối tượng và
phương pháp của một báo cáo nghiên cứu
3. Lỗi liên quan đến chọn mẫu và tính toán cỡ mẫu
 Chọn không đúng công thức tính cỡ mẫu và các thành phần trong công thức
tính cỡ mẫu
4

 Không biết cách tính cỡ mẫu từ kết quả của các nghiên cứu thử
 Không biết rõ ưu, nhược điểm của từng phương pháp chọn mẫu để chọn đúng
cách chọn mẫu cho một nghiên cứu cụ thể
 Điều chỉnh cỡ mẫu với hệ số thiết kế không đúng
 Không biết áp dụng công thức tính cỡ mẫu thích hợp với các loại thiết kế
nghiên cứu;
 Không biết cách tính toán cỡ mẫu trong nghiên cứu định tính
4. Thống kê mô tả
 Không phân biệt được khi nào có thể đo lường độ tập trung của bộ số liệu định
lượng bằng dùng giá trị trung bình, khi nào phải dùng trung vị, khi nào có thể
đo lường độ phân tán của bộ số liệu bằng độ lệch chuẩn, khi nào phải dùng
khoảng phần trăm, phần mười, phần tư
 Không biết chuyển bộ số liệu từ dạng không chuẩn sang phân bố chuẩn để có
thể áp dụng cách tổng hợp và phân tích với bộ số liệu chuẩn
 Không chọn đúng bảng, biểu đồ thị để trình bày bộ số liệu
5. Thống kê suy luận
 Không nhận thức đúng được vai trò của thống kê suy luận trong nghiên cứu

khoa học
 Không phân biệt được chỉ định và giá trị của ước lượng điểm, ước lượng
khoảng và kiểm định giả thuyết
 Không phân biệt được giá trị Alpha (sai lầm loại 1), Beta (sai lầm loại 2), giá
trị p trong thống kê suy luận;
 Không phân biệt được sự khác biệt trong kiểm định sự khác nhau và sự tương
quan
 Không phân biệt được các test trong nghiên cứu ghép cặp, không ghép cặp, test
tham số và phi tham số
 Chưa hiểu đúng khái niệm sai số, nhiễu và sự cần thiết phải khống chế sai số và
nhiễu trong nghiên cứu
 Không đánh giá đúng tính cần thiết và giá trị của phân tích đa biến trong khống
chế nhiễu
 Phân tích hồi quy khi chưa quan sát tương quan
 So sánh trước sau can thiệp khi có nhóm chứng nhưng nhóm chứng và nhóm
can thiệp chưa tương thích
6. Bất cập liên quan đến việc tìm kiếm, tham khảo, lưu giữ tài liệu tham khảo
trên Internet
 Chưa biết cách tìm các trang web chứa những thông tin cần thiết để tham khảo
trong nghiên cứu, đặc biệt là các trang web mà các nước đang phát triển có thể
truy cập miễn phí;
5

 Chưa biết cách sử dụng các phần mềm tìm kiếm, tham khảo, lưu giữ và sắp xếp
tài liệu tham khảo;
 Chưa biết triển khai những loại hình nghiên cứu mới sử dụng số liệu có sẵn
trên Internet như việc tổng hợp số liệu có hệ thống (systermatic review) và
phân tích Meta (meta-analysis);
7. Bất cập trong ứng dụng tin học trong thu thập, xử lý và phân tích số liệu
 Chưa biết sử dụng phần mềm thống kê trong chọn mẫu, thiết kế công cụ thu

thập số liệu, nhập liệu, làm sạch số liệu và phân tích số liệu;
 Chưa phân biệt được điểm mạnh, yếu của từng phần mềm thống kê;
 Chưa sử dụng được các phần mềm chuyển bộ số liệu đầu vào để có thể áp dụng
với nhiều phần mềm khác nhau hoặc chuyển dạng số liệu từ phân bố không
chuẩn sang phân bố chuẩn để sử dụng các test tham số thay thế cho các test phi
tham số.
 Chưa tiếp cận được với một số loại hình nghiên cứu mới như nghiên cứu không
gian, nghiên cứu theo Hệ thông tin địa lý (Geographic Information System –
GIS)...


NỘI DUNG
Thực trạng nêu trên về nhu cầu học tập môn thống kê, tin học y học cũng như các
bất cập trong ứng dụng môn học này trong nghiên cứu khoa học đã đặt ra một yêu
cầu cấp bách cho việc phải đổi mới nội dung giảng dạy môn thống kê và tin học y
học trong các trường đại học y. Vấn đề này sẽ được thảo luận chi tiết trong một cuộc
hội thảo vào tháng 4/2011 với sự tham gia của các giảng viên tham gia giảng dạy
môn thống kê, tin học y học trong tám Trường Đại học Y trong khuôn khổ hỗ trợ
của Dự án Tăng cường năng lực giảng dạy bác sỹ y học dự phòng trong tám Trường
Đại học Y Việt Nam, do Tổ chức Nuffic, Hà Lan hỗ trợ.
Về các bất cập mà cán bộ y tế thường gặp khi áp dụng thống kê và tin học y học
trong nghiên cứu khoa học thì với phạm vi tài liệu này, chúng tôi chỉ cung cấp được
những kiến thức chung nhất liên quan đến những bất cập này, chi tiết sẽ được trình
bày trong bộ tài liệu mà hiện Bộ môn Thống kê và Tin học Y học Trường Đại học Y
Hà Nội đang biên soạn. Dưới đây là một số kiến thức cơ bản về thống kê và tin học
y học được tổng hợp, sơ đồ hóa và được trình bày dưới dạng trả lời các câu hỏi để
giúp cho các nhà nghiên cứu có thể giải đáp các vướng mắc của mình khi tiến hành
một đề tài nghiên cứu khoa học cụ thể.
1. Mối liên quan giữa quần thể và mẫu nghiên cứu, giữa thống kê mô tả và
thống kê suy luận trong nghiên cứu như thế nào?

Trong nghiên cứu, đặc biệt là với các nghiên cứu cộng đồng trên một diện rộng thì
người nghiên cứu thường không thể nào điều tra được tất cả các cá thể trong một
quần thể nghiên cứu mà thường chỉ điều qua thông qua một mẫu nghiên cứu được
rút ra từ quần thể theo các cách khác nhau (xác suất hoặc không xác suất). Sơ đồ
dưới đây trình bày mối liên quan giữa nhiều yếu tố trong một quá trình nghiên cứu:
6


























Sơ đồ 2: Mối liên quan giữa quần thể, mẫu, thống kê mô tả và thống kê suy luận
trong nghiên cứu

Rõ ràng rằng khi nghiên cứu theo mẫu, người nghiên cứu không muốn kết luận của
mình chỉ áp dụng với mẫu nghiên cứu (thống kê mô tả) mà muốn kết luận cho cả
quần thể nghiên cứu và quần thể đích. Để làm được điều này thì họ phải áp dụng
thống kê suy luận với 2 phương pháp ước lượng hoặc kiểm định với các test thống
kê thích hợp. Tuy nhiên quá trình ngoại suy này chỉ có thể được thực hiện khi mẫu
được chọn theo phương pháp xác suất (tức là chọn ngẫu nhiên có tính đại diện cao)
với cỡ mẫu đủ lớn.
2. Mối liên quan giữa tên đề tài, mục tiêu chung và mục tiêu cụ thể của nghiên
cứu như thế nào?
Nhiều người nghiên cứu thường không để ý đến mối liên quan của 3 yếu tố này nên
khi đề xuất chúng thường phạm phải sai lầm khó có thể chấp nhận được. Hai ví dụ
dưới đây thể hiện rõ sự bất cập này
Tham số mẫu
( s, p...)
QUẦN THỂ ĐÍCH
QUẦN THỂ
NGHIÊN CỨU
Mẫu
Tham số
quần thể
(

,

, P...)


Mẫu xác suất
- Ngẫu nhiên đơn
- Ngẫu nhiên hệ thống
- Mẫu phân tầng
- Mẫu chùm
- Mẫu nhiều bậc

Mẫu không xác suất
- Mẫu kinh nghiệm
- Mẫu thuận tiện
- Mẫu chỉ tiêu
- Mẫu có mục đích.
Chọn loại
thiết kế và
chọn mẫu
nghiên cứu
Ước lượng
 - điểm
 - khoảng

Kiểm định
giả thuyết

Suy luận thông
kê (Chỉ áp
dụng cho mẫu
xác suất với cỡ
mẫu đủ lớn)
(Thống kê suy
luận)

Kết luận ngoại suy
Các khái niệm:
- Khung chọn mẫu
- Đơn vị quan sát
- Đơn vị mẫu
- Biến nghiên cứu
- Các chỉ số
Các test
thống kê

Giá trị p

Lựa chọn
Mô tả các tham số mẫu
(trình bày kết quả nghiên cứu)
(Thống kê mô tả)

Biến số
7

Ví dụ 1:
• Tên đề tài: Cao huyết áp của người cao tuổi tại huyện A năm 2010 và một số yếu
tố ảnh hưởng
• Mục tiêu chung: Xác định tỷ lệ cao huyết áp của người cao tuổi tại huyện A năm
2010 và một số yếu tố ảnh hưởng
• Mục tiêu cụ thể:
1. Xác định tỷ lệ cao huyết áp của người cao tuổi tại huyện A.
2. Xác định một số yếu tố liên quan đến tình trạng cao huyết áp.
3. Đề xuất (và thăm dò) một số giải pháp can thiệp cộng đồng làm giảm tỷ lệ
tăng huyết áp.

Ví dụ 2:
• Tên đề tài: Huyết áp của người dân tại huyện A năm 2010 và một số yếu tố ảnh
hưởng
• Mục tiêu chung: Xác định tỷ lệ cao huyết áp của người cao tuổi tại huyện A năm
2010 và một số yếu tố ảnh hưởng
• Mục tiêu cụ thể:
1. Xác định tỷ lệ cao huyết áp của người cao tuổi tại huyện A.
2. Xác định một số yếu tố liên quan đến tình trạng cao huyết áp.
3. Đánh giá hiệu quả của một số giải pháp can thiệp cộng đồng làm giảm tỷ lệ
tăng huyết áp.
Rõ ràng là ví dụ 1 thể hiện rõ tên đề tài bao trùm mục tiêu chung, còn mục tiêu
chung lại bao trùm mục tiêu cụ thể và đều tập trung vào cùng một vấn đề nghiên cứu
là cao huyết áp, cùng một đối tượng nghiên cứu là người cao tuổi, cùng một địa dư
(không gian) là huyện A và trong cùng một thời điểm nghiên cứu là năm 2010.
Trong khi đó ở ví dụ 2 thì vấn đề nghiên cứu (huyết áp) và đối tượng nghiên cứu
(người dân) nêu trong tên đề tài quá rộng so với mục tiêu chung (cao huyết áp và
người cao tuổi), và 1 trong 3 mục tiêu cụ thể (mục tiêu 3) lại không hề được đề cập
trong mục tiêu chung và tên đề tài, do vậy nếu ta hình tượng hóa tên đề tài như mái
nhà, mục tiêu chung như trần nhà, các mục tiêu cụ thể như các cột nhà thì với ví dụ
1 ta sẽ có được hình một ngôi nhà hợp lý (hình 1) còn với ví dụ 2 ta sẽ có hình một
ngôi nhà có mái quá to, trần quá nhỏ và có một cột nhà nằm ngoài cả trần lẫn mái
nhà (hình 2)






Hình 1: Hình tượng ngôi nhà ứng với ví dụ 1


Mục tiêu 3

Mục tiêu 2

Mục tiêu 1

Mục tiêu chung
Tên đề tài
8







Hình 2: Hình tượng ngôi nhà ứng với ví dụ 2
3. Mối liên quan giữa mục tiêu cụ thể và biến số như thế nào? Làm thế nào để
chọn đúng và đủ biến số cho một nghiên cứu?
Như ta đã biết, biến số quyết định bản chất và nội dung của mỗi nghiên cứu và với
mỗi mục tiêu nghiên cứu cụ thể thì cần các biến số khác nhau. Nếu ta đã coi các mục
tiêu cụ thể như những cái cột của ngôi nhà (hình 1 và 2) thì biến số chính là các vật
liệu giúp ta hình thành được từng cái cột nhà đó. Sơ đồ 2 ở phần trên đã chỉ rõ sau
khi chọn mẫu xong thì người nghiên cứu sẽ tiến hành thu thập số liệu trên các đối
tương nghiên cứu dựa vào các biến số và sau đó quá trình phân tích số liệu, viết báo
cáo cũng chỉ dựa vào các biến số này. Việc xác định đúng và đủ biến số trước khi
triển khai nghiên cứu là vô cùng quan trọng vì nếu thiếu biến số thì sẽ không có đủ
dữ liệu để phân tích và như vậy mục tiêu nghiên cứu có thể không đạt được (như
một cái cột nhà thiếu nguyên vật liệu để tạo ra nó). Tuy nhiên nếu xác định thừa biến
số thì cũng sẽ rất lãng phí thời gian, công sức và kinh phí để thu thập số liệu cho các

biến số thừa đó vì nó sẽ không được sử dụng trong nghiên cứu. Vì vậy người ta
khuyên rằng khi xác định và chọn biến số người nghiên cứu cần trả lời các câu hỏi
sau:
- Những biến số nào là cần phải thu thập để khi phân tích ta có đủ số liệu kết luận
cho từng mục tiêu cụ thể?
- Những biến số nào được đề cập đến trong phần dự kiến trình bày kết quả nghiên
cứu của đề cương nghiên cứu đã được phê duyệt?
Bằng việc trả lời 2 câu hỏi này, người nghiên cứu sẽ biết được những biến số nào đã
được chọn thừa và biến số nào còn thiếu (so sánh biến có trong trong bộ công cụ thu
thập số liệu với những biến có trong phần dự kiến kết quả nghiên cứu).
4. Khi nào thì biến định lượng không nên (hoặc nên) chuyển sang dạng định
tính để thu thập?
Rất nhiều người đều biết rằng biến định lượng là những biến có giá trị là các con số
(như số đo huyết áp của biến huyết áp) còn biến định tính có giá trị là các chữ viết
hay ký hiệu (như tên tỉnh, huyện, xã của một biến địa dư) và biến định lượng có thể
được chuyển sang dạng định tính để thu thập số liệu (biến tuổi nghề tính bằng năm
được chuyển thành các nhóm tuổi nghề < 5 năm, từ 5-10 năm, từ 11-15 năm, từ 16-
Mục tiêu 3

Mục tiêu 2

Mục tiêu chung
Tên đề tài
Mục tiêu 1

9

20 năm và > 20 năm, nhưng có nhiều người không hiểu rõ khi một biến định lượng
chuyển sang dạng định tính để thu thập số liệu, tính giá trị của chúng bị giảm đi
đáng kể. Hình 3 và 4 dưới đây minh họa cho nhận xét này:







Hình 3: Hai nhóm trẻ có tỷ lệ suy dinh dưỡng bào thai như nhau nhưng cân
nặng khi đẻ trung bình lại rất khác nhau

Nếu những đứa trẻ có cân nặng khi đẻ < 2.500 gram được coi là suy dinh dưỡng bào
thai thì nhóm trẻ A và B đều có tỷ lệ trẻ suy dinh dưỡng bào thai như nhau và đều là
10% (50 trẻ có cân nặng < 2.500 gram trên tổng số 500 trẻ được điều tra). Tuy nhiên
nếu nhìn sự phân bố cân nặng của từng trẻ trên trục số thì hai nhóm trẻ này có sự
khác biệt rất đáng kể và chắc chắn là cân nặng trung bình của nhóm trẻ A sẽ lớn hơn
nhiều so với nhóm trẻ B.
Cũng tương tự như vậy, tình trạng cao huyết áp của đối tượng nghiên cứu thuộc hai
nhóm C và D biểu thị trong hình dưới đây cho thấy hai nhóm này có tỷ lệ đối tượng
bị cao huyết áp tối đa là như nhau (40%) và huyết áp trung bình của hai nhóm này
có thể khác biệt không đáng kể, nhưng nếu xét về mức độ phân tán huyết áp của
từng cá thể thì nhóm D có độ phân tán cao hơn nhiều so với nhóm C và như vậy độ
lệch chuẩn của huyết áp tối đa của nhóm D sẽ cao hơn nhóm C.






Hình 4: Hai nhóm đối tượng nghiên cứu có tỷ lệ cao huyết áp như nhau, giá trị
huyết áp trung bình không khác biệt nhưng độ lệch chuẩn lại rất khác nhau


Như vậy, nếu các bộ số liệu trên được chuyển ngay sang dạng biến nhị phân để phân
tích thì ta không thể phát hiện được sự khác biệt khi chúng ở dưới dạng định lượng.
Chính vì những lý do nêu trên, người ta khuyên là khi thu thập số liệu, ta cố gắng
thu thập chúng ở dưới dạng định lượng.
Ví dụ: Câu hỏi thu thập tuổi nghề của công nhân:
+ Dạng biến định lượng (nên):
Anh/Chị đã làm bao nhiêu năm trong nghề này: . . . . . . . (năm)
2500 gr
50 trẻ
450 trẻ
B
2500 gr
50 trẻ 450 trẻ
A
140 mmHg
300 người 200 người
C
140 mmHg
300 người
200 người
D

×