Tải bản đầy đủ (.ppt) (47 trang)

Nguyên lí kiểm định thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (745.4 KB, 47 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

Nguyên lí kiểm định thống kê

TS. Đỗ Văn Dũng

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

Biến số, thống kê, tham số

<small>Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối tượng:</small>

<small>Có hút thuốc lá hay không hút thuốc lá </small>

<small>Chiều cao của một người</small>

<small>Tham số: Đặc trưng của đặc tính hay đại lượng của dân số</small>

<small>Tỉ lệ hút thuốc lá ở nam thanh niên Việt Nam</small>

<small>Chiều cao trung bình của nam thanh niên Việt Nam</small>

<small>Thống kê: đặc trưng của đặc tính hay đại lượng của mẫu</small>

<small>Tỉ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100 thanh niên</small>

<small>Chiều cao trung bình 100 thanh niên trong mẫu nghiên cứu</small>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

Kiến thức tiền nghiệm

lượng protein cao

Chặt chẽ nhưng phụ thuộc vào giá trị của đại mệnh đề

Nếu tiểu mệnh đề đúng chưa chắc đại mệnh đề đã đúng

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

Kiến thức hậu nghiệm

đại mệnh đề

suy ra tiểu mệnh đề

<small>Nếu tiểu mệnh đề đúng => không kết luận được</small>

<small>Nếu tiểu mệnh đề sai => bác bỏ đại mệnh đề</small>

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

Kiểm định ý nghĩa

bởi R A Fisher

ở bệnh nhân thiếu máu

<small>Một nhóm gồm 50 bệnh nhân điều trị với thuốc A </small>

<small>Sau khi điều trị Hemoglobin trung bình cải thiện 2,5 (g/lít)</small>

<small>Xác suất xảy ra sự khác biệt là 2 nếu thực sự thuốc A khơng có tác dụng cải thiện tình trạng thiếu máu</small>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<small>Nguyên tắc kiểm định ý nghĩa theo Fisher. Đường phân phối màu xanh dương thể hiện phân phối khi thuốc A khơng có tác dụng (giả thuyết Ho), Vùng diện tích màu </small>

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<small></small>

Nếu thuốc A khơng có hiệu quả lên hemoglobin (giả thuyết Ho)

và hemoglobin thay đổi giá trị s

giá trị s > 0,05

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<small></small>

Nếu thuốc A không có hiệu quả lên hemoglobin (giả thuyết Ho)

bệnh nhân này tăng không quá 2g/l

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

Cơ sở lý luận của kiểm định

<small>P(A)P(B|A) = P(B)P(A|B) = P(A và B)</small>

<small>P(A|B)= thấp  P(B|A)= thấp</small>

<small>Nếu P (cĩ cải thiện hemoglobin 2,5 nếu thuốc A vơ dụng) thấp => P (thuốc A vơ dụng khi cĩ sự </small>

<small>hemoglobin cải thiện) thấp </small>

<small>Trong thống kê </small>

<small>(A  B )  {P(B ) thấp P(B ) thấp  P(A) thấp)</small>

<small>H</small><sub>o</sub><small>  Tkê S  P(Tkê S | H</small><sub>0</sub><small> ) < ngưỡng  bác bỏ H</small><sub>o</sub>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

Cơ sở lý luận của kiểm định

<small></small>

Trong logic học

P(A|B)=0  P(B|A)=0

Nếu khơng cĩ trung tiện ở bệnh nhân tắc ruột => khơng xảy ra tắc ruột ở BN cĩ trung

(A  B )  (B  A)

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<small></small> Giá trị p (p-value)

<small>P (có cải thiện hemoglobin trung bình tăng trên 2,5 nếu thuốc A khơng có hiệu quả)</small>

<small>Giá trị p=P(Xảy ra thống kê cực đoan hơn kết quả |Giả thuyết Ho)</small>

<small>Chỉ số đo lường sức mạnh chống lại giả thuyết Ho: Xác định nguy cơ bác bỏ nhầm giả thuyết Ho</small>

<small>P <0,05: bằng chứng chống lại Ho 0,05 là ngưỡng để bác bỏ Ho</small>

<small>Ngưỡng 0,05 là tùy tiện (arbitrary) - Việc lí giải giá trị p dành cho nhà nghiên cứu</small>

<small>Được kí hiệu là sig (significant level) trong phần mềm SPSS</small>

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<small></small> Nếu sử dụng ANOVA để so sánh trung bình giữa các nhóm nhưng test Barlet cho thấy phương sai giữa các nhóm là khác nhau, có thể sử dụng 1 trong 2 giải pháp

<small>Sử dụng kiểm định phi tham số Kruskal-Wallis</small>

<small>Sử dụng phép biến đổi log: tạo biến mới bằng logarithm của biến phụ thuộc và thực hiện lệnh oneway trên biến số này</small>

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

Giả thuyết thống kê

hành suy luận thống kê

cứu muốn chứng minh (do việc chứng minh được thực hiện bằng phản chứng)

sự khác biệt

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

Giả thuyết thống kê: Các thí dụ

<small></small>

Chiều cao trung bình nam = chiều cao trung bình ở nữ

<small></small>

Tỉ lệ bị nhồi máu cơ tim ở nhóm tăng

cholesterol = tỉ lệ nhồi máu cơ tim ở nhóm có cholesterol thấp

<small></small>

Thuốc A có hiệu quả điều trị bằng thuốc B

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<small></small> Kiểm định 1 bên và kiểm định 2 bên

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

<small></small>

Vì khơng thể tính được xác suất thuốc A khơng có hiệu quả khi có thay đổi

hemoglobin

hemoglobin khi thuốc A khơng có hiệu quả

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

Giả thuyết Ho

khơng khác biệt, khơng có liên quan

được giả thuyết H

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

<small></small>

Nguyên lí của kiểm định là gì?

<small></small>

Giá trị p là gì?

có phải là giả thuyết Ho hay khơng?

khơng có tác dụng phịng bệnh cúm”. Nếu giá trị p là 0,01, có thể rút ra kết luận gì?

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

Kiểm định giả thuyết

<small>Do Neyman và Pearson đề xuất</small>

<small>Đưa ra cách tiếp cận khách quan, dựa vào quyết định để thay thế quan điểm chủ quan của sức mạnh bằng chứng chống lại giả thuyết Ho</small>

<small>Quan tâm đến cả nguy cơ bác bỏ nhầm giả thuyết Ho lẫn nguy cơ chấp nhận nhầm giả thuyết Ho</small>

<small>“Khơng có kiểm định nào cho bằng chứng có giá trị về chân lí hay sai lầm của giả thuyết. Nhưng chúng ta có thể nhìn nhận mục đích của kiểm định theo quan điểm khác. … </small>

<small>Chúng ta tìm quy tắc quy định hành vi của chúng ta đối với các giả thuyết để nhìn chung, chúng ta ít mắc phải các sai </small>

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

<small>Xác suất sailầm loại 1</small>

<small>Nhỏ<0,05</small>

<small>Bác bỏ giả thuyết</small>

<small>Xác suất sai</small>

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

Kiểm định giả thuyết

<small>Để sử dụng cách tiếp cận của Neyman-Pearson, chúng ta phải xác định giả thuyết thay thế một cách chính xác</small>

<small>Nói cách khác, nói rằng thuốc A có hiệu quả là khơng đủ mà phải xác định thuốc A có hiệu quả bao nhiêu</small>

<small>Quy tắc kiểm định có thể xác định bằng xác định nguy cơ sai lầm loại I, nguy cơ sai lầm loại II và xác định giả thuyết thay thế</small>

<small>Khơng thể lí giải giá trị p để đánh giá sức mạnh của bằng chứng chống lại giả thuyết khơng trong một nghiên cứu riêng lẻ</small>

<small>Ít nhà nghiên cứu thơng suốt được các điều lí tưởng này </small>

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

Phân biệt 2 cách tiếp cận

<small>thuyết không (Ho) và giả thuyết thay thế (Ha) một cách chính xác</small>

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

<small>Mối liên quan giữa sai lầm loại 1, sai lầm loai 2, cỡ mẫu và khoảng cách giữa Ho - Ha (khoảng 3 lần se). Đường phân phối màu xanh dương thể hiện giả thuyết Ho, </small>

<small>đường màu đỏ thể hiện giả thuyết Ha. Vùng diện tích màu đỏ là xác suất </small><b><small>sai lầm loại </small></b>

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

<small>Khi khoảng cách Ho-Ha tăng lên, vùng diện tích màu xanh thể hiện xác suất </small><b><small>sai lầm loại 2 (2%)</small></b><small> sẽ giảm đi. Nếu đã xác định Ha và cỡ mẫu để có  =20%, thì   20% </small>

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

<small>Khi khoảng cách Ho-Ha giảm đi, vùng diện tích màu xanh thể hiện xác suất </small><b><small>sai lầm loại 2 (70%)</small></b><small> sẽ tăng lên. </small>

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

<small>Khi khoảng cách Ho-Ha giảm đi, cần phải tăng cỡ mẫu để đường cong phân phối của giả thuyết Ho và Ho hẹp lạI để vùng diện tích màu xanh thể hiện xác suất </small><b><small>sai lầm </small></b>

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

Bài tập

Dựa vào đề cương nghiên cứu của nhóm hãy

<small></small>

Nêu sai lầm loại II

</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">

Chọn lựa kiểm định phù hợp

<small>Biến phụ thuộc</small>

<small>(hậu quả)</small> Biến độc lập (nguyên nhân)

<small>Nhị giáDanh địnhThứ tự -Định lượng</small>

<small>tổng quát</small> <sup>Wilcoxon tổng </sup><small>quát</small> <sup>Hồi quy Cox</sup>

<small>Phi tham số - Phân tích đa biến – Biến sống cịn</small>

</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">

Kết luận

tổng quát cho toàn bộ dân số mục tiêu

nghiên cứu và phải thể hiện bằng một đẳng thức

càng nhỏ chúng ta càng mạnh dạn bác bỏ giả thuyết Ho

</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">

<small></small> Có kiểm định 2 bên và kiểm định 1 bên. Kiểm định 2 bên tốt hơn vì khơng địi hỏi các giả định

lầm loại 2 là sai lầm khi chấp nhận

độc lập và biến phụ thuộc

lượng khơng phân phối bình thường (hay biến thứ tự) được gọi là kiểm định phi tham số

</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">

<small></small>

Cho 2 nhóm trẻ em, một nhóm có tiêm ngừa và một nhóm khơng tiêm ngừa.

Sau đó theo dõi nhóm nào có tỉ lệ bệnh ho gà cao hơn.

</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39">

Phân biệt

<small></small>

Biến số - variables(chiều cao, giới tính, cân nặng) đặc tính của một người

<small></small>

Thống kê - Statistics (trung bình, tỉ lệ) đặc tính của một mẫu

số, tỉ lệ trong dân số) đặc tính của tồn bộ dân số

</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">

<small></small>

Cho 2 nhóm bệnh nhân, một nhóm suy dinh dưỡng và nhóm dinh dưỡng tốt.

Đánh giá hiệu giá kháng thể sau tiêm vaccine ở 2 nhóm này

</div><span class="text_page_counter">Trang 41</span><div class="page_container" data-page="41">

<small>Loại thiết kế nghiên cứu</small>

</div><span class="text_page_counter">Trang 42</span><div class="page_container" data-page="42">

<small></small>

Thảo luận:

</div><span class="text_page_counter">Trang 43</span><div class="page_container" data-page="43">

Tóm tắt

xác dưới dạng một đẳng thức

càng nhỏ việc bác bỏ giả thuyết Ho càng mạnh

và sai lầm khi chấp nhận (loại 2)

đo của biến phụ thuộc và thiết kế

</div><span class="text_page_counter">Trang 46</span><div class="page_container" data-page="46">

<small>Kiểm định phi tham số </small>

<small>Không địi hỏi biến số phân phối bình thường</small>

<small>Khơng địi hỏi phương sai đồng nhất</small>

<small>Dễ tính tốn</small>

<small>Nhưng: khơng ước lượng được tham số</small>

<small>Khuynh hướng cũ: sử dụng phi tham số khi biến khơng phân phối bình thường</small>

<small>Khuynh hướng mới: dùng kiểm định tham số (và dùng phép biến đổi biến số (transformation) để có phân phối bình thường hay dùng kiểm định t-test với phương sai không bằng nhau)</small>

</div>

×