Trường Đại học Thương Mại
Báo cáo thảo luận
Lý thuyết xác suất và thống kê toán
Nhóm 3
Mã lớp học phần: 1012AMAT0111
Đề tài 4.1: Phương pháp P - giá trị trong kiểm định giả thuyết
thống kê về kỳ vọng toán.
Danh sách thành viên:
1) Bùi Thị Đào
2) Nguyễn Hữu Đạt
3) Nguyễn Mẫu Đơn
4) Tạ Văn Đức
5) Hồ Ngọc Diệp
6) Phan Thị Thanh Dung
7) Đào Anh Dũng
8) Nguyễn Việt Dũng
9) Nguyễn Thị Hồng Gấm
Lời mở đầu
Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là một
bộ phận quan trọng của thống kê toán. Nó là phương tiện giúp ta giải quyết những
bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể.
Trong kiểm định giả thuyết thống kê về kỳ vọng toán, thông thường ta thường giả
sử dấu hiệu X cần nghiên cứu trên đám đông có E(X) µ, Var(X) , trong đó
µ chưa biết. Từ một cơ sở nào đó người ta tìm được µ , nhưng nghi ngờ về
điều này. Với mức ý nghĩa cho trước ta cần kiểm định giả thuyết : µ .
Từ đám đông lấy ra mẫu: và tính được các đặc trưng mẫu:
, . Lấy một mẫu cụ thể
. Từ mẫu này ta tính được , rồi so sánh với để bác bỏ
hay không bác bỏ , chấp nhận hay không chấp nhận .
Thủ tục trình bày ở trên có tính chất truyền thống và thường được gọi là kiểm định
theo cách tiếp cận cổ điển, theo đó ta xác định được các bộ phận của một giả thuyết
thống kê theo các sai lầm loại 1 và loại 2 tương ứng với xác suất và . Trong
những năm gần đây nhiều nhà nghiên cứu thường sử dụng một cách tiếp cận khác.
Thay vì kiểm định giả thuyết với một giá trị định trước thì họ cho rằng ta nên
định rõ các giả thuyết cơ sở và giả thuyết đối , sau đó thu thập các số liệu
mẫu và xác định mức độ khẳng định việc bác bỏ giả thuyết . Mức độ khẳng
định này thường được gọi là giá trị P(P- value). Và phương pháp này được gọi là
phương pháp P- giá trị (P-Value).
Sau khi kết thúc học phần lý thuyết và xác suất thống kê toán, nhóm chúng tôi đã
vinh dự được giao nhiêm vụ thảo luận: Phương pháp P – giá trị trong kiểm định giả
thuyết thống kê về kỳ vọng toán. Thực sự đây là cơ hội rất tốt để chúng tôi có thể
hoàn thiện kiến thức của mình cho môn học đồng thời cũng là cơ hội để được làm
việc theo nhóm.
Bài thảo luận này được xây dựng dựa trên cơ sở của: giáo trình Lý thuyết xác suất
và thống kê toán của trường Đại học Thương Mại, giáo trình Lý thuyết xác suất và
thống kê toán của trường Đại học Kinh Tế Quốc Dân cùng với các kiến thức đã
tiếp thu được từ các bài giảng của giảng viên bộ môn trường Đại học Thương Mại.
Do thời gian, điều kiện và khả năng có hạn, bài thảo luận nhóm chúng tôi không
tránh khỏi những khiếm khuyết. Chúng tôi rất mong nhận được sự cảm thông, chia
sẻ và góp ý từ phía các giảng viên, các bạn sinh viên và những ai quan tâm để bài
thảo luận nhóm được hoàn thiện hơn.
Hà Nội, ngày 28/04/2010
Tập thể nhóm 3
Phương pháp P – giá trị trong kiểm định giả thuyết
thống kê về kỳ vọng toán
Để hiểu rõ hơn phương pháp này, trước hết ta xét bài toán kiểm định giả thuyết về
kỳ vọng toán của một ĐLNN phân phối chuẩn với đã biết sau:
Ta vẫn dùng TCKĐ như trong phương pháp kiểm định truyền thống: .
Nếu đúng thì . Từ mẫu cụ thể ta tìm được:
Tiếp đến ta tính được P (trong đó U~N(0,1) – quy luật phân phối xác
suất của TCKĐ khi đúng). Nếu p khá bé thì ta có cơ sở bác bỏ vì khi p khá
bé, theo nguyên lý xác suất nhỏ, trong thực hành ta có thể coi biến cố
không xảy ra trong một lần lấy mẫu. Dĩ nhiên nếu không quá bé ta
chưa có cơ sở bác bỏ .
Xác suất được gọi là P- giá trị (hoặc P-value).
Như vậy P- giá trị , trong đó U~N(0,1) (quy luật phân phối xác suất
của TCKĐ khi ) đúng),
Sau khi tìm được P- giá trị người ta có thể sử dụng nó để kết luận về giả thuyết
theo hai cách như sau:
Cách thứ nhất:
- Nếu P- giá trị thì thường người ta nhận .
- Nếu 0,005 < P- giá trị < 0,1 thì cần cân nhắc cẩn thận trước khi bác bỏ .
- Nếu 0,01< P- giá trị < 0,005 thì nghiêng về hướng bác bỏ nhiều hơn.
- Nếu 0,001 <P- giá trị < 0,01 thì có thể ít băn khoăn trước khi bác bỏ .
- Nếu P- giá trị < 0,001 thì có thể hoàn toàn yên tâm khi bác bỏ .
Cách thứ hai:
- Nếu P- giá trị < thì bác bỏ .
- Nếu P- giá trị > chưa có cơ sở bác bỏ .
Theo cách thứ hai này việc sử dụng P- giá trị lại quay về phương pháp kiểm
định giả thuyết thống kê truyền thống.
Trường hợp 1: ĐLNN trên đám đông có phân phối chuẩn với đã
biết.
Bài toán 1: ; P- giá trị .
Trong đó U~N(0,1) và
Bài toán 2: ; P- giá trị .
Bài toán 3: ; P- giá trị .
Chú ý: Các công thức tìm P- giá trị trên còn được dùng cho các bài toán kiểm định
giả thuyết thống kê khác, trong đó có dùng tiêu chuẩn U.
Các ví dụ
Bài toán 1 : ; P- giá trị .
Các bước làm:
• Xác định:
• Nếu đúng thì U~N(0,1) và
• Dùng phương pháp P- giá trị = 2P(U>
• Kết luận theo giá trị của P- giá trị.
Ví dụ 1: Trước khi thay đổi trang thiết bị, tiền lãi trung bình mỗi ngày của
một cửa hàng là 20 triệu đồng. Sau khi thay đổi trang thiết bị, theo dõi 16
ngày liên tiếp thấy tiền lãi trung bình của mỗi ngày là 20,3 triệu đồng.
Sử dụng phương pháp P- giá trị để kết luận xem: với mức ý nghĩa 0,05 có
thể cho rằng sau khi thay đổi trang thiết bị tiền lãi trung bình đã thay đổi hay
không?
Biết tiền lãi mỗi ngày của cửa hàng là một ĐLNN phân phối chuẩn với độ
lệch tiêu chuẩn là 0,6 triệu đồng.
Tóm tắt:
X: ĐLNN phân phối chuẩn
Lời giải
Gọi X là số tiền lãi của cửa hàng trong một ngày.
là số tiền lãi trung bình của cửa hàng trong một ngày trên mẫu.
là số tiền lãi trung bình của cửa hàng trong một ngày trên đám đông.
Vì X có phân phối chuẩn nên : .
Với mức ý nghĩa cần kiểm định:
XĐTCKĐ: . Nếu đúng thì U~N(0,1).
Khi đó ta tìm được P- giá trị
Ta có
P-giá trị
=> bác bỏ .
Kết luận: Vậy với mức ý nghĩa 0,05 có thể cho rằng sau khi thay đổi trang
thiết bị tiền lãi trung bình đã thay đổi.
Bài toán 2 ; P- giá trị
Các bước làm:
• Xác định:
• Nếu đúng thì U~N(0,1) và
• Dùng phương pháp P- giá trị = P(U>
• Kết luận theo giá trị của P- giá trị.
Ví dụ 1: Theo dõi 25 bệnh nhân mắc bệnh ung thư gan thấy thời gian trung
bình từ khi phát hiện ra bệnh đến khi chết kéo dài 49 tháng.
Sử dụng phương pháp P- giá trị để kết luận xem: với mức ý nghĩa 0,05 có
thể nói rằng thời gian trung bình từ khi phát hiện ra bệnh đến khi chết kéo
dài hơn 4 năm hay không?
Biết thời gian từ khi phát hiện ra bệnh ung thư gan đến khi chết của bệnh
nhân là một ĐLNN phân phối chuẩn với độ lệch tiêu chuẩn là 4 tháng.
Tóm tắt:
X: ĐLNN phân phối chuẩn.
Lời giải
Gọi X là thời gian từ khi phát hiện ra bệnh đến khi chết của bệnh nhân.
là thời gian trung bình khi phát hiện ra bệnh đến khi chết của bệnh
nhân trên mẫu.
là thời gian trung bình khi phát hiện ra bệnh đến khi chết của bệnh
nhân trên đám đông.
Vì X có phân phối chuẩn nên: .
Với mức ý nghĩa cần kiểm định: