Tải bản đầy đủ (.pdf) (187 trang)

Bài giảng thống kê trong lâm nghiệp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.07 MB, 187 trang )

TS. CAO THỊ THU HIỀN

THèNG K£

TRONG L¢M NGHIƯP

TRƯỜNG ĐẠI HỌC LÂM NGHIỆP - 2020


TS. CAO THỊ THU HIỀN

BÀI GIẢNG

THỐNG KÊ TRONG LÂM NGHIỆP

TRƢỜNG ĐẠI HỌC LÂM NGHIỆP - 2020



MỤC LỤC
MỤC LỤC ....................................................................................................................i
DANH MỤC CÁC BẢNG ........................................................................................ iii
DANH MỤC CÁC HÌNH ........................................................................................... v
LỜI NĨI ĐẦU.............................................................................................................1
Chƣơng 1. CƠ SỞ CỦA LÝ THUYẾT XÁC SUẤT ..............................................3
1.1. Thử nghiệm, biến cố, xác suất .........................................................................3
1.2. Biến ngẫu nhiên ............................................................................................. 11
1.3. Ví dụ về các biến ngẫu nhiên rời rạc và liên tục ............................................12
1.4. Kỳ vọng và phương sai .................................................................................. 21
1.5. Các biến ngẫu nhiên và tổng của các biến ngẫu nhiên ..................................24
Chƣơng 2. PHÂN BỐ CHUẨN .............................................................................. 33


2.1. Phân bố chuẩn ................................................................................................ 33
2.2. Hình dạng phân bố ......................................................................................... 36
2.3. Tại sao phân bố chuẩn thú vị?........................................................................37
2.4. Các diện tích dưới đường cong phân bố chuẩn.............................................. 43
2.4.1. Tìm các diện tích dưới đường cong phân bố chuẩn .....................................43
2.4.2. Tìm hiểu thêm về việc tìm các diện tích dưới đường cong chuẩn tiêu chuẩn ...45
2.5. Chuyển đổi thành điểm chuẩn........................................................................52
2.5.1. Chuyển đổi điểm thô thành điểm z .................................................................52
2.5.2. Chuyển đổi điểm z thành điểm thô .................................................................55
Chƣơng 3. PHƢƠNG PHÁP BÌNH PHƢƠNG NHỎ NHẤT ............................. 59
3.1. Mơ hình hồi quy tuyến tính và phương trình phân bố chuẩn Gaussian .........59
3.2. Tương quan nhiều lớp và hệ số xác định ....................................................... 75
3.3. Ví dụ về mơ hình hồi quy phi tuyến .............................................................. 76
Chƣơng 4. THỐNG KÊ MÔ TẢ ............................................................................80
4.1. Các khái niệm cơ bản và phân bố tần số ........................................................ 80
4.2. Đặc trưng vị trí, đặc trưng biến động và đặc trưng hình dạng ....................... 90
4.2.1. Đặc trưng vị trí................................................................................................90
4.2.2. Đặc trưng biến động .....................................................................................101
4.3. Phân bố hai/nhiều hướng .............................................................................106
4.4. Tương quan ..................................................................................................111
i


Chƣơng 5. THỐNG KÊ KẾT THÚC, ƢỚC TÍNH VÀ KIỂM TRA ............... 115
5.1. Khoảng tin cậy ............................................................................................. 115
5.2. Tiêu chuẩn Gauss và xác suất của sai số ..................................................... 117
5.3. Tiêu chuẩn t của Student .............................................................................. 124
5.4. Hai mẫu ........................................................................................................ 125
5.5. Tiêu chuẩn t cho hai mẫu liên hệ ................................................................. 130
5.6. Phân tích phương sai một nhân tố ............................................................... 131

5.7. Phân tích phương sai hai nhân tố ................................................................. 135
5.8. Các dạng biến đổi ........................................................................................ 137
Chƣơng 6. HỒI QUY TUYẾN TÍNH ĐƠN GIẢN ............................................ 139
6.1. Hồi quy và tương quan ................................................................................ 139
6.2. Phương trình hồi quy tuyến tính đơn giản ................................................... 141
6.3. Kiểm tra sự tồn tại của hồi quy .................................................................... 146
6.4. Khoảng tin cậy trong hồi quy ...................................................................... 151
Chƣơng 7. SO SÁNH CÁC PHƢƠNG TRÌNH HỒI QUY TUYẾN TÍNH ĐƠN 153
7.1. So sánh hai hệ số hồi quy ............................................................................ 153
7.2. So sánh hai hệ số tự do ................................................................................ 157
7.3. So sánh nhiều hệ số hồi quy ........................................................................ 161
7.4. So sánh nhiều hệ số tự do ............................................................................ 164
7.5. Nhiều so sánh giữa các hệ số hồi quy .......................................................... 165
7.6. Nhiều so sánh giữa các hệ số tự do .............................................................. 165
Chƣơng 8. TƢƠNG QUAN TUYẾN TÍNH ĐƠN GIẢN .................................. 167
8.1. Hệ số tương quan ......................................................................................... 167
8.2. Khoảng tin cậy của hệ số tương quan tổng thế ............................................ 171
TÀI LIỆU THAM KHẢO ....................................................................................... 176

ii


DANH MỤC CÁC BẢNG
Bảng 1.1. Kết quả thống kê loài cây và tính chất bị nhiễm nấm .................................8
Bảng 1.2. Bảng tổng hợp số cây theo lồi và có/khơng nhiễm bệnh .......................... 8
Bảng 2.1. Các mẫu có dung lượng là 2 và trung bình mẫu tương ứng ..................... 39
Bảng 2.2. Các mẫu có dung lượng bằng 3 và trung bình mẫu tương ứng ................ 40
Bảng 2.3. Tính xác suất theo các giá trị trong bảng .................................................. 44
Bảng 2.4. Các diện tích tương ứng với z = 2,15 ....................................................... 47
Bảng 2.5. Các diện tích tương ứng với z = 1,58 ....................................................... 48

Bảng 2.6. Các diện tích tương ứng với z = 0,85 ....................................................... 49
Bảng 2.7. Diện tích tương ứng từ z = 1,33 đến z = 0,33 ...........................................50
Bảng 2.8. Diện tích tương ứng với z = −2,20 và z = 0,25 .........................................50
Bảng 2.9. Bảng hiển thị diện tích gần đúng nhỏ hơn khoảng 0,1 ............................. 51
Bảng 3.1. Kết quả đo đường kính ngang ngực và chiều cao vút ngọn của cây rừng
được đo cho ơ tiêu chuẩn có diện tích 2.500 m2 ở trạng thái rừng lá rộng thường
xanh ở vùng lõi Khu bảo tồn thiên nhiên Na Hang, Tuyên Quang ........................... 59
Bảng 3.2. Kết quả đo x và y ...................................................................................... 63
Bảng 3.3. Kết quả tính tổng và số trung bình ............................................................ 64
Bảng 3.4. Kết quả đo đường kính ngang ngực và chiều cao vút ngọn của cây rừng
được đo cho ô tiêu chuẩn có diện tích 2.000 m2 ở trạng thái rừng lá rộng thường
xanh nghèo kiệt tại Vườn quốc gia Bái Tử Long và trên địa bàn huyện Vân Đồn,
tỉnh Quảng Ninh ........................................................................................................66
Bảng 4.1. Số liệu kiểm kê chất lượng rừng trồng của lồi cây Keo lai ở 100 ơ
tiêu chuẩn ...................................................................................................... 83
Bảng 4.2. Kết quả điều tra đường kính ngang ngực của kiểu rừng kín lá rộng thường
xanh mưa ẩm nhiệt đới tại xã Háng Đồng, huyện Bắc Yên, tỉnh Sơn La ................. 83
Bảng 4.3. Kết quả lập bảng tần số về đường kính ngang ngực của 99 cây ở kiểu
rừng kín lá rộng thường xanh mưa ẩm nhiệt đới ....................................................... 85
Bảng 4.4. Kết quả điều tra đường kính ngang ngực của của trạng thái rừng gỗ tự nhiên
núi đất lá rộng thường xanh giàu tại xã Háng Đồng, huyện Bắc Yên, tỉnh Sơn La .......86
Bảng 4.5. Kết quả lập bảng tần số thứ cấp về đường kính ngang ngực của trạng thái
rừng gỗ tự nhiên núi đất lá rộng thường xanh giàu ................................................... 88
Bảng 4.6. Ranh giới giữa các tổ ................................................................................ 89
Bảng 4.7. Kết quả đo chiều cao cây rừng được đo cho ơ tiêu chuẩn có diện tích
2.000 m2 ở trạng thái rừng gỗ tự nhiên núi đất lá rộng thường xanh phục hồi tại xã
Long Hẹ, huyện Thuận Châu, tỉnh Sơn La ............................................................... 92
iii



Bảng 4.8. Kết quả đo chiều cao cây rừng được đo cho ơ tiêu chuẩn có diện tích
2.500 m2 ở trạng thái rừng gỗ tự nhiên núi đất lá rộng thường xanh phục hồi tại xã
Liệp Tè, huyện Thuận Châu, tỉnh Sơn La ................................................................. 94
Bảng 4.9. Bảng tần số ............................................................................................... 95
Bảng 4.10. Kết quả đo đường kính ngang ngực của cây rừng được đo cho ơ tiêu
chuẩn có diện tích 2.000 m2 ở trạng thái rừng hỗn giao tre nứa tại xã Tà Hộc, huyện
Mai Sơn, tỉnh Sơn La ................................................................................................ 96
Bảng 4.11. Kết quả sắp xếp các giá trị quan sát theo thứ tự từ nhỏ đến lớn ............. 98
Bảng 4.12. Kết quả đo đường kính ngang ngực của cây rừng lá rộng thường xanh tại
lâm trường Trường Sơn, tỉnh Quảng Bình .............................................................. 101
Bảng 4.13. Kết quả đo đường kính ngang ngực và chiều cao vút ngọn của cây rừng
được đo cho ơ tiêu chuẩn có diện tích 2.000 m2 ở trạng thái rừng lá rộng thường
xanh tại huyện Vũ Quang, tỉnh Hà Tĩnh ................................................................. 106
Bảng 4.14. Bảng tương quan hai chiều ................................................................... 108
Bảng 5.1. Xác suất sai lầm loại 1 và loại 2 ............................................................. 121
Bảng 5.2. Một số giá trị của xác suất sai lầm loại hai ............................................. 123
Bảng 5.3. Bảng điều tra cây bị bệnh và không bị bệnh........................................... 127
Bảng 5.4. Kết quả điều tra xuất xứ.......................................................................... 135
Bảng 5.5. Phân tích phương sai............................................................................... 135
Bảng 6.1. Kết quả điều tra ngày tuổi và chiều dài cánh của một loài chim ............ 140
Bảng 6.2. Tổng hợp phân tích phương sai để kiểm tra giả thuyết H0: β = 0, H1: β ≠ 0..... 149
Bảng 6.3. Phân tích phương sai trong hồi quy ........................................................ 149
Bảng 7.1. Các tính tốn để so sánh sự khác nhau giữa k hệ số hồi quy.................. 162
Bảng 8.1. Các bảng phân bố chuẩn tiêu chuẩn ....................................................... 172

iv


DANH MỤC CÁC HÌNH
Hình 1.1. Tập hợp các sự kiện cơ bản .........................................................................4

Hình 1.2. Xác suất của hai biến cố ..............................................................................7
Hình 1.3. Xác suất có điều kiện .................................................................................. 9
Hình 1.4. Xác suất lựa chọn các khúc gỗ đáp ứng đủ điều kiện ............................... 10
Hình 1.5. Biến ngẫu nhiên ......................................................................................... 11
Hình 1.6. Phân bố nhị thức ........................................................................................ 13
Hình 1.7. Phân bố Poisson ........................................................................................ 14
Hình 1.8. Phân bố số cây theo cỡ đường kính........................................................... 15
Hình 1.9. Phân bố Gaussian ...................................................................................... 16
Hình 1.10. Xác suất của phân bố Gaussian ............................................................... 16
Hình 1.11. Hàm phân phối của phân bố Gaussian .................................................... 17
Hình 1.12. Phân bố Weibull 3 tham số .....................................................................20
Hình 1.13. Phân bố mũ .............................................................................................. 21
Hình 1.14. Kỳ vọng ...................................................................................................21
Hình 1.15. Phân bố của Xi ......................................................................................... 30
Hình 1.16. Phân bố của các giá trị trung bình ........................................................... 30
Hình 1.17. Xác suất của phân bố nhị thức ................................................................ 32
Hình 2.1. Phân bố chuẩn ........................................................................................... 33
Hình 2.2. Phân bố chuẩn với các số trung bình khác nhau, độ lệch chuẩn giống nhau ... 34
Hình 2.3. Phân bố chuẩn với hai giá trị trung bình giống nhau, độ lệch chuẩn khác
nhau ........................................................................................................................... 35
Hình 2.4. Ba phân bố chuẩn ...................................................................................... 35
Hình 2.5. Ví dụ về một phân bố lệch ........................................................................36
Hình 2.6. Phân bố đều ............................................................................................... 36
Hình 2.7. Hộp chứa vé đánh dấu 1, 2, 3 ....................................................................38
Hình 2.8. Phân bố của X ........................................................................................... 39
Hình 2.9. Phân bố mẫu của giá trị trung bình cho n = 2 ...........................................40
Hình 2.10. Phân bố của giá trị trung bình cho n = 3 ................................................. 41
Hình 2.11. Các mẫu cho số lượng trẻ em, n = 2 ........................................................ 42
Hình 2.12. Đường cong phân bố chuẩn tiêu chuẩn hiển thị các diện tích................. 43
Hình 2.13. Diện tích bóng mờ biểu thị tỷ lệ điểm vượt q z = 2,15 ....................... 47

Hình 2.14. Diện tích bóng mờ biểu thị tỷ lệ các điểm lên tới z = 1,58 ..................... 48
Hình 2.15. Diện tích bóng mờ biểu thị tỷ lệ các điểm từ z = -0,85 đến z = 0 ...........49
v


Hình 2.16. Diện tích bóng mờ biểu thị tỷ lệ các điểm từ z = 0,33 đến z = 1,33 ....... 49
Hình 2.17. Diện tích bóng mờ biểu thị tỷ lệ các điểm từ z = -2,20 đến z = 0,25 ...... 50
Hình 2.18. Diện tích bóng mờ biểu thị 0,1 (10%) các điểm ..................................... 51
Hình 2.19. Điểm thơ và điểm z tương đương ........................................................... 53
Hình 2.20. Diện tích bóng mờ biểu thị tỷ lệ học sinh có điểm cao hơn Mai ............ 55
Hình 2.21. Điểm trong bài kiểm tra tiếng Anh và điểm z tương ứng ...................... 55
Hình 2.22. Điểm z và điểm số thơ tương ứng ........................................................... 56
Hình 2.23. Đường cong chuẩn với 95% số điểm nhỏ hơn z ..................................... 57
Hình 3.1. Biểu đồ biểu diễn mối quan hệ H - D ....................................................... 61
Hình 3.2. Biểu đồ minh họa tổng bình phương độ lệch ............................................ 61
Hình 3.3. Tổng của phần dư ...................................................................................... 62
Hình 3.4. Kết quả tính

và biểu diễn quan hệ x - y ........................................ 65

Hình 3.5. Quan hệ H - D theo dạng hàm bậc 2 ......................................................... 70
Hình 3.6. Mối quan hệ giữa chiều cao, đường kính và tuổi ...................................... 72
Hình 3.7. Mối quan hệ giữa chiều cao, đường kính và tuổi trong khơng gian ba
chiều .......................................................................................................................... 73
Hình 3.8. Mối tương quan giữa chiều cao với đường kính ....................................... 75
Hình 3.9. Mối quan hệ giữa tăng trưởng và tuổi ....................................................... 76
Hình 3.10. Hàm tăng trưởng ..................................................................................... 78
Hình 3.11. Đường cong chiều cao............................................................................. 78
Hình 4.1. Phân loại các biến định lượng ................................................................... 82
Hình 4.2. Phân bố tần số theo cỡ đường kính ........................................................... 86

Hình 4.3. Biểu đồ tần số tuyệt đối ............................................................................. 89
Hình 4.4. Biểu đồ tần số tuyệt đối lũy tích ............................................................... 90
Hình 4.5. Hình minh họa độ nhọn phân bố ............................................................. 104
Hình 4.6. Phân bố có cùng một vị trí nhưng sự phân tán khác nhau ...................... 104
Hình 4.7. Phân bố có vị trí khác nhau nhưng sự phân tán là như nhau .................. 105
Hình 4.8. Phân bố có vị trí khác nhau và sự phân tán cũng khác nhau................... 105
Hình 4.9. Đám mây điểm biểu diễn quan hệ H - D................................................. 108
Hình 4.10. Biểu đồ phân bố và tương quan H - D .................................................. 109
Hình 4.11. Biểu đồ ba chiều .................................................................................... 110
Hình 4.12. Biểu đồ biểu thị mối quan hệ của hai biến ............................................ 112
Hình 4.13. Các cung phần tư với tích của tử số có giá trị dương và giá trị âm ...... 112
Hình 5.1. Phân bố chuẩn tiêu chuẩn ........................................................................ 115
Hình 5.2. Hàm mật độ của phân bố chuẩn tiêu chuẩn ............................................ 116
vi


Hình 5.3. Mật độ của

(phải) và

(trái)...........................119

Hình 5.4. Tiêu chuẩn Gauss một phía .....................................................................120
Hình 5.5. Tiêu chuẩn Gauss hai phía ......................................................................121
Hình 5.6. Nếu µ = µ1 > µ0, giả thuyết H1 là đúng ...................................................122
Hình 5.7. Nếu µ lớn hơn từ giả thuyết H1 ...............................................................122
Hình 5.8. Xác suất sai lầm với α = 0,05 ..................................................................124
Hình 5.9. Phân bố Student .......................................................................................125
Hình 5.10. Các khoảng tin cậy cho cây bị bệnh và không bị bệnh .........................128
Hình 5.11. Sai số dư ................................................................................................129

Hình 5.12. Tiêu chuẩn Fisher kiểm tra sự thuần nhất về phương sai ......................130
Hình 5.13. Tham số hóa ..........................................................................................132
Hình 5.14. Tiêu chuẩn F của Fisher ........................................................................134
Hình 5.15. Tương quan chéo giữa hai nhân tố với sự lặp lại nij..............................136
Hình 5.16. Thiết kế thí nghiệm hồn tồn ngẫu nhiên ............................................136
Hình 5.17. Ảnh hưởng của hai nhân tố có và khơng có tương tác với nhau ...........137
Hình 6.1. Chiều dài cánh của chim sẻ là một hàm của tuổi ....................................140
Hình 6.2. Cặp giá trị thực (Xi, Yi) và cặt giá trị đường hồi quy (Xi,

) .................142

Hình 6.3. Hệ số hồi quy của đường hồi quy có thể dương (a), âm (b) hoặc bằng (0) ... 143
Hình 6.4. Với các giá trị của tham số hồi quy khác nhau, có nhiều đường hồi quy
khác nhau, mỗi đường có hệ số tự do khác nhau ....................................................144
Hình 6.5. Với các giá trị của tham số tự do khác nhau, có nhiều đường hồi quy
khác nhau, mỗi đường có hệ số hồi quy khác nhau ................................................145
Hình 7.1. Hai đường thẳng giao nhau tại giá trị X1 = 17,920C và Y = 63,79 µl/g/giờ .. 156
Hình 7.2. Phương trình hồi quy của hai mẫu ..........................................................161
Hình 8.1. Mối tương quan tuyến tính đơn với các trường hợp ...............................168

vii



LỜI NÓI ĐẦU
Bài giảng này nhằm mục tiêu là giới thiệu về kỹ thuật của việc xử lý nhiều dữ
liệu mà đã được thu thập trong nhiều lĩnh vực nghiên cứu, đặc biệt là trong lâm
nghiệp. Do đó, mục đích của tài liệu này nhằm (1) giới thiệu những kiến thức cơ
bản nhất về thống kê cho sinh viên, giảng viên mà chưa có một chút kiến thức gì về
thống kê và (2) là tài liệu tham khảo cho học viên cao học, cho giảng viên và các

nhà nghiên cứu.
Dữ liệu trong các ví dụ trong bài giảng này phần lớn là số liệu đo đếm ngoài
thực địa của sinh viên trường Đại học Lâm nghiệp và để minh họa cho các quy trình
thống kê. Bài tập ở cuối một số chương có thể coi là ví dụ thêm cho các phương
pháp thống kê. Các ví dụ trong đây chủ yếu là minh họa cho các phương pháp tính
tốn và giúp sinh viên, học viên, giảng viên và các nhà nghiên cứu có thể hiểu được
những kiến thức căn bản trong thống kê và có thể giải thích đúng các kết quả tính
tốn được. Ngày nay, với sự phát triển của cơng nghệ thơng tin, có rất nhiều phần
mềm thống kê đã ra đời và được sử dụng rộng rãi trong giảng dạy và nghiên cứu và
đã giúp giải quyết được phần lớn các quy trình trong bài giảng này, tuy nhiên những
phần mềm đó thường phải mua bản quyền hàng năm. Do đó, tài liệu này sẽ là một
trong những nguồn tham khảo có giá trị cho việc xử lý số liệu nói chung và trong
lâm nghiệp nói riêng.
Tác giả

1


2


Chƣơng 1
CƠ SỞ CỦA LÝ THUYẾT XÁC SUẤT
1.1. Thử nghiệm, biến cố, xác suất
Lý thuyết xác suất và thống kê liên quan đến việc phân tích và định lượng
các hiện tượng đại chúng. Ở đây, dự đốn về tiến trình của các quá trình như vậy ở
cảnh gần. Một quá trình được gọi là một thử nghiệm nếu nó diễn ra trong các điều
kiện không thể thay đổi, được xác định rõ và có thể lặp lại thường xuyên như
mong muốn.
a) Thí nghiệm nhân quả (xác định)

Trong cùng điều kiện và với mỗi lần lặp lại, chúng dẫn đến cùng một kết quả.
Ví dụ: Nếu chúng ta bắc cầu cho các cực của nguồn điện 5 volt có điện trở 2,5
ohms thì dịng điện 2 ampe sẽ chạy qua.
b) Thí nghiệm ngẫu nhiên
Các thí nghiệm khơng phải là ngun nhân, nhưng thường dẫn đến kết quả
khác nhau khi lặp lại.
Ví dụ 1.1: Tung một đồng xu. Ở đây, có thể xuất hiện mặt sấp hoặc mặt ngửa.
Ví dụ 1.2: Lựa chọn ngẫu nhiên các cây trong ô tiêu chuẩn và đo đường kính
ngang ngực của cây hoặc xác định lồi cây.
Tập hợp tất cả các kết quả đầu ra của một thử nghiệm được gọi là không gian
biến cố hoặc tổng thể. Các yếu tố của nó được gọi là các biến cố cơ bản.
(1.1)
với các biến cố cơ bản ω1, ω2, ..., ωn, nếu đó là khơng gian biến cố hữu hạn
với N phần tử hoặc đối tượng. Khi tung một đồng xu, N = 2, một hình lập phương
N = 6. Mặt khác, không gian biến cố Ω = {1, ω2, ...} biểu thị một không gian biến
cố vơ hạn có thể đếm được, chẳng hạn như sẽ được sử dụng cho một thử nghiệm
trong đó các số có vai trị, khơng giống như súc sắc, khơng theo dõi từ đầu được
giới hạn ở trên. Đây có thể là trường hợp, ví dụ, với số lượng quả trên cây hoặc số
lượng vi khuẩn của một loài trong mẫu đất.
Nếu ωi là các điểm tùy ý của một khoảng hoặc một bề mặt, thì người ta cũng
nói về khơng gian biến cố liên tục (vô cùng lớn).
3


Hình 1.1. Tập hợp các sự kiện cơ bản
Trong mọi trường hợp, Ω là tập hợp các biến cố cơ bản. Chỉ rõ không gian
biến cố là một bước rất quan trọng trong việc xem xét xác suất của một thử nghiệm.
c) Biến cố
Các biến cố luôn là tập con của Ω. Nói cụ thể, tất nhiên, các biến cố cơ bản đã
được đề cập thuộc về các biến cố, mặc dù chúng rất đặc biệt, cụ thể là các phần tử

đơn. Ví dụ: Một sự kiện, nhưng khơng phải là biến cố cơ bản, là tập hợp con {"khi
ném đồng xu thứ hai, đồng xu thứ hai là một số"}, có thể được coi là tập hợp con
gồm 2 phần tử.
của không gian biến cố = {(K, K), (K, Z), (Z, K), (Z, Z)} (với
N = 4). Khi tung xúc xắc, sự kiện {"khi tung thẳng con xúc xắc"} cũng là một tập
con {2, 4, 6} ⊂ {1, 2, 3, 4, 5, 6} của không gian biến cố. Biến cố {"một cây được
chọn ngẫu nhiên từ một ô tiêu chuẩn có đường kính ngang ngực lớn hơn 30 cm và
không quá 40 cm"} mô tả một tập hợp con của tất cả các cây trong ô tiêu chuẩn và
do đó là một biến cố.
Hai biến cố đặc biệt là Ω và ∅. Ω là không gian sự kiện, cái gọi là biến cố an
toàn, ∅ là tập rỗng, cái gọi là biến cố không thể.
4


d) Xác suất
Khái niệm về sự tần số tương đối được biết đến từ thống kê mơ tả có thể được
coi đơn giản trong lý thuyết xác suất là một hàm (ngẫu nhiên) của các biến cố, một
hàm đánh giá các biến cố theo tần suất xuất hiện của chúng. Nếu một thử nghiệm
được thực hiện n lần và sự xuất hiện của một biến cố A được quan sát k lần, thì ta
có hàm như sau:
(1.2)
tần số tương đối của A. Dễ dàng thấy rằng hàm này có các thuộc tính sau:
(1)

, vì k ít nhất là 0 và nhiều nhất là n;

(2)

vì tất cả các lỗi kiểm tra ln nằm trong khơng gian sự kiện Ω


và do đó k = n;
(3) Nếu

, thì

vì nếu A xảy ra k lần,

thì Ac(n-k) lần phải xảy ra. Cụ thể,

;

(4) Nếu A và B là các biến cố rời rạc A ∩ B = ∅, nghĩa là, kết quả thử nghiệm
.
không thể là A và B cùng một lúc, vì vậy
Nếu người ta tưởng tượng rằng một thí nghiệm được lặp đi lặp lại liên tục và
tần số tương đối của mỗi lần được xác định, thì người ta có thể mong đợi rằng dãy
các tần số tương đối này sẽ hội tụ đến một giới hạn.
với
Nếu ví dụ tung đồng xu được lặp đi lặp lại rất thường xuyên, dự kiến trong
khoảng một nửa các trường hợp sẽ xảy ra mặt ngửa, nghĩa là ftđ (A) → P (A) = 0,5.
Điều này dẫn đến một thiết lập hàm mới, được xác định trên đại số ζ và có cùng
thuộc tính với tần số tương đối.
được gọi là phân bố xác suất. Hàm này nhận các giá trị từ 0
đến 1 và nó được áp dụng như trên.
(1)

.

(2)


cho số lượng rời rạc A1,

…, An.
5


(3)

.

Đơi khi xác suất có thể được bắt nguồn từ lý thuyết, chẳng hạn như tung đồng
xu hoặc lắc xúc xắc. Đối với lắc xúc xắc, luôn giả sử P(i) = 1/6 cho tất cả các kết
quả vì xúc xắc có 6 mặt i = 1, ..., 6. Có nhiều ví dụ khác trong đó tất cả các biến cố
cơ bản, như trong trường hợp hai biến cố vừa nêu, có cùng xác suất. Trong những
trường hợp như vậy, với mỗi ωi.
(1.3)
Đối với bất kỳ biết cố

,

áp dụng như sau:
(1.4)
Điều này là xuất phát từ tính chất thứ 2 của phân bố xác suất. Nếu một không
gian sự kiện bao gồm N các biến cố cơ bản xung khắc có thể xảy ra bằng nhau, thì
đối với một sự kiện E, xác suất P (E) bằng với tỷ lệ số g của kết quả thuận lợi cho
sự xuất hiện của E với số N của kết quả có thể xảy ra trong Ω.
(1.5)
Ví dụ 1.3: Xác suất tung chính xác 7 với hai con xúc xắc là bao nhiêu?
Đáp án như sau: Số lần thất bại có thể xảy ra N = 36 (cụ thể là tất cả các cặp
(i, j) với i, j € {1, 2, 3, ,4 ,5, 6}).

Số lần thuận lợi g = 6, vì E ={(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}.
P(E) = 6/36 = 1/6.
Để tính tốn với xác suất của các biến cố, đó là tập hợp con, có các quy tắc
chung khác. Quy tắc rất quan trọng được gọi là phép tính xác suất.
Đối với hai biến cố A, B ln giữ

.

Điều này được minh họa bằng hình 1.2 dưới đây:
6


Hình 1.2. Xác suất của hai biến cố
Từ hình trên, P được xác định với diện tích của các biến cố A và B, hoặc hợp
của chúng. Trung bình của hai biến cố sẽ được xem xét hai lần mà khơng trừ đi xác
suất của nó. Nếu giao điểm trống thì P (A ∩ B) = 0.
Ví dụ 1.4: Cho tập hợp mười cây Ω = {ω1, ω2, …, ω10}. Các cây ω3, ω7, ω8 là
những cây Thông, ω1, ω3, 5, ω7 là những cây bị nhiễm nấm và nó được chặt ngẫu
nhiên, đó là tất cả các cây có cùng xác suất bị chặt. Tiếp tục là:
A = {một cây ngẫu nhiên là một cây Thông} = {ω3, ω7, ω8}
B = { Một cây chặt ngẫu nhiên bị nhiễm nấm} = {ω1, ω3, 5, ω7}
Xác suất mà một cây bị chặt ngẫu nhiên là Thông hoặc bị nhiễm nấm, tức là
xác suất của biến cố ∪ B là bao nhiêu?
Ta có:

;

Một tính chất khác quan trọng hơn của xác suất được gọi là định lý nhân của
xác suất.
Nếu


, thì A và B được gọi là độc lập ngẫu nhiên.

Điều ngược lại cũng được áp dụng, đó là, nếu A và B độc lập ngẫu nhiên, thì:
7


Cả hai là tương đương. Trong ví dụ cuối:

Đó là, tính chất lồi cây (cây Thơng) và tính chất bị nhiễm nấm không độc lập.
2 trong số 3 cây Thông bị nhiễm bệnh, nhưng chỉ có 2 trong số 7 cây khơng phải là
cây Thơng (xem Bảng 1.1). Do đó, các cây Thông cho thấy xu hướng chống lại
bệnh nấm lớn hơn, hoặc nấm thích cây Thơng hơn các lồi cây khác.
Bảng 1.1. Kết quả thống kê loài cây và tính chất bị nhiễm nấm
Lồi cây

Bệnh nấm

Thơng

Khơng

Thơng



Thơng




Lim xẹt

Khơng

Lim xẹt

Khơng

Lim xẹt

Khơng

Lim xẹt



Lim xẹt

Khơng

Lim xẹt



Lim xẹt

Khơng

Ta có bảng chéo như sau:
Bảng 1.2. Bảng tổng hợp số cây theo lồi và có/khơng nhiễm bệnh

Lồi cây

Bệnh

Tổng

Khơng



Thơng

1

2

3

Lim xẹt

5

2

7

Tổng

6


4

10

8


Sự độc lập ngẫu nhiên của hai biến cố có liên quan rất chặt chẽ với khái niệm
xác suất có điều kiện P(A|B). Sau đó, lần lượt, tương ứng với các tần số tương đối
có điều kiện đã được thảo luận trước đó (xem mục 1.3). Xác suất A tồn tại với điều
kiện nó đã xảy ra được gọi là xác suất có điều kiện và được xác định bởi
(1.6)
Điều này cũng có thể được minh họa một lần nữa trong hình đã được xem xét
ở trên như sau:

Hình 1.3. Xác suất có điều kiện
Nếu người ta đã biết rằng B đã xảy ra, thì chỉ những yếu tố (kết quả) của A
mới được xem xét, cũng nằm trong B và do đó trong giao điểm A ∩ B. Do đó,
cũng rõ ràng rằng sự xuất hiện của A chỉ được xem xét trong không gian biến cố
giới hạn ở B.
Nếu hai biến cố A và B độc lập ngẫu nhiên, thì:
(1.7)
Do đó, xác suất xảy ra A là hồn toàn độc lập với việc B đã xảy ra hay chưa,
cụ thể là ln bằng P (A).
Ví dụ 1.5: Một cây gỗ bao gồm 10 khúc gỗ tròn. Một khách hàng đã đưa ra
quy tắc để mua một cây gỗ như vậy khi hai khúc gỗ tròn được chọn ngẫu nhiên liên
tiếp đáp ứng yêu cầu chất lượng của anh ta. Tất nhiên, anh ta kéo khúc gỗ mà không
đặt lại vị trí cũ, nghĩa là anh ta khơng thể kiểm tra cùng một khúc gỗ hai lần. Câu
hỏi đặt ra là với xác suất bằng bao nhiêu anh ta sẽ mua cây gỗ đó nếu 7 trong số 10
khúc gỗ tròn đáp ứng yêu cầu chất lượng của anh ta.

9


Đây là hai lựa chọn ngẫu nhiên phụ thuộc lẫn nhau, bởi vì kết quả của lựa
chọn đầu tiên ảnh hưởng đến xác suất chọn khúc gỗ thứ hai tốt. Để trả lời câu hỏi
trước tiên chúng ta xác định không gian biến cố:
Ω = {(+, +), (+, -), (-, +), (-, -)},
Theo đó, ví dụ kết quả (+, -) có nghĩa là khúc gỗ trịn đầu tiên ổn, nhưng vịng
thứ hai thì khơng. Cả 4 biến cố cơ bản này chắc chắn khơng phải đều có khả năng
như nhau, bởi vì các khúc gỗ trịn tốt thường phổ biến hơn các khúc gỗ chất lượng
xấu, vì vậy có thể nói rằng (+, +) sẽ có nhiều khả năng hơn (-, -). Hơn nữa, hãy để
A1 là biến cố mà khúc gỗ tròn đầu tiên được rút ra là ổn, A2 là sự kiện mà khúc thứ
hai ổn, theo đó:
A1 = {(+, -), (-, -)} và A2 = {(-, +), (+, +)}
Sau đó, người ta quan tâm đến biến cố A1 ∩ A2 ={(+, +)}, cụ thể là cả hai khúc
gỗ trịn đều theo thứ tự. Xác suất của nó là sau khi chuyển đổi cơng thức cho xác
suất có điều kiện là:

Kết quả 6/9 vì lần chọn thứ hai chỉ cịn lại 9 khúc gỗ, trong đó có 6 khúc gỗ đáp
ứng được điều kiện của người mua. 7/10 là đã rõ ràng. Người ta cũng có thể tưởng
tượng một không gian sự kiện khác, cụ thể là được biểu thị bằng hình 1.4 như sau:

Khúc gỗ
Hình 1.4. Xác suất lựa chọn các khúc gỗ đáp ứng đủ điều kiện
10


Dưới đây là 90 sự kiện được xem xét, và người ta cho rằng các khúc gỗ từ 1
đến 7 là những sự kiện tốt (là những khúc gỗ đáp ứng yêu cầu của người mua). Hai
trục (trục tung và trục hoành) đại diện cho hai lần vẽ và các sự kiện trên đường chéo

là không thể khi kéo mà không đi qua. Ở đây tất cả các sự kiện cơ bản đều có thể
xảy ra như nhau và kết quả thuận lợi cho các trường hợp có thể xảy ra là 42/90 =
0,467, kết quả tương tự như trước.
Ví dụ 1.6: Quay trở lại số liệu trong bảng 1.1, ta có xác suất cây Thơng bị
nhiễm nấm là:

Trong khi cây Thông chỉ chiếm 3/10 tổng số cây, chưa đến một nửa.
1.2. Biến ngẫu nhiên
Từ một số ví dụ ta thấy, không gian sự kiện thường là các tập hợp đối tượng
trừu tượng, chẳng hạn như tập hợp các cặp cây hoặc cặp + và - trong ví dụ về 10
khúc gỗ (ví dụ 3.5), hay mặt sấp và mặt ngửa trong ví dụ tung đồng xu... Đối với
nhiều thí nghiệm, điều đó chứng tỏ có ý nghĩa khơng phải là xem xét các sự kiện cơ
bản, mà là ánh xạ của chúng thông qua X thành tập hợp các số thực.

Trong lựa chọn ngẫu nhiên các cây từ một lâm phần (mỗi cây đại diện cho một
sự kiện cơ bản), người ta khơng quan tâm đến lồi cây cụ thể mà chỉ quan tâm tới
đường kính ngang ngực của cây. Sự chuyển đổi từ sự kiện cơ bản này sang kết quả
đo là ánh xạ vào các số thực (dương), như thể hiện trong hình 1.5 sau đây:

Hình 1.5. Biến ngẫu nhiên
11


Với ánh xạ này từ không gian sự kiện thành các số thực, chúng tôi cũng muốn
chuyển phân bố xác suất của thử nghiệm, bởi vì một thử nghiệm được mô tả bởi
không gian sự kiện và phân bố xác suất có liên quan, tức là theo cặp (Ω, P).

Điều này được đảm bảo nếu, đối với mỗi sự kiện, A, nghĩa là, mọi tập hợp con
IR cần xem xét, thường là các khoảng - là khoảng [a, b] -, xác suất liên quan được
lấy theo xác suất của ảnh gốc.

(1.8)
PX sau đó cũng là một phân bố xác suất, nhưng trong IR thay vì trong Ω. Giả
sử rằng một cây có đường kính của nó rơi vào khoảng (30, 34) có thể được đánh giá
một cách hữu ích với xác suất, nếu người ta xác định nó bằng tỷ lệ của các cây, có
đường kính nằm giữa các giới hạn giữa các cỡ đường kính. Hình ảnh X-1(A) là tập
hợp của tất cả các cây ωi với X(ωi) ∈ A ⊂ IR.
(1.9)
Bản đồ như vậy X : (

) → (IR, PX) được gọi là biến ngẫu nhiên và số X(ωi)

∈ IR là sự thực hiện của biến ngẫu nhiên X. PX là phân bố xác suất của X.
Người ta nói về một biến ngẫu nhiên đa chiều (k chiều) khi:
X:(

) → (IRk, PX)

(1.10)

1.3. Ví dụ về các biến ngẫu nhiên rời rạc và liên tục
Ví dụ 1.7: "Cây bị nhiễm nấm". Một biến ngẫu nhiên mô tả sự phá hoại của
nấm là:

Với:
Và được áp dụng như sau:

12


Trong trường hợp này, chúng ta cũng nói về một biến ngẫu nhiên rời rạc. Ví

dụ, chúng ta chỉ có hai nhận thức có thể. Phân bố xác suất của chúng là phân bố nhị
thức đặc biệt, B(1, p), với 2 tham số 1 và p = PX(1) = P(X = 1) = 4/10 = 0,4. Với
phân bố B(1, p) tung đồng xu cũng được mơ tả, trong đó giả sử là p = 0,5. Sau đó,
phân bố B(n, p) vẫn sẽ được giới thiệu, mô tả xác suất của việc thực hiện số nguyên
giữa 0 và n.

Hình 1.6. Phân bố nhị thức
Hình khối với một khối có thể được mô tả bằng một biến ngẫu nhiên X nhưng
đa chiều rời rạc, cụ thể là phân bố đa thức đặc biệt, Mn(p1, ..., pk), mô tả xác suất để
phân bối n đối tượng ngẫu nhiên và được chọn trả về trong các đối tượng k, giả sử
rằng tỷ lệ của các đối tượng loại i trong không gian sự kiện là pi. Nếu khơng có đối
tượng trong loại i

, thì xác suất phân bố đối tượng này là
(1.11)

Cụ thể, M1(1 – p, p) = B(1, p). Ví dụ đơn giản như khối lập phương, n = 1, pi
= 1/6 với tất cả i và k = 6. Được cuộn nhiều lần, ví dụ: 2 lần, ta có:
13


M2(1/6, 1/6, 1/6, 1/6, 1/6, 1/6)
X: (
Kết quả này, ví dụ, trong các xác suất sau:

Một phân bố rời rạc quan trọng khác là phân bố Poisson. Các biến ngẫu nhiên
trong phân bố Poisson có thể lấy tất cả các số tự nhiên bao gồm 0, đó là X = 0, 1, 2,
3... Xác suất của chúng là:
(1.12)


Hình 1.7. Phân bố Poisson
Đỉnh của phân bố dịch chuyển ngày càng xa về bên phải khi λ tăng và độ tán
xạ cũng tăng.
14


×