Tải bản đầy đủ (.pdf) (147 trang)

Ứng dụng toán trong nghiên cứu sinh thái học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.64 MB, 147 trang )


Viện sinh thái và Tài nguyên Sinh vật


Lê Xuân Cảnh - Trơng Xuân Lam






ứng dụng toán
trong nghiên cứu
sinh thái học











Hà Nội, 2007


-3 -
viện sinh thái và Tài nguyên Sinh vật


Lê Xuân Cảnh - Trơng Xuân Lam



Giáo trình

ứng dụng toán
trong nghiên cứu
sinh thái học










Hà Nội, 2007

-4 -
Mục lục

Mục lục
Lời nói đầu
Các từ ngữ viết tắt
Chơng 1: Một số khái niệm và các thuật ngữ cơ bản
1.1. Sinh thái học là gì ?
1.2. Khái niệm về toán sinh học

1.3. Đối tợng nghiên cứu của toán sinh thái
1.4. Dấu hiệu quan sát
1.5. Các thuật ngữ thống kê của mẫu
1.6. Một số loại phân bố thờng gặp
Chơng 2: Các quy trình xử lý số liệu thống kê
2.1. Tổng quát về Microsoft Excel
2.1.1. Bảng tính trong Microsoft Excel
2.1.2. Làm việc với Excel
2.1.3. Các hàm trong Excel
2.2. Phơng pháp chọn mẫu và điều tra thu mẫu cơ bản
2.3. Phơng pháp biểu thị phân bố thực nghiệm
biến số và vẽ biểu đồ phân bố
2.4. Các chỉ số thống kê và ý nghĩa
2.4.1. Trung bình cộng
2.4.2. Bình phơng toàn phơng
2.4.3. Phơng sai và sai tiêu chuẩn
2.4.4. Hệ số biến động và phạm vi biến động
2.4.5. Đặc trng của dạng phân bố
2.4.6. Khoảng tin cậy
2.4.7. Phơng pháp xác định các chỉ số thống
kê mô tả
2.4.8. Các chỉ số thống kê khác
2.5. Phơng pháp ớc lợng các tham số đặc trng của tổng thể

-5 -
2.5.1. Một số khái niệm cơ bản
2.5.2. Phơng pháp ớc lợng điểm
2.5.3. Phơng pháp ớc lợng khoảng
2.6. Một số phân bố lý thuyết thờng gặp
2.6.1. Phân bố giảm (phân bố mũ)

2.6.2. Phân bố Weibull
2.6.3. Phân bố khoảng cách
2.7.4. Một số phân bố thờng gặp khác
Chơng 3: So sánh các mẫu quan sát và thí nghiệm
3.1. Trờng hợp các mẫu độc lập
3.1.1. Trờng hợp 2 mẫu độc lập có dung lợng mẫu n<30
3.1.2. Trờng hợp 2 mẫu độc lập có dung lợng mẫu n 30
3.2. Trờng hợp các mẫu liên hệ
3.2.1. Khái niệm
3.2.2.Tiêu chuẩn phi tham số của Kruskal và Wallis
3.2.3. Trờng hợp có 2 mẫu liên hệ
3.2.4. Trờng hợp có nhiều mẫu liên hệ
3.2.5. Trờng hợp so sánh các mẫu về chất
3.3. Các bài toán ứng dụng và thực hành
Chơng 4: Phân tích phơng sai (ANOVA)
4.1. Phân tích phơng sai một nhân tố
4.2. Phân tích phơng sai hai nhân tố với 1 lần lặp lại
4.3. Phân tích phơng sai hai nhân tố với 2 lần lặp lại
4.4. Phân tích phơng sai hai nhân tố với m lần lặp lại
4.5. Phân tích thống kê nhiều biến số (Multivariate analysis)
4.6. Các bài toán ứng dụng và thực hành
Chơng 5: Hồi quy tuyến tính và phi tuyến tính
5.1. Hồi quy tuyến tính một lớp
5.2. Hồi quy tuyến tính nhiều lớp
5.3. Liên hệ phi tuyến tính
5.4. Thiết lập biểu đồ tơng quan
5.5. Các bài toán ứng dụng và thực hành

-6 -
Chơng 6: Phơng pháp hệ số đờng ảnh hởng

6.1. Khái niệm và hệ số đờng ảnh hởng
6.2. Quan hệ giữa nguyên nhân và kết quả
6.2.1. Các nguyên nhân độc lập
6.2.2. Các nguyên nhân có quan hệ với nhau
6.3. Quan hệ giữa hiệu quả với chuỗi các biến số tơng quan nhiều biến
6.4. Các bài toán ứng dụng và thực hành
Chơng 7: Mô hình toán trong hệ thống sinh thái học
7.1. Mô hình ổn định của hệ k quần thể (tiêu chuẩn Routh-Hurwitz)
7.2. Hệ thống - thú dữ - con mồi - mô hình động học Lotka-Volterra
7.3. Mô hình đa dạng sinh học không gian k quần thể
7.4. Mô hình phân loại trong mô hình cấu trúc
7.4.1. Các loại thớc đo (Metric)
7.4.2. Tiêu chuẩn phân loại cực tiểu biến phân
7.4.3. Tiêu chuẩn so sánh tổng thể
7.4.4 Mô hình xắp xếp quần xã
7.4.5 Mô hình đánh giá
Chơng 8: Phân tích sự đa dạng sinh học bằng phần mền PRIMER
8.1. Giới thiệu về phần mền PRIMER
8.2. Đa dạng sinh học trong PRIMER và ứng dụng
8.3. Một số vị dụ minh họa
Tài liệu tham khảo


-7 -
Lời nói đầu

Thời gian qua, trong nhiều các lĩnh vực nghiên cứu nhất là trong sinh
vật học và nông nghiệp ngời ta đã tiến hành thực hiện các thực nghiệm đợc
bố trí triển khai trong phòng cũng nh ngoài tự nhiên, hơn nữa các thực
nghiệm của hầu hết các đề tài dự án cần phải xử lý các kết quả mà trong đó

việc sử dụng các phơng pháp toán học hoặc biểu diễn các kết quả điều tra hay
các quy luật ngẫu nhiên bằng các mô hình toán học là khó tránh khỏi. Gần đây
do sự bùng nổ của các công trình nghiên cứu trong sinh thái học với hàng ngàn
các công trình nghiên cứu đợc đăng tải trong các tạp chí chuyên ngành thuộc
lĩnh vực sinh học trong và ngoài nớc đòi hỏi tính chính xác và chuẩn mực
trong các kết quả thì ứng dụng toán học là không thể thiếu đợc. Tuy nhiên,
những hiểu biết cơ bản nhất, chung nhất, đặc biệt là các bài toán ứng dụng thực
tế về sử dụng những phơng pháp toán hc trong nghiên cứu sinh thái học, các
mô hình sinh thái cơ bản trong hệ thống sinh thái học của các sinh viên, học
viên kể cả các cán bộ nghiên cứu trong ngành sinh học còn rất hạn chế.
Sinh học là lĩnh vực của khoa học càng ngày nó càng chứng tỏ vai trò
đóng góp to lớn cho sự phát triển kinh tế xã hội, trong đó toán học đã xâm
nhập sâu sắc vào sinh học đến mức tạo thành một bộ môn khoa học Toán
Sinh (Mathematical Biology). Chính vì vậy, để làm tài liệu cơ sở cho các học
viên cao học, các nghiên cứu sinh cũng nh các nhà nghiên cứu trong lĩnh lực
sinh học. Chúng tôi biên soạn giáo trình ứng dụng toán trong nghiên cứu sinh
thái học nhằm giúp đỡ họ biết cách khai thác hiệu quả nhất những tính toán,
những phân tích thống kê các số liệu nghiên cứu trong phòng thí nghiệm cũng
nh ở ngoài tự nhiên, thiết lập các bài toán sinh thái và các mô hình toán cơ
bản trong hệ thống sinh thái học.
Giáo trình đợc cấu trúc thành 6 chơng bao gồm:
Chơng 1: Trình bày một số khái niệm và các thuật ngữ cơ bản trong
việc ứng dụng toán trong nghiên cứu sinh thái học
Chơng 2: Trình bày tổng quát về Excel, các quy trình chọn mẫu, biểu
thị phân bố thực nghiệm, vẽ biểu đồ phân bố, tính các chỉ

-8 -
số thống kê bằng, ớc lợng các tham số đặc trng của tổng
thể và một số phân bố lý thuyết thờng gặp.
Chơng 3: Trình bày quy trình so sánh các mẫu quan sát và thí nghiệm

độc lập và mẫu liên hệ
Chơng 4: Trình bày quy trình phân tích phơng sai một nhân tố, hai
nhân tố với 1 lần lặp lại và hai nhân tố với nhiều lần lặp lại
Chơng 5: Trình bày quy trình tính toán hồi quy tuyến tính 1 lớp, tuyến
tính nhiều lớp, phi tuyến tính và mối quan hệ giữa hiệu quả
với chuỗi các biến số tơng quan
Chơng 6: Trình bày phơng pháp hệ số đờng ảnh hởng, quan hệ giữa
hiệu quả với chuỗi các biến số và một số ứng dụng
Chơng 7: Trình bày cách thiết lập, tìm nghiệm và trạng thái cân bằng
của một số mô hình cơ bản nh: mô hình ổn định của hệ K
quần thể, hệ thống thú dữ - con mồi, mô hình đa dạng
sinh học không gian và mô hình phân loại trong mô hình
cấu trúc.
Chơng 8: Giới thiệu về phần mền PRIMER và một số ứng dụng trong
việc phân tích sự đa dạng sinh học bằng phần mền
PRIMER
Do sự rộng lớn, đa dạng và phức tạp trong lĩnh vực sinh thái học, cho
nên chắc chắn rằng giáo trình này cha thể đáp ứng thật đầy đủ các công cụ
toán ứng dụng trong sinh thái học cho nhu cầu nghiên cứu của độc giả và
không thể tránh đợc những thiếu sót. Chúng tôi hy vọng rằng, sẽ nhận đợc
sự phê bình và góp ý của các bạn đồng nghiệp và học viên để cuốn sách đợc
hoàn thiện hơn trong những lần soạn sau.

-9 -
Chơng 1
Một số khái niệm và các thuật ngữ cơ bản

1.1. Sinh thái học là gì ?
Sinh thái học là môn khoa học nghiên cứu về sự phân bố và sinh sống của
những sinh vật sống và các tác động qua lại giữa các sinh vật và môi trờng

sống của chúng. Môi trờng sống của một sinh vật hàm chứa: Tổng hòa các
nhân tố vật lý nh khí hậu và địa lý đợc gọi là ổ sinh thái và các sinh vật khác
sinh sống trong cùng ổ sinh thái.
Các hệ sinh thái thờng đợc nghiên cứu ở nhiều cấp độ khác nhau từ cá
thể và các quần thể cho đến các hệ sinh thái và sinh quyển. Sinh thái học là
môn khoa học đa ngành, nghĩa là dựa trên nhiều ngành khoa học khác nhau.
1.2. Khái niệm về toán sinh học
Toán sinh học (Mathematical biology hay Biomathematics) là một lĩnh vực
giao thoa của nghiên cứu học thuật nhằm vào mô hình hoá các quá trình sinh
học trong tự nhiên với kĩ thuật và công cụ là toán học. Nó vừa mang tính ứng
dụng vừa mang tính lý thuyết trong nghiên cứu sinh học.
Toán sinh thái học (Ecological Mathematics) là những nghiên cứu sinh
thái học bằng các phơng pháp toán học. Nó rất đa dạng và muôn hình muôn
vẻ. Từ việc sử dụng những phơng pháp thống kê đơn giản tới những mô hình
hiện đại có sử dụng những máy tính điện tử hiện đại nh hiện nay. Theo cấu
trúc của toán sinh thái học thì nó cũng là bộ môn khoa học nh những bộ môn
khác (toán, lý, hóa, văn ). Đối tợng nghiên cứu chủ yếu là các hệ sinh thái
còn phơng pháp nghiên cứu là toán học. Chúng ta biết rằng Khoa học là một
phơng pháp và đối với toán sinh thái học ta cũng khẳng định rằng đó cũng là
một phơng pháp để giải quyết những vấn đề nghiên cứu về sinh thái cũng nh
về sinh học nói chung.
Những ngời nghiên cứu toán sinh thái học hiện nay bao gồm: (1)
Những nhà nghiên cứu toán học chuyển sang nghiên cứu về sinh thái học; (2)
Những nhà nghiên cứu sinh thái học áp dụng các phơng pháp toán học trong

-10 -
các kết quả nghiên cứu; (3) Những nhà nghiên cứu song song đồng thời cả hai
chuyên ngành. Cả 3 dạng trên đều đợc đánh giá cao nhng dạng thứ 3 là mô
hình thích hợp nhất cho công tác đào tạo cho chuyên ngành này ở tơng lai.
1.3. Đối tợng nghiên cứu của toán sinh thái.

Toán sinh thái học nghiên cứu tính chất của hàng loạt những hiện tợng
trong sinh học, sinh thái học, y học Những vấn đề đó thờng là rất phức tạp
về sự phong phú và đa dạng. Để có đợc sự hiểu biết đúng đắn những đặc điểm
của hàng loạt những hiện tợng và có thể đa ra những đánh giá chắc chắn
phải có sự nhận xét hoặc phân tích tổng hợp. Chính vì vậy chúng ta cần thống
nhất một số khái niệm sau đây
1.3.1. Khái niệm về tổng thể, phần tử và mẫu
Tổng thể là toàn bộ đối tợng ta cần nghiên cứu, đối tợng trong tổng
thể đợc gọi là một phần tử, số phần tử của tổng thể đợc coi là dung lợng
của tổng thể (ký hiệu là N), dung lợng tổng thể có thể là một số hữu hạn hoặc
vô hạn.
Ví dụ: Một lô hạt giống trong đó hạt giống là các phần tử, một lô cây
con trong vờn ơm trong đó cây con là phân tử, tập hợp các loài sâu hại trong
đó mỗi loài sâu hại là phần tử, khu rừng trồng thuần cây Lim trong đó mõi cây
Lim là một phần tử
Mẫu là một bộ phận của tổng thể, trên đó ngời ta tiến hành điều tra, đo
đếm và tiến hành thu thập số liệu, số phần tử của mẫu gọi là dung lợng mẫu
(ký hiệu là n), dung lợng mẫu là một số hữu hạn.
Ví dụ : Đờng kính của 30 cây keo trong lô keo 6 tuổi thì trong đó: lô
keo 6 tuổi là tổng thể, 30 cây keo là mẫu và cây keo là phần tử. Dung lợng
của mẫu (cây keo) n = 30.
Trên cơ sở những số liệu quan sát đợc của mẫu, sử dụng công cụ toán
học chủ yếu dựa trên cơ sở lý thuyết xác suất để nói lên những qui luật, những
hiện tợng của tổng thể đó chính là phơng pháp nghiên cứu của toán sinh thái
học. Để việc nghiên cứu đảm bảo độ tin cậy và chính xác thì mẫu chọn phải
đại diện đợc cho toàn bộ tổng thể, muốn vậy việc chọn mẫu phải mang tính
ngẫu nhiên tức là mọi phần tử đều có khả năng đợc nhận vào mẫu nh nhau.


-11 -


1.3.2. Phơng pháp lấy mẫu từ tổng thể
Trong thực thế ngời ta thờng tiến hành lấy mẫu theo các phơng pháp
sau:
a) Rút trực tiếp từ tổng thể
: Đó là cách chọn mẫu ngẫu nhiên có hoàn
lại hoặc không hoàn lại.
b) Rút từ tổng thể đợc chia thành nhiều phần
:
+ Chọn mẫu điển hình: Tức là chọn các phần tử điển hình từ tổng thể.
+ Chọn mẫu theo quy tắc: tức là chia tổng thể ra thành những phần
theo một quy tắc nào đó, sau đó trong mỗi phần lấy ra các phần tử để điều tra,
đo đếm để tạo thành mẫu
Cách thức chọn mẫu theo quy tắc rất hay đợc sử dụng trong nghiên
cứu động, thực vật ngoài thiên nhiên và thờng đựơc chia ra gồm:
* Phơng pháp chọn mẫu theo tuyến: Toàn bộ diện tích điều tra đợc
chia ra theo các tuyến (song song hoặc cách đều nhau) và trên các tuyến chọn
các mẫu điều tra. Nếu trong diện tích điều tra S và các mẫu có diện tích là S
o

thì dung lợng của tổng thể N = S/S
o
.
* Phơng pháp chọn mẫu theo mắt lới: Toàn bộ diện tích điều tra đợc
chia ra theo các tuyến song song hoặc cách đều nhau theo 2 hớng và trên các
điểm giao nhau chọn các mẫu điều tra.
Tổng thể (N=95)
Mẫu (n=10)
Phần t




-12 -
* Phơng pháp chọn mẫu có phân khối: Tổng thể đợc chia ra theo các
khối thuần nhất, trong các khối chọn các mẫu đại diện chung cho khối (có thể
sử dụng các phơng pháp trên để chọn mẫu trong khối)
1.4. Khái niệm về dấu hiệu quan sát
Các đặc điểm hay một tính chất nào đó đợc điều tra, quan sát, đong
đếm và thu thập đợc gọi là dấu hiệu quan sát hay đợc gọi là số liệu quan sát.
Ví dụ: Số lợng cá thể của một loài, chiều cao cây. Đờng kính ngang
ngực, số loài, các số liệu về kích thớc của hình thái của 1 loài
Bảng 1.4.1. Số liệu của đờng kính đo ngang ngực ở các lô trong
rừng trồng Lim thuần
Đờng kính ngang ngực trung bình (cm)
Lô (A) Lô (B) Lô (C) Lô (D) Lô (E)
6.2 6.6 6.5 6.8 7.8
6.5 6.4 7.6 10.2 8.5
6.8 6.4 7.5 11.5 11.2
7.2 7.2 8.5 8.4 12.4
7.6 8.8 9.3 12.6 13.6
8.2 9.4 10.4 11.2 8.8
9.2 8.2 7.5 10.4 11.4
7.6 10.4 9.4 8.2 7.8

Các số liệu quan sát đợc định lợng thì đợc gọi là đại lợng quan sát
Ví dụ: Mật độ cá thể con/m
2
, mật độ cây/m
2
, số lần bắt gặp/km, số

lợng/cm
2
, chiều cao cây, đờng kính ngang ngực
Bảng 1.4.2. Mật độ cá thể con/m
2
của loài côn trùng hại rau
Mẫu(A)
Lô(B)
1 2 3 4 5 6 7
5.85 4.62 4.68 5.21 4.52 4.85 5.9
6.41 4.36 5.51 4.16 5.89 5.31 6.86
6.12 3.85 6.02 4.72 6.72 5.12 6.64
I
6.54 3.41 5.74 4.41 5.62 5.64 6.54
II
6.12 3.85 6.02 4.72 6.72 5.12 6.64

-13 -
5.85 4.62 4.68 5.21 4.52 4.85 5.9

6.81 4.01 6.24 4.22 6.35 6.01 7.21
6.81 4.01 6.24 4.22 6.35 6.01 7.21
5.62 4.57 5.65 5.02 5.85 4.57 5.89
III
5.62 4.57 5.65 5.02 5.85 4.57 5.89
6.54 3.41 5.74 4.41 5.62 5.64 6.54
5.62 4.57 5.65 5.02 5.85 4.57 5.89
IV
6.41 4.36 5.51 4.16 5.89 5.31 6.86
5.85 4.62 4.68 5.21 4.52 4.85 5.9

6.54 3.41 5.74 4.41 5.62 5.64 6.54
V
6.12 3.85 6.02 4.72 6.72 5.12 6.64
6.54 3.41 5.74 4.41 5.62 5.64 6.54
VI
6.81 4.01 6.24 4.22 6.35 6.01 7.21

Các số liệu quan sát không định lợng đợc gọi là số liệu quan sát về
chất
Ví dụ: Cây tốt, cây xấu, cây trung bình, tần xuất bắt gặp , mức độ phân
bố rộng , hẹp vv
Bảng 1.4.3. Số liệu về tần xuất bắt gặp của đờng kính đo ngang
ngực của rừng trồng Lim thuần
Stt d
i
Tần xuất bắt gặp
1
7
19
2
9
32
3
11
17
4
13
16
5
15

11
6
17
9
7
19
9
8
21
3
9
23
2
10
25
1

-14 -
1.5. Các thuật ngữ thống kê của mẫu
1.5.1. Giá trị trung bình cộng (
X
tb
- Mean):
Số trung bình cộng của mẫu là giá trị trung bình của một dẫy hữu hạn các
số liệu quan sát và đợc tính theo công thức sau:


=
n
i

x
i
1

X
tb
=
n
Trong đó: x
i
: Số liệu quan sát
n : Dung lợng mẫu
1.5.2. Số trung vị mẫu (M - Median):
Số trung vị mẫu là giá trị của số liệu quan sát ở khoảng giữa của mẫu.
* Nếu tập hợp mẫu có dung lợng mẫu là lẻ thì số trung vị là giá trị trung tâm
Ví dụ: (2.9; 2.6; 2.4; 2.3; 2.2) n=5 (lẻ) số trung vị M=2.4
* Nếu tập hợp mẫu là chẵn thì số trung vị là giá trị trung bình của 2 giá trị
phần tử trung tâm
Ví dụ: (2.9; 2.6; 2.3; 2.2) n=4 số trung vị M=(2.6+2.3)/2 = 2.45
1.5.3. Phơng sai (S
2
) và sai tiêu chuẩn (S):
+ Phơng sai (S
2
- Sample Variance) là một đại lợng biểu thị tổng
của bình phơng các độ lệch riêng rẽ so với giá trị trung bình của các phần tử
mẫu trong cùng một điều kiện nh nhau và đựơc tính theo công thức sau:


=

n
i 1
(x
i
X
tb
)
2

S
2
=
______________________

n 1
Trong đó: x
i
: Số liệu quan sát
n : Dung lợng mẫu
X
tb
: Giá trị trung bình cộng


-15 -
+ Sai tiêu chuẩn (S - Standard error) của mẫu có khi còn gọi là độ lệch
chuẩn (Standard deviation) là đại lợng để đo độ chính xác của kết quả thực
nghiệm, độ lệch chuẩn càng lớn thì độ chính xác càng kém đợc tính bởi công
thức nh sau:


S =
S
2
=
1
1
2
)(



=
n
n
i
XtbXi
(i = 1 n)


1.5.4. Hệ số biến động và phạm vi biến động
+ Hệ số biện động (S%) của mẫu hay còn gọi là độ lêch chuẩn tơng
đối (relative standard deviation) biểu thị mức độ biến động bình quân tơng
đối của dãy trị số quan sát đợc tính bởi biểu thức

S
S% =

* 100
X
tb


+ Phạm vi biến động của mẫu (R) là hiệu số của trị số quan sát lớn nhất
và trị số quan sát nhỏ nhất và đợc tính bởi biểu thức
R = Max(X
i
) Min(X
i
)
1 5.5. Độ lệch (Sk) và độ nhọn (K)
+ Độ lệch (S
k
- Skewness) là chỉ tiêu cho thấy mức độ chênh lệch của
đỉnh đờng cong so với trị số trung bình mẫu và đựơc tính bằng:
n

=
n
i 1
(X
i
X
tb
)
3

S
k
= * ( i: 1-n)
(n-1)(n-2) S
3



Nếu: S
k
= 0 thì phân bố là đối xứng
S
k
> 0 thì đờng công lệch trái so với giá trị trung bình

-16 -
S
k
< 0 thì đờng cong lệch phải so với giá trị trung bình
+ Độ nhọn
(K - Kurtosis) là chỉ tiêu cho thấy mức độ biến động của trị
số quan sát so với trị số trung bình mẫu và đựơc tính bằng

n (n+1)

=
n
i 1
(X
i
X
tb
)
4
3(n-1)
2


K = *
_
( i: 1 - n)
(n-1)(n-2)(n-3) S
4
(n-2)(n-3)

Nếu: K = 0 thì đờng cong thực nghiệm tiệm cẩn chuẩn
K>0 thì đờng cong có dạng bẹt so với tiệm cận chuẩn
K<0 thì đờng cong có dạng nhọn so với tiệm cận chuẩn
1.5.7. Hệ số tơng quan (R- Correlation)
Hệ số tơng quan (R) là chỉ tiêu thuyết minh mức độ liên hệ giữa các đại
lợng với nhau đợc tính theo công thức sau:
Q
xy

R =

QQ
yx

Với:


=
n
i 1
X
i


=
n
i 1
Y
i

Q
xy
=

=
n
i 1
X
i
Y
i
-
(i= 1 n) n

(

=
n
i 1
X
i
)
2

(

=
n
i 1
Y
i
)
2

Q
x
=

=
n
i 1
X
i
2
-
(i= 1 n ) n
Q
y
=

=
n
i 1
Y

i
2
-
n

Trong đó:
R=0 nghĩa là hai đại lợng X và Y độc lập với nhau

-17 -
R=1 nghĩa là hai đại lợng X và Y có quan hệ hàm số
0 < R 0.3 hai đại lợng X và Y có quan hệ yếu
0.3 < R 0.5 hai đại lợng X và Y có quan hệ vừa
0.5 < R 0.7 hai đại lợng X và Y có quan hệ tơng đối chặt
0.7 < R 0.9 hai đại lợng X và Y có quan hệ chặt
0.9 < R 1 hai đại lợng X và Y có quan hệ rất chặt
1.6. Một số loại phân bố thờng gặp
1.6.1. Phân bố tần số thực nghiệm một chiều
Việc biểu diễn các kết quả quan sát theo tần số xuất hiện của nó là rất
quan trọng. Chúng đợc trình bày dới các điểm riêng biệt trên một trục số
đã chia tuyến tính (một chiều) sau đó đánh giá về mật độ xuất hiện. Sự phân bố
này đợc gọi là phân bố thực nghiệm một chiều. Để xây dựng biểu đồ này, ta
sẽ tập hợp các giá trị thành k cấp có độ rộng là d theo các công thức sau:
k =
n
Trong đó : n - là dung lợng của mẫu quan sát và
5 < k < 20 hay ta phải có dung lợng mẫu n 25
Độ rộng d thờng tính là:
(X
max
X

min
)
d =
1 + 3,322 Log(n)

Ví dụ1: Giả sử ta có 60 kết quả quan sát với giá trị quan sát Max = 42
và giá trị nhỏ Min = 16. khi đó ta có:
k=
60 = 8 và d = (42-16)/(1+3.322Log(60)) = 3.76 4.
Để xác định giá trị ứng với mỗi tần số ta lấy giá trị nhỏ nhất cộng với
giá trị d và tăng dần hay lấy giá trị lớn nhất trừ đi với d và giảm dần. Khi đó ta
xác định đựợc các lớp giá trị với k = 8. Kết quả thu đợc theo bảng sau:
Bảng 1.6.1: Giá trị của các lớp ( k=8 và d = 4)
k Lớp
Giá trị ứng với
mỗi tần số
Tần số
1 16-18 16 4
2 18-22 20 5

-18 -
3 22-26 24 6
4 26-30 28 18
5 30-34 32 12
6 34-38 36 9
7 38-42 40 4
8 42-44 44 2
Tổng 60

0

2
4
6
8
10
12
14
16
18
20
10 15 20 25 30 35 40 45 50
Giá trị ứng với mỗi tần số
Tần số

Hình 1.6.1: Phân bố tần số thực nghiệm

Ví dụ 2: Giả sử ta có một dãy số quan sát với dung lợng là n = 100 hay
k=10 và d = (29,8-19,6)/ 1+3.322Log(100)) = 1,33 1. Khi đó để xác định
giá trị ta chia lớp bằng cách: lấy giá trị trung bình của lớp nhỏ nhất cộng với
giá trị d và tăng dần hay lấy giá trị của lớp lớn nhất trừ đi giá trị d và giảm dần
Bảng 1.6.2: Giá trị của các lớp ( k=10 và d = 1)
k Lớp Trung bình Tần suất
1 19,5-20,5 20 1

-19 -
2 20,5-21,5 21 2
3 21,5-22,5 22 3
4 22,5-23,5 23 4
5 23,5-24,5 24 6
6 24,5-25,5 25 10

7 25,5-26,5 26 13
8 26,5-27,5 27 14
9 27,5-28,5 28 25
10 28,5-29,5 29 22
Tổng 100

1.6.2. Phân bố chuẩn Gauss
Ta giả thiết rằng dung lợng mẫu (n ), khi dó d 0 và sự phân bố
tần số của một giá trị có thể mô tả bằng hàm xác xuất sau:
1 (x-)
2

Y = P(x)dx = exp [ - ] (1)

2 2
Trong đó: Độ lệch chuẩn của tổng thể
Giá trị trung bình tổng
Y là tấn số xuất hiện của mỗi giá trị lệch (x - )
Đây là hàm phân bố chuẩn Gauss. Sự phân bố bởi đờng cong Gauss có
một số đặc điểm sau
+ Kết quả thuờng gặp nhất là giá trị trung bình
+ Các kết quả đối xứng xung quanh giá trị trung bình
Từ phơng trình (1) mô tả mật độ xác xuất của phân bố chuẩn, trong đó
2 tham số và hết sức quan trọng. Cực đại của đừong cong nằm ở x=,
các điểm uốn nằm ở x-và x+(hình 1.6.2). Độ lệch chuẩn càng bé độ

-20 -
chính xác càng cao và đờng cong càng nhọn và ngợc lại độ lệch chuẩn càng
lớn độ chính xác càng thấp và đờng cong càng tù.


a)Đuờng cong phân bố chuẩn

b)Đuờng cong phân bố chuẩn với các độ
lệch chuẩn khác nhau

Hình 1.6.2: Đuờng cong phân bố chuẩn
1.6.3. Phân bố Student T
Trong thực nghiệm nhiều khi phép đo không đủ lớn, để tính độ lệch
chuẩn (S) ngời ta đa phân bố Student T. Trong thực tế, ngời ta lập bảng tính
sẵn t(,f) với = p(0.9; 0.95 và 0.99) và bậc tự do f = n -1, khi đó giá trị
trung bình nằm giữa
X
tb
- < < X
tb
+
Trong đó:
t.S
=

n


Khi đó - đến +đợc gọi là khoảng tin cậy
1.6.4. Phân bố chuẩn F
Phân bố này đợc sử dụng để so sánh độ chính xác của 2 tập dữ liệu
trong cùng một phòng thí nghiệm hoặc của 2 phơng pháp phân tích khác nhau

-21 -
trên cùng một mẫu (hay nói chính xác là so sánh sự khác biệt về mặt thống kê

của 2 phơng sai). Về mặt thống kê F đợc định nghĩa là
S
1
2

F
tt
= (F >1) trong đó S
1
>S
2

S
2
2

Trong thực tế, ngời ta lập bảng tính sẵn F
lt
(,f
1
,f
2
) với = p(0.95) và
f
1
= n
1
-1, f
2
= n

2
-1.
- Nếu
F
tt
> F
tl
2 tập dữ liệu có sự khác biệt về mặt thống kê
- Ngợc lại nếu
F
tt
< F
tl
2 tập dữ liệu không có sự khác biệt về mặt
thống kê.
Ví dụ: Có 2 dẫy quan sát thực nghiệm, dẫy 1 có độ lệch chuẩn S
1
= 0.05
và dẫy 2 có độ lệch chuẩn S
2
= 0.02. Kiểm tra xem liệu độ lệch chuẩn S
1
cao
hơn S
2
có ý nghĩa hay không? và biết rằng f
1
=6 và f
2
= 4.

Tra bảng tính sẵn cho thấy F
tl
(0.95,5,3) = 9.01
Từ công thức tính toán cho thấy F
tt
=(0.05)
2
/(0.02)
2
= 6.25
Kết quả cho thấy: F
tt
<F
tl
nghĩa là 2 tập dữ liệu không có sự khác biệt về
mặt thống kê hay giả thiết không là có cơ sở.
1.6.5. Phân bố
2

Giả sử nếu có một mẫu với các đại lợng ngẫu nhiên
x
1
,x
2
,x
3
x
n



phân bố chuẩn thì có thể thu đợc một đại lợng ngẫu nhiên với số bậc tự do
f= n -1 có hàm phân bố
2
đợc tính nh sau:

x
i
- x
tb
S
2


2
=

=
n
i 1
= (n -1) (i :
1- n

2
) à
Trong đó: S
2
là phơng sai của mẫu
là phơng sai của tổng thể đợc tính



=
n
i 1
(X
i
- X
tb
)
2



2
=
______________________

N - 1

-22 -
Trong đó: X
i
: Số liệu quan sát
N : Dung lợng tổng thể
X
tb
: Giá trị trung bình cộng của tổng thể

1.6.6. phân bố mũ
Biến ngẫu nhiên liên tục X có phân bố mũ, nếu hàm mật độ có xác suất
có dạng: P

x
(X) = y = e
(-

x)
(1)
1.6.7. Phân bố Weibull
Là phân bố xác suất của biến ngẫu nhiên liên tục với miền giá trị x
thuộc (0,+) và hàm mật độ có dạng:
f
x
(x)= (/)((d-dmin)/)
(

-1)
e
dd


)/min)((

Trong đó:
x : là trị số quan sát
d: là trị số giữa cỡ
dmin: là trị số quan sát bé nhất
và là hai tham số của phân bố Weibull
1.6.8. Phân bố khoảng cách
Là phân bố có xác suất của biến ngẫu nhiên đứt quãng, Hàm toán học
có dạng:


F(x) =
(1-)(1-).
(x-1)
với x1
Trong đó: = f
o
/n với f
o
là tần số quan sát ứng với tổ đầu tiên
n là dung lợng mẫu
x = (di-d
1
)/k với k là cự ly tổ, di là đờng kính cỡ thứ i, d
1
là đờng
kính tổ thứ 1.

-23 -
Chơng 2
Các quy trình xử lý số liệu thống kê

2.1. Tổng quát về Microsoft Excel 5.0
2.1.1. Khởi động và màn hình Excel
+ Thanh tiêu đề (Title bar): Dòng trên cùng, ở đó có tên của bảng tính đang
thực hiện
+ Thanh thực đơn (Menu bar): gồm 9 thực đơn chính
- Menu File (hay Alt + F ): bao gồm các menu nh Winword
- Menu Edit: bao gồm các menu quen thuộc nh Winword ngoài ra
Delete Sheet (bỏ cả trang) và More or Copy Sheet (di chuyển và sao chép)
- Menu View: bao gồm các menu quen thuộc nh Winword ngoài ra

Chart Windows (hiện của sổ đồ họa trong Sheet)
- Menu Insect: Ngoài các lệnh chèn ô, chèn hàng, chèn cột còn có Chart
(vẽ đồ họa), Function (gọi hàm)
- Menu Format: có Cells (tạo thuộc tính cho ô đã chọn), nếu muốn tạo
cả trang thì chọn Style.
- Menu Tools: Có phần Add-Ins để nhập thêm một số phần nh Solver,
Data analysis, View manager. Ngoài ra còn có thêm lệnh Macro (để viết lệnh
và chơng trình con)
- Menu Data: menu này chuyên về quản lý số liệu nh Table (bảng),
Sort (sắp xếp thứ tự), Filter (lọc), Pivot table (Bảng tổng kết) sẽ học kỹ ở phần
sau.
- Menu Windows: là menu điều khiển
- Menu Help: giúp đỡ.
+ Thanh công cụ (Standard Toolbar): chứa các biểu tợng của các lệnh
thờng dùng. Thanh này có thể thêm hoặc bớt các biểu tợng (Icon)
+ Thanh công thức (formula bar): để đa thông tin vào một ô (cell).
+ Bảng tính Worksheet: Thờng có 16 trang ghi từ sheet 1 tới sheet 16. Mỗi
sheet có 256 cột (A,B AA,BB ) và 16384 hàng (khoảng 4 triệu ô). Mỗi ô
có 1 địa chỉ dạng (cột, hàng) .

-24 -
Ví dụ A12 (cột A, hàng 12).
Địa chỉ tơng đối (địa chỉ tơng đối là địa chỉ mà ô trong công thức sẽ
đợc điều chỉnh khi công thức đợc sao chép) ký hiệu A1, hoặc B10. Địa chỉ
tuyệt đối (địa chỉ tuyệt đối là địa chỉ mà ô trong công thức sẽ không thay đổi
khi công thức đợc sao chép) ghi dới dạng $A$1 hoặc $B$10 và tuyệt đối một
phần $A3, B$10. Một nhóm các ô liền nhau tạo thành một hình chữ nhật
A3:B10, các ô rời nhau đợc cách nhau bằng dấu phẩy A3:B10, D5:H12,
I19:K12.
+ Thanh cuốn (Scoll Bar) gồm thanh cuốn dọc (Vertical Scoll Bar) và

thanh cuốn ngang (Horizontal Scoll Bar)

2.1.2. Làm việc với Excel
a) Nhập và sửa đổi số liệu
- Nhập và sửa đổi số liệu: có thể nhập văn bản và nhập dữ liệu số
- Sao chép các nội dung trong Sheet: sử dụng lệnh Fill
- Nhập các công thức tính toán: +, -, *, / và ^
- Di chuyển và sao chép các bản tính: sử dụng More or Copy Sheet (hoặc sử
dụng rê chuột và giữ Ctrl)

-25 -
b) Tạo lập các đồ thị bằng Excel
Bớc 1: Chọn số liệu để tạo lập đồ thị
Bớc 2: Chọn các kiểu đồ thị sử dụng Chart (trong menu Insert) hoặc
Icon Chart (trên Menu bar) , thực hiện theo 04 bớc
Bớc 3:(Format đồ thị) là bớc tu chỉnh, chỉnh sửa và thay đổi tiêu đề
cho đồ thị.
Bớc 4: Chiết xuất đồ thị trong Winword
2.1.3. Các hàm trong Excel
Hm l mt thnh phn ca d liu loi cụng thc v c xem l
nhng cụng thc c xõy dng sn nhm thc hin cỏc cụng vic tớnh toỏn
phc tp. Dng thc tng quỏt: <TấN HM> (Tham s 1, Tham s 2, )
Trong ú: <TấN HM> l tờn qui c ca hm, khụng phõn bit ch
hoa hay thng
Cỏc tham s: t cỏch nhau bi d
u "," hoc ";" tu theo khai bỏo trong
Control Panel
Cỏch nhp hm: Chn mt trong cỏc cỏch:
- Cỏch 1: Chn lnh Insert - Function
- Cỏch 2: n nỳt Insert Function trờn thanh cụng c

- Cỏch 3: Gừ trc tip t bn phớm
2.1.3.1. Nhúm hm x lý s
a. Hm ABS:
- Cỳ phỏp: ABS(n)
- Cụng dng: Tr v giỏ tr tuyt i ca s n
- Vớ d: ABS(-5) đ 5
b. Hm SQRT:
- Cỳ phỏp: SQRT(n)
- Cụng dng: Tr v giỏ tr l cn bc hai ca s n
- Vớ d: SQRT(9) đ 3
c. Hm ROUND:
- Cỳ phỏp: ROUND(m, n)

-26 -
- Công dụng: Làm tròn số thập phân m đến n chữ số lẻ. Nếu n dương thì làm
tròn phần thập phân. Nếu n âm thì làm tròn phần nguyên.
- Ví dụ 1: ROUND(1.45,1) ® 1.5
- Ví dụ 2: ROUND(1.43,1) ® 1.4
- Ví dụ 3: ROUND(1500200,-3) ® 1500000
- Ví dụ 4: ROUND(1500500,-3) ® 1501000
d. Hàm INT:
- Cú pháp: INT(n)
- Công dụng: Trả về giá trị là phần nguyên của số thập phân n
- Ví dụ: INT(1.43) ® 1
e. Hàm MOD:
- Cú pháp: MOD(m,n)
- Công dụng: Trả về giá trị phần dư của phép chia số m cho số n
- Ví dụ: MOD(10,3) ® 1
2.1.3.2. Nhóm hàm xử lý dữ liệu chuỗi
a. Hàm LOWER:

- Cú pháp: LOWER(s)
- Công dụng: Chuy
ển tất cả các ký tự trong chuỗi s sang chữ thường.
- Ví dụ: LOWER(“ExCeL”) ® “excel”
b. Hàm UPPER:
- Cú pháp: UPPER(s)
- Công dụng: Chuyển tất cả các ký tự trong chuỗi s sang chữ hoa.
- Ví dụ: UPPER(“ExCeL”) ® “EXCEL”
c. Hàm PROPER:
- Cú pháp: PROPER(s)
- Công dụng: Chuyển tất cả các ký tự đầu của mỗi từ trong chuỗi s sang chữ
hoa và các ký tự còn lại là chữ thường.
- Ví dụ: PROPER(“MiCRosoFt ExCeL”) ® “Microsoft Excel”
d. Hàm LEFT:
- Cú pháp: LEFT(s, n)
- Công dụng: Trích ra n ký tự của chuỗi s kể từ bên trái.

×