3/2/2012
Chương 1
Giới thiệu về Thống kê Sinh học
Nội dung
1. Một số khái niệm
2. Dữ liệu trong sinh học
3. Giới thiệu phần mềm Minitab
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
2
1
3/2/2012
Nội dung
1. Một số khái niệm
2. Dữ liệu trong sinh học
3. Giới thiệu phần mềm Minitab
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
3
Thống kê (Statistics)
• Có thể được hiểu theo hai nghĩa:
– Thống kê là các số liệu được thu thập để phản ánh
các hiện tượng kinh tế - xã hội, tự nhiên, kỹ thuật.
– Thống kê là hệ thống các phương pháp được sử
dụng để mô tả các hiện tượng kinh tế - xã hội, tự
nhiên, kỹ thuật.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
4
2
3/2/2012
Thống kê (Statistics)
• Thống kê là hệ thống các phương pháp dùng
để thu thập, xử lý và phân tích các con số (mặt
lượng) của các hiện tượng để tìm hiểu bản chất
và tính qui luật vốn có của chúng (mặt chất)
trong điều kiện thời gian và không gian cụ thể.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
5
Thống kê (Statistics)
• Gồm hai lãnh vực:
• Thống kê mô tả (Descriptive Statistics):
– Thu thập số liệu
– Mô tả và trình bày số liệu
– Tính toán các đặc trưng đo lường.
• Thống kê suy diễn (Inferential Statistics):
– Ước lượng
– Kiểm định
– Phân tích mối liên hệ
– Dự đoán...
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
6
3
3/2/2012
Thống kê Sinh học (Biostatistics)
• Là khoa học về sự ứng dụng các phương pháp
thống kê để giải quyết các vấn đề của sinh học.
• Bao gồm:
– bố trí thí nghiệm
– thu thập dữ liệu
– trình bày và tóm tắt dữ liệu
– từ các dữ liệu mẫu suy rộng ra tổng thể.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
7
Tổng thể (Population)
• Là một tập hợp mọi phần tử thuần nhất (theo
một tiêu chuẩn nào đó) được quan tâm nghiên
cứu trong một lãnh vực nào đó.
• Kích thước của tổng thể (N) bao gồm toàn bộ
số cá thể của tổng thể.
• Tổng thể được mô tả bởi các tham số
(parameters).
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
8
4
3/2/2012
Mẫu (Sample)
• Là một tập con được rút ra từ tổng thể.
• Số phần tử nằm trong mẫu được gọi là cỡ mẫu
(n).
• Do cỡ mẫu hữu hạn (n << N) nên những kết
luận được suy ra từ mẫu cho tổng thể sẽ có
một số sai số gọi là sai số do chọn mẫu.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
9
Mẫu (Sample)
• Khi cỡ mẫu càng lớn thì sai số do chọn mẫu
càng nhỏ
n phải đủ lớn.
• Phương pháp chọn mẫu không khách quan sẽ
dẫn đến sai số lớn.
việc chọn mẫu phải tiến hành hoàn toàn
ngẫu nhiên.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
10
5
3/2/2012
Nội dung
1. Một số khái niệm
2. Dữ liệu trong sinh học
3. Giới thiệu phần mềm Minitab
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
11
Biến số
• Các đối tượng nghiên cứu được gọi là các đơn
vị quan sát (observational units).
• Trên đơn vị này, các đặc tính được quan sát
hoặc đo đạc được gọi là các biến số
(variables).
• Trong mỗi đối tượng nghiên cứu, các giá trị số
gán cho biến số được gọi là các biến (variate).
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
12
6
3/2/2012
Dữ liệu (Data)
• Dữ liệu là gì?
• Hãy nêu thêm một số thí dụ về dữ liệu.
• Các nguồn dữ liệu thu thập từ đâu?
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
13
Các loại thang đo
•
•
•
•
Thang đo định danh (Nominal scale)
Thang đo thứ hạng (Ordinal scale)
Thang đo khoảng (Interval scale)
Thang đo tỉ lệ (Ratio scale)
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
14
7
3/2/2012
Thang đo định danh
• Dùng để chỉ các thuộc tính, được mã hoá bởi
các con số dùng để phân loại đối tượng, giữa
các con số không có giá trị hơn kém.
• Thí dụ:
– Giới tính: 1 = nữ, 2 = nam.
– Chiều cao cây: 1 = cao, 2 = thấp
• Hãy nêu thêm một số thí dụ khác.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
15
Thang đo thứ hạng
• Dùng để chỉ các thứ hạng của các đơn vị quan
sát.
• Sự chênh lệch giữa các biểu hiện không nhất
thiết phải bằng nhau.
• Thí dụ:
– ước lượng mức độ độc hại của chất amiăng đối với
công nhân: 1 = thấp, 2 = trung bình, 3 = cao.
• Hãy nêu thêm một số thí dụ khác
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
16
8
3/2/2012
Thang đo khoảng và Thang đo tỉ lệ
• Dùng khi các biến được đo ở những khoảng
cách đều nhau
• Thí dụ:
– Nhiệt độ tính theo độ Celsius (thang đo khoảng)
– Chiều cao tính theo cm (thang đo tỉ lệ).
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
17
Thang đo khoảng và Thang đo tỉ lệ
Các điểm khác biệt giữa hai loại thang đo
• Ở thang đo khoảng, giá trị zero mang tính qui
ước, trong khi ở thang đo tỉ lệ có giá trị zero
thật.
– Thí dụ chiều cao bằng 0 cm nghĩa là không có
chiều cao, trong khi nhiệt độ 00C không có nghĩa
là không có nhiệt độ.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
18
9
3/2/2012
Thang đo khoảng và Thang đo tỉ lệ
Các điểm khác biệt giữa hai loại thang đo
• Khi một biến được đo bằng thang đo khoảng,
tỉ số giữa hai giá trị không có ý nghĩa, trong
khi một biến được đo bằng thang đo tỉ lệ, tỉ số
giữa hai giá trị là có ý nghĩa.
– Thí dụ một cây 140cm cao gấp đôi cây 70cm
nhưng một lò nung 3000C không nóng gấp đôi lò
nung ở 1500C.
02/03/2012
19
Thống Kê Sinh Học - Bùi Tấn Anh
Các loại biến sinh học
Biến liên tục
Biến định lượng
Biến rời rạc
Biến sinh học
Biến định danh
Biến định tính
Biến thứ hạng
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
20
10
3/2/2012
Biến định lượng (Quantitative Variable)
• Là những biến mà giá trị của chúng có thể
được biểu hiện dưới dạng số và có thể đo đạc.
• Có hai loại biến định lượng:
– Biến liên tục (Continuous Variable)
– Biến rời rạc (Discrete Variable).
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
21
Biến liên tục
• Là biến có một số giá trị xác định nằm giữa
hai điểm cố định.
• Chẳng hạn giữa hai chiều dài 1,5 cm và 1,6 cm
có vô số các giá trị có thể đo được.
• Thí dụ
– chiều cao cây (cm)
– trọng lượng cơ thể (kg)
– pH của đất.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
22
11
3/2/2012
Biến rời rạc
• Là những biến chỉ có những giá trị xác định,
không có các giá trị trung gian.
• Chẳng hạn số đốt trong phần phụ của một loài
côn trùng có thể là 4, 5 hoặc 6 nhưng không
bao giờ là 4,3 hoặc 5 ½ .
• Thí dụ:
– Số lượng lá cây
– Số cá thể con trong một lứa đẻ.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
23
Biến định tính (Qualitative Variable)
• Là những biến mà giá trị của chúng không thể
biểu hiện dưới dạng số thực sự nhưng có thể
sắp xếp theo loại.
• Có hai loại:
– Biến thứ hạng (Ranked Variable)
– Biến định danh (Nominal Variable)
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
24
12
3/2/2012
Biến thứ hạng
• Là biến có nhiều trạng thái, có thể xếp thứ tự
theo một cách nào đó.
• Thí dụ:
– Chấm điểm mức độ dễ đẻ của bò 1 = không cần
can thiệp, 2 = cần can thiệp một ít, 3 = cần bác sĩ
thú y
– Đánh giá mức độ nghiêm trọng của bệnh từ 1 – 5...
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
25
Biến định danh
• Là những biến không thể đo đạc, xếp hạng nhưng
có thể được biểu hiện về tính chất.
• Còn được gọi là biến thuộc tính.
• Các thuộc tính có thể có hai trạng thái hoặc nhiều
trạng thái.
• Thí dụ:
–
–
–
–
Giới tính: đực hoặc cái
Mang thai: có hoặc không
Màu hoa: trắng, vàng, đỏ…
Các kiểu gen: đồng hợp trội, dị hợp, đồng hợp lặn…
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
26
13
3/2/2012
Độ đúng và độ chính xác
• Độ đúng: giá trị tính toán hoặc đo đạc gần với
giá trị thực nhất.
• Độ chính xác: giá trị đo đạc của các lần lặp lại
gần giống nhau nhất.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
27
Độ đúng và độ chính xác
• Thí dụ: một cái cân bị lệch nhưng nhạy có thể
cho ra số đo không đúng nhưng có độ chính
xác. Ngược lại, một cái cân không nhạy có thể
cho ra số đo không chính xác.
• Nếu không có sự sai lệch của dụng cụ đo, độ
chính xác sẽ dẫn đến độ đúng.
Cần tập trung hơn vào độ chính xác.
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
28
14
3/2/2012
Nội dung
1. Một số khái niệm
2. Dữ liệu trong sinh học
3. Giới thiệu phần mềm Minitab
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
29
Các thành phần
1. Các thanh:
– Tiêu đề (Title Bar)
– Trình đơn (Menu Bar)
– Công cụ (Tool Bar)
– Trạng thái (Status Bar)
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
30
15
3/2/2012
Các thành phần
2. Các cửa sổ:
– Phiên làm việc (Session): có thể lưu (save) dạng
.TXT hoặc RTF, sao chép (copy), cắt (cut), dán
(paste) vào word.
– Bảng tính (Worksheet):
• nhập các dữ liệu dạng số, dạng text (-T), dạng ngày
giờ (-D)
• Lưu các giá trị là hằng số (K) hoặc ma trận (M)
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
31
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
32
16
3/2/2012
Quản lý Dữ liệu & Tính toán
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
33
Stat > Basic Statistics > Graphical Summary…
02/03/2012
Thống Kê Sinh Học - Bùi Tấn Anh
34
17