Tải bản đầy đủ (.pdf) (17 trang)

Thống kê sinh học (Bùi Tấn Anh ĐHCT)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (611.48 KB, 17 trang )

3/2/2012

Chương 1

Giới thiệu về Thống kê Sinh học

Nội dung
1. Một số khái niệm
2. Dữ liệu trong sinh học
3. Giới thiệu phần mềm Minitab

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

2

1


3/2/2012

Nội dung
1. Một số khái niệm
2. Dữ liệu trong sinh học
3. Giới thiệu phần mềm Minitab

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh


3

Thống kê (Statistics)
• Có thể được hiểu theo hai nghĩa:
– Thống kê là các số liệu được thu thập để phản ánh
các hiện tượng kinh tế - xã hội, tự nhiên, kỹ thuật.
– Thống kê là hệ thống các phương pháp được sử
dụng để mô tả các hiện tượng kinh tế - xã hội, tự
nhiên, kỹ thuật.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

4

2


3/2/2012

Thống kê (Statistics)
• Thống kê là hệ thống các phương pháp dùng
để thu thập, xử lý và phân tích các con số (mặt
lượng) của các hiện tượng để tìm hiểu bản chất
và tính qui luật vốn có của chúng (mặt chất)
trong điều kiện thời gian và không gian cụ thể.

02/03/2012


Thống Kê Sinh Học - Bùi Tấn Anh

5

Thống kê (Statistics)
• Gồm hai lãnh vực:
• Thống kê mô tả (Descriptive Statistics):
– Thu thập số liệu
– Mô tả và trình bày số liệu
– Tính toán các đặc trưng đo lường.

• Thống kê suy diễn (Inferential Statistics):
– Ước lượng
– Kiểm định
– Phân tích mối liên hệ
– Dự đoán...
02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

6

3


3/2/2012

Thống kê Sinh học (Biostatistics)
• Là khoa học về sự ứng dụng các phương pháp
thống kê để giải quyết các vấn đề của sinh học.

• Bao gồm:
– bố trí thí nghiệm
– thu thập dữ liệu
– trình bày và tóm tắt dữ liệu
– từ các dữ liệu mẫu suy rộng ra tổng thể.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

7

Tổng thể (Population)
• Là một tập hợp mọi phần tử thuần nhất (theo
một tiêu chuẩn nào đó) được quan tâm nghiên
cứu trong một lãnh vực nào đó.
• Kích thước của tổng thể (N) bao gồm toàn bộ
số cá thể của tổng thể.
• Tổng thể được mô tả bởi các tham số
(parameters).

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

8

4



3/2/2012

Mẫu (Sample)
• Là một tập con được rút ra từ tổng thể.
• Số phần tử nằm trong mẫu được gọi là cỡ mẫu
(n).
• Do cỡ mẫu hữu hạn (n << N) nên những kết
luận được suy ra từ mẫu cho tổng thể sẽ có
một số sai số gọi là sai số do chọn mẫu.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

9

Mẫu (Sample)
• Khi cỡ mẫu càng lớn thì sai số do chọn mẫu
càng nhỏ
 n phải đủ lớn.
• Phương pháp chọn mẫu không khách quan sẽ
dẫn đến sai số lớn.
 việc chọn mẫu phải tiến hành hoàn toàn
ngẫu nhiên.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

10


5


3/2/2012

Nội dung
1. Một số khái niệm
2. Dữ liệu trong sinh học
3. Giới thiệu phần mềm Minitab

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

11

Biến số
• Các đối tượng nghiên cứu được gọi là các đơn
vị quan sát (observational units).
• Trên đơn vị này, các đặc tính được quan sát
hoặc đo đạc được gọi là các biến số
(variables).
• Trong mỗi đối tượng nghiên cứu, các giá trị số
gán cho biến số được gọi là các biến (variate).

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh


12

6


3/2/2012

Dữ liệu (Data)
• Dữ liệu là gì?
• Hãy nêu thêm một số thí dụ về dữ liệu.
• Các nguồn dữ liệu thu thập từ đâu?

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

13

Các loại thang đo





Thang đo định danh (Nominal scale)
Thang đo thứ hạng (Ordinal scale)
Thang đo khoảng (Interval scale)
Thang đo tỉ lệ (Ratio scale)

02/03/2012


Thống Kê Sinh Học - Bùi Tấn Anh

14

7


3/2/2012

Thang đo định danh
• Dùng để chỉ các thuộc tính, được mã hoá bởi
các con số dùng để phân loại đối tượng, giữa
các con số không có giá trị hơn kém.
• Thí dụ:
– Giới tính: 1 = nữ, 2 = nam.
– Chiều cao cây: 1 = cao, 2 = thấp

• Hãy nêu thêm một số thí dụ khác.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

15

Thang đo thứ hạng
• Dùng để chỉ các thứ hạng của các đơn vị quan
sát.
• Sự chênh lệch giữa các biểu hiện không nhất

thiết phải bằng nhau.
• Thí dụ:
– ước lượng mức độ độc hại của chất amiăng đối với
công nhân: 1 = thấp, 2 = trung bình, 3 = cao.

• Hãy nêu thêm một số thí dụ khác

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

16

8


3/2/2012

Thang đo khoảng và Thang đo tỉ lệ
• Dùng khi các biến được đo ở những khoảng
cách đều nhau
• Thí dụ:
– Nhiệt độ tính theo độ Celsius (thang đo khoảng)
– Chiều cao tính theo cm (thang đo tỉ lệ).

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

17


Thang đo khoảng và Thang đo tỉ lệ
Các điểm khác biệt giữa hai loại thang đo
• Ở thang đo khoảng, giá trị zero mang tính qui
ước, trong khi ở thang đo tỉ lệ có giá trị zero
thật.
– Thí dụ chiều cao bằng 0 cm nghĩa là không có
chiều cao, trong khi nhiệt độ 00C không có nghĩa
là không có nhiệt độ.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

18

9


3/2/2012

Thang đo khoảng và Thang đo tỉ lệ
Các điểm khác biệt giữa hai loại thang đo
• Khi một biến được đo bằng thang đo khoảng,
tỉ số giữa hai giá trị không có ý nghĩa, trong
khi một biến được đo bằng thang đo tỉ lệ, tỉ số
giữa hai giá trị là có ý nghĩa.
– Thí dụ một cây 140cm cao gấp đôi cây 70cm
nhưng một lò nung 3000C không nóng gấp đôi lò
nung ở 1500C.


02/03/2012

19

Thống Kê Sinh Học - Bùi Tấn Anh

Các loại biến sinh học

Biến liên tục
Biến định lượng
Biến rời rạc
Biến sinh học
Biến định danh
Biến định tính
Biến thứ hạng

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

20

10


3/2/2012

Biến định lượng (Quantitative Variable)
• Là những biến mà giá trị của chúng có thể

được biểu hiện dưới dạng số và có thể đo đạc.
• Có hai loại biến định lượng:
– Biến liên tục (Continuous Variable)
– Biến rời rạc (Discrete Variable).

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

21

Biến liên tục
• Là biến có một số giá trị xác định nằm giữa
hai điểm cố định.
• Chẳng hạn giữa hai chiều dài 1,5 cm và 1,6 cm
có vô số các giá trị có thể đo được.
• Thí dụ
– chiều cao cây (cm)
– trọng lượng cơ thể (kg)
– pH của đất.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

22

11



3/2/2012

Biến rời rạc
• Là những biến chỉ có những giá trị xác định,
không có các giá trị trung gian.
• Chẳng hạn số đốt trong phần phụ của một loài
côn trùng có thể là 4, 5 hoặc 6 nhưng không
bao giờ là 4,3 hoặc 5 ½ .
• Thí dụ:
– Số lượng lá cây
– Số cá thể con trong một lứa đẻ.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

23

Biến định tính (Qualitative Variable)
• Là những biến mà giá trị của chúng không thể
biểu hiện dưới dạng số thực sự nhưng có thể
sắp xếp theo loại.
• Có hai loại:
– Biến thứ hạng (Ranked Variable)
– Biến định danh (Nominal Variable)

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh


24

12


3/2/2012

Biến thứ hạng
• Là biến có nhiều trạng thái, có thể xếp thứ tự
theo một cách nào đó.
• Thí dụ:
– Chấm điểm mức độ dễ đẻ của bò 1 = không cần
can thiệp, 2 = cần can thiệp một ít, 3 = cần bác sĩ
thú y
– Đánh giá mức độ nghiêm trọng của bệnh từ 1 – 5...

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

25

Biến định danh
• Là những biến không thể đo đạc, xếp hạng nhưng
có thể được biểu hiện về tính chất.
• Còn được gọi là biến thuộc tính.
• Các thuộc tính có thể có hai trạng thái hoặc nhiều
trạng thái.
• Thí dụ:






Giới tính: đực hoặc cái
Mang thai: có hoặc không
Màu hoa: trắng, vàng, đỏ…
Các kiểu gen: đồng hợp trội, dị hợp, đồng hợp lặn…

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

26

13


3/2/2012

Độ đúng và độ chính xác
• Độ đúng: giá trị tính toán hoặc đo đạc gần với
giá trị thực nhất.
• Độ chính xác: giá trị đo đạc của các lần lặp lại
gần giống nhau nhất.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh


27

Độ đúng và độ chính xác
• Thí dụ: một cái cân bị lệch nhưng nhạy có thể
cho ra số đo không đúng nhưng có độ chính
xác. Ngược lại, một cái cân không nhạy có thể
cho ra số đo không chính xác.
• Nếu không có sự sai lệch của dụng cụ đo, độ
chính xác sẽ dẫn đến độ đúng.
 Cần tập trung hơn vào độ chính xác.

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

28

14


3/2/2012

Nội dung
1. Một số khái niệm
2. Dữ liệu trong sinh học
3. Giới thiệu phần mềm Minitab

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh


29

Các thành phần
1. Các thanh:
– Tiêu đề (Title Bar)
– Trình đơn (Menu Bar)
– Công cụ (Tool Bar)
– Trạng thái (Status Bar)

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

30

15


3/2/2012

Các thành phần
2. Các cửa sổ:
– Phiên làm việc (Session): có thể lưu (save) dạng
.TXT hoặc RTF, sao chép (copy), cắt (cut), dán
(paste) vào word.
– Bảng tính (Worksheet):
• nhập các dữ liệu dạng số, dạng text (-T), dạng ngày
giờ (-D)
• Lưu các giá trị là hằng số (K) hoặc ma trận (M)


02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

31

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

32

16


3/2/2012

Quản lý Dữ liệu & Tính toán

02/03/2012

Thống Kê Sinh Học - Bùi Tấn Anh

33

Stat > Basic Statistics > Graphical Summary…

02/03/2012


Thống Kê Sinh Học - Bùi Tấn Anh

34

17



×