Tải bản đầy đủ (.pdf) (77 trang)

Bài giảng Thống kê trong nghiên cứu khoa học xã hội: Chương 3 - Nguyễn Công Nhựt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (507.06 KB, 77 trang )

THỐNG KÊ TRONG
NGHIÊN CỨU XÃ HỘI

1


Chương 3. Thống kê mô tả
(Descriptive statistics)


Thống kê mô tả là phương pháp liên quan đến
việc tổ chức, tổng hợp và trình bày số liệu thu
thập được từ mẫu nghiên cứu hoặc tổng thể.

2




Dữ liệu thơ: Thích loại nước ngọt
3 3 3 3 3 3 3 2 3 3 3 1 3 3 3 3 3 1 3
2 3 3 1 3 3 3 3 3 3 1



Một trong những lý do chính sử dụng phương
pháp thống kê là để tổng hợp và mơ tả dữ liệu,
làm cho thơng tin được trình bày rõ ràng hơn.
3



PP thống kê mô tả dưới dạng bảng


Phân phối tần suất: 1 bảng trình bày số lần
xuất hiện của một hay nhiều giá trị được quan
sát trong mẫu hoặc tổng thể

4


PP thống kê mô tả dưới dạng bảng


Các kiểu phân phối tần suất





Thô (raw)
Liên hệ (relative): tỉ lệ (proportion) và phần trăm
(percent)
Lũy tiến (cumulative)

5


Phân phối tần suất



Một số ký hiệu sử dụng trong tính tốn phân
phối tần suất





n = tổng số mẫu quan sát
X = biến
i = giá trị (thành phần) của biến X
fi = tần suất quan sát của giá trị i

6


Phân phối tần suất (t.t)


Các thành phần (giá trị) của biến phải:



Loại trừ lẫn nhau
Bao phủ hết các trả lời

7


Phân phối tần suất (t.t)



Bảng phân phối tần suất nên bao gồm:






Tiêu đề mô tả nội dung của bảng
Tên biến
Nhãn giá trị cho các thành phần biến
Tổng các quan sát của mẫu
Khai báo nguồn dữ liệu

8


1. Bảng phân phối tần suất thô
Bảng 1. Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọt thích

Số đếm được
(Tally)

Tần số
(Frequency)

1. Coca – Cola

4


4

2. Pepsi

2

2

3. Khác

24

24

Tổng (n)

30

30

Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
9


2. Bảng phân phối tần suất liên hệ
Bảng 2. Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọt thích

Tần số ni

(frequency)

Tần suất Phần trăm-%i
(fi)
(percent)

1. Coca – Cola

4

0,133

13,3

2. Pepsi

2

0,067

6,7

3. Khác

24

0,80

80,0


Tổng

30

1,0

100,0

Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
10


2. Bảng phân phối tần suất liên hệ


Công thức:
- Tần suất tỉ lệ
fi = ni/n
∑fi = 1

11


2. Bảng phân phối tần suất liên hệ


Công thức:
- Tần suất phần trăm
%i = ni/n * 100
∑%i = 100


12


3. Bảng phân phối tần suất lũy tiến
Bảng 3. Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọt thích

Tần số ni
(frequency)

Phần trăm % lũy tiến
(percent)

1. Coca – Cola

4

13,3

13,3

2. Pepsi

2

6,7

20,0


3. Khác

24

80,0

100,0

Tổng

30

100,0

Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
13


Thử tài


Tâm trạng khi học Thống kê xã hội
Data:
3 3 3 4 3 2 3 2 2 4 2 3 3 3 3
3 4 3 4 3 1 3 4 4 1 4 2 3 2 2
Lập bảng phân phối tần suất thể hiện: tần số
ni, tần suất (fi), phần trăm, và % lũy tiến.
14



4. Bảng phân phối tần suất cho biến có
thang đo thứ bậc

Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
15


5. Bảng phân phối tần suất cho biến có
thang đo khoảng cách – tỉ lệ
Bảng 5.1: Danh sách sinh viên lớp TK04 với điểm trung bình chung năm học
SV

Điểm TB

SV

Điểm TB

SV

Điểm TB

1

68

11

68


21

64

2

71

12

68

22

69

3

80

13

75

23

60

4


69

14

65

24

72

5

77

15

63

25

72

6

55

16

62


26

70

7

57

17

66

27

70

8

64

18

68

28

69

9


63

19

62

29

70

10

65

20

66

30

73
16

Nguồn: Khảo sát lớp học TK04, tháng 11, 2007


Bảng 5.2: Phân bổ tần suất điểm trung bình chung năm học của
SV lớp TK04
k=5, h=(Xmax - Xmin )/k =(80-55)/5=5
Điểm TB chung

55 – 60
60 – 65
65 – 70
70 – 75
75 – 80
Tổng

Tần số
(số sinh viên)
2
7
11
7
3
30

Phần trăm
6,67
23,33
36,67
23,33
10,00
100,0

Nguồn: Khảo sát lớp học TK04, tháng 11, 2007
17


Bài tập
Bảng phân phối tần suất

Vấn đề 1: Theo Cục dân số, trong năm 1994 Hoa
Kỳ có 23,6 triệu hộ gia đình (hgđ) chỉ có 1
người; 31,2 tr hgđ có 2 người; 16,9 tr hgđ có
3 người; 15,1 tr hgđ có 4 người; 6,7 tr hgđ có
5 người; 2,2 tr hgđ có 6 người; và 1,4 tr hgđ
có từ 7 người trở lên.
a) Lập bảng tần suất liên hệ
b) Lập bảng tần suất lũy tiến
18


Vấn đề 2: Bảng 2 trình bày số liệu (triệu người)
dân số có quốc tịch Mỹ nhưng sinh ra tại nước
ngoài.
a) Lập bảng phân phối tần suất liên hệ
b) “Nơi sinh” được xem là biến định tính hay
định lượng? Vì sao?

19


Bảng 2:
Nơi sinh
Châu Âu
Liên Xô cũ
Châu Á
Canada
Mexico
Caribê
Trung Mỹ

Nam Mỹ
Châu Phi
Châu Đại Dương
Nguồn: Cục thống kê Hoa Kỳ, 1994

Số lượng
4,0
0,3
5,0
0,7
4,3
1,9
1,1
1,0
0,4
0,1

20


Mô tả độ tập trung biến
(central tendency)
1. Yếu vị (Mode): giá trị xuất hiện nhiều lần nhất
trong tập một dữ liệu
□ Mode có thể được sử dụng cho tất cả các loại
thang đo.
□ Mode không chịu ảnh hưởng của những giá trị
ngoại lệ.

21



Yếu vị (Mode)


VD1:
2 3 3 3 2 2 2 3 3 2 3 3 2 2
3 2 3 3 2 3 3 4 4 2 3 4 3 2 2
3
⮲ Mode = 3

22


Yếu vị (Mode)
VD2:

23

Nguồn: Khảo sát lớp học TK04, tháng 11, 2007


Mô tả độ tập trung biến
(central tendency)
2. Trung vị (Median): là giá trị đứng giữa trong
tập một dữ liệu.


Giá trị này chia tập quan sát làm hai phần đều
nhau, 50% số quan sát của tập dữ liệu có giá

trị bé hơn giá trị trung vị và 50% lớn hơn giá
trị trung vị.
24


Trung vị (Median)


Chú ý:




Muốn xác định giá trị trung vị của một tập dữ
liệu, các quan sát trong tập dữ liệu này trước tiên
phải được sắp xếp theo trật tự (từ nhỏ đến lớn hay
ngược lại)
Khơng tính tốn giá trị trung vị cho biến có thang
đo danh nghĩa.

25


×