Tải bản đầy đủ (.ppt) (39 trang)

Phân tích số liệu đơn biến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (276.6 KB, 39 trang )

PH¢N TÝCH Sè LIÖU TRONG NGHI£N
CøU XHH
NguyÔn H÷u Minh
ViÖn NC Gia ®×nh vµ Gݬi
2
Nội dung

Tỷ lệ, tỷ lệ phần trăm, tỷ số

Đại l ợng đo xu h ớng tập trung

Đại l ợng đo sự phân tán
Tỉ lệ, tỉ lệ phần trăm, tỉ số (1)
Tỉ lệ:

Gỉa định: Ph ơng pháp phân loại cho phép các loại là
loại trừ lẫn nhau và bảo đảm tính toàn diện. Nh vậy
thì tổng của tỉ lệ là 1.

Chẳng hạn, ta có 4 loại với N1, N2, N3, và N4 tr ờng
hợp. Tổng số là N tr ờng hợp. Tỉ lệ của các tr ờng hợp
của bất kỳ loại nào đ ợc tính là số tr ờng hợp của lọai
đó trên tổng số tr ờng hợp (Ni/N). Nh vậy tổng giá trị
là bằng 1.

Ví dụ về chuyển từ số.
Tỉ lệ, tỉ lệ phần trăm, tỉ số (2)
Tỉ lệ phần trăm

Có thể tính trực tiếp từ Tỉ lệ bằng cách
nhân với 100. Tổng giá trị là 100.



Quy tắc có tính kinh nghiệm

Luôn báo cáo số tr ờng hợp cùng với tỉ lệ phần trăm
và tỉ lệ.

Nếu số l ợng các tr ờng hợp quá nhỏ, th ờng là ít hơn
50, thì không nên tính tỉ lệ phần trăm và tỉ lệ. Trong
tr ờng hợp này nên cung cấp số tuyệt đối.

Cách tính các hệ số trong bảng theo hàng
và cột

5
Tỉ lệ, tỉ lệ phần trăm, tỉ số (3)
Ví dụ 1: Các nhóm trẻ em tiếp cận với các TT t vấn

Loại tr ờng hợp Trung tâm A Trung tâm B Trung tâm C Tổng số
N % N % N % N %
Có cả hai cha mẹ
Bố mẹ li dị
Bố mẹ li thân
Bố hoặc mẹ mất
Khác
63
19
27
13
11
47,3

14,3
20,3
9,8
8,3
88
37
20
32
16
45,5
19,2
10,4
16,6
8,3
41
26
16
21
9
36,6
23,2
13,4
18,8
8,0
192
82
62
66
36
43,8

18,7
14,2
15,1
8,2
Tổng số 133 100 193 100 112 100 438 100
6
Tỉ lệ, tỉ lệ phần trăm, tỉ số (4)
Loại tr ờng hợp Trung
tâm A
(N=121)
Trung
tâm B
(N=181)
Trung
tâm C
(N=100)
Tổng số
(N=402)
Có cả hai cha mẹ (N=192)
Bố mẹ li dị (N=82)
Bố mẹ li thân (N=62)
Bố hoặc mẹ mất (N=66)
32,8
23,2
43,5
19,7
45,8
45,1
32,3
48,5

21,4
31,7
24,2
31,8
100
100
100
100
7
Tỉ lệ, tỉ lệ phần trăm, tỉ số (5)
Ví dụ: Tỷ lệ các hành vi bạo lực vợ/chồng

3.1
14.8
7.2
0.6
8.1
1.7
0
2
4
6
8
10
12
14
16
ỏnh Mng chi ẫp quan h tỡnh dc
%
Bo lc vi ngi v

Bo lc vi ngi chng
8
Tỉ lệ, tỉ lệ phần trăm, tỉ số (6)
Tỉ số

Tỉ số là một số thể hiện quy mô t ơng đối của hai
số khác. Chẳng hạn tỉ số của một số A đối với
một số B là số A chia cho số B.

120 bé trai sinh ra so với 100 bé gái. Tỉ số giới
tính khi sinh là 120/100. Nh vậy giá trị có thể lớn
hơn 1.

Tỉ số phụ thuộc bằng số ng ời d ới 15 và trên 64
chia cho tổng số ng ời 15-64.
9
Tỉ lệ, tỉ lệ phần trăm, tỉ số (7)

Thông th ờng tỉ số dùng trong những tr ờng hợp mà
A và B là những loại khác nhau (nam/nữ; đang kết
hôn/ly dị). Trong tr ờng hợp có nhiều loại khác nhau
thì số phải tính toán rất lớn => dùng tỉ lệ hay tỉ lệ
phần trăm, đặc biệt là trong tr ờng hợp chỉ có 2 loại.

Tỉ số có thể đ ợc thể hiện ở bất kỳ cơ số nào tùy
thuộc vào độ lớn của mẫu số. Trong tr ờng hợp ta có
mẫu số lớn nh 1000 hay 100000 ta có tỉ lệ (rates)
một dạng khác của tỉ số khi dùng tỉ lệ phần trăm là
quá bé.
10

Tỉ lệ, tỉ lệ phần trăm, tỉ số (8)
Loại tội phạm Thành phố 1 Thành phố 2 Thành phố 3
Trộm cắp đồ vật
Dùng bạo lực c ớp
147
59
182
75
191
108
Tổng số tr ờng hợp
Tổng dân số
206
115.000
257
175.000
299
540.000
Loại tội phạm Thành phố
1
Thành
phố 2
Thành
phố 3
Trộm cắp đồ vật
Dùng bạo lực c ớp
71,4
28,6
70,8
29,2

63,9
36,1
Tổng số
Tỉ số của trộm cắp tài sản với bạo lực
Tỉ lệ phạm tội bạo lực (100.000)
100
2,49:1
51,3
100
2,43:1
43,9
100
1,77:1
20,0
11
Tỉ lệ, tỉ lệ phần trăm, tỉ số (10)
Thực hành
Nhận thức về quyền TE
Học vấn cao nhất
Thấp Cao Tổng số
Ch a tốt nghiệp Cấp 3 210 90 300
Tốt nghiệp Cấp 3 hoặc cao
hơn
25 75 100
Tổng số 235 165 400
12
Các đại l ợng đo xu h ớng tập trung (1)
Gíơi thiệu

Theo thang đo định danh chúng ta có thể sử

dụng tỉ số, tỉ lệ, tỉ lệ phần trăm và các biểu đồ, đồ
thị.

Trong tr ờng hợp thang khoảng chúng ta có thể
sử dụng sự phân bố tần suất.

Ngoài ra có thể sử dụng các phép đo sự tập trung
và phân tán. Mỗi phép đo có u thế và nh ợc điểm
riêng.
13
Các đại l ợng đo xu h ớng tập trung (2)

Phép đo xu h ớng tập trung chỉ ra mức độ tập
trung của số liệu. Trong phần lớn các phân bố của
dãy số, các giá trị quan sát có xu h ớng tập trung
quanh một giá trị trung tâm.

Ví dụ, khi điều tra thu nhập của 5 hộ gia đình
trong tháng, chúng ta có các số liệu sau: 10120000,
11210000, 15450000, 18920000, 45000000. Đây
chính là 5 giá trị quan sát của dãy số liệu về thu
nhập hộ gia đình.
14
Các đại l ợng đo xu h ớng tập trung (3)
Trung bình số học hay trung bình
cộng
Giá trị trung bình cộng đ ợc tính
theo công thức sau đây:
Trong đó: X1, X2, X3. là giá trị
của các đơn vị trong dãy số (i

nhận giá trị 1,2,3,4 đến n); n
là tổng số các tr ờng hợp.
n
1

=
=
=
ni
i
i
X
X
15
Các đại l ợng đo xu h ớng tập trung (4)

Giá trị trung bình cho biết đặc tr ng chung của tập
hợp các đơn vị nghiên cứu, không tính đến ảnh h
ởng của giá trị cá biệt (Nếu chúng ta lấy giá trị
trung bình trừ đi mỗi giá trị của dãy số và lấy
tổng các hiệu số thì kết quả sẽ bằng 0 - đại l ợng đo
l ờng trung tâm

Giá trị trung bình rất nhạy với trị số cá biệt, nhất
là trong tr ờng hợp dãy số phân bố không đều.
16
Các đại l ợng đo xu h ớng tập trung (5)

Trong tr ờng hợp mà giá trị trung bình đ ợc tính từ
số liệu đ ợc nhóm gộp thì công thức nh sau: X trung

bình=(sigma fm)/N, ở đây fm là tần số của mỗi
nhóm tr ờng hợp nhân với điểm giữa của nó
(midpoint). Sở dĩ phải dùng điểm giữa của nhóm là
vì nó phản ánh tốt nhất đánh giá của chúng ta về
giá trị trung bình của các giá trị trong nhóm. Khi
tính toán chúng ta coi tất cả các tr ờng hợp đều
nhận giá trị điểm giữa trong nhóm tr ờng hợp đó.
17
Các đại l ợng đo xu h ớng tập trung (6)
L u ý:

Trung bình cộng xóa bỏ những biến đổi ngẫu
nhiên, những ảnh h ởng của đặc điểm cá biệt, và
trình bày đặc tr ng chung của tập hợp các đơn vị
nghiên cứu (đồng nhất về chất theo dấu hiệu
tính toán).

Chẳng hạn, khi ta nói thu nhập trung bình của
hộ gia đình Việt Nam thì chúng ta chỉ có một
con số duy nhất, con số thu nhập trung bình đó
có thể khác xa so với thu nhập trung bình của
những ng ời giàu nhất hay nghèo nhất Việt Nam.
18
Các đại l ợng đo xu h ớng tập trung (7)

Gía trị trung bình có đặc điểm là tổng chênh lệch của các
giá trị với giá trị trung bình luôn bằng 0.

Trong tr ờng hợp có sự phân bố không đều, nghĩa là số l ợng
các đơn vị tập trung đông ở điểm thấp nhất hoặc ở điểm

cao nhất của dãy số thì giá trị trung bình cộng sẽ bị ảnh h
ởng. Trong tr ờng hợp này trung bình cộng không đ ợc sử
dụng làm đại l ợng đặc tr ng cho biến đó.

Tổng độ lệch bình ph ơng của các giá trị với giá trị trung
bình là nhỏ hơn bất kỳ độ lệch bình ph ơng của các giá trị
với bất kỳ một số nào khác. (Sigma của (Xi-X trung bình)
bình ph ơng=nhỏ nhất. Điều này có liên quan đến việc
phân tích t ơng quan và hồi quy sau này.
Các đại l ợng đo xu h ớng tập trung
(8)
.
X

= (10,3+4,9+8,9+11,7+6,3+2,7)/6 = 7,5 triệu đồng
Nếu X
4
= 50,7 thì kết quả sẽ bị ảnh h ởng mạnh:
X

= (10,3+4,9+8,9+50,7+6,3+7,7)/6 = 14,0 triệu đồng
Ví dụ:
Thu nhập trung bình hộ gia đình/tháng của các gia đình (triệu đồng) tháng
12/2010 đ ợc báo cáo nh sau. Tính thu nhập trung bình của các hộ này?
X
1
= 10,3
X
2
= 4,9

X
3
= 8,9
X
4
= 11,7
X
5
= 6,3
X
6
= 2,7
20
Các đại l ợng đo xu h ớng tập trung (9)
Số liệu thu nhập hàng ngày (1000đ) của 30 ng ời:
Số liệu ch a nhóm gộp Số liệu đã nhóm gộp
Gía trị Tần số Gía trị Tần số Nhóm Tần số
12
13
14
16
18
19
20
24
25
26
1
2
1

4
1
1
1
1
3
1
28
29
30
32
35
36
37
38
40
97
99
2
1
2
1
2
1
1
1
1
1
1
10-15

16-20
21-25
26-30
31-35
36-40
95-100
4
7
4
6
3
4
2
21
Các đại l ợng đo xu h ớng tập trung (10)

Thu nhập trung bình hàng ngày tính từ bảng trên
là: (12+13+ + 99)/30=29,73

Trung bình sau khi nhóm gộp:
Sigma fm= (12,5*4) + (18*7)+(23*4) + (28*6) +
(33*3) + (38*4) + (97,5*2)= 882
X trung bình=882/30=29,4

Nh vậy hơi có sự khác biệt về kết quả. Nguyên
nhân là do chúng ta giả định rằng các giá trị đ ợc
phân bố giống nhau quanh điểm giữa trong khi đó
thực tế không phải nh vậy.
Các đại l ợng đo xu h ớng tập trung
(11)

Trung vị (Median):
Ví dụ: X
4
= 11,7 (hoặc X
4
= 50,7 giá trị cá biệt)
X
1
= 10,3
X
3
= 8,9
X
5
= 6,3
X
2
= 4,9
X
6
= 2,7
Số trung vị: (8,9 + 6,3) = 7,6 triệu đồng [trong cả 2 tr ờng hợp]
Trung vị là giá trị của đơn vị ở vị trí trung điểm trong dãy số (lẻ) hoặc giá
trị trung bình cộng của 2 đơn vị ở trung điểm trong dãy số (chẵn). Trong
mọi tr ờng hợp tính toán trung vị, dãy số phải đ ợc sắp xếp theo thứ tự (tăng
hoặc giảm dần)
Số trung vị không chịu ảnh h ởng của giá trị các đơn vị trong dãy số. Nó bỏ
qua đ ợc ảnh h ởng của các giá trị cá biệt.
Các đại l ợng đo xu h ớng tập trung
(12)

Ví dụ: Trong tr ờng hợp số đơn vị là lẻ (7 đơn vị):
3 1 2 5 1 8 6
Sắp xếp lại thứ tự 1 1 2 3 5 6 8
Giá trị trung vị là giá trị của số đứng giữa, tức là 3
Trong tr ờng hợp số đơn vị là chẵn (6 đơn vị)
10 15 7 19 12 11
Sắp xếp thứ tự. 7 10 11 * 12 15 19
- Số trung vị đứng ở vị trí giữa hai số thứ 3 và thứ 4. Giá trị của nó là
trung bình cộng của 2 số này: (11+12)/2 = 11,5
Các đại l ợng đo xu h ớng tập trung
(13)
ý nghĩa: Số trung vị = 7,6 triệu đồng có nghĩa là tháng 12
năm 2010, 50% số hộ gia đình có thu nhập trung bình d ới 7,6
triệu, và 50% số hộ gia đình có thu nhâp trung bình trên mức
7,6 triệu.

Giống với giá trị trung bình, số trung vị đo l ờng đặc tr ng chung của
một tập hợp các đơn vị quan sát

Trung vị không bị chi phối bởi các giá trị cá biệt trong dãy số, dù là
dãy số có phân bố lệch.

Trung vị chịu ảnh h ởng bởi số l ợng đơn vị trong dãy số.
Các đại l ợng đo xu h ớng tập trung (14)
Mốt:

Trong thống kê, Mode là giá trị dễ đ ợc xác đinh nhất. Nó chính là giá trị
gặp nhiều lần nhất trong một dãy số

Mode là giá trị có tần suất lớn nhất. Một dãy số có thể có nhiều hoặc

không có giá trị Mode. Mode phụ thuộc vào mỗi lần lấy mẫu
Số con trong gia đình Xi Số l ợng gia đình Ni
1
2
3
4
5
6
7 trở lên
30
60
75
45
30
15
5
Tổng số 260
Mốt Xo=3

×