Tải bản đầy đủ (.pdf) (11 trang)

Bài giảng điều tra xã hội học chương 5 phân tích dữ liệu và trình bày kết quả nghiên

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.51 MB, 11 trang )

Page 1
I
PHÂN TÍCH
DỮ LIỆU
II
TRÌNH BÀY
KẾT QUẢ
NGHIÊN CỨU
Chương V
PHÂN TÍCH DỮ LIỆU
VÀ TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU
I. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU
Chuẩn bị dữ liệu và xử lý1
Phương pháp mô tả và phân tích dữ liệu
2
1. Chuẩn bị dữ liệu và xử lý
Chuẩn bị (làm sạch) dữ liệu
Phương pháp xử lý dữ liệu
Nhập dữ liệu
Nhập dữ liệu
Thiết kế form nhập dữ liệu
Nhập trực tiếp vào phần mềm xử lý
Mã hoá dữ liệu
Mã hoá dữ liệu
Các thủ tục mã hóa
 Mã hóa trước
 Mã hóa sau
Mã hoá dữ liệu
 Các nguyên tắc thiết lập mã hóa
 Số lượng "kiểu mã hóa" thích hợp
 Tính tương đương của thông tin trả lời trong cùng “loại mã"


 Sự khác biệt của các thông tin trả lời giữa các "loại mã"
 Nguyên tắc loại trừ giữa các loại mã hóa
 Nguyên tắc toàn diện
Page 2
Mã hoá dữ liệu
 Lập danh bạ mã hóa

Danh bạ mã hóa: là bảng gồm nhiều cột, chứa đựng những lời
giải thích về mã hiệu đã được sử dụng trong những trường dữ liệu

Chức năng của danh bạ mã hóa:
 Giúp người làm mã hóa thực hiện việc làm biến đổi từ một câu trả
lời ra một ký hiệu (mã hiệu) thích hợp mà máy tính có thể đọc được.
 Giúp nhà nghiên cứu nhận diện được các biến số sử dụng trong
các quá trình phân tích.
Chuẩn bị (làm sạch) dữ liệu
Kiểm tra dữ liệu
Hiệu chỉnh dữ liệu
Kiểm tra dữ liệu
 Mục đích: xác định dữ liệu đã thu thập được có thể chấp
nhận được hay không? Trả lời câu hỏi "dữ liệu đó có thực
sự chính xác hay không?"
 Nội dung: Kiểm tra: con số và logic
Kiểm tra dữ liệu
Cách làm:
- Nếu bản thân người nghiên cứu đi thu thập: kiểm tra tính chính
xác trên phiếu điều tra.
- Nếu việc thu thập dữ liệu đặt hàng cho một tổ chức khác: kiểm
tra lấy mẫu và chọn mẫu, tính chính xác trên phiếu điều tra
Hiệu chỉnh dữ liệu

Một số thiếu sót phổ biến cần hiệu chỉnh
 Những câu trả lời không
đầy đủ
 Những câu trả lời thiếu
nhất quán
 Những câu trả lời không
thích hợp
 Những câu trả lời không
đọc được
 Quay trở lại điều tra viên hay
người trả lời để làm sáng tỏ.
 Suy luận từ những câu trả
lời khác.
 Loại toàn bộ câu trả lời
Cách tiếp cận để xử lý
Phương pháp xử lý dữ liệu
Xử lý thủ công (bằng tay):
 - Phương pháp kiểm đếm bằng tay
 - Phương pháp lựa ra và đếm
 Xử lý bằng máy tính
 Ưu điểm:
 Không đòi hỏi
các thiết bị kỹ
thuật phức tạp.
 Đơn giản với
kỹ thuật viên tính
toán
 Khi lập bảng
có thể dùng ngôn
ngữ phổ thông

 Nhược điểm
 Khả năng phân tích dữ
liệu đa chiều
 Mất nhiều thời gian khi
phải xử lý một số lớn đơn
vị điều tra, Không có khả
năng thực hiện khi số
lượng biến lớn và khối
lượng dữ liệu nhiều.
 Không có khả năng kết
hợp nhập, phân tích dữ
liệu, in kết quả và lưu trữ
dữ liệu, kết quả.
Đây là phương pháp thích hợp nhất và
mang lại hiệu quả cao về kinh tế cũng
như kỹ thuật xử lý, phân tích. Hiện nay
có nhiều phần mềm hữu hiệu cho việc
nhập, xử lý và phân tích các dữ liệu
phân tích kinh tế xã hội. (SPSS, STATA,
SAS, Minitab, Eviews )
Page 3
I. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU
Chuẩn bị dữ liệu và xử lý1
Phương pháp mô tả và phân tích dữ liệu
2
2. Phương pháp mô tả và
phân tích dữ liệu
2.1. Mô tả dữ liệu
2.2. Phân tích dữ liệu
2.1. Mô tả dữ liệu

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê
2.1.2. Bảng thống kê và đồ thị thống kê
2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng
2.1.1.1 Sắp xếp dữ liệu
2.1.1.2 Phân tổ thống kê
2.1.1 Sắp xếp dữ liệu và phân tổ
thống kê
2.1.1.1 Sắp xếp dữ liệu
 Sắp xếp số liệu theo thứ tự
 Biểu hiện bằng sơ đồ thân lá (Stem and leaf)
S¾p xÕp???
TUOI Stem-and-Leaf Plot
Frequency Stem & Leaf
3,00 2 . 1&
10,00 2 . 2333
30,00 2 . 44444445555555
33,00 2 . 6666667777777777
76,00 2 . 8888888888888888888999999999999999999
56,00 3 . 0000000000000000000001111111
62,00 3 . 2222222222222222222233333333333
51,00 3 . 4444444444455555555555555
25,00 3 . 666666777777
45,00 3 . 8888888888888889999999
31,00 4 . 000000000000011
23,00 4 . 22222233333
41,00 4 . 44444444455555555555
17,00 4 . 66666677
25,00 4 . 888888899999
20,00 5 . 000000011
9,00 5 . 2233

4,00 5 . 5&
4,00 5 . 7&
3,00 5 . 8
Stem width: 10
Each leaf: 2 case(s)
2.1.1.2 Phân tổ thống kê
Phân tổ thống kê là căn cứ vào một (hay một số) tiêu
thức nào đó để tiến hành phân chia các đơn vị của
hiện tượng nghiên cứu thành các tổ (hoặc các tiểu tổ)
có tính chất khác nhau
Page 4
2.1.1.2 Phân tổ thống kê
Các loại phân tổ thống kê
Các loại phân tổ
thống kê
Căn cứ vào số lượng
tiêu thức của phân tổ
Phân tổ
phân loại
Phân tổ
kết cấu
Phân tổ
liên hệ
Phân tổ theo
1 tiêu thức
Phân tổ theo
nhiều tiêu thức
Phân tổ
kết hợp
Phân tổ

nhiều chiều
2.1.1.2 Phân tổ thống kê
Phân phối các đơn vị vào từng tổ
Xác định số tổ và khoảng cách tổ
Lựa chọn tiêu thức phân tổ
Xác định mục đích phân tổ
Bước 4Bước 4
Bước 3Bước 3
Bước 2Bước 2
Bước 1Bước 1
2.1. Mô tả dữ liệu
2.1.1 Sắp xếp dữ liệu và phân tổ thống kê
2.1.2. Bảng thống kê và đồ thị thống kê
2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng
2.1.2.1 Bảng thống kê
2.1.2.2 Đồ thị thống kê
2.1.2. Bảng thống kê và đồ thị thống kê
2.1.3.1 Bảng thống kê
Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ
thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng
nghiên cứu.
Cấu thành bảng thống kê
Tên bảng thống kê (tiêu đề chung)
Phần giải thích
Phần chủ đề
Các chỉ tiêu giải thích (tên cột)
(A) (1) (2) (3) (4)
Các chỉ tiêu giải thích (tên cột)
Nguyên tắc trình bày bảng
- Quy mô của bảng thống kê không nên quá lớn.

- Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và
dễ hiểu.
- Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số.
- Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự
hợp lý
- Cách ghi các số liệu vào bảng thống kê.
- Phần ghi chú ở cuối bảng thống kê.
Page 5
2.1.3.2 Đồ thị thống kê
Là các hình vẽ hoặc đường nét hình học dùng để miêu tả
có tính chất quy ước các tài liệu thống kê.
Có tính quần chúng, có sức hấp dẫn và sinh động, làm cho
người hiểu biết ít về thống kê vẫn lĩnh hội được vấn đề chủ yếu
một các dễ dàng, đồng thời giữ được ấn tượng sâu đối với
người đọc.
Nguyên tắc trình bày đồ thị
- Quy mô của đồ thị
- Các ký hiệu hình học
- Hệ tọa độ
- Thang và tỷ lệ xích
- Phần ghi chú
Đồ thị hình cột
0
5
10
15
20
25
Jan Feb Mar Apr May Jun
Food

Đồ thị so sánh hình cột
0
5
10
15
20
25
30
Jan Feb Mar Apr May Jun
Food
Gas
Đồ thị đường gấp khúc
Food
0
5
10
15
20
25
Jan Feb Mar Apr May Jun
Đồ thị cơ cấu
12
17
22
14
19
Page 6
Đồ thị so sánh cơ cấu
0%
20%

40%
60%
80%
100%
Jan Feb Mar Apr May Jun
Motel
Gas
Food
Đồ thị liên hệ
400
450
500
550
600
650
700
750
0 5 10 15 20 25 30 35 40
Đồ thị hình “mạng nhện”
0
5
10
15
20
25
30
Jan
Feb
Mar
Apr

May
Jun
Food
Gas
Bản đồ thống kê
2.1. Mô tả dữ liệu
2.1.1 Sắp xếp dữ liệu và phân tổ thống kê
2.1.2. Bảng thống kê và đồ thị thống kê
2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng
2.1.3.1 Các mức độ điển hình
2.1.3.2 Các tham số biến thiên (phân tán)
2.1.3. Tóm tắt dữ liệu
bằng các tham số đặc trưng
Page 7
2.1.3.1 Các mức độ trung tâm
Trung vị
Số bình quân
Mốt
Số bình quân
Số bình quân trong thống kê là mức độ biểu hiện trị số
đại biểu theo một tiêu thức nào đó của một tổng thể bao
gồm nhiều đơn vị cùng loại
Số bình quân
-Số bình quân cộng:
+ Giản đơn:
+ Gia quyền:
+ Điều hoà gia quyền
+ Điều hoà giản đơn
i
ii

n
nn
f
fx
fff
fxfxfx
x








.


21
2211
n
x
n
xxx
x
in








21
_









.
.

_
i
i
i
i
ii
i
i
x
M
M
x
fx

fx
f
fx
x
i
x
n
x
1


_
Số bình quân
- Số bình quân nhân:
+ Giản đơn:
+ Gia quyền:
n
n
i
i
n
n
xxxxx



1
21








i
i
i
n
f
n
i
f
i
f
f
n
ff
xxxxx
1
21
21

Số bình quân
Đặc điểm
•Nêu lên mức độ chung nhất, phổ biến nhất, có tính chất đại
biểu nhất của tiêu thức nghiên cứu, không kể đến chênh lệch
thực tế giữa các đơn vị tổng thể
•San bằng mọi chênh lệch giữa các đơn vị về trị số của tiêu
thức nghiên cứu

•Chịu ảnh hưởng của các lượng biến đột xuất
Số bình quân
Điều kiện vận dụng
- Số bình quân chỉ được tính ra từ tổng thể đồng chất (bao gồm
nhiều đơn vị, phần tử hoặc hiện tượng có cùng chung một tính
chất, thuộc cùng một loại hình kinh tế xã hội, xét theo một tiêu
thức nào đó)
- Số bình quân chung cần được vận dụng kết hợp với các số
bình quân tổ hoặc dãy số phân phối
Page 8
2.1.3.1 Các mức độ trung tâm
Trung vị
Số bình quân
Mốt
Mốt (Mo)
Là biểu hiện của một tiêu thức được gặp nhiều nhất trong một
tổng thể hay trong một dãy số phân phối
(Được sử dụng đối với cả biến định tính và định lượng)
- Đối với một dãy số lượng biến, mốt là lượng biến có tần số lớn nhất
- Đối với một dãy số lượng biến có khoảng cách tổ, muốn tìm mốt
trước hết cần xác định tổ có mốt, tức là tổ có tần số lớn nhất. Sau đó,
trị số gần đúng của mốt tính theo công thức:
)()(
.
11
1
0
0min0






oooo
oo
MMMM
MM
MM
ffff
ff
hxM
Mốt (Mo)
Tác dụng
• Là mức độ đại biểu, nên có thể dùng Mo để thay thế cho số
trung bình trong những trường hợp tính số trung bình gặp khó
khăn.
• Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý
nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến
đột xuất
•Là một trong những tham số nêu lên đặc trưng phân phối
• Phục vụ nhu cầu hợp lý
Mốt (Mo)
Hạn chế
• Kém nhạy bén với sự biến thiên của tiêu thức
• Không xác định được trong trường hợp dãy số phân phối
không bình thường
2.1.3.1 Các mức độ trung tâm
Trung vị
Số bình quân
Mốt

Trung vị (Me)
Là một lượng biến tiêu thức của đơn vị đứng ở vị trí giữa trong
một dãy số lượng biến
-Nếu số đơn vị tổng thể lẻ (n = 2m + 1), số trung vị sẽ là lượng biến
của đơn vị đứng ở vị trí giữa
- Nếu số đơn vị tổng thể chẵn (n = 2m), số trung vị là bình quân của
2 số đứng ở vị trí giữa:
- Dãy số lượng biến có khoảng cách tổ: xác định tổ có số trung vị và
tính theo công thức:
e
e
ee
M
M
i
MMe
f
S
f
hxM




1
2
.
min
Page 9
Trung vị (Me)

Tác dụng
• Là mức độ đại biểu, có thể dùng Me để thay thế cho số trung
bình trong những trường hợp tính số trung bình gặp khó khăn.
• Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý
nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến
đột xuất
•Là một trong những tham số nêu lên đặc trưng phân phối
• Tác dụng trong kỹ thuật và phục vụ công cộng
Khoảng tứ phân vị,…
Q1 Me Q2
568N =
TUOI
70
60
50
40
30
20
10
Đặc trưng phân phối
Hệ số bất đối xứng
K<0 dãy số phân phối chuẩn lệch trái
K>0 dãy số phân phối chuẩn lệch phải
K=0 dãy số phân phối chuẩn đối xứng
K càng lớn thì dãy số càng không đối xứng

0
Mx
K



X Me Mo
2.1.3.1 Các mức độ điển hình
2.1.3.2 Các tham số biến thiên (phân tán)
2.1.3. Tóm tắt dữ liệu
bằng các tham số đặc trưng
2.1.3.2 Các tham số biến thiên (phân tán)
Phân tán
Ý nghĩa nghiên cứu:
- Xét trình độ đại biểu của số
bình quân
- Thấy rõ nhiều đặc trưng của
dãy số, như đặc trưng về phân
phối, về kết cấu, tính chất đồng
đều của tổng thể nghiên cứu
- Sử dụng trong nhiều trường
hợp nghiên cứu thống kê khác
như: phân tích biến động, phân
tích mối liên hệ, dự đoán thống

Khoảng biến thiên (R)
Là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất
của tiêu thức nghiên cứu, biểu hiện bằng công thức:
R = X
max
- X
min
Không phụ thuộc vào sự phân bố của dữ liệu:
7 8 9 10 11 12
R = 12 - 7 = 5

7 8 9 10 11 12
R = 12 - 7 = 5
Page 10
Độ lệch tuyệt đối bình quân
Là số bình quân cộng của các độ lệch tuyệt đối giữa các lượng
biến với số bình quân cộng của các lượng biến đó
n
xx
d
i







i
ii
f
fxx
d
Phương sai
Là số bình quân cộng của bình phương các độ lệch giữa các
lượng biến với số bình quân cộng của các lượng biến đó
Công thức thực hành:
n
xx
i




2
2
)(





i
ii
f
fxx
2
2
)(

222
)( xx 

Độ lệch tiêu chuẩn
Là căn bậc hai của phương sai, tức là số bình quân toàn
phương của bình phương các độ lệch giữa các lượng biến với
số bình quân cộng của các lượng biến đó
Là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong nghiên
cứu thống kê để đánh giá độ biến thiên của tiêu thức
222
)(xx 


Hệ số biến thiên
Là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tuyệt đối
bình quân (hoặc độ lệch tiêu chuẩn) với số bình quân cộng
Là thước đo độ biến thiên tương đối, có thể dùng để so sánh
giữa các chỉ tiêu khác loại hoặc cùng loại và có số trung bình
không bằng nhau
100.
x
V


2. Phương pháp mô tả
và phân tích dữ liệu
2.1. Mô tả dữ liệu
2.2. Phân tích dữ liệu
2.2. Phân tích dữ liệu
Phương pháp hồi quy tương quan
Phương pháp dãy số thời gian
Một số phương pháp dự đoán thống kê
Page 11
I
PHÂN TÍCH
DỮ LIỆU
Chương V
PHÂN TÍCH DỮ LIỆU
VÀ TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU
II
TRÌNH BÀY
KẾT QUẢ
NGHIÊN CỨU

II. TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU
Vai trò của báo cáo1
Các loại báo cáo
2
Nguyên tắc trình bày kết quả nghiên cứu
3
Cách thuyết trình
4
1. Vai trò của báo cáo
- Là phương tiện mà qua đó các dữ liệu, các phân tích và các
kết quả được sắp xếp có hệ thống.
- Phản ánh chất lượng của công trình nghiên cứu.
- Hiệu quả của bản báo cáo có thể xác định những hoạt động
sẽ được tiến hành (kết luận, đề xuất, kiến nghị giải pháp,…).
2. Các loại báo cáo
11
Báo cáo gốc
22
Báo cáo được phổ biến
33
Báo cáo kỹ thuật
44
Báo cáo cho lãnh đạo
3. Nguyên tắc soạn thảo báo cáo
- Rõ ràng, dễ theo dõi
- Dùng câu có cấu trúc tốt
- Tránh dùng ngôn ngữ chuyên môn
- Trình bày ngắn gọn
- Nhấn mạnh các kết luận có tính thực tiễn
- Sử dụng các bảng, đồ thị, hình vẽ,… trong bản báo cáo

4. Cách thuyết trình
a) Lựa chọn kỹ thuật thuyết trình:
- Đọc một bài soạn trước
- Đọc thuộc lòng
- Nói tuỳ hứng
- Nói ứng biến
b) Lựa chọn phương tiện hỗ trợ
- Tính hiệu quả
- Các kỹ thuật

×