CHƯƠNG 5
PHÂN TÍCH DỮ LIỆU
Giảng viên: Đàm Sơn Toại
Email:
Bài giảng được soạn bởi PGS.TS Lê Quang Cảnh
– Viện quản lý châu Á – Thái Bình Dương
1
Nội dung:
2
Giới thiệu về phân tích dữ liệu
Các dạng phân tích dữ liệu
Phân tích dữ liệu định tính
Phân tích dữ liệu định lượng
Năm
Dân số
(triệu người)
Năm
Dân số
(triệu người)
1960
34,7
1987
61,8
1961
35,4
1988
63,3
1962
36,1
1989
64,8
1963
36,8
1990
66,0
1964
37,6
1991
67,2
1965
38,3
1992
68,5
1966
39,1
1993
69,6
1967
40,0
1994
70,8
1968
40,9
1995
72,0
1969
41,8
1996
73,2
1970
42,7
1997
74,3
1971
43,7
1998
75,5
1972
44,8
1999
76,6
1973
45,8
2000
77,6
1974
46,9
2001
78,6
1975
48,0
2002
79,5
1976
49,2
2003
80,5
1977
50,3
2004
81,4
1978
51,4
2005
82,4
1979
52,6
2006
83,3
1980
53,7
2007
84,2
1981
54,7
2008
85,1
1982
55,7
2009
86,0
1983
56,7
2010
86,9
1984
57,7
2011
87,8
1985
58,9
2012
88,8
1986
60,2
2013
89,7
3
Dân số (triệu người)
100
90
80
70
60
50
40
30
20
10
0
Tính tốc độ tăng trưởng dân số của Việt Nam theo
từng thời kỳ.
Hoặc sự thay đổi dân số theo thời gian
Thông tin gì từ dữ liệu này?
4
Thông tin gì từ dữ liệu này?
5
Nghiên cứu ví dụ:
Khi muốn đánh giá tình hình thực hiện kế hoạch của một huyện
Tông
NN
CN
DV
6
Kế hoạch Thực hiện Kế hoạch
Thực hiện
QI-2014 Q1-2015 Q1-2015 (%)
504171
534573
5.8
65537
66940
2
170414
184644
8.5
204691
216604
5.5
1. Giới thiệu phân tích dữ liệu
7
1. Giới thiệu phân tích dữ liệu: khái niệm
8
Khái niệm: sử dụng công cụ để diễn giải ý nghĩa của dữ liệu
hay thông tin chứa đựng sau dữ liệu
Cần có công cụ/kỹ thuật/phương pháp
Phát hiện được thông tin/ý nghĩa đằng sau dữ liệu
Kỹ thuật và phương pháp phân tích dữ liệu phụ thuộc vào dạng
dữ liệu
Dữ liệu định tính
Dữ liệu định lượng
1. Giới thiệu phân tích dữ liệu: Nội dung và quy trình
9
Nội dung của phân tích dữ liệu bao gồm:
Xác định phương pháp và thủ tục phân tích dữ liệu,
Luận giải kết quả hoặc phát hiện từ dữ liệu,
Phác thảo kết quả phân tích
Quy trình của phân tích
Nhập dữ liệu: (mã hóa, nhập và làm sạch dữ liệu)
Xử lý làm nổi bật thông tin dữ liệu chứa đựng
Luận giải kết quả phân tích
Viết báo cáo phân tích dữ liệu
1. Giới thiệu phân tích dữ liệu: Yêu cầu
Phân tích dữ liệu phải đáp ứng được những
mục tiêu:
Giúp
xác định nội dung hay chủ đề
Mô
tả lại được đối tượng nghiên cứu và các yếu tố
liên quan
Có
phân tích so sánh theo thời gian hoặc không
gian
Phục
vụ cho việc phát hiện ý nghĩa của dữ liệu
Cung
cấp được dẫn chứng kiểm định giả thuyết
2. Các dạng phân tích dữ liệu
11
2. Các dạng phân tích dữ liệu
12
Phân theo nội dung
Phân tích khám phá
Phân tích xu thế (theo thời gian)
Phân tích theo không gian
Phân tích tương quan và tác động
Phân theo dạng dữ liệu
Phân tích dữ liệu định tính
Phân tích dữ liệu định lượng
2. Các dạng phân tích dữ liệu: phân tích phát hiệnkhám phá
Mỗi đối tượng nghiên cứu luôn có mối quan hệ với các đối
tượng khác
Một đặc điểm của đối tượng nghiên cứu lại có thể được mô
tả/đo lường theo nhiều cách khác nhau hoặc chỉ tiêu khác nhau
Phân tích khám phá sẽ giúp hiểu đối tượng nghiên cứu và giúp
rút gọn dữ liệu phục vụ cho nghiên cứu:
13
Dựa trên mối liên hệ giữa các biến/đặc điểm
Những đặc điểm hay biến tương đồng có thể được rút gọn lại
Ví dụ: Tìm hiểu các nguyên nhân phá rừng HOẶC
2. Các dạng phân tích dữ liệu: phân tích khám phá
Hãy sáp xêp các guong mat theo cách nhóm khác nhau!
14
2. Các dạng phân tích dữ liệu: phân tích theo thời
gian
15
Mỗi đối tượng nghiên cứu luôn biến động theo thời
gian
Khi phân tích theo thời gian, sẽ:
Cho biết xu thế vận động và phát triển
Cho phép so sánh sự thay đổi theo thời gian
Tốc độ tăng trưởng
Cung cấp các dẫn chứng luận giải hoặc dự báo
2. Các dạng phân tích dữ liệu: phân tích theo không
gian
16
Đối tượng nghiên cứu luôn thuộc trong không gian nhất định
nào đó, trong đó có liên hệ với các bộ phận khác để hình thành
lên tổng thể/hệ thống
Ví dụ: Khi nghiên cứu GDP của ngành Nông nghiệp,
Phân tích theo không gian cho biết cơ cấu hay vị thế của đối
tượng nghiên cứu trong tổng thể hoặc hệ thống
Ví dụ:
2. Các dạng phân tích dữ liệu: phân tích theo không
gian
GDP của Việt Nam trong năm 2013, theo
giá cố định 2010
Làm thế nào để biết thêm các thông tin từ
dữ liệu này?
Tổng
Nông nghiệp
Công nghiệp
Dịch vụ
2013
2543596
446905
981146
1115545
17.6
43.9
38.6
NN
17
CN
DV
2. Các dạng phân tích dữ liệu: phân tích tương
quan và tác động
Đối tượng nghiên cứu luôn có mối quan hệ với các biến hay chỉ
tiêu kinh tế xã hội khác.
Ví dụ: giữa thời gian học và kết quả thi hết môn
Thời gian
Sinh viên
học
Kết quả thi
1
2.0
7.8
2
2.5
8.4
3
3.0
8.8
4
4.0
9.2
5
3.5
9.1
6
1.0
6.2
7
2.0
7.8
8
4.5
9.2
9
5.0
9.0
10
6.0
8.2
18
10
9
8
7
6
5
4
3
2
1
0
0
1
2
3
4
5
6
7
Tác động: KQT = 4 + 2,5*TGH -0,3*TGH2
3. Phân tích dữ liệu định tính
19
3. Phân tích dữ liệu định tính
20
Khái niệm
Các kỹ thuật phân tích dữ liệu định tính
Quy trình tiến hành
Giới thiệu một số phần mềm sử dụng trong phân tích
định tính
3.1. Phân tích dữ liệu định tính: khái niệm
21
Phân tích dữ liệu định tính là quá trình:
Nghiên cứu các dữ liệu dạng chữ, lời nói, hình ảnh, âm
thanh,… mà nhà nghiên cứu quan sát thấy
Đặc điểm của người trả lời, sự đồng ý hoặc từ chối trả lời về
những vấn đề cụ thể
Nghiên cứu có thể phân tích và sắp xếp lại các dữ liệu dạng
chữ nhằm giúp người đọc hiểu được ý nghĩa sâu xa của
những dữ liệu hay những thông tin mà dữ liệu ẩn chứa
3.1 Phân tích dữ liệu định tính: Khái niệm
Kỹ năng/ kinh nghiệm
Trực giác/cảm giác
Nhạy bén
Làm việc
nghiêm túc
Quy trình phân tích hợp lý
22
Về cơ bản, không có quy tắc
chuẩn mực nào cho phân tích dữ
liệu định tính
Có thể sử dụng các bản hướng
dẫn với điều kiện phải rất linh
hoạt
3.2. Phân tích dữ liệu định tính: Phương pháp
23
Phân tích dữ liệu định tính dạng chữ
Phân tích những từ ngữ quan trọng trong hoàn cảnh cụ thể (KWIC)
Đếm từ
Phân tích những mạng lưới có ý nghĩa
Phân tích dữ liệu dạng mã hóa
Phân tích giản đồ
Phân tích quy nạp
Phân tích lý thuyết nền
3.3. Phân tích dữ liệu định tính: Quy trình
Thu
gọn/làm
sạch
dữ liệu
Thể hiện
thông tin
Kết luận/
Kiểm
chứng
thông tin
24
3.3. Phân tích dữ liệu định tính: Quy trình
25
Nhập và lưu trữ dữ liệu ban đầu
Các dữ liệu định tính thương lưu trữ đặc tính về đối tượng nghiên
cứu thu thập được từ: ghi âm, phỏng vấn, thảo luận nhóm, quan sát
Tùy mục đích sử dụng dữ liệu mà có thể sử dụng phương pháp xử
lý khác nhau
Cần lưu ý sắp xếp dữ liệu theo mục tiêu nghiên cứu
Phân tích dữ liệu định tính
Sử dụng các phương pháp phân tích thích hợp với dạng dữ liệu và
mục tiêu nghiên cứu
Phát hiện thông tin đằng sau dữ liệu và sắp xếp thông tin