Tải bản đầy đủ (.pdf) (328 trang)

BÀI GIẢNG MÔN HỌC-PHÂN TÍCH SỐ LIỆU THỐNG KÊ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.06 MB, 328 trang )

Bài giảng môn học
PHÂN TÍCH
SỐ LIỆU THỐNG KÊ
Giảng viên: Ths. Dƣơng Thị Mai Thƣơng
Bộ môn: Khoa học máy tính – CNTT
Email:
Mobile: 0945373858


1
MÔN HỌC TIỀN ĐỀ
• Toán cao cấp
• Xác suất thống kê
• Lập trình căn bản
2
MỤC TIÊU MÔN HỌC
• Cung cấp kiến thức cơ bản về phân tích thống
kê dữ liệu
– Ước lượng
– Kiểm định
– Phân tích hồi quy và tương quan
– Phân tích chuỗi thời gian
• Cung cấp kỹ năng sử dụng phần mềm SPSS
3
YÊU CẦU & ĐÁNH GIÁ
• 100% sinh viên lên lớp và thực hành
• Thực hiện chia nhóm để thảo luận, làm bài tập
lớn, tiểu luận môn học.
• Kết thúc môn sinh viên có thể phân tích thống
kê số liệu dựa trên phần mềm SPSS 19.
• Đánh giá:


– Chuyên cần: 10%
– Giữa kỳ: 10%
– Báo cáo bài tập lớn: 20%
– Thi hết học phần: 60%
4
TÀI LIỆU THAM KHẢO
• [1] Dang Quang A and Bui The Hong, Statistical data analysis,
• www.netnam.vn/unescocourse/statistics.htm, 1999 ( Giáo trình điện tử
theo đặt hàng của UNESCO).
• [2] Bùi Thế Hồng, Giáo trình phân tích thống kê dữ liệu và SPSS for
Windows, Hà Nội, 1999.
• [3] Trần Bá Nhẫn, Đinh Thái Hoàng, Lý thuyết thống kê, NXB Thống kê,
1998.
• [4] Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như, Thống kê toán học,
NXB ĐHQG Hà Nội, 2004.
• [5] Nguyễn Văn Liệu, Nguyễn Đình Cừ, Nguyễn Quốc Anh, SPSS - ứng
dụng phân tích dữ liệu trong quản trị kinh doanh và khoa học tự nhiên –
xã hội, NXB Giao thông vận tải, 2000.
• [6] Hoàng Trọng, Chu Nguyễn Mộng Ngọc, Phân tích dữ liệu nghiên
cứu với SPSS, NXB Hồng Đức, 2008.

5
Thời

gian

NỘI DUNG
Nội

dung

Tuần

1
Giới
thiệu môn học, ôn tập các kiến thức


bản
Chƣơng
1. Phân loại dữ liệu, mã hóa,
nhập liệu và một số xử lý trên biến



thuyết
Tuần

2,3
Chƣơng 2
. Làm sạch dữ liệu
Chƣơng
3. Tóm tắt và trình bày dữ liệu


thuyết
thực

hành
Tuần


4
Chƣơng 4
. Kiểm định mối liên hệ giữa
hai biến định tính.



thuyết
thực

hành
Tuần

5
Chƣơng 5.
Phân tích liên hệ giữa biến
nguyên nhân định tính và biến kết quả
định lượng:

Kiểm định trung bình quần thể



thuyết
thực

hành
6

7

Thời
gian
NỘI DUNG
Nội

dung
Tuần 6

Chương
6. Phân tích liên hệ giữa biến
nguyên
nhân định tính và biến kết quả
định
lượng: Phân tích phƣơng sai


thuyết
thực

hành
Tuần 7

Kiể
m tra bài 1
Tuần 8

Chƣơng
7: Kiểm định phi tham số



thuyết
thực

hành
Tuần 9

Chƣơng 8.
Kiểm định tỷ lệ
Chƣơng
9. Tương quan và hồi quy
tuyến
tính


thuyết
thực

hành
Tuần

10,
11, 12

Báo
cáo bài tập lớn
Kiểm
tra bài 2
Ôn
Tập
Báo cáo


NỘI DUNG MÔN HỌC (đọc thêm)
• Chương 10: Hồi qui Bianry Logistic
• Chương 11: Đánh giá độ tin cậy của thang đo
• Chương 12: Phân tích nhân tố
• Chương 13: Phân tích biệt số
• Chương 14: Phân tích cụm
• Chương 15: Lập bản đồ nhận thức với đo lường đa
hướng và phân tích tương hợp
• Chương 16: Các tiện ích

8
GIỚI THIỆU PHÂN TÍCH DỮ LIỆU
• Nghiên cứu và phân tích dữ liệu
1. Xác định vấn đề cần nghiên cứu
2. Thu thập dữ liệu
3. Xử lý dữ liệu
4. Phân tích dữ liệu
5. Báo cáo kết quả
9
GIỚI THIỆU PHÂN TÍCH DỮ LIỆU
• Bản chất của phân tích dữ liệu
10
Dữ liệu
Thông tin
Sự kiện
Hiểu biết, tri thức
Mức độ chính xác của
mô hình thống kê
Mức độ cải thiện

của các quyết định
BẢN CHẤT CỦA PT DỮ LIỆU (cont.)
• Dữ liệu trở thành thông tin khi nó liên quan
đến vấn đề nhận thức, kết luận và quyết định
của người nghiên cứu
• Thông tin trở thành sự kiện khi thông tin hỗ
trợ cho việc ra quyết định
• Sự kiện trở thành tri thức khi nó được sử dụng
để hoàn tất quá trình ra quyết định một cách
thành công.
11
THỐNG KÊ VÀ PHÂN TÍCH DỮ LIỆU
• Thống kê: tập hợp các phương pháp dùng để
thu thập, phân tích, trình bày và diễn giải dữ
liệu
• Phân tích dữ liệu: cung cấp kinh nghiệm thực
hành được đúc kết để đẩy mạnh việc ứng dụng
tư duy thống kê và kỹ thuật thống kê nhằm
hiểu rõ các hiện tượng nghiên cứu, từ đó hỗ trợ
cho việc ra quyết định
12
Chƣơng 1
PHÂN LOẠI DỮ LIỆU, MÃ HÓA
NHẬP LIỆU VÀ MỘT SỐ XỬ LÝ
TRÊN BIẾN
13
PHÂN LOẠI DỮ LIỆU
Dữ liệu
Dữ liệu định
tính

Thang đo
danh nghĩa
Thang đo
thứ bậc
Dữ liệu định
lượng
Thang đo
khoảng cách
Thang đo tỉ
lệ
14
PHÂN LOẠI DỮ LIỆU (cont.)
• Dữ liệu định tính:
– Phản ánh tính chất, sự hơn kém, không tính đc giá
trị trung bình của dữ liệu dạng định tính.
– Ví dụ: Nam/ Nữ, Giỏi/ Khá/ TBK/ TB/ Yếu/ Kém
• Dữ liệu định lƣợng
– Phản ánh mức độ, mức độ hơn kém, tính được trị
trung bình.
– Ví dụ: Tuổi, Thu nhập trong tháng…

15
CÁC LOẠI THANG ĐO
• Thang đo danh nghĩa (phân loại) – nominal scale
– Các con số mang ý nghĩa phân loại đối tượng
– Ví dụ: Vui lòng cho biết tình trạng hôn nhân của bạn?







– Chứng minh các thang đo trên là biến phân loại
– Thứ tự thang đo phân loại có quan trọng ko?

16
1

Độc
thân
2

Đang
có gia đình
3


góa
4

Ly
thân hoặc ly dị
CÁC LOẠI THANG ĐO
• Thang đo thứ bậc – ordinal scale
– Các con số được sắp xếp theo một quy ước nào đó về
thứ bậc hay sự hơn kém, nhưng không biết được
khoảng cách giữa chúng?
– Ví dụ: Mức độ hài lòng của bạn về GV giảng dậy?
• 1. Rất hài lòng
• 2. Hài lòng

• 3. Bình thường
• 4. Không hài lòng
– Chứng minh đây là thang đo thứ bậc?
– Thang đo thứ bậc có phải là thang đo phân loại?
17
CÁC LOẠI THANG ĐO
• Thang đo khoảng cách – interval scale
– Là một dạng đặc biệt của thang đo thứ bậc, cho biết
khoảng cách giữa các thứ bậc.
– Ví dụ: Theo bạn tầm quan trọng của việc chăm chỉ
đối với kết quả học tập? (1 = không quan trọng, 10 =
rất quan trọng)
• Thang đo khoảng cách không có điểm 0 tuyệt đối.
– Thang đo khoảng cách hay thứ bậc cho nhiều thông
tin hơn?
18
CÁC LOẠI THANG ĐO
• Thang đo tỉ lệ - ration scale
– Thang đo tỉ lệ = thứ tự + khoảng cách + điểm
“0” là giá trị thật
– Ví dụ:
• Bạn đang có bao nhiêu tiền?
• Điểm trung bình học tập của bạn đạt bao nhiêu?
19
VÍ DỤ THANG ĐO
• Giá trị 0 của biến có mang nghĩa tự nhiên.
– Tôi hết sạch tiền
– Lương tôi chỉ bằng ½ sếp tôi
– Dân số Việt Nam gấp 10 lần dân số NewDilan
• Giá trị 0 không mang nghĩa tự nhiên.

– 0
0
F là một điểm 0 nhân tạo.
– 32
0
F = 0
0
C
– Nếu nói 32
0
F nóng gấp đôi 16
0
F thì ko có ý nghĩa vì
chúng đều đóng băng.
– So sánh hai vật ở 50
0
C ( (0+100)/2 và
122
0
F ((32+212)/2) đều ở điểm giữa nhiệt độ sôi và đóng
băng.

20
NGUYÊN TẮC MÃ HÓA
& NHẬP LIỆU
• Xét 2 ví dụ
21
Họ tên Giới
tính
Tuổi

Nghề nghiệp
1 Đỗ Văn An
Nam

21

Sinh
viên
2 Lý Thu Hoa
Nữ

34

Giáo
viên
3
Đào
Thị Lê
Na
Nữ

56

Nghỉ
hưu


n Ngô Hà Nam

Nam


17

Học
sinh
Các biến
Những người trẳ lời câu hỏi
NGUYÊN TẮC MÃ HÓA &
NHẬP LIỆU
• Sau khi mã hóa
22
Họ tên Giới
tính
Tuổi
Nghề nghiệp
1 Đỗ Văn An 1 21

1
2 Lý Thu Hà 0 34

2
3
Đào
Thị Lê
Na
0 56

3



n Ngô Hà Nam

1 17

19
Các biến
NGUYÊN TẮC MÃ HÓA & NHẬP
LIỆU
• Chú ý:
– Chỉ mã hóa được thang đo định tính
– Mỗi cột là một biến cần khảo sát
– Mỗi hàng là thông tin của một đối tượng cần thu thập
– Câu hỏi có nhiều khả năng trả lời?
• Ví dụ: Trong vòng 5 năm vừa qua, bạn đã đi
những địa danh nào?
Thái Nguyên, Hà Nội, Huế, Đà Nẵng, Sài Gòn, Khác.
Biểu diễn dữ liệu trên?
23
QUẦN THỂ VÀ MẪU
• Quần thể: Tập hợp các cá thể hoặc các đối
tượng mà người nghiên cứu cần quan tâm.
– Quần thể loài người
– Quần thể sinh viên
– Quần thể khách sạn 3 sao
• Mẫu: Tập hợp các cá thể mà tập này có thể coi
là đại diện của quần thể được quan sát
QUẦN THỂ HỮU HẠN
• Quần thể hữu hạn: Là quần thể mà cá thể có
thể liệt kê được
– Sinh viên lớp KHMT: Quần thể hữu hạn

– DS sinh viên lớp KHMT: DS liệt kê
– Dân số Việt Nam ?

×