Tải bản đầy đủ (.pptx) (95 trang)

Bài giảng tin học đại cương chương 6 học viện ngân hàng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.52 MB, 95 trang )

HỌC VIỆN NGÂN HÀNG
KHOA HỆ THỐNG THÔNG TIN KINH TẾ

SPSS
(Statistical Products for the Social Sevices)

Bài giảng của Khoa Hệ thống thông tin Quản lý


Nội dung

1

Giới thiệu về phân tích dữ liệu và SPSS

2

Dữ liệu trong SPSS

3

Các phép xử lý dữ liệu căn bản


6.1- Giới thiệu về phân tích dữ liệu và SPSS
1/ Dữ liệu là gì?
Dữ liệu là các số liệu hoặc tài liệu cho trước chưa qua xử lý.
2/ Phân loại dữ liệu:
a) Dữ liệu định tính: là loại dữ liệu được đưa ra theo tiêu chí mang tính chủ quan như ý kiến, kinh nghiệm,
cảm giác, tính chất… và thường thể hiện dưới dạng từ ngữ. Ví dụ: Kết quả học tập của sinh viên: giỏi, khá,
trung bình hay kém; Các dịch vụ ngân hàng bạn thường dùng: Gửi tiền, vay tiền, chuyển khoản, thanh toán


nội địa…
b) Dữ liệu định lượng: là loại dữ liệu được đưa ra theo tiêu chí mang tính khách quan và được thể hiện
dưới dạng số học. Ví dụ: Số lượng trẻ em dưới 10 tuổi của từng khu vực dân cư; Lãi suất gửi tiền của các kỳ
hạn;…
⟹ Phân loại dữ liệu định tính và định lượng nhằm xác định các phép toán thống kê hợp lý.

12/4/15

Chương 6 - SPSS

3


6.1- Giới thiệu về phân tích dữ liệu và SPSS

4/ Phân tích dữ liệu là gì?
Phân tích dữ liệu là quy trình sử dụng các công cụ tính toán điện tử và các phương pháp chuyên dụng để
biến đổi các dòng dữ liệu ban đầu thành các dòng thông tin kết quả.
Việc chắt lọc được các
thông tin hữu ích nhất từ
một kho các thông tin chính
là yêu cầu số một của quá
trình phân tích dữ liệu thông
tin kinh tế.

Quá trình tư duy thống kê dựa trên dữ liệu
12/4/15

Chương 6 - SPSS


4


6.1- Giới thiệu về phân tích dữ liệu và SPSS

3/ Tại sao phải phân tích dữ liệu?
Dữ liệu chỉ là các số liệu thô và bản thân chúng không phải là tri thức. Phân tích dữ liệu có vai trò quan
trọng trong các hệ thống quản lý kinh tế, nó giúp biến đổi dữ liệu trở thành những thông tin thống kê làm cơ
sở cho việc gia tăng sự hiểu biết, tri thức từ đó đưa ra được các quyết định kịp thời, chính xác. Tất cả mọi
quyết định quản lý chỉ mang lại hiệu quả kinh tế cao khi dựa trên cơ sở của một quy trình xử lý thông tin khoa
học, bao quát được các nguồn thông tin chiến lược và đón đầu được các xu thế phát triển.

12/4/15

Chương 6 - SPSS

5


6.1- Giới thiệu về phân tích dữ liệu và SPSS
Nghiên cứu, phân tích một vấn đề kinh tế xã hội thường bao gồm 5 bước cơ bản sau:
a) Xác định vấn đề nghiên cứu: cần xác định rõ ràng, chính xác vấn đề cần nghiên cứu giúp thu thập dữ liệu
tiến hành nhanh gọn, chính xác.
b) Thu thập dữ liệu:




Thiết kế các cách thức thu thập dữ liệu là công việc quan trọng đối với phân tích thống kê.
Hai khía cạnh quan trọng của nghiên cứu thống kê là: tổng thể (tập hợp các phần tử) và mẫu (một tập hợp

con của tổng thể).



Dữ liệu có thể được thu thập từ những nguồn có sẵn hay qua quan sát, nghiên cứu, thử nghiệm.

12/4/15

Chương 6 - SPSS

6


6.1- Giới thiệu về phân tích dữ liệu và SPSS

c) Xử lý dữ liệu: qua 3 bước



Mã hoá: trừ một số dữ liệu định lượng thì không cần mã hoá, còn các dữ liệu định tính cần được mã hóa
để chuyển về dạng số.



Nhập liệu: Dữ liệu được nhập và lưu trữ bởi ít nhất hai người nhập liệu độc lập khác nhau. Thông
thường trong thực tế nhập dữ liệu từ bảng câu hỏi vào máy tính là nhập hai lần.



Hiệu chỉnh: Dữ liệu được kiểm tra bằng cách so sánh hai tập hợp dữ liệu được nhập độc lập với nhau và

phát hiện sai lệch giữa hai lần nhập. Kiểm tra bằng cách nhập lần hai bảo đảm mức độ chính xác lên đến
99,8%.

12/4/15

Chương 6 - SPSS

7


6.1- Giới thiệu về phân tích dữ liệu và SPSS
d) Phân tích dữ liệu: Các phương pháp phân tích dữ liệu được chia thành hai loại:



Các phương pháp thăm dò: dùng để khám phá ý nghĩa của dữ liệu bằng các phép tính số học đơn
giản và các biểu đồ đơn giản tóm tắt dữ liệu.



Các phương pháp khẳng định: dùng các ý tưởng trong lý thuyết xác suất để trả lời các vấn đề nghiên
cứu cụ thể

e) Báo cáo kết quả: thông qua suy diễn, từ dữ liệu mẫu thu thập được ước lượng, kiểm định và các mô
hình phân tích khác sẽ giúp khẳng định các đặc tính của tổng thể. Các kết quả có thể được báo cáo dưới
dạng bảng, đồ thị hay các số phần trăm.

12/4/15

Chương 6 - SPSS


8


6.1- Giới thiệu về phân tích dữ liệu và SPSS
5/ SPSS là gì?
∎ SPSS (Statistical Products for the Social Sevices) là một phần mềm chuyên dụng cho thống kê kinh tế
xã hội và kinh tế lượng được thiết kế để thực hiện tất cả các bước trong phân tích thống kê, từ việc liệt kê dữ
liệu, lập bảng biểu và thống kê mô tả cho đến các phân tích thống kê phức tạp mà không cần phải lập trình
như các phần mềm khác.
∎ SPSS có thể tạo ra các bảng tính tần suất của tất cả các biến trong cơ sở dữ liệu, hoặc cho phép tạo ra
các bảng tương quan giữa các biến. Ví dụ: cơ sở dữ liệu của một cơ quan có thể lập các bảng tổng hợp
như: mức lương phân theo chức vụ, mức lương phân theo trình độ học vấn, hệ số phụ cấp phân theo số
năm công tác…
∎ SPSS ra đời từ 1960, đến nay đã xuất hiện phiên bản 18.

12/4/15

Chương 6 - SPSS

9


6.1- Giới thiệu về phân tích dữ liệu và SPSS
6/ Khởi động SPSS
Chọn Start – All Programs – SPSS 16.0 - SPSS 16.0

Chạy chương trình Tutorial
Mở 1 tệp trống .sav cho phép người dùng nhập dữ liệu
mới

Chạy một câu truy vấn dữ liệu có sẵn với phần mở rộng
là .spq
Cho phép tạo mới câu truy vấn dữ liệu với phần mở rộng
.spq
Mở 1 tệp dữ liệu đã có sẵn với các định dạng của: SPSS, Excel, Lotus,
DBASE…
Mở 1 tệp dữ liệu với các định dạng khác

12/4/15

Chương 6 - SPSS

10


6.1- Giới thiệu về phân tích dữ liệu và SPSS
7/ Giao diện của SPSS
Sau khi khởi động SPSS sẽ xuất hiện cửa sổ SPSS Data Editor với giao diện
như một bảng tính
cho phép người
Thanh tiêu đề (Title bar)

dùng định nghĩa,
Thanh thực đơn (Menu bar)

nhập, hiệu đính
và thể hiện dữ liệu.

Thanh công cụ (Tool bar)


Cột: Mỗi cột chứa một biến dữ liệu cụ thể
Dòng: Mỗi dòng trong bảng chứa các dữ liệu của đối tượng được quan sát
Thanh cuộn

Màn hình để nhập và thể hiện dữ liệu đã
Thanh trạng thái (Status bar)

nhập
Màn hình để khai báo biến (tên, loại, độ
rộng, loại thang đo…của biến)

12/4/15

Chương 6 - SPSS

11


6.1- Giới thiệu về phân tích dữ liệu và SPSS
Tìm hiểu thanh thực đơn Menu:

File: Khởi tạo, đóng mở file, lưu file, in ấn, thoát…
Edit: Undo, sao chép, cắt dán, tìm kiếm thay thế, chèn biến, chèn giá trị…
View: Cho hiện dòng trạng thái, thanh công cụ, chọn font chữ, cho hiện giá trị nhập vào hay nhãn của các giá trị nhập…
Data: Định nghĩa biến, thêm biến, ghép file, chia file, chọn quan sát…
Transform: Tính toán, mã hoá lại các biến…
Analyze: Thực hiện thống kê: tóm tắt dữ liệu, so sánh trung bình, phương sai, tương quan và hồi quy, phân tích đa biến…
Utilities: Tìm hiểu thông tin về các biến, file…
Graphs: Tạo các biểu đồ và đồ thị.
Window: Sắp xếp và di chuyển các cửa sổ làm việc trong SPSS…


12/4/15

Chương 6 - SPSS

12


6.1- Giới thiệu về phân tích dữ liệu và SPSS
Sử dụng tiếng Việt trong SPSS: từ cửa sổ Data chọn View – chọn Font rồi chọn kiểu font.

12/4/15

Chương 6 - SPSS

13


6.2- Dữ liệu trong SPSS
1/ Thu thập dữ liệu
• Việc thu thập dữ liệu là từ các phiếu trả lời của các bảng hỏi.
• Ví dụ một bảng hỏi được xây dựng theo cách thức sau:
BẢNG CÂU HỎI PHỎNG VẤN
Số phiếu:……
Đề tài nghiên cứu: “Thăm dò về thói quen đọc và mua báo”.
Mục đích: Tìm hiểu một phần cuộc sống tinh thần của người dân cũng như giúp cho các cơ quan báo chí hiểu rõ hơn nhu cầu đọ
và mua báo, trên cơ sở đó có phương hướng cải tiến tờ báo, phục vụ tốt hơn nhu cầu của bạn đọc.
Xin vui lòng khoanh tròn các phương án mà anh/chị/ông/bà thấy phù hợp với mình.
A- ĐỌC VÀ MUA BÁO
1.Trong vòng 1 năm qua anh/chị/ông/bà có thường xuyên đọc báo không?

(chọn 1 câu trả lời):

 Hầu như không đọc báo
Thỉnh thoảng (tuần 1-2 tờ)
Thường xuyên (tuần 3-7 tờ
 Rất thường xuyên (trên 7 tờ/ tuần)

12/4/15

Chương 6 - SPSS

14


6.2- Dữ liệu trong SPSS
2a. Trong vòng 6 tháng qua anh/chị/
ông/bà thường đọc các tờ báo tiếng
Việt nào? (có thể chọn nhiều trả lời).
2b. Trong vòng 6 tháng qua các thành
viên gia đình anh/chị/ông/bà thường
mua các tờ báo tiếng Việt nào?
(có thể chọn nhiều trả lời)
3. Trong gia đình anh/chị/ông/bà, số lượng người đọc báo thường xuyên là bao nhiêu? Ghi một con số cụ thể: ___ người.
4. Anh/chị/ông/bà thường đọc báo vào những lúc nào? (chọn tối đa 2 trả lời)

 Sáng sớm/ Trước giờ làm việc
 Trong giờ làm việc
 Lúc rảnh rỗi
 Lúc khác (ghi cụ thể) _____________________
5. Anh/chị/ông/bà thường đọc báo như thế nào? (chọn 1 trả lời cho 1 cột)


12/4/15

Chương 6 - SPSS

15


6.2- Dữ liệu trong SPSS

B- ĐỌC BÁO SÀI GÒN TIẾP THỊ
Xem lại câu 2a, nếu có đọc SGTT thì hỏi câu 6, nếu không đọc thì hỏi câu 7
6. Trong vòng 6 tháng qua, anh/chị/ông/bà có thường xuyên đọc báo SGTT không?
Mỗi tháng đọc 1-2 số báo
Gần như đọc hàng tuần
Không bỏ sót số nào

12/4/15

Chương 6 - SPSS

tiếp câu 7
tiếp câu 8
tiếp câu 8

16


6.2- Dữ liệu trong SPSS
7. Xin vui lòng cho biết lý do vì sao anh/chị/ông/bà không đọc hay không đọc báo SGTT thường xuyên?

8. Trong các mục của báo SGTT, anh/chị/ông/bà thích đọc các trang mục nào nhất? (chọn tối đa 5 trả lời)

9. Hãy xếp hạng các chủ đề sau đây trên báo SGTT tùy theo mức độ quan tâm của anh/chị/ông/bà đối với từng loại chủ đề: chủ đề nào
quan tâm nhất thì ghi số 1, quan tâm nhì thì ghi số 2, quan tâm ba thì ghi số 3.
Thông tin thị trường: _____

12/4/15

Mua sắm:

_____

Gia đình:

_____

Chương 6 - SPSS

17


6.2- Dữ liệu trong SPSS
10. Mục đích xem quảng cáo trên SGTT của anh/chị/ông/bà là gì? (chọn tối đa 3 trả lời)

Tìm kiếm thông tin để mua sắm
Tìm cơ hội mua hàng khuyến mãi
 Xem giới thiệu công ty và sản phẩm mới
 Để giải trí
 Mục đích khác: ____________________
C- ĐÁNH GIÁ VÀ GÓP Ý CHO BÁO SGTT

11. Anh/chị/ông/bà đánh giá các mặt sau đây của tờ báo SGTT như thế nào?

12/4/15

Chương 6 - SPSS

18


6.2- Dữ liệu trong SPSS
D- THÔNG TIN CÁ NHÂN
Họ tên: __________________________ Điện thoại:

____________

Địa chỉ: _________________________________________________
Tuổi:

____________

Số người trong hộ gia đình:

Giới tính: 1. Nam

_____________

2. Nữ

Thu nhập cá nhân(TB tháng):
1. Không


2. Dưới 1 tr

3. 1-2 tr

4. 2-4 tr

5. Trên 4 tr

Thu nhập gia đình (TB tháng):
1. Dưới 2 tr 2. 2-4 tr

3. 4-6 tr

4. Trên 6 tr

Học vấn:
1. Phổ thông

2. CĐ

3. ĐH

4. Sau ĐH

Nghề nghiệp:
1. Công chức
4. Nhân viên KD
7. LĐ đơn giản


2. Giáo viên
5. Tự KD
8. Về hưu

3. Nhân viên văn phòng
6. SV – HS
9. Không làm việc

10. Nghề chuyên môn (Bác sĩ, kiến trúc sư, kế toán, nhạc sĩ…)
12/4/15

Chương 6 - SPSS

19


6.2- Dữ liệu trong SPSS
2/ Nhập dữ liệu: Để nhập dữ liệu thu thập được từ các câu trả lời của bảng câu hỏi hay các bảng ghi chép quan sát
vào môi trường SPSS, ta thực hiện theo 2 bước sau:
 Bước 1: Mã hoá và tạo khuôn nhập dữ liệu theo 4 quy tắc sau:
• Các thông tin thu thập không phải dưới dạng số phải mã hoá để chuyển thành dạng số. VD: Giới tính được mã hóa:
1. Nam; 2. Nữ
• Các thông tin thu thập đã ở dạng số không cần mã hoá. VD: Tuổi
• Các câu hỏi chỉ có một trả lời thì chỉ cần tạo một biến để lưu trữ câu trả lời. VD: Trong vòng 1 năm qua
anh/chị/ông/bà có thường xuyên đọc báo không? (chọn 1 trả lời) ⟹ chỉ cần tạo 1 biến

o
o
o
o


12/4/15

Hầu như không đọc báo
Thỉnh thoảng (tuần 1-2 tờ)
Thường xuyên (tuần 3-7 tờ)
Rất thường xuyên (trên 7 tờ/ tuần)

Chương 6 - SPSS

20


6.2- Dữ liệu trong SPSS
• Các câu hỏi có thể chọn nhiều trả lời thì cần phải tạo nhiều biến để lưu trữ các phương án trả lời tương ứng. VD:
Trong vòng 6 tháng qua anh/chị/ông/bà thường đọc các tờ báo tiếng Việt nào? (có thể chọn nhiều trả lời)
mới

 Sài Gòn Tiếp thị
 Lao Động
 Tiền Phong
 Thanh Niên
 Tuổi trẻ
 Khác

⟹ cần tạo 7 biến

 Bước 2: Nhập dữ liệu: dữ liệu có thể được nhập theo 3 cách sau:
• Cách 1: Nhập trực tiếp trong cửa sổ Data Editor.
• Cách 2: Lấy từ các file dữ liệu có các định dạng khác nhau từ:

- Các bảng tính worksheet được lập trong Excel hoặc Lotus.
- Cơ sở dữ liệu được lập dưới định dạng DBASE và SQL.
- Các file dạng text ASCII với kiểu Tab-deliminated…
• Cách 3: Dùng phần mềm tạo form nhập liệu.
12/4/15

Chương 6 - SPSS

21

 Hà Nội


Cách 1: Nhập trực tiếp dữ liệu trong cửa sổ Data Editor

Tổ chức sắp xếp dữ liệu và nhập liệu trong SPSS như sau:
• Mỗi đối tượng trả lời (quan sát) tương ứng với một dòng (1 case). Thông tin của mỗi đối tượng được nhập
vào một dòng của cửa sổ Data View
• Mỗi loại thông tin thu thập được sắp xếp tương ứng với một cột (1 variable)
• Nhập liệu từ trái qua phải trên cửa số Data View theo từng dòng). Xong một phiếu (một dòng) thì chuyển
sang phiếu khác (sang dòng mới).

12/4/15

Chương 6 - SPSS

22


Định nghĩa các biến cần dùng trong bảng Variable View

 Biến là đại lượng đại diện cho các câu hỏi trong bảng hỏi hoặc các vấn đề cần quan sát. VD: Giới tính,
Tuổi… là các biến.
 Bảng Variable View chứa đựng các thông tin về các thuộc tính của từng biến trong file dữ liệu. Trong một
bảng Data View ta có: các hàng là danh sách các biến; các cột là các thuộc tính của từng biến. Với mỗi một
biến ta xác định các thuộc tính sau:

 Tên biến {Name}
 Kiểu dữ liệu {Type}
 Số các chữ số của biến {Width} ⟹ Xđ độ rộng cột chứa biến
 Số lượng chữ số thập phân {Decimals}
 Mô tả nhãn hiển thị của biến {Lable}
 Xác định nhãn giá trị của biến {Values}
 Mô tả giá trị khuyết thiếu {Missing}
 Căn lề hiển thị giá trị của biến trong cửa sổ Data View {Align}
 Xác định thang đo của biến {Measure}

12/4/15

Chương 6 - SPSS

23


a) Tên biến (Name): Tên biến là một chuỗi có độ dài ≤ 8 ký tự, không bắt đầu bằng một chữ số, không kết
thúc bằng dấu chấm, không chứa các ký tự đặc biệt như: !, ?, ‘,* . Thông thường tên biến được đặt tương
ứng với thứ tự của câu hỏi mà biến đó mô tả, ví dụ với câu hỏi 1 thì đặt tên biến là c1.
- Cách tạo tên biến: gõ trực tiếp giá trị của tên biến tại cột Name. Với những câu hỏi có nhiều phương án
trả lời thì phải tạo nhiều biến lưu trữ.
Ví dụ câu 2a: “Trong vòng 6 tháng qua anh/chị/ông/bà thường đọc các tờ báo tiếng Việt nào?”, có thể có 7
phương án trả lời khác nhau, nên ta định nghĩa tương ứng 7 biến là: c2a1, c2a2, c2a3, c2a4, c2a5, c2a6,

c2a7.

12/4/15

Tin học đại cương

24


Chú ý: ta có thể Copy các thuộc tính đã định nghĩa ở 1 biến cho các biến khác.
 Bước 1: Trong cửa sổ Variable View lựa chọn ô, các ô hay một dòng các thuộc tính đã được định
nghĩa muốn áp dụng cho các biến khác. Từ thanh menu Edit chọn Copy hoặc kích chuột phải chọn
Copy.
 Bước 2: Chọn ô, các ô/dòng muốn áp dụng các thuộc tính. Từ thanh menu Edit chọn Paste hoặc
kích chuột phải chọn Paste.

12/4/15

Chương 6 - SPSS

25


×