Tải bản đầy đủ (.ppt) (35 trang)

Thu thập và xử lí số liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.07 MB, 35 trang )


1
2

Số liệu sơ cấp và số liệu thứ cấp

Số liệu sơ cấp: Những số liệu được quan sát hay thu thập lần
đầu tiên bởi nhà nghiên cứu. Số liệu dạng này thường các nhà nghiên
cứu tự thu thập từ: bản câu hỏi, phỏng vấn, quan sát, nghiên cứu
tình huống, …

Số liệu thứ cấp: Những số liệu đã được công bố hay thu thập trong
quá khứ hay do một nhóm thứ ba thu thập. Số liệu này thường được
thu thập từ các cơ quan có liên quan, các nghiên cứu trước đó, cơ
quan thống kê của chính phủ, Internet, …

Nhà nghiên cứu cần tìm kiếm kỹ lưỡng các
nguồn số liệu thứ cấp trước khi quyết định
sử dụng số liệu sơ cấp do chi phí thấp hơn.

Số liệu thứ cấp thường được thu thập theo mục
đích của người khác nên đôi khi không phù hợp với mục tiêu đang
nghiên cứu.
Các loại số liệu
3
Số liệu chuổi thời gian, cắt ngang,
và hỗn hợp

Số liệu chuổi thời gian (Time-series
data): Số liệu chuổi thời gian là một
tập hợp của những quan sát về những


giá trị mà một biến số nhận được tại
những thời điểm khác nhau. Số liệu này
có thể được thu thập hàng ngày, tuần,
tháng, quý, năm, 5 năm, … .

Số liệu chuổi thời gian thường được sử
dụng trong phân tích kinh tế vĩ mô để thấy
được xu hướng phát triển của nền kinh tế
4
Tốc độ tăng trưởng và lạm phát của Việt Nam 1989-2007
Năm Tốc độ tăng trưởng (%) Tỷ lệ lạm phát (%)
1999 4,77
2000 6,79 -1,6
2001 6,89
2002 7,08
2003 7,34 3,2
2004 7,79 7,7
2005 8,44 8,3
2006 8,23 7,5
2007 8,48 8,3
5
Số liệu
cắt ngang (Cross
cắt ngang (Cross
section data)
section data)

Là số liệu về một hay nhiều biến số
Là số liệu về một hay nhiều biến số
được thu thập

được thu thập
tại cùng một thời điểm
tại cùng một thời điểm

Ví dụ: như tổng điều tra dân số được
Ví dụ: như tổng điều tra dân số được
Cục Tổng điều tra thực hiện mỗi 5
Cục Tổng điều tra thực hiện mỗi 5
năm, Điều tra về chi tiêu tiêu dùng
năm, Điều tra về chi tiêu tiêu dùng
(VHLSS)
(VHLSS)

Loại số liệu này thường có tính
Loại số liệu này thường có tính
không
không
đồng nhất:
đồng nhất:
giá trị của các biến số
giá trị của các biến số
biến động rất lớn giữa các quan sát
biến động rất lớn giữa các quan sát
6
Sản lượng trứng của các tiểu bang
Sản lượng trứng của các tiểu bang
Hoa Kỳ
Hoa Kỳ
7
Số liệu hỗn hợp (Panel

Số liệu hỗn hợp (Panel
data)
data)

là số liệu được kết hợp bởi cả số liệu
là số liệu được kết hợp bởi cả số liệu
chuổi thời gian và cắt ngang: cùng
chuổi thời gian và cắt ngang: cùng
một đơn vị cắt ngang (chẳng hạn,
một đơn vị cắt ngang (chẳng hạn,
một gia đình hay một công ty) được
một gia đình hay một công ty) được
quan sát theo thời gian.
quan sát theo thời gian.
8
Ví dụ về số liệu hỗn hợp
Ví dụ về số liệu hỗn hợp
9
Các phương pháp chọn mẫu
Các phương pháp chọn mẫu
1. Chọn mẫu phi xác suất: Chọn mẫu
theo ý định chủ quan của người NC.
2. Chọn mẫu xác suất: Dựa vào lý
thuyết xác suất để lấy mẫu ngẫu
nhiên
10
Các phương pháp chọn mẫu
Các phương pháp chọn mẫu
phi xác suất
phi xác suất


Chọn mẫu thuận tiện
Chọn mẫu thuận tiện

Chọn mẫu phán đoán
Chọn mẫu phán đoán

Chọn mẫu chỉ định
Chọn mẫu chỉ định

Chọn mẫu theo mạng quan hệ
Chọn mẫu theo mạng quan hệ
11
Chọn mẫu thuận tiện

Các đơn vị mẫu được chọn ở tại một địa điểm và
vào một thời gian nhất định

Vd: chọn mẫu những người đi mua sắm ở Metro
CT và tiếp cận họ khi họ bước vào sthị hoặc khi họ
mua sắm món hàng mà ta muốn khảo sát.

Ưu điểm: dễ dàng tập hợp các đơn vị mẫu

Nhược điểm: không đạt được độ xác thực cao

Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện”
để chọn mẫu

Chỉ dùng cho nghiên cứu thăm dò, trắc nghiệm,

không dùng cho nghiên cứu mô tả hay nhân quả
vì tính đại diện không cao
12
Chọn mẫu phán đoán

Các đơn vị mẫu được chọn dựa vào sự phán đoán
của người nghiên cứu mà họ nghĩ rằng những mẫu
này có thể đại diện cho tổng thể

Vd: Chọn mẫu một số ít liên doanh lớn có thể
chiếm phần lớn tổng sản lượng ngành công nghiệp
cả nước.

Cách chọn mẫu này được dùng phổ biến khi
nghiên cứu định tính

Ưu điểm: chọn đúng phần tử rất quan trọng của
tổng thể

Nhược điểm: có khả năng phát sinh những sai lệch
lớn
13
Chọn mẫu chỉ định

Là chọn mẫu theo tỷ lệ gần đúng của các nhóm đại diện
trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi nhóm

Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải khát để
so sánh kết quả thống kê về thái độ khách hàng. Hoặc tổng
thể NC bao gồm 1.000 c.ty, trong đó 600 c.ty vừa và nhỏ,

300 trung bình và 100 qui mô lớn. Số mẫu chỉ định là 10%
trên tổng thể, ta sẽ chọn 60 c.ty vừa và nhỏ, 30 trung bình
và 10 c.ty lớn

Tổng thể quá lớn, sự khác biệt (biến động) giữa các phần tử
không lớn

Tổng thể đã được phân tổ nhóm trước (đồng nhất) PVV chỉ
cần chọn cho đủ số lượng không cần ngẫu nhiên

Vd: ý thức tham gia giao thông của SV ĐHCT (có thể chọn
bất kỳ sinh viên nam nữ nào vì trong trường hợp này thì giới
tính không có sự khác biệt lớn)

Ưu điểm: đảm bảo được số mẫu cần thiết cho từng nhóm
trong tổng thể phục vụ khách hàng

Nhược điểm: có thể cho kết quả sai lệch
14
Chọn mẫu theo mạng quan hệ

người nghiên cứu sẽ thông qua người trả
lời đầu tiên để tiếp cận những người trả lời
kế tiếp
A
C
E
D
B
F

×