Tải bản đầy đủ (.pdf) (35 trang)

Bài giảng Phương pháp nghiên cứu kinh tế - Chương 3: Thu thập và xử lý số liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.32 MB, 35 trang )

1


Các loại số liệu
 Số liệu sơ cấp và số liệu thứ cấp
 Số liệu sơ cấp: Những số liệu được quan sát hay thu thập lần đầu tiên 

bởi nhà nghiên cứu. Số liệu dạng này thường các nhà nghiên cứu tự thu thập 
từ: bản câu hỏi, phỏng vấn, quan sát, nghiên cứu tình huống, …
 Số liệu thứ cấp: Những số liệu đã được công bố hay thu thập trong quá 
khứ hay do một nhóm thứ ba thu thập. Số liệu này thường được thu thập từ 
các cơ quan có liên quan, các nghiên cứu trước đó, cơ quan thống kê của 
chính phủ, Internet, …

 Nhà nghiên cứu cần tìm kiếm kỹ lưỡng các nguồn 
số liệu thứ cấp trước khi quyết định sử dụng số 
liệu sơ cấp do chi phí thấp hơn.
 Số liệu thứ cấp thường được thu thập theo mục đích của 
người khác nên đôi khi không phù hợp với mục tiêu đang nghiên cứu.

 

 

2


Số liệu chuổi thời gian, cắt ngang, và 
hỗn hợp 
• Số liệu chuổi thời gian (Time­series data): 
Số liệu chuổi thời gian là một tập hợp của 


những quan sát về những giá trị mà một 
biến số nhận được tại những thời điểm 
khác nhau. Số liệu này có thể được thu thập 
hàng ngày, tuần, tháng, quý, năm, 5 năm, … .
• Số liệu chuổi thời gian thường được sử dụng 
trong phân tích kinh tế vĩ mô để thấy được xu 
hướng phát triển của nền kinh tế
 

 

3


Tốc độ tăng trưởng và lạm phát của Việt Nam 1989­2007

Năm

Tốc độ tăng trưởng (%)

Tỷ lệ lạm phát (%)

1999

4,77

2000

6,79


2001

6,89

2002

7,08

2003

7,34

3,2

2004

7,79

7,7

2005

8,44

8,3

2006

8,23


7,5

2007

8,48

8,3

 

 

­1,6

4


Số liệu cắt ngang (Cross section 
data)






 

Là số liệu về một hay nhiều biến số được 
thu thập tại cùng một thời điểm
Ví dụ: như tổng điều tra dân số được Cục 

Tổng điều tra thực hiện mỗi 5 năm, Điều 
tra về chi tiêu tiêu dùng (VHLSS)
Loại số liệu này thường có tính không 
đồng nhất: giá trị của các biến số biến 
động rất lớn giữa các quan sát
 

5


Sản lượng trứng của các tiểu bang Hoa 
Kỳ

 

 

6


Số liệu hỗn hợp (Panel data)


 

là số liệu được kết hợp bởi cả số liệu 
chuổi thời gian và cắt ngang: cùng một 
đơn vị cắt ngang (chẳng hạn, một gia 
đình hay một công ty) được quan sát theo 
thời gian. 


 

7


Ví dụ về số liệu hỗn hợp

 

 

8


Các phương pháp chọn mẫu
1.

2.

 

Chọn mẫu phi xác suất: Chọn mẫu theo 
ý định chủ quan của người NC.
Chọn mẫu xác suất: Dựa vào lý thuyết 
xác suất để lấy mẫu ngẫu nhiên

 

9



Các phương pháp chọn mẫu phi 
xác suất





 

Chọn mẫu thuận tiện
Chọn mẫu phán đoán
Chọn mẫu chỉ định
Chọn mẫu theo mạng quan hệ

 

10


Chọn mẫu thuận tiện











 

Các đơn vị mẫu được chọn ở tại một địa điểm và vào 
một thời gian nhất định
Vd: chọn mẫu những người đi mua sắm ở Metro CT và 
tiếp cận họ khi họ bước vào sthị hoặc khi họ mua sắm 
món hàng mà ta muốn khảo sát.
Ưu điểm: dễ dàng tập hợp các đơn vị mẫu
Nhược điểm: không đạt được độ xác thực cao
Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện” để 
chọn mẫu
Chỉ dùng cho nghiên cứu thăm dò, trắc nghiệm, không 
dùng cho nghiên cứu mô tả hay nhân quả vì tính đại 
diện không cao
 

11


Chọn mẫu phán đoán











 

Các đơn vị mẫu được chọn dựa vào sự phán đoán của 
người nghiên cứu mà họ nghĩ rằng những mẫu này có 
thể đại diện cho tổng thể
Vd: Chọn mẫu một số ít liên doanh lớn có thể chiếm 
phần lớn tổng sản lượng ngành công nghiệp cả nước.
Cách chọn mẫu này được dùng phổ biến khi nghiên cứu 
định tính
Ưu điểm: chọn đúng phần tử rất quan trọng của tổng 
thể
Nhược điểm: có khả năng phát sinh những sai lệch lớn

 

12


Chọn mẫu chỉ định















 

Là chọn mẫu theo tỷ lệ gần đúng của các nhóm đại diện trong tổng 
thể hoặc theo số mẫu được chỉ định cho mỗi nhóm
Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải khát để so 
sánh kết quả thống kê về thái độ khách hàng. Hoặc tổng thể NC bao 
gồm 1.000 c.ty, trong đó 600 c.ty vừa và nhỏ, 300 trung bình và 100 
qui mô lớn. Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60 c.ty 
vừa và nhỏ, 30 trung bình và 10 c.ty lớn
Tổng thể quá lớn, sự khác biệt  (biến động) giữa các phần tử không 
lớn
Tổng thể đã được phân tổ nhóm trước (đồng nhất) PVV chỉ cần chọn 
cho đủ số lượng không cần ngẫu nhiên
Vd: ý thức tham gia giao thông của SV ĐHCT (có thể chọn bất kỳ 
sinh viên nam nữ nào vì trong trường hợp này thì giới tính không có 
sự khác biệt  lớn)
Ưu điểm: đảm bảo được số mẫu cần thiết cho từng nhóm trong tổng 
thể phục vụ khách hàng
Nhược điểm: có thể cho kết quả sai lệch
 

13


Chọn mẫu theo mạng quan hệ



người nghiên cứu sẽ thông qua người trả lời đầu 
tiên để tiếp cận những người trả lời kế tiếp
D

B
A

E
C
F

 

 

14


Chọn mẫu theo mạng quan hệ








 


Các mẫu đầu tiên được chọn theo 
phương pháp xác suất
Các mẫu tiếp theo được chọn ra từ việc 
cung cấp thông tin qua hình thức nhờ giới 
thiệu
Áp dụng cho các nội dung NC khá đặc 
biệt, không phổ biến
Ưu điểm: Giúp cho người NC chọn được 
các mẫu mà họ cần NC. 
 

15


Chọn mẫu xác suất




Dựa vào lý thuyết xác suất để lấy mẫu 
ngẫu nhiên
Một số cách chọn mẫu xác suất




 

Chọn mẫu ngẫu nhiên đơn giản

Chọn mẫu có hệ thống
Chọn mẫu ngẫu nhiên phân tầng

 

16


Chọn mẫu ngẫu nhiên đơn giản
Là  cách  chọn  mẫu  mà  mỗi  phần  tử  trong 
tổng  thể  có  cùng  cơ  hội  được  chọn  với 
xác  suất  như  nhau.  Để  chọn  được  mẫu, 
người NC phải có danh sách tổng thể NC
 Vd: Chọn ngẫu nhiên 100 mẫu sinh viên 
trong tổng số 4.000 sinh viên Khoa Kinh 
Tế & QTKD. 

 

 

17


Chọn mẫu có hệ thống
 Chọn ngẫu nhiên mẫu đầu tiên.
 Sau đó dùng bước nhảy (lặp đi lặp lại) 
 Áp dụng tốt nếu danh sách tổng thể được 
xếp ngẫu nhiên (giảm sai lệch do tuần 
hoàn bước nhảy)

 Vd: PV các hộ gia đình vùng nông thôn

 

 

18


Chọn mẫu ngẫu nhiên phân tầng
Là phân chia các đối tượng nghiên cứu thành các nhóm, 
tầng theo các đặc tính, sau đó lấy mẫu theo tầng, nhóm.
 Chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức nào đó 
gọi là tiêu thức phân tầng (thu nhập, giới tính, tuổi tác, 
TĐHV, nhân khẩu,…).
 Chọn ngẫu nhiên hay hệ thống trong từng nhóm phân 
tầng theo tỷ lệ với nhóm.  
Ưu điểm: Phổ biến nhất vì tính chính xác và đại diện cao.
Quan trọng là chọn tiêu thức phân tầng phù hợp


 

 

19


SO SÁNH CHỌN MẪU XÁC SUẤT 
VÀ PHI XÁC SUẤT

 

Xác suất

Phi xác suât

Ưu điểm

Tính đại diện cao.
Khái quát hóa cho 
tổng thể.

Tiết kiệm thời 
gian và chi phí.

Nhược điểm

Tốn kém thời gian và 
chi phí.

Tính đại diện 
thấp.

Phạm vi sử dụng

Nghiên cứu mô tả, 
nhân quả và khám 
phá.

Nghiên cứu thăm 

dò, thử nghiệm.

 

 

20


Thiết kế bảng câu hỏi
1 MỤC TIÊU
 Giúp đáp viên hiểu đúng nội dung câu hỏi.
 Động viên, tranh thủ sự cộng tác.
 Hướng dẫn cách trả lời.
 Tối thiểu các sai sót có thể xảy ra khi đáp 
viên trả lời.

 

 

21


2 Nội dung BCH
Phần giới thiệu
 Giới thiệu bản thân phỏng vấn viên.
 Giới thiệu lý do, mục đích nghiên cứu.
 Khoảng thời gian cần thiết để hoàn thành.
Phần sàng lọc

 Chọn đúng đối tượng để thu dữ liệu.
 Thường dùng BCH phân đôi.
Phần nội dung chính
 Đa số câu hỏi liên quan đến nội dung NC.
Phần quản lý: xác nhận, lời cam đoan, mẫu số.
 

 

22


Ví dụ
Phần giới thiệu
Xin chào, tôi là             thuộc nhóm nghiên cứu
. Chúng tôi đang thực hiện đề tài. Anh (chị) 
vui lòng dành chút thời gian khoảng để giúp 
chúng tôi trả lời một số câu hỏi dưới đây.
Chúng tôi rất hoan nghênh sự cộng tác và giúp 
đỡ của anh (chị). Các ý kiến trả lời của anh 
(chị) sẽ được đảm bảo giữ bí mật tuyệt đối. 

 

 

23


Phần quản lý

Nghiên cứu số

Vùng, địa phương

Bảng câu hỏi

Phỏng vấn viên

Phỏng vấn lúc

Thời gian phỏng vấn

Giám sát viên

Kết luận của GSV

Kiểm tra viên

Kết quả kiểm tra

Tên người trả lời

Địa chỉ

Điện thoại
 

 

24



Những việc cần làm khi thiết kế BCH
1 Xác định thông tin cần thiết
Dự án nghiên cứu
Danh mục các 
thông tin cần có

Bảng câu hỏi

Nhóm người trả lời

Các câu hỏi cần 
được chi tiết

Các dữ liệu cần thu 
thập

Vd: năng suất lúa Sản lượng từng vụ Sản lượng đã thu 
Diện tích từng vụ hoạch
Diện tích gieo trồng
 

 

25


×