Tải bản đầy đủ (.pdf) (65 trang)

HƯỚNG DẪN THỰC HÀNH STATA 12

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.98 MB, 65 trang )


TRƢỜNG ĐẠI HỌC KINH TẾ TPHCM


HƢỚNG DẪN THỰC HÀNH
STATA 12
PHẦN CƠ BẢN
TRẦN THỊ TUẤN ANH

HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

2

HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

3

LỜI MỞ ĐẦU

Stata là phần mềm xử lý số liệu rất mạnh, được sử dụng phổ biến trong
đào tạo và nghiên cứu về Kinh tế lượng.
Tài liệu Hướng dẫn thực hành Stata 12 được soạn ra để phục vụ cho
sinh viên, học viên cao học, nghiên cứu sinh, các nhà nghiên cứu muốn


tìm hiểu thực hành các kiến thức Kinh tế lượng trên phần mềm Stata
Số liệu thực hành được sử dụng trong tài liệu này có thể được tìm thấy
tại trang web - mục số liệu thực
hành.
Đây là tài liệu được soạn thảo lần đầu tiên nên còn rất nhiều thiếu sót.
Mọi góp ý giúp cải thiện tài liệu xin gửi về địa chỉ mail
Tác giả xin trân trọng mọi ý kiến đóng góp.
Trn Th Tun Anh
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

4


HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

5
MC LC

I THIU PHN MM STATA 12 8
1.1. GII THIU GIAO DIN CA STATA 12 8
1.1.1. Khng phn mm Stata 8
1.2. THAO TÁC NHP S LIU VÀO PHN MM STATA 9

1.2.1. Nhp liu trc tip t bàn phím 9
1.2.4. M mt tp tin s liu có sn ca Stata 13
1.3.  LIU VÀ KT QU TRÊN STATA 14
1.3.1.  liu 14
1.3.2. t qu x lý s liu 14
a. Sao chép và ct dán 14
b. S dng file log 15
1.4. TO VÀ QUN LÝ BIN (VARIABLE ) TRONG STATA 17
1.4.1. Xóa bin trong Stata 17
1.4.2. i tên bin trong Stata 18
1.4.3. To bin mi t nhng bi 19
1.5. THOÁT KHI PHN MM STATA 21
I QUY TUYN TÍNH VI STATA 22
2.1. MÔ T S LIU 22
2.1.1. Mô t tp tin s liu 22
2.1.2. Thc hin mô t tóm tt s liu 22
2.1.3. V  th phân tán 24
2.2. MÔ HÌNH HI QUY TUYN TÍNH -  25
2.2.1. ng mô hình hi quy tuyn tính b 26
2.2.2. H s nh và kinh h s nh 27
2.2.3. Khong tin cy ca h s hi quy 28
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

6
2.2.4. Kinh gi thuyt v h s hi quy 29
a. Kinh gi thuyt hai phía 29

b. Kinh gi thuyt phía phi 30
c. Kinh gi thuyt phía trái 31
d. Kinh gi thuyng thn t hp tuyn tính các h s
hi quy 31
2.3. PHA MÔ HÌNH HI QUY 32
2.3.1. V bi histogram ca ph 33
2.3.2. Kinh tính chun ca ph 33
2.4. XUT NHIU KT QU HI DNG BNG 34
 RNG HI QUY TUYN TÍNH 36
3.1. HI QUY TUYN TÍNH QUA GC T 36
3.2. DNG HÀM LOG LOG; DNG HÀM LOG LIN; DNG HÀM LIN 
LOG 36
3.2.1. Dng hàm log  log 36
3.2.2. Dng hàm log  lin 37
3.2.3. Dng hàm lin  log 38
3.3. DNG HÀM BC HAI (QUADRATIC MODEL) 39
I QUY VI BIN GI 40
4.1. GII THIU BIN GI 40
4.2. HI QUY VI BIN GI 40
4.3. HI QUY VI BI 41
4.4. To bin gi t binh tính 43
4.4.1. To bng lnh tabulate 43
4.4.2. Dùng bin factor 44
4.5. A 2 BINH GI - 
IN DIFFERENCE 45
4.6. NG HÀM HI QUY THEO TNG NHÓM 45
HƯỚNG DẪN THỰC HÀNH STATA 12




TRN TH TUN ANH - UEH

7
NG TUYN 48
5.1. PHÁT HING TUYN 48
5.1.1. H s  48
5.1.2. Nhân t  49
5.2 PHÁT HIN I DNG TUYN 49
I 51
6.1. PHÁT HII 52
6.1.1.  th ph 52
6.1.2. Kinh Breusch  Pagan 52
6.1.3. Kinh White 53
6.2. X I 55
6.2.1. ng vng ca ma trn hi 55
6.2.2.  nht tng quát (GLS) 56
  58
7.1. KINH T  59
7.1.1.  th ph 59
7.1.2. Bi t - Autocorrelation Function) 60
7.1.3. Kinh Durbin  Watson 60
7.1.4. Kinh Breusch  Godfrey 61
7.2. X LÝ T  62
7.2.1. Ma trng hi- West 62
7.2.2. Khc phc t ng GLS  th tc Prais - Winsten 63
TÀI LIU THAM KHO 65

HƯỚNG DẪN THỰC HÀNH STATA 12




TRN TH TUN ANH - UEH

8

I THIU PHN MM STATA 12

1.1. GIỚI THIỆU GIAO DIỆN CỦA STATA 12
1.1.1. Khởi động phần mềm Stata
Tên gc vit tt t Statistics và data. Vic khng Stata có th c thc
hin bng nhiu cách:
Cách 1 : Kh ng bng cách nhp chut kép (double - click) vào biu
ng phn mm trên màn hình chính (Desktop) ca h u hành.
- Cách 2 : Khng bng cách nhp chut kép vài nhng tp tin s liu
có phn m rng là dtang tp tin s liu c Stata. Khi nhp chut kép
vào nhng tp tin này, h u hành s t ng khng phn m c
tp tin loi này.
Lưu ý : trong mng hp, h n dc tp tin *.dta là
tp tin ca Stata,  m tp tin cn nhp chut phi trên tp tin .dta cn m, chn
Open with” và chChoose default program. t nút lBrowse
ca s hin ra và ch ng dt Stata hoc ch ng dn n màn
hình chính có bing Stata .
Giao din ca phn mm Stata 12 sau khi khng s gm có 4 ca s chính
Command : ca s l nhp các câu lnh cn thc hin
Results : ca s kt qu,  hin th kt qu thc thi các câu lnh
Review : ca s xem lt kê tt c các câu l dng t
c khng
Variables : ca s tên bin, lit kê danh sách các bi  c s
dng
HƯỚNG DẪN THỰC HÀNH STATA 12




TRN TH TUN ANH - UEH

9

Phía trên bên trái ca màn hình Stata là h thng thmain menus)

i h thng th hin th các nút lnh ng vi các
chc s dng ca Stata

1.2. THAO TÁC NHẬP SỐ LIỆU VÀO PHẦN MỀM STATA
1.2.1. Nhập liệu trực tiếp từ bàn phím
Nu mun nhp liu trc tii dùng cn s dng màn hình nhp liu
(Data editor window) ca Stata bng cách nhp chut vào nút lnh edit trên thanh
công c

Hoc dùng lnh
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

10

a s nhp liu s hin th.

1.2.2. Sao chép và cắt dán từ Excel

Thay vì gõ s liu trc tip, ta có th sao chép s liu t Excel và dán vào Stata. u
tiên, m tp tin Excel có cha d liu khi nhng d liu cn sao chép (k
c dòng tên bin trên cùng);      thc hin sao chép.  ,
chuyn qua ca s nhp liu ca Stata, nh dán s liu tiên
là tên bin nên chú ý chn mTreat first row as variable namep hi thoi
hin ra sau khi dán d liu.
S liu sau khi dán s có dng sau:
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

11

D liu sau khi chuyn sàng cho vic x lý.
1.2.3. Nhúng một file số liệu từ Excel
 vic nhp lic thun tin, Stata còn cho phép nhúng (import) mt tp tin d
liu có sn  nhnh dnh dng
ng gp nht là xls hoc xlsx ca Excel.
Chc thc hin bng cách chn mc import trong thFile ca
h thng thc dùng lnh import ca Stata.
Lnh import c nhp theo ví d sau.

Hoc dùng h thng tha Stata : File/Import/Excel spreadsheet
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH


12

Sau khi chn ch h thng tha s nhúng tp tin s hin ra. Ta phi
ch ng dn tp tin, chn sheet có s liu, chn vùng có s li
chn. Nu tiên ca tp tin là tên bin thì chn vào ô import first row as
variable name và n OK

Các bic nhp trc tip hoc nhúng vào Stata s hin th ra trong ca s
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

13
bin s bên phi ca màn hình Stata

1.2.4. Mở một tập tin số liệu có sẵn của Stata
Nn tp tin s liu ca Stata trên máy tính, có th m trc tip tp tin này
bng lnh use

Hoc chn t h thng thFile/Open và ch ng dn tp tin cn m
trong ca s hin ra


Hoc s dng nút lnh Open trên thanh công c
HƯỚNG DẪN THỰC HÀNH STATA 12




TRN TH TUN ANH - UEH

14

1.3. LƢU DỮ LIỆU VÀ KẾT QUẢ TRÊN STATA
1.3.1. Lƣu dữ liệu
Mu lip vào Stata, s dng lnh save

Hoc dùng thFile/Save hoc File/Save as

Hoc s dng nút lnh save t thanh công c

1.3.2. Lƣu kết quả xử lý số liệu
Sau khi x lý s liu, kt qu x lý s liu bng nhiu cách.
a. Sao chép và cắt dán
Nu mun sao chép và xut kt qu x lý s liu ra Word hoc Excel, có th dùng các
chcopy c Stata h trc ht, chn mng kt qu cn sao chép trên
ca s Result, nhp chut phi và chn mt trong s các chcopy trên thc
n ra.

HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

15

Mi chcopy ca Stata có mnh da chn

chp nht vi yêu cu. Tuy nhiên, la chn thông dng nht là copy
table  sao chép s linh dng này gi nguyên hàng  ct ca kt qu cn sao
ng thi cho phép k khung hoc trang trí li cách trình bày. La chn copy as
picture s xut kt qu dng nh nên không th trang trí li theo yêu cu.
b. Sử dụng file log
Nhng kt qu thc hin lc hin th ra trên ca s kt qu results không th
c bng lnh save. Nu mung kt qu này, cn s dng tp tin log.
Tp tin log cnh dng : dng tp tin .txt và dng tp tim .smcl . Tuy
nhiên, dng .smcl c s dng vì nó gi nh dng kt qu mà Stata
xut ra.
 to mt tp tin .smcl, dùng lnh. Phía sau t khóa using ng dn và tên ca
tp tin log s c to

Hoc có th dùng h thng thFile/Log/Begin
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

16

Sau các thao tác trên,  ca s kt qu s hin th các thông tin cho bit t
c to

Và thanh trng thái  cui ca s kt qu s có dòng ch

K t lúc này tr t qu thc hin câu l c
i trong tp tin log. Sau khi kt thúc các thao tác, nu mun d
p tin log thì dùng lnh


Hoc chn t thFile /Log/ Close
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

17

Lưu ý : nhng kt qu thc hin ch c to, có du hiu
log on  cui ca s lnh. Nhng kt qu thc hin lc khi to tp tin log hoc
sau khi ti.
1.4. TẠO VÀ QUẢN LÝ BIẾN (VARIABLE ) TRONG STATA
1.4.1. Xóa biến trong Stata
 xóa bt mt hay nhiu bin trong s các bio có th dùng lnh drop. Phía
sau tên lnh là danh sách các bin cn xóa, mi tên bin cách nhau mt khong trng.

Nu mun xóa tt c các bin trong tp tin s liu, dùng lnh

Nu mun xóa nhng bin có cùng nhng ký t u trong tên ging nhau, ví v 
var01, var02, var03; dùng lnh

Thay vì dùng lnh drop, ta chn mt hoc nhiu bin cn xóa  ca s tên bin, nhp
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH


18
chuc phi và chn mc Drop Selected Variables t thn ra.


1.4.2. Đổi tên biến trong Stata
Tên bin i bng lnh rename
Ví di tên bin DT thành tên bin doanhthu

Nu không dùng lnh, có th dùng cha Stata. c ht , cn hin th li s
liu ca các bing lnh

Hoc có th chn nút lbrowse trên thanh công c

Sau khi thc hin lnh Browse, ca s s liu s hin ra
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

19

Góc trên bên phi ca ca s này là danh sách bii là các tính ch
ng ca bic chn trên danh sách biu s li i tên
bin, cn chn bin ci tên  danh sách bin và gõ tên mi vào ô Name  phn
properties i.
Lưu ý : Vì Stata phân bit ch hoa và ch ng rt rõ ràng nên phi cn thn v
ch hoa  ch ng trong tên bing thi tên bic có khong trng
hoc các ký t c bi-
1.4.3. Tạo biến mới từ những biến đã có

Dùng lnh generate hoc vit gn là gen
Ví d to bin lnDoanhThu b t nhiên ca bi
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

20

Tên ca bin mc to s c thêm vào ca s danh sách bin  góc phi
màn hình chính

Hoc to bin DoanhThu2 ba bin DoanhThu

Lưu ý : Mt s toán t và hàm s ng dùng trong Stata khi to bin hoc x lý s
liu
Du cng +
Du tr -
Du nhân *
Du chia /
Da ^
Toán t  &
Toán t hoc |
So sánh bng ==
So sánh khác != hoc ~=
Ph nh ~
Nh  <
Nh c bng <=
L >

Lc bng >=
Hàm e
x :
exp()
Hàm log nepe : ln()


HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

21
1.5. THOÁT KHỎI PHẦN MỀM STATA
 kt thúc s dng phn mm Stata, có th thoát khi phn mm bng cách gõ lnh exit
vào ca s lnh và nhEnter

Hoc chn mc “Exit” trong tha mc File trong th

HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

22
I QUY TUYN TÍNH VI STATA

2.1. MÔ TẢ SỐ LIỆU

c khi tin hành hi quy, s liu có th c mô t  kim tra xem liu s liu có
phù hp vi yêu cu nghiên cu.
2.1.1. Mô tả tập tin số liệu
Dùng lnh describe  mô t các thông tin chung nht v tp tin s li quan sát,
s bic tp tin, tên các bin, kiu s liu ca tng bin, và nhãn ca bin (nu
có)

Kt qu mô t t

2.1.2. Thực hiện mô tả tóm tắt số liệu
Dùng lnh summarize vi cú pháp n 
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

23
summarize [varlist] [if] [, options]
Ví d

Lưu ý :
 Nu sau lnh summarize mà không lit kê tên bin, phn mm s hin th thông
tin ca tt c các bin hin có trong tp tin s liu.
 Nu mun mô t chi tit, có th tùy chn detail vào cui lnh summarize sau khi
u phy


HƯỚNG DẪN THỰC HÀNH STATA 12




TRN TH TUN ANH - UEH

24
2.1.3. Vẽ đồ thị phân tán
Stata v c rt nhiu lo th  th phân tán là d th ng dùng nht
khi phân tích h quy. i dùng v  th phân tán ca hai bin bng lnh scatter
scatter [varlist] [if] [, options]
scatter ng  v  th gia hai bin.Trong varlist, bic
lit kê là bin  trc tung, bin tip theo s là bin  trc hoành.

Kt qu thc hin câu lnh :


 v  th t gc t ho, cn thêm các tùy chn nh
sau:
HƯỚNG DẪN THỰC HÀNH STATA 12



TRN TH TUN ANH - UEH

25

Kt qu thc hin lnh :

  th, dùng lnh

Hoc có th nh ca ca s  th. Sau ng dn và

 th cn m r th ca Stata là .gph
2.2. MÔ HÌNH HỒI QUY TUYẾN TÍNH - PHƢƠNG PHÁP OLS
Trong Stata, ngoài ving mô hình, phn mm còn h tr rt nhiu các kinh
 a chn mô hình

×