TRƢỜNG ĐẠI HỌC KINH TẾ TPHCM
HƢỚNG DẪN THỰC HÀNH
STATA 12
PHẦN CƠ BẢN
TRẦN THỊ TUẤN ANH
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
2
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
3
LỜI MỞ ĐẦU
Stata là phần mềm xử lý số liệu rất mạnh, được sử dụng phổ biến trong
đào tạo và nghiên cứu về Kinh tế lượng.
Tài liệu Hướng dẫn thực hành Stata 12 được soạn ra để phục vụ cho
sinh viên, học viên cao học, nghiên cứu sinh, các nhà nghiên cứu muốn
tìm hiểu thực hành các kiến thức Kinh tế lượng trên phần mềm Stata
Số liệu thực hành được sử dụng trong tài liệu này có thể được tìm thấy
tại trang web - mục số liệu thực
hành.
Đây là tài liệu được soạn thảo lần đầu tiên nên còn rất nhiều thiếu sót.
Mọi góp ý giúp cải thiện tài liệu xin gửi về địa chỉ mail
Tác giả xin trân trọng mọi ý kiến đóng góp.
Trn Th Tun Anh
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
4
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
5
MC LC
I THIU PHN MM STATA 12 8
1.1. GII THIU GIAO DIN CA STATA 12 8
1.1.1. Khng phn mm Stata 8
1.2. THAO TÁC NHP S LIU VÀO PHN MM STATA 9
1.2.1. Nhp liu trc tip t bàn phím 9
1.2.4. M mt tp tin s liu có sn ca Stata 13
1.3. LIU VÀ KT QU TRÊN STATA 14
1.3.1. liu 14
1.3.2. t qu x lý s liu 14
a. Sao chép và ct dán 14
b. S dng file log 15
1.4. TO VÀ QUN LÝ BIN (VARIABLE ) TRONG STATA 17
1.4.1. Xóa bin trong Stata 17
1.4.2. i tên bin trong Stata 18
1.4.3. To bin mi t nhng bi 19
1.5. THOÁT KHI PHN MM STATA 21
I QUY TUYN TÍNH VI STATA 22
2.1. MÔ T S LIU 22
2.1.1. Mô t tp tin s liu 22
2.1.2. Thc hin mô t tóm tt s liu 22
2.1.3. V th phân tán 24
2.2. MÔ HÌNH HI QUY TUYN TÍNH - 25
2.2.1. ng mô hình hi quy tuyn tính b 26
2.2.2. H s nh và kinh h s nh 27
2.2.3. Khong tin cy ca h s hi quy 28
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
6
2.2.4. Kinh gi thuyt v h s hi quy 29
a. Kinh gi thuyt hai phía 29
b. Kinh gi thuyt phía phi 30
c. Kinh gi thuyt phía trái 31
d. Kinh gi thuyng thn t hp tuyn tính các h s
hi quy 31
2.3. PHA MÔ HÌNH HI QUY 32
2.3.1. V bi histogram ca ph 33
2.3.2. Kinh tính chun ca ph 33
2.4. XUT NHIU KT QU HI DNG BNG 34
RNG HI QUY TUYN TÍNH 36
3.1. HI QUY TUYN TÍNH QUA GC T 36
3.2. DNG HÀM LOG LOG; DNG HÀM LOG LIN; DNG HÀM LIN
LOG 36
3.2.1. Dng hàm log log 36
3.2.2. Dng hàm log lin 37
3.2.3. Dng hàm lin log 38
3.3. DNG HÀM BC HAI (QUADRATIC MODEL) 39
I QUY VI BIN GI 40
4.1. GII THIU BIN GI 40
4.2. HI QUY VI BIN GI 40
4.3. HI QUY VI BI 41
4.4. To bin gi t binh tính 43
4.4.1. To bng lnh tabulate 43
4.4.2. Dùng bin factor 44
4.5. A 2 BINH GI -
IN DIFFERENCE 45
4.6. NG HÀM HI QUY THEO TNG NHÓM 45
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
7
NG TUYN 48
5.1. PHÁT HING TUYN 48
5.1.1. H s 48
5.1.2. Nhân t 49
5.2 PHÁT HIN I DNG TUYN 49
I 51
6.1. PHÁT HII 52
6.1.1. th ph 52
6.1.2. Kinh Breusch Pagan 52
6.1.3. Kinh White 53
6.2. X I 55
6.2.1. ng vng ca ma trn hi 55
6.2.2. nht tng quát (GLS) 56
58
7.1. KINH T 59
7.1.1. th ph 59
7.1.2. Bi t - Autocorrelation Function) 60
7.1.3. Kinh Durbin Watson 60
7.1.4. Kinh Breusch Godfrey 61
7.2. X LÝ T 62
7.2.1. Ma trng hi- West 62
7.2.2. Khc phc t ng GLS th tc Prais - Winsten 63
TÀI LIU THAM KHO 65
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
8
I THIU PHN MM STATA 12
1.1. GIỚI THIỆU GIAO DIỆN CỦA STATA 12
1.1.1. Khởi động phần mềm Stata
Tên gc vit tt t Statistics và data. Vic khng Stata có th c thc
hin bng nhiu cách:
Cách 1 : Kh ng bng cách nhp chut kép (double - click) vào biu
ng phn mm trên màn hình chính (Desktop) ca h u hành.
- Cách 2 : Khng bng cách nhp chut kép vài nhng tp tin s liu
có phn m rng là dtang tp tin s liu c Stata. Khi nhp chut kép
vào nhng tp tin này, h u hành s t ng khng phn m c
tp tin loi này.
Lưu ý : trong mng hp, h n dc tp tin *.dta là
tp tin ca Stata, m tp tin cn nhp chut phi trên tp tin .dta cn m, chn
Open with” và chChoose default program. t nút lBrowse
ca s hin ra và ch ng dt Stata hoc ch ng dn n màn
hình chính có bing Stata .
Giao din ca phn mm Stata 12 sau khi khng s gm có 4 ca s chính
Command : ca s l nhp các câu lnh cn thc hin
Results : ca s kt qu, hin th kt qu thc thi các câu lnh
Review : ca s xem lt kê tt c các câu l dng t
c khng
Variables : ca s tên bin, lit kê danh sách các bi c s
dng
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
9
Phía trên bên trái ca màn hình Stata là h thng thmain menus)
i h thng th hin th các nút lnh ng vi các
chc s dng ca Stata
1.2. THAO TÁC NHẬP SỐ LIỆU VÀO PHẦN MỀM STATA
1.2.1. Nhập liệu trực tiếp từ bàn phím
Nu mun nhp liu trc tii dùng cn s dng màn hình nhp liu
(Data editor window) ca Stata bng cách nhp chut vào nút lnh edit trên thanh
công c
Hoc dùng lnh
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
10
a s nhp liu s hin th.
1.2.2. Sao chép và cắt dán từ Excel
Thay vì gõ s liu trc tip, ta có th sao chép s liu t Excel và dán vào Stata. u
tiên, m tp tin Excel có cha d liu khi nhng d liu cn sao chép (k
c dòng tên bin trên cùng); thc hin sao chép. ,
chuyn qua ca s nhp liu ca Stata, nh dán s liu tiên
là tên bin nên chú ý chn mTreat first row as variable namep hi thoi
hin ra sau khi dán d liu.
S liu sau khi dán s có dng sau:
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
11
D liu sau khi chuyn sàng cho vic x lý.
1.2.3. Nhúng một file số liệu từ Excel
vic nhp lic thun tin, Stata còn cho phép nhúng (import) mt tp tin d
liu có sn nhnh dnh dng
ng gp nht là xls hoc xlsx ca Excel.
Chc thc hin bng cách chn mc import trong thFile ca
h thng thc dùng lnh import ca Stata.
Lnh import c nhp theo ví d sau.
Hoc dùng h thng tha Stata : File/Import/Excel spreadsheet
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
12
Sau khi chn ch h thng tha s nhúng tp tin s hin ra. Ta phi
ch ng dn tp tin, chn sheet có s liu, chn vùng có s li
chn. Nu tiên ca tp tin là tên bin thì chn vào ô import first row as
variable name và n OK
Các bic nhp trc tip hoc nhúng vào Stata s hin th ra trong ca s
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
13
bin s bên phi ca màn hình Stata
1.2.4. Mở một tập tin số liệu có sẵn của Stata
Nn tp tin s liu ca Stata trên máy tính, có th m trc tip tp tin này
bng lnh use
Hoc chn t h thng thFile/Open và ch ng dn tp tin cn m
trong ca s hin ra
Hoc s dng nút lnh Open trên thanh công c
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
14
1.3. LƢU DỮ LIỆU VÀ KẾT QUẢ TRÊN STATA
1.3.1. Lƣu dữ liệu
Mu lip vào Stata, s dng lnh save
Hoc dùng thFile/Save hoc File/Save as
Hoc s dng nút lnh save t thanh công c
1.3.2. Lƣu kết quả xử lý số liệu
Sau khi x lý s liu, kt qu x lý s liu bng nhiu cách.
a. Sao chép và cắt dán
Nu mun sao chép và xut kt qu x lý s liu ra Word hoc Excel, có th dùng các
chcopy c Stata h trc ht, chn mng kt qu cn sao chép trên
ca s Result, nhp chut phi và chn mt trong s các chcopy trên thc
n ra.
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
15
Mi chcopy ca Stata có mnh da chn
chp nht vi yêu cu. Tuy nhiên, la chn thông dng nht là copy
table sao chép s linh dng này gi nguyên hàng ct ca kt qu cn sao
ng thi cho phép k khung hoc trang trí li cách trình bày. La chn copy as
picture s xut kt qu dng nh nên không th trang trí li theo yêu cu.
b. Sử dụng file log
Nhng kt qu thc hin lc hin th ra trên ca s kt qu results không th
c bng lnh save. Nu mung kt qu này, cn s dng tp tin log.
Tp tin log cnh dng : dng tp tin .txt và dng tp tim .smcl . Tuy
nhiên, dng .smcl c s dng vì nó gi nh dng kt qu mà Stata
xut ra.
to mt tp tin .smcl, dùng lnh. Phía sau t khóa using ng dn và tên ca
tp tin log s c to
Hoc có th dùng h thng thFile/Log/Begin
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
16
Sau các thao tác trên, ca s kt qu s hin th các thông tin cho bit t
c to
Và thanh trng thái cui ca s kt qu s có dòng ch
K t lúc này tr t qu thc hin câu l c
i trong tp tin log. Sau khi kt thúc các thao tác, nu mun d
p tin log thì dùng lnh
Hoc chn t thFile /Log/ Close
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
17
Lưu ý : nhng kt qu thc hin ch c to, có du hiu
log on cui ca s lnh. Nhng kt qu thc hin lc khi to tp tin log hoc
sau khi ti.
1.4. TẠO VÀ QUẢN LÝ BIẾN (VARIABLE ) TRONG STATA
1.4.1. Xóa biến trong Stata
xóa bt mt hay nhiu bin trong s các bio có th dùng lnh drop. Phía
sau tên lnh là danh sách các bin cn xóa, mi tên bin cách nhau mt khong trng.
Nu mun xóa tt c các bin trong tp tin s liu, dùng lnh
Nu mun xóa nhng bin có cùng nhng ký t u trong tên ging nhau, ví v
var01, var02, var03; dùng lnh
Thay vì dùng lnh drop, ta chn mt hoc nhiu bin cn xóa ca s tên bin, nhp
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
18
chuc phi và chn mc Drop Selected Variables t thn ra.
1.4.2. Đổi tên biến trong Stata
Tên bin i bng lnh rename
Ví di tên bin DT thành tên bin doanhthu
Nu không dùng lnh, có th dùng cha Stata. c ht , cn hin th li s
liu ca các bing lnh
Hoc có th chn nút lbrowse trên thanh công c
Sau khi thc hin lnh Browse, ca s s liu s hin ra
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
19
Góc trên bên phi ca ca s này là danh sách bii là các tính ch
ng ca bic chn trên danh sách biu s li i tên
bin, cn chn bin ci tên danh sách bin và gõ tên mi vào ô Name phn
properties i.
Lưu ý : Vì Stata phân bit ch hoa và ch ng rt rõ ràng nên phi cn thn v
ch hoa ch ng trong tên bing thi tên bic có khong trng
hoc các ký t c bi-
1.4.3. Tạo biến mới từ những biến đã có
Dùng lnh generate hoc vit gn là gen
Ví d to bin lnDoanhThu b t nhiên ca bi
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
20
Tên ca bin mc to s c thêm vào ca s danh sách bin góc phi
màn hình chính
Hoc to bin DoanhThu2 ba bin DoanhThu
Lưu ý : Mt s toán t và hàm s ng dùng trong Stata khi to bin hoc x lý s
liu
Du cng +
Du tr -
Du nhân *
Du chia /
Da ^
Toán t &
Toán t hoc |
So sánh bng ==
So sánh khác != hoc ~=
Ph nh ~
Nh <
Nh c bng <=
L >
Lc bng >=
Hàm e
x :
exp()
Hàm log nepe : ln()
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
21
1.5. THOÁT KHỎI PHẦN MỀM STATA
kt thúc s dng phn mm Stata, có th thoát khi phn mm bng cách gõ lnh exit
vào ca s lnh và nhEnter
Hoc chn mc “Exit” trong tha mc File trong th
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
22
I QUY TUYN TÍNH VI STATA
2.1. MÔ TẢ SỐ LIỆU
c khi tin hành hi quy, s liu có th c mô t kim tra xem liu s liu có
phù hp vi yêu cu nghiên cu.
2.1.1. Mô tả tập tin số liệu
Dùng lnh describe mô t các thông tin chung nht v tp tin s li quan sát,
s bic tp tin, tên các bin, kiu s liu ca tng bin, và nhãn ca bin (nu
có)
Kt qu mô t t
2.1.2. Thực hiện mô tả tóm tắt số liệu
Dùng lnh summarize vi cú pháp n
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
23
summarize [varlist] [if] [, options]
Ví d
Lưu ý :
Nu sau lnh summarize mà không lit kê tên bin, phn mm s hin th thông
tin ca tt c các bin hin có trong tp tin s liu.
Nu mun mô t chi tit, có th tùy chn detail vào cui lnh summarize sau khi
u phy
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
24
2.1.3. Vẽ đồ thị phân tán
Stata v c rt nhiu lo th th phân tán là d th ng dùng nht
khi phân tích h quy. i dùng v th phân tán ca hai bin bng lnh scatter
scatter [varlist] [if] [, options]
scatter ng v th gia hai bin.Trong varlist, bic
lit kê là bin trc tung, bin tip theo s là bin trc hoành.
Kt qu thc hin câu lnh :
v th t gc t ho, cn thêm các tùy chn nh
sau:
HƯỚNG DẪN THỰC HÀNH STATA 12
TRN TH TUN ANH - UEH
25
Kt qu thc hin lnh :
th, dùng lnh
Hoc có th nh ca ca s th. Sau ng dn và
th cn m r th ca Stata là .gph
2.2. MÔ HÌNH HỒI QUY TUYẾN TÍNH - PHƢƠNG PHÁP OLS
Trong Stata, ngoài ving mô hình, phn mm còn h tr rt nhiu các kinh
a chn mô hình