Giới thiệu phần mềm Stata
Giới thiệu Stata
• Phần mềm có bản quyền của Statacorp
• Phần mềm thống kê mạnh
• Có thể gõ lệnh trực tiếp hoặc sử dụng menu
điều khiển
• Các câu lệnh đơn giản và dễ hiểu
• Thích hợp với các nghiên cứu lớn
Phần mềm trả tiền
So sánh stata với một số phần mềm thống kê
khác
TT
Phần mềm
Giá
Nhà SX
Mã nguồn mở
1
Epi Info
Miễn phí
CDC
Có
2
R
Miễn phí
R Foundation
Có
3
SAS
6000 $
SAS institute
Không
4
SPSS
1000 $
IBM
Không
5
Stata
295 $ ++
Stata Corp.
Không
Cài đặt stata
Giao diện stata 10
Hiện thị kết
quả
Các biến số
Các lệnh đã
thực hiện
Gõ lệnh
Giao diện menu
• File: Mở, đóng, lưu dữ liệu, in, thoát …
• Edit: Các thao tác copy, paste …
• Data: Làm việc với biến (mô tả, tạo…), liên kết dữ
liệu
• Graphics: Làm việc với đồ thị
• Statistics: Làm việc với thống kê
• Window: Dùng để hiển thị các cửa sổ như comand,
Review… và do file
Câu lệnh trong stata
• Phân biệt chữ hoa chữ thường. Chỉ dùng chữ
thường khi gõ lệnh
• Lệnh có thể viết tắt, không cần viết đầy đủ
• Cấu trúc lệnh trong stata:
[by danh sách biến] lệnh [Biến 1] [Biến 2] [điều
kiện] [phạm vi] [quyền số] [, lựa chọn]
• Sử dụng hỗ trợ: help cau_lenh; findit cau_lenh
Hàm toán học và toán tử
Toán tử
Ý nghĩa
= (==)
So sánh bằng
!= (~=)
So sánh không bằng
>
Lớn hơn
<
Nhỏ hơn
>=
Lớn hơn hoặc bằng
<=
Nhỏ hơn hoặc bằng
&
Và
|
Hoặc
!(~)
Không
.
Số liệu missing
Các phép toán trong stata
Phép toán
Ý nghĩa
+
Cộng
-
Trừ
*
Nhân
/
Chia
^
Mũ
sqrt
Căn bậc 2
ln
Logarit tự nhiên
exp
Lấy mũ cơ số e
Mở, đóng số liệu trong stata
• File Open: chọn file *.dta
Đóng stata: exit
Biên bản làm việc stata (log file, do
file)
• Tạo file log trước khi làm việc
File/ log/ begin
• Kết thúc log file khi kết thúc phân tích số liệu
File/ log/ close
• Do file editor: cửa sổ viết chương trình
Quản lý số liệu trong stata
set mem
rename
describe (d)
generate (gen) / egen
list
replace
count
di
browse
label
codebook
sort / gsort
edit
keep
drop
recode
preserve / restore / save
exit
set mem #m
• Đặt bộ nhớ cho stata
• Cần tiến hành trước khi mở file số liệu, hoặc
thoát khỏi tệp số liệu bằng lệnh clear
set mem 100m
describe
• Công việc đầu tiên khi
mở bộ số liệu xem có
bao nhiêu bản ghi, bao
nhiêu biến số, kích
thước, chi tiết từng
biến
• Viết tắt: d; de; desc
count
• Đếm bản ghi, số quan sát
• Lệnh này thường kết hợp với điều kiện (if)
count if tuoi < 50
list
• Liệt kê biến số, giá trị. Thường kết hợp với [if]
[in] để thoả mãn điều kiện nào đó
list tuoi caotb gioitinh if tuoi==30
browse
• Xem lướt số liệu
browse
edit
• Sửa đổi số liệu
edit
codebook
• Xem chi tiết biến số
codebook caoha
sort
• Sắp xếp bộ số liệu từ thấp tới cao
• Sort là lệnh bắt buộc sử dụng với lựa chọn
“by”
sort age
gsort
• Sắp xếp bộ số liệu mở rộng
• Sắp xếp bộ số liệu theo chiều tăng dần hoặc giảm
dần
• Nếu sắp xếp theo chiều giảm dần thì thêm dấu “-”
(dấu trừ) trước tên biến
gsort -tuoi
gsort –tuoi, mfirst
drop
• Xoá các biến số hoặc bản ghi
drop age
drop if age==40
keep
• Giữ lại các biến số hoặc xoá các bản ghi
keep id chl
keep if age != 50
recode
• Mã hoá lại giá trị của biến
recode nangkn 0 = 2
Quy tắc
Ví dụ
Ý nghĩa
#=#
2=0
Chuyển giá trị 2 thành 0
##=#
2.=3
Chuyển giá trị 2 và missing thành 3
#/# = #
1/5 = 10
Chuyển giá trị từ 1 đến 5 thành 10
missing = #
.=#
miss = 9
.=9
Chuyển giá trị missing thành 9