Tải bản đầy đủ (.pdf) (64 trang)

Giới thiệu về phần mềm stata phân tích dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.09 MB, 64 trang )

Giới thiệu phần mềm Stata


Giới thiệu Stata
• Phần mềm có bản quyền của Statacorp
• Phần mềm thống kê mạnh
• Có thể gõ lệnh trực tiếp hoặc sử dụng menu
điều khiển
• Các câu lệnh đơn giản và dễ hiểu
• Thích hợp với các nghiên cứu lớn


Phần mềm trả tiền


So sánh stata với một số phần mềm thống kê
khác
TT

Phần mềm

Giá

Nhà SX

Mã nguồn mở

1

Epi Info


Miễn phí

CDC



2

R

Miễn phí

R Foundation



3

SAS

6000 $

SAS institute

Không

4

SPSS


1000 $

IBM

Không

5

Stata

295 $ ++

Stata Corp.

Không


Cài đặt stata


Giao diện stata 10
Hiện thị kết
quả

Các biến số
Các lệnh đã
thực hiện

Gõ lệnh



Giao diện menu
• File: Mở, đóng, lưu dữ liệu, in, thoát …
• Edit: Các thao tác copy, paste …
• Data: Làm việc với biến (mô tả, tạo…), liên kết dữ
liệu
• Graphics: Làm việc với đồ thị
• Statistics: Làm việc với thống kê
• Window: Dùng để hiển thị các cửa sổ như comand,
Review… và do file


Câu lệnh trong stata
• Phân biệt chữ hoa chữ thường. Chỉ dùng chữ
thường khi gõ lệnh
• Lệnh có thể viết tắt, không cần viết đầy đủ
• Cấu trúc lệnh trong stata:
[by danh sách biến] lệnh [Biến 1] [Biến 2] [điều
kiện] [phạm vi] [quyền số] [, lựa chọn]
• Sử dụng hỗ trợ: help cau_lenh; findit cau_lenh


Hàm toán học và toán tử
Toán tử

Ý nghĩa

= (==)

So sánh bằng


!= (~=)

So sánh không bằng

>

Lớn hơn

<

Nhỏ hơn

>=

Lớn hơn hoặc bằng

<=

Nhỏ hơn hoặc bằng

&



|

Hoặc

!(~)


Không

.

Số liệu missing


Các phép toán trong stata
Phép toán

Ý nghĩa

+

Cộng

-

Trừ

*

Nhân

/

Chia

^




sqrt

Căn bậc 2

ln

Logarit tự nhiên

exp

Lấy mũ cơ số e


Mở, đóng số liệu trong stata
• File  Open: chọn file *.dta

 Đóng stata: exit


Biên bản làm việc stata (log file, do
file)

• Tạo file log trước khi làm việc
File/ log/ begin

• Kết thúc log file khi kết thúc phân tích số liệu
File/ log/ close


• Do file editor: cửa sổ viết chương trình


Quản lý số liệu trong stata
set mem

rename

describe (d)

generate (gen) / egen

list

replace

count

di

browse

label

codebook

sort / gsort

edit


keep

drop

recode

preserve / restore / save

exit


set mem #m
• Đặt bộ nhớ cho stata
• Cần tiến hành trước khi mở file số liệu, hoặc
thoát khỏi tệp số liệu bằng lệnh clear

set mem 100m


describe
• Công việc đầu tiên khi
mở bộ số liệu xem có
bao nhiêu bản ghi, bao
nhiêu biến số, kích
thước, chi tiết từng
biến
• Viết tắt: d; de; desc



count
• Đếm bản ghi, số quan sát
• Lệnh này thường kết hợp với điều kiện (if)

count if tuoi < 50


list
• Liệt kê biến số, giá trị. Thường kết hợp với [if]
[in] để thoả mãn điều kiện nào đó
list tuoi caotb gioitinh if tuoi==30


browse
• Xem lướt số liệu

browse


edit
• Sửa đổi số liệu

edit


codebook
• Xem chi tiết biến số
codebook caoha



sort
• Sắp xếp bộ số liệu từ thấp tới cao
• Sort là lệnh bắt buộc sử dụng với lựa chọn
“by”

sort age


gsort
• Sắp xếp bộ số liệu mở rộng
• Sắp xếp bộ số liệu theo chiều tăng dần hoặc giảm
dần
• Nếu sắp xếp theo chiều giảm dần thì thêm dấu “-”
(dấu trừ) trước tên biến
gsort -tuoi
gsort –tuoi, mfirst


drop
• Xoá các biến số hoặc bản ghi
drop age
drop if age==40


keep
• Giữ lại các biến số hoặc xoá các bản ghi
keep id chl
keep if age != 50



recode
• Mã hoá lại giá trị của biến
recode nangkn 0 = 2
Quy tắc

Ví dụ

Ý nghĩa

#=#

2=0

Chuyển giá trị 2 thành 0

##=#

2.=3

Chuyển giá trị 2 và missing thành 3

#/# = #

1/5 = 10

Chuyển giá trị từ 1 đến 5 thành 10

missing = #
.=#


miss = 9
.=9

Chuyển giá trị missing thành 9


×