Tải bản đầy đủ (.pdf) (5 trang)

Báo cáo khoa học: "XÁC ĐỊNH KÍCH THƯỚC MẪU SỐ LIỆU" pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (238.92 KB, 5 trang )



VTKT

I. ĐẶT VẤN ĐỀ
Việc áp dụng phương pháp phân tích tương quan trong phân tích kinh tế đã được đề cập
đến trong nhiều tài liệu, giáo trình. Tuy nhiên, vấn đề xác định kích thước mẫu số liệu cần thu
thập là bao nhiêu để đảm bảo tính đúng đắn, đáng tin cậy của các nghiên cứu và mặt khác tiết
kiệm được các chi phí thu thập tính toán.
II. NỘI DUNG
Một xu hướng quan trọng khi hoàn thiện phương pháp phân tích tương quan trong phân
tích kinh tế đó là việc hoàn thiện cơ sở số liệu ban đầu. Theo [1] đã đưa ra phương pháp lựa
chọn mẫu số liệu trên cơ sở đảm bảo tính đồng nhất của mẫu số liệu thống kê. Phương pháp này
chủ yếu đảm bảo về mặt “chất” của mẫu số liệu thông qua việc phân tích lựa chọn xử lý thô đối
với tập hợp số liệu ban đầu. Vấn đề đặt ra là với một mức độ tin cậy nhất định và một độ chính
xác cho trước, kích thước của mẫu số liệu bằng bao nhiêu để đạt được độ chính xác đó. Vì trong
thực tế việc tăng kích thước mẫu số liệu sẽ rất khó khăn đòi hỏi nhiều thời gian, công sức và
kinh phí.
Theo [2] việc xác định kích thước mẫu số liệu cho trung bình mẫu được xác định như sau:
Từ biểu thức


 u
n
để độ chính xác không vượt quá 
0
cho trước ta cần có
0
u.
n





(1)
2


(2)
 là khoảng ước lượng;  là phương sai; u

tính theo bảng Laplat;  là độ tin cậy; n là kích
thước mẫu số liệu.
XÁC ĐỊNH KÍCH THƯỚC MẪU SỐ LIỆU

TS. ĐẶNG THỊ XUÂN MAI
Bộ môn Kinh tế xây dựng
Khoa Vận tải - Kinh tế
Trường Đại học Giao thông Vận tải

Tóm tắt: Bài báo nêu lên phương pháp ứng dụng toán xác suất thống kê trong việc xác
định kích thước mẫu số liệu trong các nghiên cứu phân tích kinh tế.
Summary: The aim of this paper is to provide a method that applying statistics and
probability theories to determine the sample size of the data in economic analysis research.



VTKT

Từ đó suy ra:
2
0

un












(3)
Trong công thức trên nếu phương sai 
0
chưa biết ta thay bằng độ lệch mẫu S
'



2
0
u
S
n













(4)
Tuy nhiên do S
'
lại phụ thuộc n, để khắc phục điều này ta thực hiện lấy một mẫu
(x
1
, x
2
…x
m
) với kích thước m

30 nào đó và tính trị số trung bình


và độ lệch mẫu S
'
theo
mẫu đó




m
1i
i
X
m
1
X (5)
 






n
1i
2
i
Xx
1m
1
S
(6)
Sau đó kết hợp với bảng tính sẵn [2] giá trị hàm Laplat
dte
2
)x(
x
2
t

2





ta tính ra
được kích cỡ mẫu n theo công thức (2).
Ví dụ ta có mẫu số liệu ban đầu như sau:
Số liệu ban đầu
TT Tên công ty Số lao động
Giá trị vốn sản
xuất (tỷ)
Giá trị sản
lượng (tỷ)
1 XN xử lý nền móng XD 214 21,600 17,931
2 CT XD chuyên ngành BXD 225 20,435 26,643
3 CT xây lắp số 5 230 12,844 15,477
4 CTXD & PT nhà 238 25,000 17,009
5 CT sửa chữa đ.bộ 710 238 26,056 33,990
6 CTXD & PT nhà Q.Tân Bình 249 21,521 26,244
7 CTXD bưu điện 250 30,931 32,279
8 CT cầu đường10 298 13,981 21,880
9 CTXD công trình 124 300 22,648 23,505
10 CTXD Hồng Hà 303 29,787 17,998
11 CTXD công trình Tiến Phát 305 12,299 15,647
12 CTXD cg.tr.Hùng Vương 305 12,299 41,086
13 CTXD &sửa chữa nhà 312 31,511 25,310
14 CTXLắp GTCC 324 15,483 13,447
15 CTXD&PT nhà Q.H.B.Trưng 330 18,709 16,360

16 CT cg.tr.GT 68 346 11,536 33,816
17 CT cg.tr.GT 4 361 15,892 13,103
18 CT đầu tư XD số 2 382 19,704 18,598
19 CT Cầu 13 Thăng Long 392 24,179 19,361
20 CT Cầu 11 Thăng Long 395 14,233 14,600


VTKT

21 CT XD số 3 400 17,446 24,208
22 CTXD Sài Gòn 412 17,126 25,268
23 CT đầu tư PT hạ tầng đô thị 436 23,576 20,241
24 CT quản lý nhà Q.3 443 14,641 42,363
25 CTXD cg.tr.120 450 21,699 30,240
26 CT chiếu sáng &th.bị đô thị 459 20,337 24,840
27 CTXD thuỷ lợi 44 463 17,092 40,639
28 CTXLắp số 1 Bộ Thương mại 467 24,840 22,010
29 CTXD thuỷ lợi 46 488 12,282 25,663
30 CT cung ứng vật tư thiết bị 491 18,394 37,900
( Tổng cục thống kê 1996)
Việc tính toán xác định kích cỡ mẫu sẽ được xác định theo từng tiêu chí:
1. Số lao động
2. Giá trị vốn sản xuất
3. Giá trị sản lượng
Tiêu chí 1: Số lao động (số người)
Với sai số 
0
= 25, ta chia khoảng và lập bảng phân bố tần số sau:
Khoảng chia Tần số
Từ 214 đến 238

- 239 - 263
- 264 - 288
- 289 - 313
- 214 - 338
- 339 - 363
- 364 - 388
- 389 - 413
- 414 - 438
- 439 - 463
- 464 - 491
5
2
0*
6
2*
2*
1
4
1
4
3
* Bỏ khoảng có tần số bằng 0 và gộp 2 khoảng có tần số bằng nhau ta có:

Từ đó tính: Kỳ vọng mẫu (trung bình mẫu):
X
= 348
Phương sai mẫu (độ lệch tiêu chuẩn): S
'
= 85
Với độ tin cậy 90% thì kích thước mẫu tối thiểu là 31

Khoảng chia Tần số
Từ 214 đến 238
- 239 - 263
- 289 - 313
- 314 - 363
- 364 - 388
- 389 - 413
- 414 - 438
- 439 - 463
- 464 - 491
5
2
6
4
1
4
1
4
3


VTKT

Tiêu chí 2: Giá trị vốn sản xuất (tỷ đồng)
Số liệu xếp theo thứ tự tăng dần là:
11,536 17,092 21,699
12,282 17,126 22,648
12,299 17,446 23,576
12,299 18,394 24,179
12,844 18,709 24,840

13,981 19,704 25,000
14,233 20,337 26,056
14,641 20,435 29,787
15,483 21,521 30,931
15,892 21,600 31,511
Với sai số 
0
= 1,5 ta chia khoảng và lập bảng phân bố tần số sau:
Khoảng cách Tần số
Từ 11,536 đến 13,035
- 13,036 - 14,535
- 14,536 - 17,535
- 17,536 - 19,035
- 19,036 - 22,035
5
2
6
2
6
- 22,036 - 23,535
- 23,536 - 25,035
- 25,036 - 26,535
- 29,536 - 31,511
1
4
1
3
Từ đó tính: Kỳ vọng (trung bình) mẫu:
X
= 19,410

Phương sai (độ lệch tiêu chuẩn) S’ = 5, 518
Với độ tin cậy 90% thì kích thước mẫu tối thiểu là: 37
Tiêu chí 3: Giá trị sản lượng ( tỷ đồng)
Số liệu xếp theo thứ tự tăng dần là:
13,103 19,361 26,244
13,447 20,241 26,643
14.600 21,880 30,240
15,477 22,010 32,279
15,647 23,505 33,816
16,360 24,208 33,990
17,009 24,840 37,900
17,931 25,268 40,639
17,998 25,310 41,086
18,598 25,663 42,363
Với sai số 
0
= 2,0 ta chia khoảng và lập bảng phân bố tần số như sau:


VTKT

Khoảng chia Tần số
Từ 13,103 đến 15,102
15,103 - 17,102
17,103 - 19,102
19,103 - 23,102
23,103 - 25,102
25,103 - 27,102
29,103 - 33,102
33,103 - 35,102

37,103 - 39,102
39,103 - 41,102
41,103 - 42,363
3
4
3
4
3
5
2
2
1
2
1
Từ đó tính: Kỳ vọng (trung bình) mẫu
X
= 24, 624
Phương sai (độ lệch tiêu chuẩn) S’ = 8,223
Với độ tin cậy 90% kích thước mẫu tối thiểu là 45.
Ta thấy rằng với các tiêu chí nghiên cứu khác nhau (với các nội dung nghiên cứu khác
nhau), đủ để đảm bảo một độ tin cậy nhất định kích thước của mẫu số liệu là hoàn toàn khác
nhau. Do đó khi nghiên cứu hiện tượng kinh tế dưới tác động của một chỉ tiêu sẽ tiết kiệm được
thời gian, công sức và chi phí tính toán. Vì khi tăng kích thước mẫu n thì độ chính xác 
0
của
các ước lượng càng nhỏ và do đó độ chính xác của các ước lượng càng tăng lên. Khi nghiên cứu
hiện tượng kinh tế dưới tác động đồng thời của nhiều chỉ tiêu nghiên cứu ta có thể phân ra làm
hai trường hợp sau:
- Nếu coi xét mức độ quan trọng của các tiêu chí là như nhau (hoặc không tính đến mức độ
quan trọng của các chỉ tiêu) thì kích thước của mẫu số liệu nên chọn theo giá trị lớn nhất của các

kích thước mẫu đã xác định [tức là max(n
1
, n
2
, n
3
…)]
- Nếu có xem xét đến mức độ quan trọng của các chỉ tiêu

thì kích thước của mẫu số liệu có
thể chọn theo kích thước của tiêu chí quan trọng nhất trong các tiêu chí nghiên cứu

III. KẾT LUẬN
Việc xác định kích thước mẫu số liệu trong các nghiên cứu kinh tế rất quan trọng, nó đảm
bảo cả về mặt “chất” và mặt “lượng” của mẫu số liệu. Phương pháp xác định kích thước mẫu số
liệu này còn có thể áp dụng trong nhiều lĩnh vực khoa học công nghệ khác như: xác định số lần
tiến hành thí nghiệm, số lượng đối tượng nghiên cứu, số lần quan sát ghi chép sự kiện… Ưu
điểm nổi bật của phương pháp này là vừa đảm bảo độ tin cậy của các nghiên cứu vừa tiết kiệm
được thời gian, công sức và chi phí tính toán.
Tài liệu tham khảo
[1]. TS. Đặng Thị Xuân Mai, Tính đồng nhất của số liệu khi áp dụng phương pháp phân tích tương quan
trong phân tích kinh tế, tạp chí Khoa học Giao thông vận tải số 21 tháng 3/2008
[2]. Trần Văn Minh (chủ biên), Xác suất thống kê và các tính toán trên Excel, NXB Giao thông vận tải,
Hà Nội 2001.
[3]. Luận án tiến sỹ Đặng Thị Xuân Mai, Nghiên cứu hoàn thiện một số vấn đề về phân tích hoạt động
kinh doanh của doanh nghiệp xây dựng, 2001
[4]. Danh mục các doanh nghiệp xây lắp có đến 31-12-1995, Tổng cục Thống kê, Vụ giao thông - Xây dựng,1996

×