Trêng cao ®¼ng y tÕ hµ ®«ng
Gi¸o tr×nh
NGUY£N Lý ThèNG K£
Tµi liÖu ®µo t¹o trung cÊp d©n sè y tÕ
Hµ Néi - N¨m 2011
Danh mục chữ viết tắt
DS : Dân số
DS - KHHGĐ : Dân số - Kế hoạch hoá gia đình
KHH : Kế hoạch hoá
KHHGĐ : Kế hoạch hoá gia đình
THCS : Trung học cơ sở
THPT : Trung học phổ thông
KT - XH : Kinh tế xã hội
SKSS : Sức khoẻ sinh sản
L
ỜI NÓI ĐẦU
Ngày nay, th
ống kê được coi là một trong những công cụ quản lý vĩ mô quan
tr
ọng, có vai tr
ò cung cấp các thông tin thống kê trung thực, khách quan, chính xác,
đ
ầy đủ, kịp thời phục vụ các cơ quan nhà nước trong việc đánh giá, dự báo tình
hình, ho
ạch định chiến lược, chính sách, xây dựng kế ho
ạch, chiến l
ược và chính
sách phát tri
ển kinh tế
- xã h
ội ngắn hạn và dài hạn, trong phạm vi một lĩnh vực hay
toàn b
ộ nền kinh tế, trong phạm vi một x
ã hay qu
ốc gia
. Đ
ồng thời, các con số
th
ống kê cũng là n
h
ững cơ sở quan trọng nhất để kiểm điểm, đánh giá tình hình
th
ực hiện các kế hoạch, chiến lược và các chính sách đó. Trên giác độ quản lý vi
mô, th
ống kê không những có vai trò đáp ứng nhu cầu thông tin thống kê của các tổ
ch
ức, cá nhân trong xã hội, mà cò
n ph
ải xây dựng, cung cấp các phương pháp phân
tích đánh giá v
ề mặt lượng các hoạt động kinh tế
- xã h
ội của các tổ chức, đơn vị.
Nh
ằm kịp thời đáp ứng yêu cầu đào tạo đối tượng trung học Dân số
- Y t
ế,
m
ột mã ngành mới có ở Việt Nam. Đồng thời phù hợp với
đi
ều kiện hiện nay và
nh
ững chủ tr
ương, chính sách của Đảng và Nhà
nư
ớc về công tác dân số v
à kế
ho
ạch hóa gia đình
. Chúng tôi đ
ã tiến hành biên soạn cuốn sách này làm tài liệu học
t
ập cho các lớp đào tạo trung học Dân số
- Y t
ế.
Giáo trình
được biên soạn
theo Chương tr
ình môn học
Nguyên lý th
ống kê
đ
ã được phê duyệt. Cuốn sách gồm
6 bài:
Bài 1: Nh
ập môn thống k
ê
Bài 2: Thu th
ập dữ liệu thống kê
Bài 3: Mô t
ả dữ liệu bằng đặc tr
ưng đo lường
Bài 4: Tóm t
ắt v
à trình bày dữ liệu thống kê
Bài 5: Phương pháp phân tích dãy s
ố thời gian
Bài 6: Phương pháp h
ồi quy v
à tương quan
Xin chân thành cám ơn các cán b
ộ,
chuyên gia c
ủa Tổng cục Dân số
- K
ế
hoạch hóa gia đình, Quỹ dân số Liên hợp quốc tại Việt Nam đã có những ý kiến quý
báu giúp chúng tôi hoàn thi
ện giáo
trình này.
Đây là giáo tr
ình biên soạn lần đầu
tiên dành riêng cho đ
ối tượng trung học
Dân s
ố
- Y t
ế, v
ì vậy không tránh khỏi những thiếu s
ót, tôi mong nh
ận đ
ược những
ý ki
ến đóng góp quý báu của các nhà khoa học, nhà quản lý và
đông đảo bạn đọc.
Th
ạc sỹ Đinh Thái H
à
M
ỤC LỤC
TT
Tên bài h
ọc
Trang
1
Nh
ập môn thống kê
1
2
Thu th
ập dữ liệu thống kê
13
3
Mô t
ả dữ liệu bằng đặc trưng đo lường
21
4
Tóm t
ắt v
à trình bày dữ liệu thống kê
27
5
Phương pháp phân tích dãy s
ố thời gian
36
6
Phương pháp h
ồi quy và tương quan
43
1
Bài 1. NH
ẬP MÔN THỐNG K
Ê
M
ục ti
êu
1. Trình bày được tổng quan về thống kê
2. Nêu đư
ợc đối tượng nghiên cứu của thống kê học
3. Nêu được các khái niệm cơ bản của thống kê học
________________
1. Sơ lư
ợc sự phát triển của khoa học thống kê
1.1. L
ịch sử phát triển của thống kê
Th
ống kê
ra đ
ời,
phát tri
ển từ nhu cầu thực tiễn của xã hội
loài ngư
ời
và là
m
ột trong những môn khoa học xã hội có lịch sử
phát tri
ển
lâu dài nh
ất. Đó là một
quá trình phát tri
ển không ngừng từ đ
ơn giản đến phức tạp, được đúc rút dần thành
lý lu
ận khoa học và ngày nay đã trở thành một môn khoa học độc lập.
Ngay t
ừ thời cổ đại, con người đã biết chú ý tới việc đăng ký, ghi chép và
tính toán s
ố người trong bộ tộ
c, s
ố súc vật, số người có thể huy động phục vụ các
cu
ộc chiến tranh giữa các bộ tộc, số người được tham gia ăn chia
, phân ph
ối của cải
thu đư
ợc
Nh
ững hoạt động n
ày xu
ất hiện rất sớm ở Trung Quốc từ thế kỷ
XXIII
trư
ớc công nguyên. Vào thời La M
ã c
ổ đại
c
ũng diễn ra sự ghi chép, tính toán
nh
ững người
dân t
ự do, số nô lệ và của cải
. M
ặc dù việc ghi chép còn rất giản đơn
v
ới phạm vi hẹp, nhưng đó chính là những cơ sở thực tiễn ban đầu của thống kê.
Cùng v
ới sự phát triển của xã hội, hàng hóa trong nước c
ũng nh
ư trên thị
trư
ờng thế giới ngày càng tăng lên, điều này đ
òi h
ỏi phải có các thông tin
th
ống kê.
Phạm vi hoạt động của thống kê ngày càng mở rộng, dẫn đến sự hoàn thiện của các
phương pháp thu th
ập, xử lý và phân
tích th
ống kê. Trong thực tế, c
ác ho
ạt
đ
ộng đa
d
ạng của thống k
ê được thể hiện nhờ vào sự tích hợp nhiều nguyên lý, từ đó khoa
h
ọc thống kê được hình thành.
Nhi
ều nhận định cho rằng: Nền tảng của khoa học thống kê được xây dựng
b
ởi nhà kinh tế học Wiliam Petty (
1623- 1687). T
ừ các tác phẩm “Số
h
ọc chính trị”,
“S
ự khác biệt về tiền tệ” và mộ
t s
ố tác phẩm khác nữa, Kar Mark
đ
ã gọi Petty là
ngư
ời sáng lập ra môn Thống k
ê học. Petty đã thành lập một hướng nghiên cứu
khoa h
ọc gắn với “Số học chính trị”.
2
M
ột hướng nghiên cứu cơ bản khác cũng làm khoa
h
ọc thống kê phát triển
đó là hư
ớng nghi
ên c
ứu của nhà khoa học G. Conbring (1606
– 1681), ông đ
ã x
ử lý,
phân tích h
ệ thống mô tả chế độ Nhà nước. Môn sinh của ông
, giáo sư lu
ật và triết
h
ọc G. Achenwall (1719
– 1772) đ
ã dạy môn học mới với tên là “Statis
tics” l
ần đầu
tiên
ở tr
ường Tổng hợp Marburs (1746)
. N
ội dung chính của khóa học n
ày là mô tả
tình hình chính trị và những sự kiện đáng ghi nhớ của Nhà nước. Số liệu về Nhà
nư
ớc được tìm t
h
ấy trong các tác phẩm của M.B.
Lomonosov (1711 – 1765), trong
đó các v
ấn đề đưa ra xem xét là dân số, tài nguyên thiên nhiên, tài chính, của cải
hàng hóa. . . đư
ợc minh họa bằng các số liệu thống k
ê.
Hư
ớng
phát tri
ển n
ày của
th
ống kê được gọi là thống kê mô tả.
Giáo sư trường Đại học Tổng hợp Gettingen, A. Sliser (1736 – 1809) cho
r
ằng, thống kê không chỉ mô tả chế độ chính trị Nhà nước, mà
còn là toàn b
ộ xã hội.
S
ự phát triển tiếp theo của thống kê được vun đắp bởi nhiều nhà khoa học. Trong
đó, đáng quan tâm là nhà th
ống k
ê h
ọc A. Ketle (
1796 – 1874) đ
ã
đóng góp m
ột
công trình
đáng giá về lý thuyết ổn định của các chỉ số thống kê.
Xu hư
ớng toán học trong thống kê được phát triển trong công trình nghiên
c
ứu của Fra
ncis Galton (1822 – 1911), K. Pearson (1857 – 1936), V.S.Gosset (bi
ệt
hi
ệu Student, 1876
– 1937), R.A.Fisher (1890 – 1962), M.Mitrel (1874 – 1948) và
m
ộ
t s
ố nhà toán học khác nữa
. F. Galton đi tiên phong
ở nước Anh về Thống kê
h
ọc, ông đưa ra khái niệm mở đầu về hệ thống tương hỗ cách thăm dò thống kê để
xác đ
ịnh hiệu quả của việc cầu kinh. Ông đã cùng K.
Pearson thành l
ậ
p Tạp chí
Sinh tr
ắc (Biometrika). Kế tục công tr
ình c
ủa Galton, K.Pearson
, m
ột trong những
người sáng lập ra ngành Toán học Thống kê hiện đại, đã nghiên cứu các mẫu, đưa
ra nh
ững hệ số mà ngày nay
g
ọi là hệ số Pearson. Ông nghiên cứu lý thuyết tiến
hoá
theo mô hình Th
ống kê toán. Còn nhà toán học V. Gosset,
dư
ới danh hiệu Student
,
đ
ã đưa ra lý thuyết chọn mẫu nhỏ để rút ra kết luận xác đáng nhất từ hiện tượng
nghiên c
ứu. R. Fisher đã có công phân chia các phươ
ng pháp phân tích s
ố lượng,
phát tri
ển cá
c phương pháp th
ống kê để so sánh những trung bình của hai mẫu, từ
đó xác đ
ịnh sự khác biệt của chúng có ý nghĩa
th
ống k
ê
hay không. M. Mitrel đ
ã
đóng góp ý tưởng “Phong vũ biểu kinh tế”. Như vậy, đại diện cho khuynh hướng
này là cơ s
ở Lý thuyết xác suất t
h
ống kê. Đó là một trong các ngành toán ứng dụng.
Góp ph
ần quan trọng cho sự phát triển của thống kê
h
ọc
là các nhà khoa h
ọc
th
ực nghiệm. Ở thế kỷ XVII, trong công trình khoa học của I.C. Kirilov (1689
–
1737) và V. N. Tatisev (1686 – 1750) th
ống kê chỉ đư
ợc luận giải chủ yếu nh
ư một
ngành khoa h
ọc mô tả. Nhưng sau đó, vào nữa đầu thế kỷ XIX, khoa học thống kê
đ
ã chuyển thành ý nghĩa
nh
ận thức. V.S. Porosin (1809
- 1868) trong tác ph
ẩm
“Nghiên c
ứu nhận xét về nguyên lý thống kê” đã nhấn mạnh: “Khoa học thống
kê
không ch
ỉ giới hạn ở việc mô tả”. Còn I.I. Srezenev (1812
– 1880) trong quy
ển
3
“Kinh nghi
ệm về đối tượng, các đơn vị thống kê và kinh tế chính trị” đã nói rằng:
Th
ống k
ê trong r
ất nhiều trường hợp ngẫu nhiên đã phát hiện ra “Những tiêu chuẩn
hoá”. Nhà th
ống kê
D.P. Jurav (1810 – 1856) trong nghiên c
ứu “Về nguồn gốc và
ứng dụng của số liệu thống k
ê” đã cho rằng: “Thống kê là môn khoa học về các tiêu
chu
ẩn của việc tính toán”.
Trong nghiên c
ứu của giáo s
ư trường Đại học Bách khoa Peterbur
,
A.A.Truprov (1874 – 1926), th
ống kê được xem như phương pháp nghiên cứu các
hi
ện tượng tự nhiên và xã hội số lớn. Giáo sư I.U.E. Anson
(1835 – 1839), trư
ờng
Đ
ại học Tổng hợp Peterbur,
trong quy
ển “Lý thuyết thống kê” đã gọi thống kê là
môn khoa h
ọc x
ã h
ội. Đi theo quan đ
i
ểm n
ày có nhà kinh t
ế học nổi tiếng A.I.
Trurov (1842 –1908) trong tác phẩm “Thống kê học” đã nhấn mạnh: “Cần nghiên
c
ứu thống kê với qui mô lớn nhờ vào phương pháp điều tra dữ liệu với đầy đủ số
lư
ợng và yếu tố cần thiết để từ đó có thể miêu tả các hiện
tư
ợng xã hội, tìm ra quy
lu
ật v
à các nguyên nhân
ảnh hưởng”.
Còn nghiên c
ứu của nh
à bác h
ọc A.A.
Caufman (1874 – 1919) đ
ã nêu lên
quan đi
ểm về thống kê như là “Nghệ thuật đo
lư
ờng các hiện tượng chính trị và xã
h
ội”.
Ngày nay, th
ống kê được coi là một tron
g nh
ững công cụ quản lý vĩ mô quan
tr
ọng, có vai tr
ò cung cấp các thông tin thống kê trung thực, khách quan, chính xác,
đ
ầy đủ, kịp thời phục vụ các cơ quan nhà nước trong việc đánh giá, dự báo tình
hình, ho
ạch định chiến lược, chính sách, xây dựng kế hoạc
h phát tri
ển kinh tế
- xã
h
ội ngắn hạn và dài hạn. Đồng thời, các con số thống kê cũng là những cơ sở quan
tr
ọng nhất để kiểm điểm, đánh giá t
ình hình th
ực hiện các kế hoạch, chiến lược và
các chính sách đó. Trên giác độ quản lý vi mô, thống kê không những có vai trò đáp
ứng nhu cầu thông tin thống k
ê của các tổ chức, cá nhân trong xã hội, mà còn phải
xây d
ựng, cung cấp các phương pháp phân tích đánh giá về mặt lượng các hoạt
đ
ộng kinh tế
- xã h
ội của các tổ chức, đơn vị.
K
ể từ khi ra đời,
th
ống kê
ngày càng đóng vai tr
ò quan trọng trong đời sống
xã h
ội. Thông qua việc phát hiện, phản ánh những quy luật về lượng của hiện
tư
ợng, các con số
th
ống kê
giúp cho vi
ệc kiểm tra, giám sát, đánh giá các chương
trình, k
ế hoạch v
à định hướng sự phát triển kinh tế
- xã hội trong t
ương lai.
Th
ống
kê là m
ột môn khoa
h
ọc, ra đời và phát triển nhờ vào sự tích lũy kiến thức của nhân
lo
ại, rút ra được từ
kinh nghi
ệm nghiên cứu lý thuyết và thực tiễn, cho phép con
ngư
ời sử dụng để
qu
ản lý xã hội.
Trên th
ực tế,
đ
ể
có thông tin chính xác, đ
ầy đủ cho lập kế hoạch về công tác
DS-KHHGĐ thì cán b
ộ dân số
c
ần
đư
ợc trang bị tốt
ki
ến thức thống k
ê, bao g
ồm
Nguyên lý th
ống kê
– môn cơ s
ở để nghiên cứu
th
ống kê kinh tế xã hội và
Th
ống kê
chuyên ngành – môn h
ọc
các phương pháp th
ống kê chu
yên ngành
4
1.2. Khái ni
ệm thống k
ê
Trong công tác, c
ũng như trong đời sống hàng ngày chúng ta thường gặp
thu
ật ngữ “Thống kê”. Thuật ngữ này có thể hiểu theo hai nghĩa:
Th
ứ nhất: Thống kê là số liệu được thu thập để phản ánh các hiện tượng kinh
t
ế
- xã hội, t
ự nhiên, kỹ thuật. Ví dụ: D
ân s
ố của một địa phương tại một thời điểm
nào đó; s
ố trẻ em sinh ra trong năm của một tỉnh A.
Th
ứ hai: Thống kê là hệ thống các phương pháp được sử dụng để nghiên cứu
các hi
ện t
ượng kinh tế
- xã h
ội, tự nhi
ên kỹ thuật.
Ví d
ụ: Th
eo Tổng điều tra dân số
và nhà
ở 1/4/2009,
T
ổng tỷ suất sinh của Việt Nam là 2,03 con/phụ nữ
.
Thực ra khi hỏi thống kê là gì, có nhiều cách trả lời, ví dụ trả lời như sau có
th
ể khó bắt bẻ
“Th
ống kê là công việc mà các nhà thống kê làm”.
Công vi
ệc của nhà
th
ống kê
g
ồm
r
ất nhiều
ho
ạt động trên một phạm vi rộng, có thể tóm tắt thành các
m
ục lớn nh
ư sau:
- Thu th
ập và xử lý số liệu.
- Đi
ều tra thống kế chọn mẫu.
- Nghiên c
ứu mối liên hệ giữa các hiện tượng
- D
ự đoán
(d
ự báo)
.
- Nghiên c
ứu các hiện tượng
trong hoàn c
ảnh không chắc chắn
- Ra quy
ết định trong điều kiện không chắc chắc.
M
ột cách tổng quát, Thống kê có thể định nghĩa như sau:
Th
ống kê là hệ thống các phương pháp dùng để thu thập, xử lý và p
hân tích
các con s
ố (mặt lượng) của hiện tượng số lớn
nh
ằm
tìm hi
ểu bản chất và tính quy
lu
ật vốn có của chúng (mặt chất) trong điều kiện thời gian v
à không gian cụ thể.
M
ỗi
s
ự vật
hi
ện tượng đều
có hai m
ặt ch
ất v
à lượng không tách rời nhau. K
hi
nghiên c
ứu
m
ột hiện tượng, điều ai cũng
mu
ốn
bi
ết
là b
ản chất c
ủa hiện t
ượng.
Nhưng m
ặt chất thường ẩn bên trong còn mặt lượng biểu hiện ra bên ngoài dưới
d
ạng các đại lượng ngẫu nhiên. Do đó phải thông qua các phương pháp
thu th
ập,
x
ử
lý và phân tích thích h
ợp tr
ên m
ặt lượng của số lớn đơn vị cấu thành hiện tượng, tá
c
đ
ộng của các yếu tố ngẫu nhiên mới được bù trừ và triệt tiêu, bản chất của hiện
tượng mới bộc lộ ra và ta có thể nêu rõ bản chất, quy luật vận động.
Th
ống kê chia thành hai lĩnh vực
Thống kê mô tả: Gồm các phương pháp thu thập số liệu, mô tả và trình bày
s
ố liệu, tính toán các đặc trựng đo lường.
5
Th
ống kê suy diễn:
Gồm các ph
ương pháp như ước lượng, kiểm định, phân
tích m
ối li
ên h
ệ, dự đoán trên cơ sở các thông tin thu thập từ mẫu.
Trong kinh t
ế
- xã h
ội, thống kê
quan tâm nghiên c
ứu các hiện tượng:
- Các hi
ện tượng về nguồn tài nguyên, môi trường, của cải tích lũy.
- Các hi
ện tượng về sản xuất, phân phối, lưu thông, tiêu dùng sản phẩm
- Các hi
ện tượng về dân số, nguồn lao động
- Các hi
ện tượng về đời sống vật chất, văn hóa của dân cư
- Các hi
ện tượng về
sinh ho
ạt chính trị xã hội.
2. Đ
ối tượng nghiên cứu của thống kê học
Nghiên c
ứu quá trình hình thành và phát triển của
th
ống kê
h
ọc
cho th
ấy:
th
ống kê học là một môn khoa học xã hội. Tuy nhiên, khác với các môn khoa học xã
h
ội khác,
th
ống k
ê
h
ọc không trực
ti
ếp nghi
ên cứu mặt chất của hiện tượng, mà chỉ
ph
ản ánh bản chất, tính quy luật của hiện tượng thông qua các con số, các biểu hiện
về lượng của hiện tượng. Điều đó có nghĩa là thống kê học phải sử dụng các con số
v
ề quy mô, kết cấu, quan hệ tỷ lệ, quan h
ệ so sánh, tr
ình độ phát triển, trình độ phổ
bi
ến của hiện t
ượng để phản ánh, biểu thị bản chất, tính quy luật của hiện tượng
nghiên c
ứu trong những điều kiện, hoàn cảnh cụ thể. Như vậy, các con số
th
ống kê
không ph
ải chung chung, trừu tượng, mà bao giờ
c
ũng chứa đựng một nội dung
kinh t
ế, chính trị, xã hội nhất định, giúp ta nhận thức được bản chất và quy luật của
hi
ện t
ư
ợng nghiên cứu.
Theo quan đi
ểm của triết học, chất v
à lư
ợng là hai mặt không thể tách rời của
m
ọi sự vật, hiện tượng, giữa chúng luôn
t
ồn tại mối liên hệ biện chứng với nhau.
Trong m
ối quan hệ đó, sự thay đổi về lượng quyết định sự biến đổi về chất. Quy
lu
ật l
ượng
- ch
ất của triết học đ
ã chỉ rõ: mỗi lượng cụ thể đều gắn với một chất nhất
đ
ịnh, khi lượng thay đổi và tích lũy đến một chừng
m
ực nhất định thì chất thay đổi
theo. Vì vậy, nghiên cứu mặt lượng của hiện tượng sẽ giúp cho việc nhận thức bản
ch
ất của hiện tượng.
Ví d
ụ:
Có th
ể đánh
giá công tác dân s
ố
c
ủa một
huy
ện
qua các
con s
ố
th
ống k
ê
v
ề
s
ố
dân, m
ức sinh,
t
ỷ lệ
tăng dân s
ố
Tuy nhiên, đ
ể có thể phản ánh đ
ư
ợc bản chất và quy luật phát triển của hiện
tư
ợng, các con số
th
ống kê phải được tập hợp, thu thập trên một số lớn các hiện
tư
ợng cá biệt.
Th
ống kê học coi tổng thể các hiện tượng cá biệt như một thể hoàn
ch
ỉnh và lấy đó làm đ
ối t
ượng nghiên cứu.
M
ặt lượng của hiện tượng cá biệt thường
ch
ịu tác động của nhiều yếu tố, trong đó có cả những yếu tố tất nhi
ên và ng
ẫu nhiên.
M
ức độ và chiều hướng tác động của từng yếu tố này trên mỗi hiện tượng cá biệt rất
khác nhau. N
ếu chỉ thu thập
s
ố liệu trên một số ít hiện tượng thì khó có thể rút ra
6
b
ản chất chung của hiện tượng, mà nhiều khi người ta chỉ tìm thấy những yếu tố
ng
ẫu nhi
ên, không b
ản chất. Ngược lại, khi nghiên cứu trên một số lớn các hiện
tư
ợng cá biệt, các yếu tố ngẫu nhiên sẽ b
ù tr
ừ, triệt tiêu nhau và khi đó, bản chất,
quy lu
ật phát triển của hiện tượng mới được bộc lộ rõ. Chẳng hạn, nghiên cứu tình
hình sinh đ
ẻ trong một tổng thể dân c
ư, cho
th
ấy có nhiều cặp vợ chồng sinh to
àn
con trai, ngược lại cũng có nhiều gia đình chỉ có con gái. Nếu nghiên cứu trên một
s
ố ít gia đình, có thể thấy số bé trai được sinh ra nhiều hơn số bé gái hoặc ngược lại.
Nhưng khi nghiên c
ứu trong cả tổng thể dân cư, với một số lớn cặp vợ chồng
(trên
10.000 trư
ờng hợp)
, nh
ững tr
ường hợp sinh toàn con tr
ai s
ẽ bị b
ù trừ bởi những cặp
sinh toàn con gái. Khi đó, quy lu
ật tự nhiê
n: s
ố
bé trai và s
ố
bé gái x
ấp x
ỉ bằng nhau
theo t
ỷ lệ khoảng 103
- 107 bé trai trên 100 bé gái m
ới được bộc lộ rõ.
Hi
ện tượng số lớn trong thống kê được hiểu là một tập hợp các hiện
tư
ợng cá
bi
ệt đủ bù trừ, triệt tiêu tác động của các yếu tố ngẫu nhiên. Giữa hiện tượng số lớn
(t
ổng thể) v
à các hi
ện tượng cá biệt (đơn vị tổng thể) luôn tồn tại mối quan hệ biện
ch
ứng. Muốn nghiên cứu tổng thể, phải dựa trên cơ sở nghiên cứu từng đơn vị
t
ổng
th
ể. Mặt khác, trong quá trình phát triển không ngừng của xã hội, luôn nảy sinh
nh
ững hiện t
ượng cá biệt mới, những điển hình tiên tiến hoặc lạc hậu. Sự nghiên
cứu các hiện tượng cá biệt này sẽ giúp cho sự nhận thức bản chất của hiện tượng
đ
ầy đủ, toà
n di
ện và sâu sắc hơn. Vì vậy trong thống kê, nhất là thống kê kinh tế
-
xã h
ội, người ta thường kết hợp nghiên cứu hiện tượng số lớn với việc nghiên cứu
hi
ện t
ượng cá biệt.
Đ
ối t
ư
ợng nghiên cứu của
th
ống k
ê
h
ọc bao giờ cũng tồn tại trong điều kiện
thời gian và địa điểm cụ thể. Trong điều kiện lịch sử khác nhau, các đặc điểm về
ch
ất và biểu hiện về lượng của hiện tượng cũng khác nhau, nhất là với các hiện
tư
ợng kinh tế
- xã h
ội
. Ch
ẳng hạn,
trình
độ hiện đại hóa
, m
ột trong những yếu tố
ảnh h
ưởng trực tiếp đế
n năng su
ất lao động của người công nhân
trong ngành dư
ợc
,
l
ại rất khác nhau giữa các doanh nghiệp
dư
ợc
. Ngay trong cùng m
ột đơn vị, cũng lại
có th
ể khác nhau giữa các giai đoạn, các thời kỳ, Thậm chí, giữa các bộ phận
trong cùng m
ột đ
ơn vị, nhiều khi c
ũng tồn tại những khác biệt đáng k
ể. V
ì vậy, các
con số về năng suất lao động của người công nhân trong từng doanh nghiệp dược,
t
ừng thời kỳ khác nhau cũng có ý nghĩa khác nhau. Như vậy, khi sử dụng các số
li
ệu
th
ống kê
ph
ải luôn gắn nó trong điều kiện thờ
i gian, đ
ịa điểm cụ thể của hiện
tư
ợng m
à số liệu phản ánh.
T
ừ các phân tích trên, c
ó th
ể rút ra kết luận:
Đ
ối tượng nghiên cứu của
th
ống
kê là m
ặt lượng trong sự liên hệ mật thiết với mặt chất của các hiện tượng số lớn,
trong đi
ều kiện thời gian và địa đi
ểm cụ thể.
7
Xu
ất phát từ đối tượng nghiên cứu trên, thống kê có nhiệm vụ cụ thể sau:
- Xây d
ựng hệ thống chỉ tiêu thống kê
- Thu th
ập thông tin
- T
ổng hợp thông tin
- Phân tích th
ống k
ê
- D
ự đoán thống k
ê
- Đ
ề xuất
ý ki
ến cho quyết định quản lý
3. M
ột số k
hái ni
ệm th
ư
ờng dùng trong thống kê
3.1. Quy lu
ật số lớn
Quy lu
ật số lớn là phạm trù của lý thuyết xác suất, ý nghĩa của quy luật này
là t
ổng hợp sự quan sát số lớn tới mức đầy đủ các sự kiện
cá bi
ệt
ng
ẫu nhiên thì
tính
t
ất nhiên của hiện tượng sẽ bộc lộ.
Quy lu
ật số lớn không giải thích bản chất của hiện tượng kinh tế
- xã h
ội
, hi
ện
tư
ợng dân số, nh
ưng vận dụng quy luật số lớn
ngư
ời ta có thể biểu hiện bản chất cụ
th
ể của hiện tượng kinh tế
- xã h
ội, hiện tượng dân số.
Th
ống kê vận dụng quy luật số lớn để
lư
ợng hóa bản chất và quy luật của
hi
ện tượng kinh tế
- xã h
ội thông qua tính quy luật thống kê.
Ví dụ: Tỷ số giới tính khi sinh được xác định bằng số bé trai trên 100 bé gái
m
ới sinh ra của một thời kỳ, thường là một năm lịch
(12 tháng).
Gi
ả sử n
ăm 2011, ta đ
ếm số trẻ em sinh ra tại tỉnh A, như sau:
gia đ
ình thứ
nhất sinh con trai, gia đ
ình thứ hai
sinh con gái, gia đ
ình thứ ba
sinh đôi con trai,
N
ếu
ta đ
ếm
trong ph
ạm vi
300 trư
ờng hợp (tương đương số sinh 1 xã trong năm)
, s
ố
bé trai là 180 cháu và số bé gái là 120 cháu, tỷ số là 150/100. Lý do, số lượng
trư
ờng hợp sinh
đư
ợc
đ
ếm quá nhỏ nên chưa thể hiện bản chất
c
ủa hiện tượng tỷ số
gi
ới sinh khi sinh
. Nhưng n
ếu ta đếm
t
ất cả số sinh của tỉnh
A, thì s
ố b
é trai là 5.300
cháu và s
ố bé gái là 5
.000 cháu, t
ỷ
s
ố là 106/100
. Khi s
ố
lư
ợng cá thể được
đ
ếm đủ
l
ớn (trường hợp này là trên 10.000 cháu) nên đã thể hiện bản chất của hiện tượng tỷ
s
ố giới sinh khi sinh
c
ủa tỉnh A.
3.2. Tính quy lu
ật thống kê
Tính quy lu
ật thống kê là một trong những hình thức biểu hiệ
n m
ối liên hệ
chung c
ủa các hiện tượng trong tự nhiên và xã hội.
Tính quy lu
ật thống kê không phải là tính quy luật của hiện tượng cá biệt mà
là k
ết quả nghiên cứu của thống kê đối với hiện tượng số lớn, trong đó chênh lệch
8
v
ề số lượng ở từng đơn vị cá biệ
t mang tính ng
ẫu nhiên. Về thực chất, tính quy luật
c
ủa thống k
ê c
ũng như các quy luật nói chung phản ánh những mối liên hệ nhân quả
t
ất nhiên. Nhưng các mối liên hệ này thường không có tính chất chung rộng rãi mà
ph
ụ thuộc vào phạm vi thời gian và không g
ian nh
ất định, tồn tại trong điều kiện
phát tri
ển cụ thể của hiện t
ượng.
Tính quy lu
ật thống k
ê không phải
là tác đ
ộng của một nguy
ên nhân mà là
toàn b
ộ các nguyên nhân kết hợp với nhau. Đó là biểu hiện tổng hợp của mối liên hệ
nhân qu
ả, là đặc trưng của h
i
ện tượng số lớn được tổng hợp lại qua các tổng thể
th
ống kê. Nhìn chung càng mở rộng phạm vi nghiên cứu về thời gian và không gian
thì tính quy lu
ật trong thống k
ê càng th
ể hiện rõ.
Ví d
ụ:
Ti
ếp theo ví
d
ụ tr
ên, T
ỷ số giới tính khi sinh đ
ư
ợc xác định bằng
s
ố bé
trai trên 100 bé gái m
ới sinh ra của một thời kỳ, thường là một năm lịch
(12 tháng).
Bình th
ường tỷ số này dao động từ 103 đến 107 và rất ổn định qua thời gian và
không gian (quy lu
ật thống k
ê).
3.3. T
ổng thể thống k
ê
T
ổng thể l
à khái niệm để chỉ đố
i tư
ợng nghi
ên cứu cụ thể. Tổng thể thống kê
là hi
ện tượng kinh tế
- xã h
ội số lớn gồm những đơn vị (phần từ, hiện tượng) cá biệt
c
ần được quan sát, phân tích mặt lượng của chúng.
Ví d
ụ: Toàn bộ nhân khẩu
c
ủa
nư
ớc ta tại thời điểm
ngày 1/4/2009 là m
ột tổng
th
ế thống kê, bao gồm
nhi
ều
nhân
kh
ẩu với những đặc tr
ưng khác nhau.
- T
ổng thể có thể phân loại theo cách thể hiện:
+ T
ổng thể bộc lộ l
à t
ổng thể
g
ồm các đ
ơn v
ị cấu thành tổng thể có thể
th
ấy
đư
ợc bằng trực quan
(quan sát đư
ợc)
. Ví d
ụ:
Số nhân khẩu, số trư
ờng đại học
y.
+ Tổng thể tiềm ẩn là tổng thể gồm các đơn vị không thể nhận biết được
b
ằng trực quan
(không quan sát đư
ợc)
. Ví d
ụ: số phụ nữ đang sử dụng
m
ột
bi
ện
pháp tránh thai.
- T
ổng thể có thể phân loại theo đặc điểm:
+ T
ổ
ng th
ể đồng chất l
à tổng thể
g
ồm các đ
ơn vị giống nhau về một số đặc
đi
ểm chủ yếu có liên quan đến mục đích nghiên cứu.
+ T
ổng thể
không đ
ồng nhất là tổng thể
g
ồm các đơn vị khác nhau về các đặc
đi
ểm, các loại hình.
- T
ổng thể cũng có thể phân loại theo tính chất
+ T
ổng thể chung là
t
ổng thể
g
ồm tất cả
đơn v
ị thuộc phạm vi nghiên cứu.
+ T
ổng thể bộ phận là tổng thể bao gồm chỉ những đơn vị thuộc bộ phận.
9
Đ
ịnh nghĩa tổng thể không những chỉ giới hạn về thực thể (tổng thể là gì
?)
mà c
ần phải giới hạn về thời gian v
à không gian (t
ổng thể
t
ồn tại v
ào th
ời gian nào?
ở đâu?).
Đ
ịnh nghĩa tổng thể làm rõ đặc trưng cơ bản chung của hiện tượng kinh tế
-
xã h
ội số lớn phù hợp với mục đích nghiên cứu. Thông qua việc phân tích lý luận và
th
ực tiễn phải l
àm rõ tổng thể đó bao gồm đơn vị cá biệt, các
hi
ện t
ượng cá biệt là
đơn v
ị tổng thể. Tất cả các đơn vị cá thể thuộc tổng thể chỉ giống nhau một số mặt
còn m
ột số mặt khác thì khác nhau. Trong thực tế, phải nêu rõ
t
ổng thể nghiên cứu
bao g
ồm những
đơn v
ị tổng thể
nào.
Ví d
ụ: tổng thể những phụ nữ tron
g đ
ộ tuổi sinh đẻ từ 15 đến 49 tuổi, nó
không bao g
ồm những phụ nữ tr
ên 50 tuổi.
Đơn v
ị tổng thể bao giờ cũng có đơn vị tính toán phù hợp. Xác định đơn vị
tổng thể là việc cụ thể hóa tổng thể. Cho nên xác định đơn vị tổng thể cũng quan
tr
ọng như xác định t
ổng thể.
3.4. Tiêu th
ức thống kê
Nghiên c
ứu thống kê phải dựa vào các đặc điểm của đơn vị tổng thể. Đơn vị
nghiên c
ứu có nhiều đặc điểm, n
ên tùy theo mục đích nghiên cứu mà chọn lựa một
s
ố đặc điểm. Các đặc điểm này gọi là các tiêu thức.
Ví d
ụ:
m
ột người t
rong t
ổng thể nhân khẩu có các tiêu thức: họ và tên, năm
sinh, gi
ới tính, trình độ văn hóa, tình trạng hôn nhân, nơi ở, nghề nghiệp
Đơn v
ị tổng thể được làm rõ đặc trưng của nó qua các tiêu thức: thực thể,
th
ời gian và không gian.
- Tiêu th
ức thực thể:
nêu lên b
ản chất của
đơn v
ị tổng thể. Ví dụ: giới tí
nh,
năm sinh, tr
ình độ văn hóa, nghề nghiệp. Theo nội dung, tiêu thức
th
ực tế
g
ồm hai
lo
ại là
thu
ộc tính và số lượng.
+ Tiêu thức thuộc tính là tiêu thức không có biểu hiện trực tiếp bằng các con
s
ố. Ví d
ụ: gi
ới tính, trình độ học vấn.
Tiêu th
ức thuộc tính có thể
có bi
ểu hiện trực tiếp. Ví dụ; giới tính có biểu
hi
ện trực tiếp
là nam và n
ữ.
Tiêu th
ức thuộc tính có thể biểu hiện gián tiếp. Các biểu hiện gián tiếp của
tiêu th
ức thuộc tính còn gọi là chỉ b
áo th
ống kê. Ví dụ: tiêu thức đời sống vật chất
có bi
ểu hiện gián tiếp: lượng tiêu dùng thịt, sữa theo đầu người.
+ Tiêu th
ức số lượng
là tiêu th
ức
có bi
ểu hiện trực tiếp
b
ằng các
con s
ố (gọi
là lư
ợng biến). Tiêu thức số lượng còn gọi là tiêu thức lượng
hóa. Ví d
ụ:
năng su
ất
lao đ
ộng
có bi
ểu hiện trực tiếp là số sản phẩm sản xuất ra trong một đơn vị thời gian
10
c
ủa một người công nhân
ngành dư
ợc
.
+ Tiêu th
ức thực thể nếu chỉ có
hai bi
ểu hiện không trùng nhau trên một
đơn
v
ị tổng thể được gọi là tiêu thức tha
y phiên. Vi d
ụ: tiêu thức giới tính (nam, nữ)
Tiêu th
ức thực thể có ba biểu hiện trở lên có thể tr
ở th
ành tiêu thức thay
phiên. Ví d
ụ trình độ văn hóa có thể rút gọn thành hai tiêu thức: biết chữ và mù chữ.
Nh
ững trường hợp này được tiến hành khi người ta
ch
ỉ quan tâm đến một biểu hiện
nào đó, xu
ất hiện hay không xuất hiện tr
ên đơn vị tổng thể.
- Tiêu th
ức thời gian:
nêu hi
ện t
ượng kinh tế
- xã h
ội xuất hiện v
ào thời gian
nào. Nh
ững biểu hiện của tiêu thức thời gian là ngày, tháng, năm. Thời gian có giá
tr
ị
c
ủa các chỉ dẫn về đối tượng nghiên cứu và đơn vị tổng thể, về sự phân phối
chúng trong m
ột thời gian cũng như thay đổi từ thời kỳ này đến thời kỳ khác được
kh
ẳng định qua tiêu thức thời gian.
Ví d
ụ:
theo T
ổng điều tra dân số
và nhà
ở
vào 0 gi
ờ ng
ày
1/4/2009, dân s
ố
nư
ớc ta
là 85,8 tri
ệu người, Nam
là 42,2 tri
ệu người
, chi
ếm
49% dân s
ố;
N
ữ là 43,6
tri
ệu người
, chi
ếm
51%; so v
ới năm 1999 tăng 9
,47 tri
ệu người, tức là tăng
1,2%/năm. Như v
ậy, T
ổng dân số n
ư
ớc ta và phân bố theo theo giới tính có gi
á tr
ị
t
ại 0
gi
ờ ngày 1/4/2009. Dân số tăng là 9,47
tri
ệu người với tốc độ tăng là 1,2
%/năm
có giá tr
ị trong thời kỳ 1999
-2009.
- Tiêu th
ức không gian:
nêu ph
ạm vi lãnh thổ bao trùm của đơn vị nghiên
c
ứu và sự xuất hiện theo địa điểm của các đơn vị tổng thể.
Nh
ững biể
u hi
ện của nó chỉ ra nhờ sự phân định về mặt quản lý hành chính
ho
ặc theo điều kiện tự nhi
ên, vùng kinh t
ế. Nghiên cứu thống kê theo tiêu thức
không gian có ý ngh
ĩa quan trọng, trước hết là gắn với tiêu thức thực tế để quan sát
phân ph
ối về mặt lãnh thổ củ
a các đơn v
ị tổng thể.
Ví d
ụ:
ngư
ời ta không chỉ quan tâm đến số lượng cơ cấu tuổi của người lao
đ
ộng mà còn phải chỉ ra số người lao động này ở đâu.
Các tiêu th
ức góp phần v
ào việc khẳng định đơn vị tổng thể cũng như tổng
th
ể, vì chúng nêu rõ các mặt và t
ính ch
ất nhất định của đơn vị tổng thể. Nhờ đó
chúng ta phân bi
ệt đơn vị này với đơn vị khác, tổng thể này với tổng thể kia.
3.5. Ch
ỉ tiêu thống kê
Ch
ỉ tiêu thống kê là tiêu chí mà biểu hiện bằng số của nó phản ánh quy mô,
t
ốc độ phát triển, cơ cấu, quan h
ệ tỷ lệ của hiện t
ượng kinh tế
- xã h
ội trong điều
ki
ện không gian v
à th
ời gian cụ thể.
M
ỗi chỉ tiêu thống kê đều gắn với một đơn vị đo lường và phương pháp tính
cụ thể. Chỉ tiêu thống kê có hai bộ phận: khái niệm và con số. Ví dụ: [khái niệm]
11
T
ổng số
nhân kh
ẩu thực tế thường trú
[không gian] t
ại
Vi
ệt Nam
[th
ời gian]
vào
thời điểm 0 giờ ng
ày 1/4/2009 là
85.789.573 [s
ố l
ư
ợng]
ngư
ời
[đơn v
ị tính]
.
- Theo n
ội dung phản ánh,
có ch
ỉ tiêu khối lượng và chỉ tiêu chất lượng:
+ Ch
ỉ tiêu khối lượng phản ánh quy mô
, kh
ối lượng của tổng
th
ể. Ví dụ
:
T
ổng
s
ố
dân s
ố
, s
ố nam
+ Ch
ỉ tiêu chất lượng phản ánh các đặc điểm về mặt chất, trình độ phổ biến,
m
ối quan hệ tổng thể. Ví dụ:
Số bác s
ĩ trên một
v
ạn dân
,
Tuy nhiên, s
ự phân biệt giữa hai loại chỉ tiêu trên chỉ có ý
ngh
ĩa tương đối.
- Theo hình th
ức biểu hiện,
có ch
ỉ tiêu hiện vật và chỉ tiêu giá trị:
+ Ch
ỉ tiêu hiện vật biểu hiện bằng đơn vị tự nhiên. Ví dụ:
s
ố lượng
máy siêu
âm xách tay tính b
ằng
cái, s
ản lượng lương thực tính bằng tấn, hoặc đơn vị đo
lường quy ước như: vải tính bằng mét, nước mắm tính bằng lít, v.v
+ Ch
ỉ tiêu giá trị biểu hiện bằng đơn vị tiền tệ Đồng Việt Nam, ngoài ra còn
đư
ợc tính bằng ngoại tệ như đôla Mỹ, Euro Ví dụ:
Giá tr
ị sản
xu
ất công nghiệp
dư
ợc
, doanh thu tiêu th
ụ sản phẩm đ
ược t
ính b
ằng Đồng Việt Nam (ngh
ìn đồng,
tri
ệu đồng ); kim ngạch xuất, nhập khẩu được tính bằng đôla Mỹ.
- Theo đ
ặc điểm về thời gian,
có ch
ỉ tiêu thời điểm và chỉ tiêu thời kỳ:
+ Ch
ỉ tiêu thời điểm phản ánh quy mô của hiện tượng nghiên cứu tại một
thời điểm. Vì vậy, quy mô của hiện tượng nghiên cứu không phụ thuộc vào độ dài
th
ời gian nghiên cứu.
+ Ch
ỉ tiêu thời kỳ phản ánh quy mô của hiện tượng nghiên cứu trong một
th
ời kỳ nhất định. Vì vậy, quy mô của hiện tượng nghiên cứu phụ thuộc vào độ dài
th
ời gian ngh
iên c
ứu.
H
ệ thống chỉ tiêu thống kê là tập hợp những chỉ tiêu thống kê nhằm phản ánh
b
ản chất của lĩnh vực nghiên cứu. Hệ thống chỉ tiêu thống kê do cơ quan nhà nước
có th
ẩm quyền ban h
ành.
Trong th
ống k
ê kinh tế
- xã h
ội có nhiều lo
ại hệ thống chỉ ti
êu t
h
ống k
ê: H
ệ
th
ống chỉ tiêu thống kê của từng ngành, từng lĩnh vực và hệ thống chỉ tiêu thống kê
qu
ốc gia hoặc chung cho nhiều lĩnh vực, Hệ thống chỉ tiêu thống kê quốc gia
chung cho nhi
ều lĩnh vực là hệ thống chỉ tiêu có phạm vi rộng, phản ánh tình hìn
h
kinh t
ế
- xã h
ội chủ yếu của đất nước hoặc về các mặt sản xuất vật chất, dịch vụ, đời
s
ống văn hóa, xã hội.
_____________________
12
Bài 2. THU THẬP DỮ LIỆU THỐNG KÊ
M
ục ti
êu
1. Phân biệt được các loại dữ liệu thống kê
2. Nêu đư
ợc các phương pháp thu
th
ập dữ liệu thống kê
3. Nêu được các bước xây dựng phương án điều tra thống kê
4. Nêu đư
ợc các điểm chính của sai số trong điều tra thống kê
______________
Quá trình nghiên c
ứu thống k
ê các hi
ện tượng kinh tế
- xã h
ội phải có nhiều
dữ liệu. Việc thu thập số liệu đòi hỏi nhiều thời gian, công sức và chi phí. Cho nên
công tác thu th
ập dữ liệu thống kê cần phải được tiến hành có hệ thống theo một kế
ho
ạch thống nhất để thu thập được dữ liệu đáp ứng mục tiêu và nội dung nghiên cứu
v
ới khả năng nhân lực v
à chi
phí trong gi
ới hạn cho phép.
1. Các lo
ại dữ liệu thống kê
1.1. Xác định dữ liệu cần thu thập
Chúng ta có kh
ả năng thu thập rất nhiều dữ liệu liên quan đến hiện tượng
nghiên cứu. Vấn đề đầu tiên của công việc thu thập dữ liệu là làm rõ những dữ liệu
nào c
ầ
n thu th
ập? thứ tự ưu tiên của các dữ liệu này. Nếu không thì chúng ta sẽ mất
r
ất nhiều thời gian v
à tiền bạc cho những dữ liệu không quan trọng hay không liên
đ
ến vấm đề đang nghiên cứu. Xác định dữ liệu cần thu thập xuất phát từ vấn đề
nghiên c
ứu và mục
tiêu nghiên c
ứu. Nếu vấn đề nghiên cứu và mục tiêu nghiên cứu
càng c
ụ thể thì việc xác định dữ liệu cần thu thập càng dễ dàng.
Vi
ệc xác định nội dung điều tra, cần căn cứ vào các yếu tố sau:
- M
ục đích điều tra: Mục đích điều tra chỉ r
õ cần thu thập những
thông tin
nào đ
ể đáp ứng yêu cầu của nó. Mục đích điều tra khác nhau, nhu cầu thông tin
cũng khác nhau. Mục đích càng nhiều, nội dung điều tra càng phải rộng, càng phải
phong phú.
- Đ
ặc điểm của hiện tượng nghiên cứu: Tất cả những hiện tượng mà thống kê
nghiên c
ứu đều tồn tại trong những điều kiện cụ thể về thời gian v
à không gian. Khi
đi
ều kiện này thay đổi, đặc điểm của hiện tượng cũng thay đổi. Khi đó, các biểu
hi
ện cũng khác nhau
, do v
ậy
vi
ệc lựa chọn tiêu thức nghiên cứu cũng phải khác
nhau.
13
- Năng l
ực
, trình
độ thực tế của đơn vị, của người tổ chức điều tra. Điều này
bi
ểu hiện ở khả năng về t
ài chính, v
ề thời gian, về kinh nghiệm và trình độ tổ chức
đi
ều tra. Nếu tất cả các yếu tố này được đảm bảo tốt, có thể mở rộng nội dung điều
tra, nhưng v
ẫn đảm bả
o ch
ất lượng của các thông tin thu được. Trường hợp ngược
l
ại, cần ki
ên quyết loại bỏ những nội dung chưa thực sự cần thiết
1.2. D
ữ liệu định tính v
à dữ liệu định lượng
Trư
ớc khi thu thập dữ liệu, cần phải phân biệt tính chất của dữ liệu. Có hai
loại là dữ liệu định tính và dữ liệu định lượng. Dữ liệu định tính phản ánh tính chất,
s
ự hơn k
ém c
ủa các đối tượng nghiên cứu
. D
ữ liệu định lượng phản ánh mức độ hay
m
ức độ hơn kém. Dữ liệu định tính thu thập bằng thang đo định danh hay thứ bậc,
d
ữ liệu định l
ượng
thu th
ập bằng thang đo khoảng cách hay
thang đo t
ỷ lệ
.
D
ữ liệu định lượng thường cung cấp nhiều thông tin hơn
và d
ễ áp dụng nhiều
phương pháp phân tích hơn. Khi thực hiện nghiên cứu, trong giai đoạn lập kế hoạch,
ngư
ời nghiên cứu cần xác định trước các ph
ương pháp phân tích c
ần sử dụng để phục
v
ụ cho mục tiêu nghiên cứu của mình, và từ đó xác định loại dữ liệu cần thu thập.
1.3. D
ữ liệu thứ cấp v
à dữ liệu sơ cấp
D
ữ liệu thu thập đ
ược nếu chia theo nguồn là dữ liệu thứ cấp và dữ liệu sơ
c
ấp. Dữ liệu thứ cấp
là d
ữ liệu thu thập từ những nguồn số liệu có sẵn, đó chính là
nh
ững dữ liệu đã qua tổng hợp, xử lý. Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp,
ban đ
ầu từ đối tượng nghiên cứu.
- Dữ liệu thứ cấp khá đa d
ạng đối với trạm y tế
, có th
ể sử dụng
ngu
ồn sau
:
+ N
ội bộ: C
ác s
ố liệu thống kê, báo cáo về tình hình chăm sóc sức khỏe nhân
dân, chương tr
ình dân số
- k
ế hoạch hóa gia đình, chương trình phòng chống suy
dinh dưỡng của các nhân viên y tế của trạm y tế.
+ Cơ quan Th
ống kê tập trung: C
án b
ộ thống kê của Ủ
y ban Nhân dân xã
ho
ặc
Chi c
ục
Th
ống kê
c
ấp
huy
ện cung cấp trong Niên giám thống kê hoặc công bố
s
ố liệu chính thức (có tính pháp lý duy nhất) của huyện. Chủ yếu các các dữ liệu
t
ổng quát về dân số, mức sống, lao động
+ Cơ quan chuyên môn: Cung c
ấp số li
ệu thống k
ê chuyên ngành mang tính
chi ti
ết hơn và đặc thù của ngành.
+ Báo, t
ạp chí: Số liệu mang tính thời sự, cập nhật cao, nhưng mức độ tin cậy
ph
ụ thuộc vào nguồn số liệu mà bài báo sử dụng.
+ Các ngu
ồn khác
- Thu th
ập dữ liệu sơ cấp
: D
ữ liệu sơ
c
ấp được thu thập thông qua điều tra
kh
ảo sát. Các điều tra khảo sát chia thành nhiều loại. Căn cứ vào tính chất liên tục
14
c
ủa điều tra, chia ra điều tra thường xuyên và không thời xuyên. Căn cứ vào phạm
vi thu th
ập thực tế, chia ra th
ành đi
ều tra toàn bộ h
ay không toàn b
ộ.
Đi
ều tra thường xuyên
là ti
ến hành thu thập, ghi chép dữ liệu ban đầu về hiện
tư
ợng nghiên cứu một cách có hệ thống theo sát quá trình biến động của hiện tượng.
Ví d
ụ thu thập, ghi chép biến động dân số của một địa phương (sinh, chết, đi,
đ
ến).
Đi
ều tra không thường xuyên
là ti
ến hành thu thập, ghi chép dữ liệu ban đầu
không liên t
ục, m
à chỉ tiến hành thu thập khi có nhu cầu cần nghiên cứu hiện tượng.
Ví dụ Tổng điều tra dân số. Các cuộc điều tra không thường xuyên có thể tiến hành
theo đ
ị
nh k
ỳ (3 tháng, 6 tháng, 1 năm, 2 năm, 5 năm ) hay không định kỳ.
Đi
ều tra toàn bộ
là ti
ến hành thu thập, ghi chép dữ liệu trên tất cả các đơn vị
c
ủa tổng thể nghiên cứu. Ví dụ: Tổng điều tra dân số. Điều tra toàn bộ cung cấp dữ
li
ệu đầu đủ nhất cho nghiê
n c
ứu thống kê. Nó giúp ta tính toán các chỉ tiêu quy mô,
khối lượng một cách khá chính xác. Cho phép nghiên cứu cơ cấu, tình hình biến
đ
ộng, đánh giá thực trạng hiện tượng, dự đoán xu hướng biến động của hiện tượng
Đi
ều tra toàn bộ đòi hỏi chi phí lớn
v
ề nhân lực, thời gian và tiền bạc, vì vậy không
th
ể áp dụng cho tất cả các trường hợp nghiên cứu.
Đi
ều tra không toàn bộ
là ti
ến hành thu thập, ghi chép dữ liệu trên một số đơn
v
ị được chọn của tổng thể nghiên cứu. Tùy theo cách chọn đơn vị, điều tra khôn
g
toàn b
ộ chia ra 3 loại: điều tra chuyên đề, điều tra chọn mẫu và điều tra trọng điểm.
Đi
ều tra chuyên đề
là ti
ến hành thu thập dữ liệu trên một số rất ít các đơn vị
c
ủa tổng thể, nh
ưng l
ại đi sâu nghiên cứu nhiều khía cạnh của đơn vị đó. Mục đích
là khám phá, tìm hiểu các yếu tố ảnh hưởng đến hiện tượng nghiên cứu. Dự liệu của
đi
ều tra chuyên đề để phục vụ cho nghiên cứu định tính, không dùng để suy rộng,
không dùng đ
ể tìm hiểu tình hình cơ bản của hiện tượng, mà chỉ rút ra kết luận về
b
ản thân các đơn
v
ị được điều tra. Kết quả điều tra chuyên đề có thể được sử dụng
làm cơ s
ở để thiết kế cho một điều tra quy mô lớn, mang tính chất định lượng.
Điều tra chọn mẫu là tiến hành thu thập dữ liệu trên một số phần tử hoặc đơn
v
ị được lựa chọn từ tổng thể nghiên
c
ứu. Điều tra chọn mẫu được sử dụng nhiều
nh
ất, do tiết kiệm thời gian, chi phí v
à dữ liệu đáng tin cậy. Dữ liệu điều tra chọn
m
ẫu được sử dụng để suy rộng thành các đặc trưng của tổng thể nghiên cứu.
Điều tra trọng điểm là tiến hành thu thập dữ liệu trên bộ phận chủ yếu, tập
trung nh
ất của toàn bộ tổng thể nghiên cứu. Kết quả của điều tra trọng điểm giúp ta
nh
ận biết nhanh tình hình cơ bản của hiện tượng nghiên cứu, mà không dùng để suy
r
ộng th
ành cách đ
ặc trưng của tổng thể.
15
2. Các phương pháp thu th
ập
d
ữ liệu ban đầu
2.1. Thu th
ập trực tiếp.
Quan sát là thu th
ập dữ liệu bằng cách quan sát các hành động, thái độ của
đ
ối tượng khảo sát trong những tình huống nhất định. Ví dụ
: Quan sát s
ố lượng và
thái đ
ộ của khách đến
thăm khám t
ại
cơ s
ở y tế
; quan sát th
ứ tự hành động đi đến
các bàn khám c
ủa từng khách hàng đến khá
m.
Ph
ỏng vấn trực tiếp:
Ngư
ời phỏng vấn trực tiếp hỏi đối tượng được điều tra
và t
ự ghi chép dữ liệu v
ào câu hỏi hay phiếu điều tra. Phương pháp phỏng vấn trực
ti
ếp phù hợp với những cuộc điều
tra ph
ức tạp cần thu thập nhiều dữ liệu. Ưu điểm
là th
ời gian phỏng vấn có thể ngắn hay dài tuỳ thuộc vào số lượng dữ liệu cần thu
th
ập; và nhân viên trực tiếp phỏng vấn có điều kiện để có thể giải thích một cách
đ
ầy đủ, cặn kẽ, đặt những câu hỏi chi tiết
đ
ể khai thác thông tin và kiểm tra dữ liệu
trước khi ghi chép vào phiếu điều tra.
Phương pháp ph
ỏng vấn trực tiếp có ưu điểm lớn là dữ liệu được thu thập
đ
ầy đủ theo nội dung điều tra và có độ chính xác khá cao, cho nên được áp dụng
khá ph
ổ biến trong điều
tra th
ống k
ê. Tuy nhiên, phương pháp này
đ
òi
h
ỏi chi phí
l
ớn, nhất là chi phí về nhân lực và thời gian.
2.2. Thu th
ập gián tiếp.
Nhân viên đi
ều tra thu thập tài liệu qua trao đổi bằng điện thoại, hoặc thư gửi
qua bưu đi
ện với đơn vị điều tra hoặc qua chứ
ng t
ừ, sổ sách có sẵn ở đơn vị điều tra.
Ví d
ụ
: trong đi
ều tra hộ gia đình, nhân viên điều tra gặp đại diện hộ gia đình
trao phi
ếu điều tra, giải thích ý nghĩa điều tra, cách trả lời
Đ
ại diện hộ gia đình
xác đ
ịnh các dữ liệu cần thiết và tự ghi vào phiế
u đi
ều tra, rồi gửi cho nhân viên
điều tra. Trong điều tra về biến động dân số của một địa phương, nhân viên điều tra
có th
ể thu thập tài liệu qua sổ sách theo dõi của cơ quan địa phương, nhân viên điều
tra có th
ể thu thập tài liệu qua sổ sách theo dõi của
cơ quan đ
ịa phương về số sinh,
t
ử, chuyển đi, chuyển đến.
Thu th
ập gián tiếp ít tốn kém hơn thu thập trực tiếp, nhưng chất lượng dữ
li
ệu không cao, nên thườn
g ch
ỉ áp dụng trong những trường
h
ợp khó khăn hoặc
không có đi
ều kiện thu thập trực tiếp.
3. Xây d
ựng phương án điều tra thống kê
Đ
ể thu thập dữ liệu khách quan đáp ứng được nhu cầu nghiên cứu kịp thời và
đ
ầy đủ th
ì
điều tra thống kê cần phải được tổ chức một cách khoa học, thống nhất và
chu đáo. V
ấn đề cơ bản nhất được đặt ra trước khi tiến hành điều
tra th
ực tế là phải
xây d
ựng được kế hoạch điều tra.
16
K
ế hoạch điều tra là một tài liệu dưới dạng văn bản, trong đó đề cập những vấn
đ
ề cần giải quyết hoặc cần đ
ư
ợc hiểu thống nhất, trình tự và phương pháp tiến hành
cu
ộc điều tra, những vấn đề thuộc về chu
ẩn bị v
à tổ chức toàn bộ cuộc điều tra.
Đ
ối với mỗi cuộc điều tra thống kê cần phải xây dựng kế hoạch điều tra phù
h
ợp.
Sau đây là nội dung c
ơ
b
ản của kế hoạch điều tra
.
3.1. Mô t
ả mục đích điều tra
M
ục đích điều tra là nội dung quan trọng đầu tiên của kế
ho
ạch điều tra, xác
đ
ịnh r
õ điều tra để tìm hiểu những khía cạnh nào của hiện tượng, phục vụ yêu cầu
nghiên c
ứu hoặc yêu cầu quản lý nào.
Bất kỳ một hiện tượng nào cũng có thể được quan sát, nghiên cứu từ nhiều
góc đ
ộ khác nhau. Nhưng với mỗi cuộc điều tra
ta không th
ể và cũng không cần
thi
ết phải điều tra tất cả các khía cạnh của hiện tượng, mà chỉ cần khảo sát điều tra
nh
ững khía cạnh phục vụ y
êu c
ầu nghiên cứu cụ thể.
Vi
ệc xác định mục đích điều tra có tác dụng định hướng cho toàn bộ quá trình
điều tra. Nó liên quan đến xác định đối tượng, đơn vị và nội dung điều tra. Muốn xác
đ
ịnh mục đích điều tra cần căn cứ vào mục đích toàn bộ quá trình nghiên cứu.
3.2. Xác đ
ịnh đối tư
ợng điều tra v
à đơn vị điều tra
Đ
ối tương điều tra:
Là t
ổng thể các đơn vị thuộc hiệ
n tư
ợng nghiên cứu có
th
ể cung cấp những dữ liệu cần thiết khi tiến h
ành điều tra.
Xác đ
ịnh đối t
ư
ợng điều tra có nghĩa là quy định rõ phạm vi của hiện tượng
nghiên c
ứu, vạch rõ ranh giới của hiện tượng ngiên cứu với hiện tượng khác, giúp ta
xác đ
ịnh đúng
đ
ắn số đơn vị cần điều tra thực tế. Xác định chính xác đối tượng điều
tra giúp tránh đư
ợc nhầm lẫn khi thu thập dữ liệu, làm cho dữ liệu thu thập và tổng
h
ợp phản ánh đúng hiện tượng cần nghiên cứu.
Khi xác đ
ịnh đối tượng điều tra phải căn cứ mục đích điều
tra, đ
ồng thời phải
định nghĩa những tiêu chuẩn phân biệt rõ ràng, vì nhiều khi biểu hiện bên ngoài của
hi
ện tượng giống
nhau, nhưng th
ực chất lại khác
nhau. Ví d
ụ
: T
ổng điều tra dân số,
đ
ối t
ượng điều tra được xác định là “Nhân khẩu thường trú” trên lãnh
th
ổ Việt Nam.
Đ
ể phân biệt “nhân khẩu thường trú” với “nhân khẩu tạm trú” và với “nhân khẩu có
m
ặt”, tránh đăng ký trùng lặp hay bỏ sót, kế hoạch điều tra đã nêu ra những tiêu
chu
ẩn cụ thể để xác định thế nào là nhân khẩu thường trú.
Đơn v
ị điều tra:
là đơn v
ị thuộc đối tượng điều tra và được xác định sẽ điều
tra th
ực tế. Trong điều tra to
àn b
ộ thì số đơn vị điều tra chính là số đơn vị thuộc đối
tư
ợng điều tra. Trong điều tra không toàn bộ thì số đơn vị điều tra là những đơn vị
đư
ợc chọn ra trong số đơn vị
c
ủa đối tượng điều tra.
17
Xác đ
ịnh đơn vị điều tra chính là xác định nơi cung cấp những dữ liệu cần
thi
ết cho quá tr
ình nghiên c
ứu. Đồng thời đơn vị điều tra là căn cứ để tiến hành tổng
h
ợp, phân tích và dự báo thống kê.
Khi xác đ
ịnh đơn vị điều tra phải că
n c
ứ vào mục đích điều tra và đối tượng
đi
ều tra. Đơn vị điều tra có thể là từng doanh nghiệp, từng của hàng, từng trường
h
ọc , nh
ưng cũng có thể là từng công nhân, từng học sinh Trong một cuộc điều
tra c
ũng có thể dùng nhiều loại đơn vị điều tra để đá
p
ứng những yêu cầu ngh
iên
c
ứu khác nhau. Ví dụ
: Tổng điều tra dân số th
ường dùng hai loại đơn vị điều t
ra là
t
ừng người dân và từng hộ
. Tuy nhiên, trong cu
ộc Tổng điều tra dân số 2009, người
ta đ
ã xác
đ
ịnh đơn vị điều tra là “hộ
dân cư” (hộ dân cư bao g
ồm
m
ột ng
ư
ời ăn, ở
riêng hoặc một nhóm người ăn chung, ở chung).
3.3. N
ội dung điều tra
Nội dung điều tra là mục lục các tiêu thức hay đặc trưng cần thu thập dữ liệu
trên các đơn v
ị điều tra.
T
ừ đơn vị điều tra có thể thu thập được dữ liệu theo nhiều phương
th
ức khác
nhau. Nhưng trong m
ỗi cuộc điều tra ta không cần thu thập dữ liệu theo tất cả các
tiêu th
ức, mà chỉ thu thập theo một số các tiêu thức. Những tiêu thức này đủ đáp
ứng cho mục đích điều tra v
à mục đích nghiên cứu. Vì vậy trong kế hoạch điều tra
phải xác định v
à thống nhất mục lục các tiêu thức cần thu thập dữ liệu, xác định và
thông nh
ất nội dung điều tra. Khi tiến h
ành điều tra cần thu thập dữ liệu theo đúng
n
ội dung điều tra từ tất cả các đơn vị điều tra.
Khi xác định nội dung điều tra phải căn cứ vào mục đích nghiên cứu chung,
m
ục đích điều tra cụ thể, đồng thời phải
tính đ
ến
kh
ả
năng v
ề nhân lực, thời gian,
chi phí Cho nên n
ội dung điều tra chỉ nên bao gồm những tiêu thức hay đặc trưng
quan tr
ọng nhất có liên quan trực tiếp đến mục đích điều
tra và có quan h
ệ chặt chẽ
ho
ặc có thể bổ sung cho nhau, tạo điều kiện thuận lợi cho việc kiểm tra tính chất
chính xác các d
ữ liệu.
M
ỗi tiêu thức trong nội dung điều tra phải được diễn đạt thành câu hỏi ngắn
g
ọn, cụ thể, r
õ ràngđể cả người điều tra và ngư
ời đ
ư
ợc điều tra điều hiểu thống nhất.
3.4. Xác định thời điểm, thời kỳ điều tra
Tu
ỳ theo tính chất, đặt điểm của hiện t
ượng nghiên cứu cần phải xác định
đúng đ
ắn và chặt chẽ thời gia thu thập dữ liệu về hiện tượng.
Thời điểm điều tra: là mốc thời gian được xác định để thống nhất đăng ký dữ
li
ệu của toàn bộ các đơn vị điều tra. Xác định thời điểm điều tra là xác định cụ thể
ngày, gi
ờ để thống nhất đăng ký dữ liệu, tức là xác định ý muốn nghiên cứu trạng
thái, hi
ện tượng ở chính thời điểm đó.
18
Khi xác đ
ịnh th
ời điểm điều tra phải căn cứ v
ào tính chất mỗi loại hiện
tư
ợng, đồng thời phải đảm bảo thuận tiện cho việc đăng ký dữ liệu v
à tính các ch
ỉ
tiêu t
ừ dữ liệu điều tra. Ví dụ tổng điều tra dân số Việt Nam, thời điểm điều tra
đư
ợc xác định là 0 giờ ngày 1 tháng
4 vì
ở thời điểm này dân số ít biến động nhất để
v
ừa đăng ký dữ liệu chính xác, vừa tránh đăng ký tr
ùng, hoặc bỏ sót đơn vị điều tra
khi thu thập dữ liệu.
Th
ời kỳ điều tra:
Là kho
ảng thời gia
n xác đ
ịnh để thống nhất đăng ký dữ liệu
c
ủa các đơn vị điều tr
a trong su
ốt khoản thời gian đó (ngày, tuần, 10 ngày, 1 tháng,
3 tháng hay 1 năm ). Ví d
ụ điều tra số người sinh, chết, chuyển đi, chuyển đến
trong m
ột năm của một địa ph
ương; s
ố lần đi siêu thị trong vòng một tháng qua, số
lượng tập vỡ học sinh sử dụng trong năm học qua Thời kỳ điều tra có thể dài hay
ng
ắn phụ thuộc vào mục đích nghiên cứu.
Th
ời hạn điều tra:
Là th
ời gia
n dành cho vi
ệc đăng ký ghi chép tất cả các dữ
li
ệu điều tra, đ
ược tính từ khi bắt đầu cho đến khi kết thúc toàn bộ việc thu thập dữ
li
ệu. Ví dụ tổng điều tra dân số thời hạn điều tra là trong vòng 10 ngày đầu tháng 4.
Th
ời hạn điều tra dài hay ngắn tuỳ thuộc vào quy mô, tính chất phức tạp của
hi
ện tượng, vào nội dung nghiên cứu, lực lượng tham gia điều tra. Nhưng thời hạn
đi
ều tra không
nên quá dài.
3.5. Bi
ểu điều tra và
b
ảng giải thích ghi biểu
Bi
ểu điều tra:
(còn g
ọi là phiếu điều tra, bảng câu hỏi) là loại bảng in sẵn
theo m
ẫu quy định trong kế hoạch điều tra, đ
ư
ợc sử dụng thống nhất để ghi dữ liệu
của đơn vị điều tra.
Bi
ểu điều tra p
h
ải chứa đựng toàn bộ nội dung cần điều tra, đồng thời phải
thu
ận tiện cho việc ghi chép và kiểm tra dữ liệu, thuận tiện cho tổng hợp.
Trên bi
ểu điều tra, những thang đo định tính sử dụng trong nội dung điều tra
c
ần được mã hoá sẵn tạo điều kiện thuận lợi
cho vi
ệc nhập dữ liệu vào máy tính.
Thư
ờng người ta dùng số liệu để mã hoá.
B
ảng giải thích cách ghi biểu:
Kèm theo bi
ểu điều tra là bản giải thích và
hư
ớng dẫn cụ thể cách xác định và ghi dữ liệu vào biểu điều tra. Nó giúp cho nhân
viên đi
ều tra nhận thức
th
ống nhất các câu hỏi trong biểu điều tra. Nội dung, ý nghĩa
các câu h
ỏi phải đ
ược giải thích một cách khoa học và chính xác. Những câu hỏi
ph
ức tạp có nhiều khã năng trả lời cần có ví dụ cụ thể.
Ngoài nội dung chủ yếu trên, trong kế hoạch điều tra còn c ần đề cập và giải
thích m
ột số vấn đề thuộc phương pháp, tổ chức và tiến hành điều tra như:
- Cách th
ức chọn mẫu
;
19
- Phương pháp thu th
ập dữ liệu và ghi chép ban đầu
;
- Các bư
ớc và tiến độ tiến hành điều tra
;
- T
ổ chức và quy định nhiệm vụ của bộ phận tham
gia đi
ều tra
;
- B
ố trí lực l
ượng điều tra và phân chia khu vực điều tra
;
- T
ổ chức cuộc họp chuẩn bị v
à huấn luyện nhân viên điều tra
;
- Ti
ến h
ành điều tra thử để rút kinh nghiệm
;
- T
ổ chức tuy
ên truyền mục đích, ý nghĩa của cuộc điều tra
4. Sai số trong điều tra thống kê
Trong điều tra thống kê có hai loại sai số: Sai số chọn mẫu (sai số do tính đại
diện của số liệu vì chỉ chọn một bộ phận các đơn vị để điều tra) và sai số phi chọn
mẫu (sai số thuộc về lỗi của các quy định, hướng dẫn, giải thích tài liệu điều tra, do
sai sót của việc cân đong, đo đếm, cung cấp thông tin, ghi chép, đánh m
ã, nh
ập
tin, ) từ đây gọi là "sai số điều tra".
Sai số chọn mẫu chỉ phát sinh trong điều tra chọn mẫu khi tiến hành thu thập
ở một bộ phận các đơn vị tổng thể (gọi là mẫu) rồi dùng kết quả suy rộng cho toàn
bộ tổng thể chung. Sai số chọn mẫu phụ thuộc vào cỡ mẫu (mẫu càng lớn thì sai số
càng nhỏ), vào độ đồng đều của chỉ tiêu nghiên cứu (độ đồng đều cao thì sai số
chọn mẫu càng nhỏ) và phương pháp tổ chức điều tra chọn mẫu. Còn sai số điều tra
xảy ra cả trong điều tra chọn mẫu và điều tra toàn bộ.
Trong thực tế công tác điều tra thống kê hiện nay, phương pháp chọn mẫu
được áp dụng ngày càng nhiều và có hiệu quả. Số liệu thu được từ điều tra chọn
mẫu ngày càng phong phú, đa dạng và phục vụ kịp thời các yêu cầu sử dụng. Bên
cạnh đó chất lượng số liệu của điều tra chọn mẫu c
ũng còn nh
ững hạn chế nhất
định. Có một số ý kiến hiện nay đánh giá không công bằng và thiếu khách quan về
kết quả điều tra chọn mẫu, cho rằng số liệu chưa sát với thực tế vì chỉ điều tra một
bộ phận rồi suy rộng cho tổng thể.
Tất nhiên c
ũng ph
ải thấy rằng đ
ã là đi
ều tra chọn mẫu thì không thể tránh
khỏi sai số chọn mẫu nhưng mức độ sai số chọn mẫu của phần lớn những chỉ tiêu
trong các cuộc điều tra thống kê hiện nay thường là ở phạm vi cho phép nên chấp
nhận được. Hơn nữa khi cần thiết ta có thể chủ động giảm được sai số chọn mẫu
bằng cách điều chỉnh cỡ mẫu và tổ chức chọn mẫu một cách khoa học, tuân thủ
đúng nguyên tắc chọn mẫu.
Điều đáng nói và cần quan tâm hơn trong điều tra thống kê chính là sai số
phi chọn mẫu. Loại sai số này xảy ra ở cả ba giai đoạn điều tra, liên quan đến tất cả
các đối tượng tham gia điều tra thống kê và ảnh hưởng đáng kể đến chất lượng số
20
liệu thống kê.
Dưới đây sẽ đi sâu nghiên cứu về sai số phi chọn mẫu - sai số điều tra, xảy ra
trong cả ba giai đoạn nhưng chỉ đề cập đến sai số liên quan tới những công việc,
những đối tượng thường gặp nhiều hơn.
- Sai số trong quá trình chuẩn bị điều tra thống kê
+ Sai số điều tra liên quan đến xác định mục đích, nội dung, đối tượng điều tra.
+ Sai số liên quan đến xây dựng các khái niệm, định ngh
ĩa dùng trong đi
ều tra.
+ Sai số điều tra liên quan tới thiết kế bảng hỏi, xây dựng các bảng danh mục
và mã số dùng trong điều tra.
+ Sai số điều tra liên quan tới việc lựa chọn điều tra viên và hướng dẫn
nghiệp vụ.
- Sai số trong quá trình tổ chức điều tra
+ Sai số điều tra liên quan đến quan hệ giữa yêu cầu về nội dung thông tin và
quỹ thời gian, các điều kiện vật chất cần cho thu thập số liệu.
+ Sai số điều tra liên quan đến điều tra viên.
+ Sai số điều tra liên quan đến ý thức, tâm lý và khả năng hiểu biết của người
trả lời .
+ Sai số điều tra liên quan đến các phương tiện cân, đong, đo lường.
- Sai số liên quan đến quá trình xử lý thông tin
Sai số điều tra còn có thể xảy ra vì sai sót trong khâu
đánh mã, nh
ập tin trong
quá trình tổng hợp, xử lý số liệu.
+ Số liệu thu về phải được kiểm tra sơ bộ trước khi đánh m
ã, nh
ập tin. Việc
kiểm tra này có thể phát hiện ra những trường hợp hiểu đúng nhưng ghi chép sai.
+ Sai sót trong đánh m
ã có th
ể là lựa chọn mã không phù hợp với nội dung
của thông tin (hoặc là do bảng mã không cụ thể, khó xác định, hoặc là khả năng liên
hệ vận dụng mã của người đánh m
ã không t
ốt), đánh m
ã sai (mã này l
ẫn với mã kia)
hoặc có mã
đúng nhưng l
ộn số (ví dụ 51 thành 15), v.v
+ Sai sót trong khâu nhập tin và khâu này c
ũng thư
ờng xuyên xảy ra sai số.
_______________________
21
Bài 3. MÔ T
Ả DỮ LIỆU BẰNG ĐẶC TRƯNG ĐO LƯỜNG
M
ục tiêu
1. Nêu đư
ợc khái niệm, ý nghĩa và phân loại số tu
y
ệt đối
2. Nêu đư
ợc khái niệm, ý nghĩa và phân loại số tương đối
3. Phân bi
ệt một số loại thường dùng trong thống kê dân số
- y t
ế
___________
1. S
ố tuyệt đối
1.1. Khái niệm và ý nghĩa
Số tuyệt đối là chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng hoặc
quá trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể.
Số tuyệt đối trong thống kê bao gồm các con số phản ánh quy mô của tổng
thể hay của từng bộ phận trong tổng thể (số doanh nghiệp dược, số nhân khẩu, số
học sinh đi học, số lượng bác s
ĩ
, ) hoặc tổng các trị số theo một tiêu thức nào đó
(tiền lương của bác s
ĩ
, giá trị sản xuất công nghiệp dược, v.v ).
Số tuyệt đối trong thống kê bao giờ c
ũng có
đơn vị tính cụ thể. Đơn vị tính
số tuyệt đối có thể là đơn vị hiện vật tự nhiên (cái, con, chiếc, kg, mét, v.v ), đơn vị
hiện vật quy ước tức là đơn vị quy đổi theo một tiêu chuẩn nào đó (nước mắm quy
theo độ đạm; than quy theo hàm lượng calo; xà phòng quy theo tỷ lệ chất béo; vải
quy theo mét độ dài tiêu chuẩn, ), đơn vị tiền tệ (đồng, nhân dân tệ, đô la v.v ),
đơn vị thời gian (giờ, ngày, tháng, năm) và đơn vị kép (tấn-km, ngày -người, ).
Số tuyệt đối dùng để đánh giá và phân tích thống kê, là căn cứ không thể
thiếu được trong việc xây dựng chiến lược phát triển kinh tế, tính toán các mặt cân
đối, nghiên cứu các mối quan hệ kinh tế - xã hội, là cơ sở để tính toán các chỉ tiêu
tương đối và bình quân.
1.2. Các loại số tuyệt đối
Có hai loại số tuyệt đối: Số tuyệt đối thời kỳ và số tuyệt đối thời điểm
Số tuyệt đối thời kỳ: Phản ánh quy mô, khối lượng của hiện tượng trong một
thời kỳ nhất định. Ví dụ: Số trẻ em sinh ra trong 1 quý, năm.
Số tuyệt đối thời điểm: Phản ánh quy mô, khối lượng của hiện tượng ở một
thời điểm nhất định như: dân số của một địa phương nào đó có đến 0 giờ ngày