Tải bản đầy đủ (.pdf) (12 trang)

THU THẬP DỮ LIỆU - XÁC ĐỊNH NHỮNG DỮ LIỆU CẦN THU THẬP doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (233.8 KB, 12 trang )

1
Chương 2. THU THẬP DỮ LIỆU
2.1. Xác định dữ liệu cần thu thập dữ liệu
Chúng ta có thể thu thập rất nhiều dữ liệu liên quan đến hiện tượng nghiên cứu. Vấn đề
đầu tiên của công việc thu thập dữ liệu là xác định rõ những dữ liệu nào cần thu thập, thứ tự ưu
tiên của các dữ liệu này. Nếu không thì chúng ta sẽ mất rất nhiều thời gian, tiền bạc cho những
dữ liệu không quan trọng hay không liên quan đến vấn đề chúng ta nghiên cứu. Xác định dữ liệu
cần thu thập xuất phát từ vấn đề nghiên cứu và mục tiêu nghiên cứu. Nếu vấn đề nghiên cứu và
mục tiêu nghiên cứu càng cụ thể thì xác định dữ liệu cần thu thập càng dễ dàng.
Ví dụ như khi nghiên cứu về vấn đề sinh viên đi làm thêm có ảnh hưởng đến kết quả học
tập hay không, hai nhóm dữ liệu chính cần thu thập là đi làm thêm và kết quả học tập.
a. Về nhóm dữ liệu đi làm thêm, có thể thu thập các dữ liệu liên quan như:
 Có đi làm thêm hay không.
 Mức độ thường xuyên công việc làm thêm như thế nào.
 Thời gian làm thêm hàng ngày, hàng tuần bao nhiêu giờ.
 Tính chất công việc có liên quan với ngành nghề đang được đào tạo hay
không.
 Mục đích của việc đi làm thêm.
 Nơi làm thêm có xa chỗ ở và chỗ học không.
 Có thích thú với công việc không, có giúp ích cho việc học không, giúp ích ở
khía cạnh nào…
b. Một số dữ liệu khác về việc đi làm thêm, nhưng không liên quan lắm đến mục tiêu
nghiên cứu ảnh hưởng của việc đi làm thêm đến kết quả học tập thì không nhất thiết
phải thu thập, ví dụ như:
 Đi làm thêm có phải mặc đồng phục không.
 Có được huấn luyện trước khi làm không.
 Tính chất công việc làm thêm là làm một mình hay làm với nhiều người.
 Người phụ trách công việc là nam hay nữ, có phải là cựu sinh viên của trường
hay không.
 Người cùng làm là nam hay nữ.
 Những người cùng chỗ làm có cùng quê không.


 Việc làm thêm là do tự tìm, hay do quen biết, giới thiệu.
 Có phải trả phí môi giới, giới thiệu việc làm không, trả bao nhiêu…
Qua ví dụ trên chúng ta thấy, nếu không xác định rõ giới hạn, phạm vi dữ liệu thu thập thì
công việc rất nhiều và các dữ liệu thu thập được lại ít ý nghĩa trong việc đáp ứng mục tiêu nghiên
cứu đã đề ra.
Khi thực hiện một nghiên cứu cụ thể, người nghiên cứu có thể sử dụng dữ liệu từ một
nguồn có sẵn đã công bố hay chưa công bố, hay tự mình thu thập các dữ liệu cần thiết cho
nghiên cứu. Có hai loại dữ liệu là dữ liệu thứ cấp và dữ liệu sơ cấp phân theo nguồn. Dữ liệu thứ
cấp là dữ liệu thu thập từ những nguồn có sẵn, đó chính là những dữ liệu đã qua tổng hợp, xử lý.
2
Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu. Ví dụ khi nghiên
cứu về ảnh hưởng của việc đi làm đến kết quả học tập của sinh viên, những dữ liệu liên quan đến
kết quả học tập của sinh viên, những dữ liệu liên quan đến kết quả học tập của sinh viên có thể
của sinh viên có thể lấy từ phòng đào tạo hay thư ký khoa như điểm trung bình, số môn thi lại…
(dữ liệu thứ cấp). Nhưng những dữ liệu này không có sẵn mà chúng ta phải trực tiếp thu thập từ
sinh viên (dữ liệu sơ cấp).
Dữ liệu thứ cấp có ưu điểm là thu thập nhanh, rẻ… nhưng đôi khi ít chi tiết và ít đáp ứng
nhu cầu nghiên cứu. Ngược lại, dữ liệu sơ cấp đáp ứng nhu cầu tốt nhu cầu nghiên cứu nhưng
phải tốn kém chi phí và thời gian rất nhiều.
2.2. Nguồn thu thập dữ liệu
1. Nguồn dữ liệu thứ cấp
Nguồn dữ liệu thứ cấp khá đa dạng, đối với doanh nghiệp có thể sử dụng các nguồn sau:
 Nội bộ: các số liệu báo cáo về tình hình sản xuất, tiêu thụ, tài chính, nhân sự…
của các phòng ban, bộ phận; các số liệu báo cáo từ các cuộc điều tra khảo sát
trước đây.
 Cơ quan thống kê nhà nước: các số liệu do các cơ quan thống kê nhà nước (tổng
cục thống kê, cục thống kê tỉnh/ thành phố…) cung cấp trong Niên giám thống kê.
Nội dung chủ yếu là các dữ liệu tổng quát về dân số, lao động, việc làm, mức
sống dân cư, tài nguyên, đầu tư, kết quả sản xuất cuẩ nền kinh tế, xuất nhập
khẩu…

 Cơ quan chính phủ: số liệu do các cơ quan trực thuộc chính phủ (Bộ, cơ quan
ngang Bộ, Ủy ban nhân dân…) công bố hay cung cấp. Các số liệu này thường chi
tiết hơn và mang đặc tính ngành hay địa phương. Ví dụ như số người mắc bệnh
tiểu đường của cả nước hay của TP. HCM (công ty sản xuất, kinh doanh, xuất
nhập khẩu sản phẩm y tế hay ngành dược sẽ quan tâm đến con số này), số xe tải,
xe buýt quá niên hạn cần thay thế…
 Báo và tạp chí: số liệu mang tính thời sự và cập nhật cao nhưng mức độ tin cậy
phụ thuộc vào nguồn số liệu của chính tờ báo hay tạp chí sử dụng. Ví dụ như số
lượng học sinh, sinh viên các cấp; số lượng trung tâm ngoại ngữ có phép hay
không có phép hoạt động…
 Các tổ chức, hiệp hội, viên nghiên cứu… ví dụ số lượng doanh nghiệp dệt
may…
 Các công ty nghiên cứu và cung cấp cung cấp thông tin theo yêu cầu.
Trong thời đại kỹ thuật số, khá nhiều các dữ liệu thứ cấp đã được nhiều cơ quan chính phủ, các
tổ chức, các đơn vị nghiên cứu, các doanh nghiệp, trường học…
2. Nguồn thu thập dữ liệu sơ cấp
Dữ liệu sơ cấp thường được thu thập theo một quy trình bài bản tùy theo loại nghiên cứu
thống kê là nghiên cứu thử nghiệm hay nghiên cứu quan sát.
3
Trong nghiên cứu thử nghiệm, người nghiên cứu đo đạc và thu thập dữ liệu trên các biến
kết quả trong các điều kiện khác nhau của các biến nguyên nhân có ảnh hưởng đang nghiên cứu.
Trong nghiên cứu mang tính quan sát thì các dữ liệu cần thiết có thể thu thập từ nhiều
người cung cấp thông tin khác nhau như: người chủ hộ gia đình, người đại diện doanh nghiệp
hay cá nhân… bằng nhiều hình thức khác nhau. Người thu thập dữ liệu có thể gặp người cung
cấp thông tin tại địa điểm thuận lợi cho việc thu thập (nhà, văn phòng, trường học…) trực tiếp
hỏi và ghi chép các dữ liệu vào phiếu khảo sát hay bản câu hỏi; hoặc người thu thập có thể gửi
bản câu hỏi đến người cung cấp thông tin tự trả lời vào lúc thuận tiện.
Dữ liệu sơ cấp được thu thập qua các cuộc điều tra, khảo sát. Các cuộc điều tra khảo sát
để thu thập dữ liệu ban đầu có thể được chia thành nhiều loại. Căn cứ vào tính chất liên tục hay
không liên tục của việc ghi chép dữ liệu chia ra điều tra thường xuyên hay không thường xuyên.

Căn cứ vào phạm vi khảo sát và thu thập thực tế chia ra điều tra toàn bộ hay điều tra không toàn
bộ.
a. Điều tra thường xuyên và điều tra không thường xuyên.
Điều tra thường xuyên là tiến hành thu thập, ghi chép dữ liệu ban đầu về hiện tượng nghiên
cứu một cách có hệ thống theo sát quá trình biến động của hiện tượng. Ví dụ thu thập, ghi chép
tình hình biến động nhân khẩu của một địa phương (sinh, tử, đi, đến); trong phạm vi một doanh
nghiệp việc theo dõi, ghi chép hằng ngày về số công nhân đi làm, số lượng sản phẩm sản xuất ra,
số lượng sản phẩm tiêu thụ… là điều tra thường xuyên. Dữ liệu của điều tra thường xuyên là cơ
sở chủ yếu để lập các báo cáo thống kê theo định kỳ.
Điều tra không thường xuyên là tiến hành thu thập, ghi chép dữ liệu ban đầu một cách liên
tục, mà chỉ tiến hành khi có nhu cầu cần nghiên cứu hiện tượng. Dữ liệu của cuộc điều tra không
thường xuyên phản ánh trạng thái hiện tượng tại một thời điểm nhất định. Ví dụ tổng điều tra dân
số, tổng điều tra đất đai nông nghiệp… là những cuộc điều tra không thường xuyên. Các cuộc
điều tra không thường xuyên có thể tiến hành theo định kỳ nhất định (3 tháng, 6 tháng, 1 năm, 2
năm… ) hay không theo định kỳ.
b. Điều tra toàn bộ và điều tra không toàn bộ
Điều tra toàn bộ là tiến hành thu thập, ghi chép dữ liệu trên tất cả các đơn vị của tổng thể
hiện tượng nghiên cứu. Ví dụ tổng điều tra dân số, tổng điều tra tồn kho vật tư, hàng hóa, tổng
điều tra vốn sản xuất, kinh doanh của các doanh nghiệp… là điều tra toàn bộ. Điều tra toàn bộ
cung cấp dữ liệu đầy đủ nhất cho nghiên cứu thống kê, nhất là trong nghiên cứu kinh tế và thị
trường. Nó giúp ta tính được các chỉ số quy mô, khối lượng một cách khá chính xác, cho phép
nghiên cứu cơ cấu, tình hình biến động, đánh giá thực trạng hiện tượng, dự đoán xu hướng biến
động hiện tượng… Nhưng điều tra toàn bộ đòi hỏi chi phí rất lớn về nhân lực, thời gian, chi
phí… vì thế không thể áp dụng cho tất cả các trường hợp nghiên cứu.
4
Điều tra không toàn bộ là tiến hành thu thập, ghi chép dữ liệu trên một số đơn vị được chọn
ra từ toàn bộ các đơn vị thuộc tổng thể hiện tượng nghiên cứu. Tùy theo cách chọn số đơn vị để
tiến hành điều tra thực tế, điều tra không toàn bộ chia thành 3 loại cụ thể sau đây: điều tra
chuyên đề, điều tra chọn mẫu, điều tra trọng điểm.
 Điều tra chuyên đề là tiến hành điều tra trên một số ít các đơn vị của tổng thể nhưng lại

đi sâu nghiên cứu nhiều khía cạnh của đơn vị đó. Mục đích là để khám phá, tìm hiểu các
yếu tố ảnh hưởng đến hiện tượng nghiên cứu. Dữ liệu của điều tra chuyên đề phục vụ cho
nghiên cứu định tính, không để dùng suy rộng, không dùng để tìm hiểu tình hình cơ bản
của hiện tượng mà chỉ rút ra kêt luận về bản thân các đơn vị được điều tra. Kết quả của
điều tra chuyên đề có thể được sử dụng làm cơ sở thiết kế cho một cuộc điều tra trên quy
mô lớn hơn, mang tính chất nghiên cứu định lượng.
Ví dụ điều tra điển hình một số ít sinh viên có đi làm thêm, đạt kết quả học tập tốt
và thành tích nghiên cứu khoa học xuất sắc, vài sinh viên có đi làm thêm nhưng kết quả
học tập kém, bị tạm dừng học tập. Các kêt quả điều tra chuyên đề này giúp ta khám phá
những yếu tố quan trọng có ảnh hưởng đến kết quả học tập của sinh viên, trên cơ sở đó
xác định các dữ liệu cần thu thập trong nghiên cứu định lượng (điều tra chọn mẫu) tiếp
theo để kết luận về ảnh hưởng của việc đi làm thêm đối với kết quả học tập của sinh viên.
Hoặc các kết quả điều tra chuyên đề giúp người nghiên cứu giải thích được nguyên nhân
của các khám phá phát hiện qua cuộc điều tra chọn mẫu hay toàn bộ.
 Điều tra chọn mẫu được thực hiện bằng cách chọn ra một số phần tử hay đơn vị thuộc
tổng thể đơn vị nghiên cứu để thu thập dữ liệu thực tế. Điều tra chọn mẫu được dùng
nhiều nhất trong nghiên cứu vì tiết kiệm thời gian, chi phí và dữ liệu đáng tin cậy. Dữ
liệu của điều tra chọn mẫu được dùng để suy rộng thành các đặc trưng chung cho toàn bộ
tổng thể hiện tượng nghiên cứu.
 Điều tra trọng điểm là tiến hành thu thập dữ liệu trên bộ phận chủ yếu nhất, tập trung
nhất trong toàn bộ tổng thể hiện tượng nghiên cứu. Kết quả thu được từ điều tra trọng
điểm giúp ta nhận biết nhanh tình hình cơ bản của hiện tượng nghiên cứu, chứ không
dùng để suy rộng thành các đặc trưng tổng thể. Ví dụ khi cần nắm nhanh tình hình cơ bản
về sản xuất cao su, cà phê ở nước ta, ta có thể chỉ tiến hành điều tra về sản xuất cao su, cà
phê ở miền Đông Nam Bộ và Tây Nguyên chứ không cần tiến hành trên cả nước.
2.3.Các phương pháp thu thập dữ liệu sơ cấp
2.3.1. Thu thập dự liệu sơ cấp trong nghiên cứu thực nghiệm
Các công ty và các tổ chức thương thực hiện các thực nghiệm hoặc nhóm các thí nghiệm để
thu thập dữ liệu cung cấp cho nhà quản lý để ra những quyết định. Một kế hoạch thực nghiệm
dựa trên ý tưởng cơ bản xác định trước yếu tố quan tâm. Một số nhân tố ảnh hưởng được lựa

chọn, sẽ được điều khiển hoặc thay đổi sao cho tác động của chúng lên yếu tố quan tâm có thể đo
đạc hoặc quan sát được.
5
Ví dụ một nhà máy chế biến khoai tây chiên cần thực hiện các nghiên cứu về quá trình sản
xuất khoai tây. Khách hàng mua khoai chiên của họ đặt ra những tiêu chuẩn nghiêm ngăt về chất
lượng khoai mà họ mua vào, một yếu tố quan trọng là màu sắc của khoai sau khi chiên, chúng
phải có màu vàng nâu đồng đều, không quá nhạt màu cũng không quá sậm màu. Khoai tây chiên
thành phẩm phải làm từ khoai tây chiên gọt vỏ, xắt lát, tẩy trắng, nấu chin một phần và được làm
lạnh- khô. Đó không phải là một quy ttrình đơn giản, vì khoai tây vốn khác nhau ở nhiều mặt
(như hàm lượng đường và độ ẩm), thời gian tẩy trắng, nhiệt độ lúc nấu, cùng các nhân tố khác
cũng thay đổi từ mẻ này qua mẻ khác.
Nhân viên kỹ thuật bắt đầu thí nghiệm của họ bằng cách nhóm các củ khoai tây sống khác
nhau vào những mẻ có tính chất tương tự nhau về môi trường nhiệt độ và thời gian tẩy được thiết
lập ở mức độ mà thiết kế thí nghiệm đã xác định. Sau khi kiểm tra thành phẩm của mẻ đó, họ
tiếp tục thay đổi môi trường và làm tiếp mẻ khác, rồi lại kiểm tra thành phẩm lần nữa. Ghi chép
lại kết quả, ví dụ tỷ lệ phầm trăm không bị cháy đen thay đổi theo mỗi sự kết hợp loại khoai, thời
gian tẩy trắng và nhiệt độ được ghi lại.
2.3.2. Thu thập dữ liệu sơ cấp trong nghiên cứu quan sát
Các hình thức thu thập dữ liệu trong nghiên cứu quan sát như phỏng vấn qua điện thoại, qua
thư, quan sát trực tiếp và phỏng vấn cá nhân khá giống nhau. Các nội dung chính để thu thập dữ
liệu trong nghiên cứu quan sát bao gồm:
- Từ kế hoạch nghiên cứu, nghĩ ra các câu hỏi và thiết kế thành bản câu hỏi hoàn chỉnh.
- Quyết định cách chọn mẫu nếu không khảo sát hết toàn bộ tổng thể.
- Thực hiện việc thu thập dữ liệu: tiếp cận đối tượng và quan sát, ghi nhận dữ liệu.
a. Khảo sát qua điện thoại:
Đây là một phương pháp khá đơn giản để thu được dữ liệu về ý kiến của mọi người. Khảo sát
qua điện thoại là một công cụ thu thập dữ liệu hiệu quả và ít tốn kém. Dĩ nhiên, một số người
được hỏi sẽ từ chối không trả lời, một số người không có nhà khi bạn gọi đến, một số khác
không thể liên lạc được qua điện thoại về lý do này hay lý do khác… Như vậy mẫu bạn dự định
ban đầu cuối cùng được hoàn thành không như dự kiến. Khảo sát qua điện thoại thường ngắn

gọn, câu hỏi thường là những câu hỏi yêu cầu người trả lời lựa chọn câu trả lời từ một số lựa
chọn xác định.
Ví dụ câu hỏi đóng có thể như sau: “Nhà bạn có kết nối internet không?” Trả lời có hoặc
không. “Kết nối qua hình thức dịch vụ nào?” Trả lời: dial-up, ADSL trên đường dây điện thoại,
ADSL trên đường cáp truyền hình hay một hình thức nào khác…
Nội dung các câu trao đổi trong cuộc khảo sát nên được thiết kế sẵn thành văn bản, bao gồm
phát biểu ngắn ở phần đầu giải thích mục đích của khảo sát và bảo đảm với người trả lời của họ
sẽ được giữ bí mật. Phần đầu nên là những câu hỏi liên quan đến vấn đề trọng tâm của khảo sát.
Phần cuối liên quan đến những câu hỏi về thong tin cá nhân người trả lời phỏng vấn (như giới
tính, mức thu nhập, trình độ học vấn…). Những thông tin này sẽ giúp người nghiên cứu có cái
6
nhìn sâu hơn về kết quả khảo sát. Thời gian gọi điện khảo sát phù hợp nhất là từ 7 giờ tối đến 9
giờ tối.
b. Thư hỏi và những khảo sát dạng viết
Ví dụ khảo sát ở dưới dạng một bức thư hỏi gửi qua đường bưu điện, hoặc các bản khảo sát
phát tận tay người được phỏng vấn. Đây là phương tiện thu thập dữ liệu ít tốn kém nhất. Thư hỏi
và khảo sát dạng viết có thể hỏi chi tiết hơn, do đó cũng cần nhiều thời gian để hoàn thành hơn
khảo sát qua điện thoại.
Khảo sát dạng viết gồm cả câu hỏi đóng và mở. Câu hỏi mở là câu hỏi cho phép người được
hỏi tự do trả lời theo đánh giá, ngôn ngữ, nhận định của chính họ. Câu hỏi mở tạo cho người
được hỏi sự linh hoạt hơn khi trả lời; tuy nhiên những trả lời như vậy lại khó khăn trong việc xử
lý và phân tích. Chú ý rằng, khảo sát điện thoại cũng có thể sử dụng cả câu hỏi mở; tuy nhiên
người thực hiện phỏng vấn có thể hiểu sai người trả lời khi phải ghi lại một câu trả lời dài.
Nội dung khảo sát dạng viết cũng nên được định hình sao cho dễ hiểu và rõ ràng để người
được hỏi có thể cung cấp dữ liệu chính xác và đáng tin cậy. Ngoài ra bản khảo sát dạng viết cần
phải dễ nhìn vì bề ngoài của nó như thế nào sẽ ảnh hưởng đến tỷ lệ trả lời, bởi vậy cần phải thiết
kế sao cho trông có vẻ chuyên nghiệp.
Nói chung các khảo sát dạng viết là phương tiện hiệu quả, ít tốn kém để thu thập dữ liệu nếu
bạn có thể khắc phục vấn đề tỷ lệ trả lời thấp.
c. Quan sát trực tiếp và phỏng vấn cá nhân

Quan sát trực tiếp là một công cụ khác, thường được dùng để thu thập dữ liệu. Quá trình
thu thập dữ liệu của kỹ thuật này được thực hiện qua quan sát bằng mắt và dữ liệu được người
thu thập ghi lại dựa trên những gì bản thân người thu thập nhận biết được trong quá trình đó.
Ví dụ, nếu bạn đang muốn khẳng định phương pháp trình bày sản phẩm ở siêu thị có thể đem
lại thoải mái cho người tiêu dùng hay không, bạn hãy thay đổi một số trình bày và quan sát phản
ứng của khách hàng. Nếu bạn là một nhà sản xuất phim, bạn muốn dự đoán bộ phim mới của bạn
có thành công hay không, hãy tổ chức chiếu thử và quan sát phản ứng và nhận xét về bộ phim
khi khan giả rời buổi chiếu.
Để quan sát có hiệu quả, cần dùng những người quan sát đã được đào tạo bài bản, nhưng điều
này làm tăng chi phí. Quan sát cá nhân cũng đòi hỏi nhiều thời gian. Cuối cùng khó khăn nữa là
nhận thức cá nhân của người thực hiện việc thu thập mang tính chủ quan, những người quan sát
khác nhau có thể sẽ nhìn nhận một tình huống không cùng một cách và báo cáo có thể sẽ không
phản ánh cùng một kiểu khác nhau.
Phỏng vấn cá nhân là cách để thu thập dữ liệu từ các đối tượng thông qua hỏi đáp. Phỏng
vấn có thể có cấu trúc hoặc không có cấu trúc, và có thể sử dụng những câu hỏi mở hoặc đóng.
7
Phỏng vấn có cấu trúc là phỏng vấn mà các câu hỏi đã được soạn sẵn thành bản hỏi. Phỏng vấn
không có cấu trúc là phỏng vấn bắt đầu với một hoặc nhiếu câu hỏi chung, rồi phát triển những
câu hỏi sâu hơn dựa trên những câu trả lời trước đã được trả lời như thế nào.
d. Những phương pháp thu thập dữ liệu khác
Thu thập dữ liệu sử dụng những kỹ thuật mới đang dần trở nên thông dụng hơn. Khi sử dụng
thẻ tín dụng hay thẻ ghi nợ, dữ liệu được các nhà bán lẻ cập nhật một cách tự động, thông qu hệ
thống máy vi tính để lưu trữ và xử lý dữ liệu để cung cấp thông tin theo ý muốn của người sử
dụng.
2.4.Các kỹ thuật chọn mẫu
Việc chọn mẫu không cần thiết trong những trường hợp đối tượng nghiên cứu đồng nhất.
Tuy nhiên, nếu bạn đang nghiên cứu một tổng thể có nhiều yếu tố biến đổi thì khi đó một mẫu
được rút ra một cách khoa học từ tổng thể là điều kiện cần thiết vì nó giúp bạn tiết kiệm được
một khoản chi phí và thời gian rất đáng kể so với nghiên cứu toàn bộ.
Ví dụ khi bạn điều tra một tổng thể là một cộng đồng khoảng 1000 hộ gia đình, bạn cần

có nhiều phỏng vấn viên để tiếp cận hết mọi người. Các phỏng vấn viên của bạn có thể không sử
dụng cùng một cách diễn đạt về các câu hỏi, họ cũng có thể không ứng xử tốt như nhau đối với
các đối tượng cần được phỏng vấn thận trọng; họ có thể không cẩn thận như nhau trong việc ghi
chép dữ liệu và mã hóa dữ liệu cho việc phân tích.
Ngoài ra một nghiên cứu mang tính đại diện thường tốt hơn nghiên cứu toàn bộ tổng thể
còn ở chỗ là dữ liệu mẫu có thể có giá trị đo đạc lớn hơn dữ liệu thu thập từ toàn bộ tổng thể.
Từ tổng thể bạn chọn ra mẫu ngẫu nhiên, tính toán các tham số thống kê đặc trưng trên
mẫu để từ đó mô tả về tổng thể, hoặc cũng từ các mối quan hệ, các nhận định trên mẫu mà bạn
có các suy diễn về tổng thể; như vậy là bạn làm việc với mẫu nhưng mục tiêu cuối cùng của bạn
lại là hiểu biết về tồng thể. Mục tiêu đó chỉ đạt được trọn vẹn nếu bảo đảm mẫu đươch chọn thực
sự phản ánh trung thực, đại diện cho toàn bộ tổng thể, cũng như chụp hình toàn cảnh một đối
tượng, bức hình hoàn hảo là bức hình cho bạn thấy trọn vẹn toàn thể đối tượng được thu nhỏ lại
chứ không phải là một góc phía trái hay phía phải…
Có hai kỹ thuật lấy mẫu là kỹ thuật lấy mẫu xác suất và kỹ thuật lấy mẫu phi xác
suất.
2.4.1. Kỹ thuật lấy mẫu xác suất
a. Lấy mẫu ngẫu nhiên đơn giản: là phương pháp chọn mẫu trong đó mỗi đơn vị của tổng
thể được chọn với sự ngẫu nhiên như nhau, hay nói cách khác là các đơn vị tổng thể được
chọn vào mẫu với cơ hội bằng nhau.
Trước hết chuẩn bị khung lấy mẫu hay dàn chọn mẫu gồm danh sách các đơn vị
của tổng thể cần nghiên cứu, cần thu thập dữ liệu. Các đơn vị trong danh sách này có thể
8
được sắp xếp theo một thứ tự nào đó như vần abc, theo quy mô, theo địa chỉ… và được
gán cho một số thứ tự đơn vị thứ 1 đến đơn vị cuối cùng.
Thực hiện lấy mẫu đơn vị ra, bằng nhiều cách như bốc thăm, quay số hay dùng số
ngẫu nhiên…
b. Lấy mẫu hệ thống: là phương pháp lấy mẫu thông qua các bước sau:
 Chuẩn bị danh sách chọn mẫu, xếp thứ tự theo một quy ước nào đó, đánh số thứ tự
cho các đơn vị trong danh sách. Tổng số đơn vị trong danh sách là .
 Xác định cỡ mẫu muốn lấy là .

 Chia N đơn vị tổng thể thành k nhóm theo công thức = / , là khoảng cách
chọn mẫu.
 Trong đơn vị đầu tiên chọn ngẫu nhiên ra 1 đơn vị (có thể bốc thăm, sử dụng bảng
số ngẫu nhiên, biến ngẫu nhiên…), các đơn vị mẫu tiếp theo được chọn cách đơn vị
mẫu đầu tiên này một khoảng ,2 ,3 …
Ví dụ: = 60; = 10 nên có khoảng cách chọn mẫu là: = = 6.
Chọn một số ngẫu nhiên từ 1 đến 6 là số thì các giá trị tiếp theo sẽ là +6; +12;
+18; …; +54.
Trường hợp nếu không chia hết cho tức là là số thập phân ta làm tuần tự các bước
sau:
 Tính khoảng cách chọn mẫu = /
 Chọn một số ngẫu nhiên từ 1 đến , đơn vị mẫu đầu tiên có số thứ tự với số đã
được chọn ra.
 Các đơn vị tiếp theo cách đơn vị mẫu đầu tiên một khoảng là ,2 ,3 …
 Nếu đến hết danh sách đơn vị chưa đủ đơn vị mẫu ta quay trở lại đầu danh
sách với quy ước: +1tương ứng đơn vị thứ nhất; +2tương ứng đơn vị thứ
hai trong danh sách.
Ví dụ: = 13; = 4
Tính khoảng cách chọn mẫu = = 3.25 →chọn = 3.
Chọn một số ngẫu nhiên từ 1 đến 13, ví dụ chọn được số 6, thì các đơn vị mẫu tương ứng sẽ là 6;
9; 12; (12+3-13)=2 (Khi số thứ tự lớn hơn thì số thứ tự= số thứ tự - ).
Cả lấy mẫu ngẫu nhiên đơn giản và lấy mẫu hệ thống cùng đòi hỏi phải cần có danh sách đơn vị.
Trong thực tế chọn mẫu ngẫu nhiên hay hệ thống chỉ được áp dụng trong một giai đoạn nào đó
hay trong giai đoạn cuối cùng của những thủ tục chọn mẫu khác sẽ được trình bày tiếp theo.
c. Lấy mẫu cả khối/ cụm và lấy mẫu nhiều giai đoạn
9
Đầu tiên tổng thể được chia thành nhiều khối, mỗi khối xem như một tổng thể con, lấy ngẫu
nhiên đơn giản khối, sau đó khảo sát hết các đối tượng trong các khối mẫu đã được lấy ra.
Trong trường hợp danh sách đơn vị (danh sách hộ gia đình hay danh sách nhân khẩu của khu
vực khảo sát) không có, người nghiên cứu có thể dùng chọn mẫu cả khối hay chọn mẫu nhiều

giai đoạn. Ưu điểm là không cần có danh sách của tất cả các đơn vị mà chỉ cần có dnah sách các
khối hay của các đơn vị mẫu bậc thấp như danh sách quận, phường, khu phố, tổ dân phố… Khi
áp dụng cách chọn cả khối thì do không có danh sách tất cả các đơn vị nên phải dùng danh sách
các khối. Sauk hi chọn ra các khối mẫu thì khảo sát hết tất cả các đơn vị trong khối đó.
Ví dụ quận 3 có 14 phường, sau khi chọn ra hai phường mẫu thì khảo sát hết tất cả các hộ
trong phường; hoặc quận 3 có 700 tổ dân phố, sau khi chọn ra 7 tổ dân phố mẫu thì sẽ khảo sát
hết tất cả các hộ trong 7 tổ dân phố này.
Trong thực tế, nếu khảo sát hết tất cả các đơn vị khối mẫu đã chọn ra thì: một là cỡ mẫu khảo
sát thực tế quá lớn và chi phí cao; hai là các đơn vị trong cùng một khối có khuynh hướng khá
giống nhau nên không nhất thiết phải khảo sát hết (ví dụ trong cùng một ngõ hẻm, trong cùng
một chung cư, trong cùng một khu biệt thự, trong cùng một khu tập thể trong cùng một lớp…)
Lúc đó trong một khối mẫu chọn ra chỉ khảo sát một số đơn vị trong khối này mà thôi. Lúc này
mỗi khối chính là đơn vị trong khối này mà thôi. Lúc này mỗi khối chính là đơn vị mẫu bậc 1,
mỗi hộ gia đình là đơn vị mẫu bậc 2; và cách chọn mẫu này gọi là chọn mẫu hai giai đoạn.
Ví dụ tổng thể nghiên cứu là quận 3; trong quận 3 có 14 phường chia ra 700 tổ dân phố. Nếu
đơn vị mẫu bậc 1 là phường, ta chọn ngẫu nhiên ra 2 phường mẫu. Từ đó mỗi phường hay mỗi tổ
chọn ra, ta chọn ra các đơn vị mẫu bậc hai là hộ gia đình hay cá nhân…
Hoàn toàn tương tự như vậy chúng ta có chọn mẫu nhiều giai đoạn. Chọn mẫu cả khối hay
chọn mẫu nhiều giai đoạn giúp chúng ta vượt qua điều kiện đầu tiên của chọn mẫu ngẫu nhiên là
phải có danh sách các đơn vị chọn mẫu / khung chọn mẫu ngày từ đầu.
d. Lấy mẫu phân tầng
Chọn mẫu phân tầng sử dụng khi các đơn vị quá khác nhau về tính chất liên quan đến vấn đề
cần nghiên cứu và khảo sát. Theo phương pháp này, tổng thể nghiên cứu được chia thành các
tầng lớp, mục tiêu là để các giá trị của các đối tượng tổng thể ta quan tâm thuộc cùng một tầng
càng ít khác nhau càng tốt. Sau đó các dơn vị mẫu được chọn từ các tầng lớp này theo các
phương pháp lấy mẫu xác suất thông thường như lấy mẫu ngẫu nhiên đơn giản hay lấy mẫu hệ
thống.
Chọn mẫu phân tầng có hai đặc điểm: phân tầng theo đặc điểm gì và phân bố số lượng mẫu
vào các tầng, lớp khác nhau như thế nào. Đặc điểm dùng để phân tầng có liên quan đến nội dung
bạn cần nghiên cứu khảo sát. Ví dụ mục đích chính của cuộc nghiên cứu có thể là cách gửi và số

tiền gửi ngân hàng trung bình của các cá nhân có tiền gửi. Việc gửi tiền chịu ảnh hưởng của mức
10
sống các hộ gia đình (social economic class – SEC: loại A, B, C hay D…). Chúng ta có thể phân
tầng tổng thể theo SEC rồi tiến hành chọn mẫu trong từng tầng lớp.
Giả sử chúng ta cần lấy đơn vị mẫu từ đơn vị tổng thể, các đơn vị tổng thể được phân
tầng thành lớp.
- Nếu dùng phân bổ mẫu đều thì công thức tính số lượng đơn vị mẫu lấy ra trong từng tầng
lớp đơn giản là = = = = .
- Nếu dùng mẫu phân bổ theo tỷ lệ thì công thức tính số lượng đơn vị mẫu lấy ra trong
từng tầng lớp sẽ theo tỷ lệ thức là / tức là = = = = .
Ví dụ: Tại một trường đại học có 20000 sinh viên ở 5 hệ đào tạo và cấp bậc khác nhau được cho
trong bảng sau. Số lượng mẫu dự định lấy ra là 1000 (5% của tổng thể). Nếu phân bổ mẫu từng
tầng theo tỷ lệ thì chúng ta sẽ lấy 5% đơn vị mẫu ở mỗi tầng như trong bảng sau:
Hệ đào tạo/ cấp đào tạo
Số lượng
sinh viên
% sinh viên
Số lượng sinh viên lấy ra từ
từng tầng
Cử nhân hệ chính quy
10000
50%
500
Cử nhân hệ hoàn chỉnh đại học
2000
10%
100
Cử nhân hệ văn bằng hai
2000
10%

100
Cử nhân hệ tại chức
5000
25%
250
Cao học
1000
5%
50
Tổng số
20000
100%
1000
Hoặc chúng ta có thể áp dụng một cách phân bổ đơn vị mẫu vào các tầng khác, đó là
phân bổ đều 1000 mẫu/5 tầng=200 đơn vị mẫu ở mỗi tầng.
Tuy nhiên, khi cầ tính toán chung cho toàn bộ mẫu thì trong đó tính toán cần chọn cơ cấu
mẫu giống với cơ cấu tổng thể nghiên cứu, để kết quả chung của mẫu đại diện được cho toàn bộ
tổng thể.
2.4.2. Kỹ thuật lấy mẫu phi xác suất
Khi không có điều kiện để thực hiện lấy mẫu ngẫu nhiên, lúc đó chúng ta có thể sử dụng lấy
mẫu phi xác suất (hay gọi là phi ngẫu nhiên). Mẫu ngẫu nhiên phi xác suất không đại diện để ước
lượng cho toàn bộ tổng thể, nhưng được chấp nhận trong nghiên cứu khám phá và trong kiểm
định giả thuyết.
a. Lấy mẫu thuận tiện
Lấy mẫu ngẫu nhiên được sử dụng trong nghiên cứu khám phá, để có cảm nhận về “điều gì
đang diễn ra ở thực tế” và để kiểm tra trước bản câu hỏi nhằm bảo đảm là các đặc điểm cần thu
thập dữ liệu trong bảng câu hỏi rõ ràng và không gây lo lắng cho người trả lời. Mẫu thuận tiện
còn được dùng khi bạn muốn có một ước lượng sơ bộ về kết quả bạn quan tâm mà không muốn
mất nhiều thời gian và chi phí.
11

Ví dụ nếu bạn hỏi những sinh viên đang trong thư viện là họ cảm thấy như thế nào về một
vấn đề đang được sinh viên quan tâm và tranh luận tại các trường đại học hiện nay, bạn có thể
thu được nhiều câu trả lời phong phú hơn nếu bạn hỏi các sinh viên đang chơi tại quán café.
Tương tự, nếu bạn quan tâm đến việc du lịch hay giải trí của những phụ nữ ở tầng lớp trung lưu
ở đô thị lớn, nếu bạn chọn chợ là nơi tiếp xúc thì có thể dễ dàng thấy rằng đó là nơi không phù
hợp vì phụ nữ ở tầng lớp trung lưu này sẽ rất ít khi đi chợ. Trong trường hợp này thì siêu thị,
trung tâm mua sắm, nơi chăm sóc da, dưỡng tóc, các câu lạc bộ sẽ phù hợp vì bạn dễ gặp các đối
tượng mà bạn muốn nghiên cứu ở đó.
b. Lấy mẫu định mức
Trong lấy mẫu định thức, bạn sẽ quyết định các tổng thể con (tương tự như các tầng lớp trong
lấy mẫu phân tầng) cần quan tâm tỷ lệ của tổng thể con này trong mẫu của bạn lấy ra. Nếu định
lấy một mẫu 400 người lớn tại một thành phố, người nghiên cứu có thể quyết định rằng, vì giới
tính là một biến độc lập có ảnh hưởng và phụ nữ tạo thành một nửa cảu tổng thể thì một nửa mẫu
phải là phụ nữ và một nửa là nam giới. Hơn nữa bạn lại quyết định rằng một nửa của mỗi phần
giới tính phải có tuổi trên 40 và nửa còn lại trẻ hơn; một nửa là lao động tự do và một nửa là làm
công ăn lương…
Nếu quyết định mẫu định mức, hãy cận thận rằng không nên chỉ chọn những người mà bạn
thích phỏng vấn và tránh những người mà bạn cảm thấy khó chịu hay cảm thấy họ bất hợp tác.
c. Lấy mẫu phán đoán
Trong lấy mẫu phán đoán, bạn chính là người quyết định sự thích hợp các đối tượng để mời
họ tham gia vào mẫu khảo sát. Tuy nhiên vấn đề còn lại là phỏng vấn viên là người trực tiếp
phán đoán sự thích hợp của các đối tượng để họ mời. Do đó, tính đại diện của mẫu khảo sát thực
tế sẽ phụ thuộc nhiều vào kiến thức và kinh nghiệm không những của người nghiên cứu điều tra
mà còn phụ thuộc vào kiển thức và kinh nghiệm của những người đi thu thập dữ liệu trực tiếp.
2.5. Kỹ thuật thiết kế bảng hỏi
Bảng hỏi là công cụ thu thập dữ liệu cho nghiên cứu. Bảng hỏi cần đáp ứng các yêu cầu
sau:
 Xác định dữ liệu cần thu thập
 Xác định dạng phỏng vấn
 Đánh giá nội dung bảng câu hỏi

 Xác định hình thức trả lời
 Xác định cách dùng thuật ngữ
 Xác định trình tự bảng câu hỏi
 Xác định hình thức bảng câu hỏi.
Các loại câu hỏi trong bảng câu hỏi:
 Câu hỏi mở
 Câu hỏi đóng
 Câu hỏi phân đôi
12
 Câu hỏi liệt kê một lựa chọn
 Câu hỏi phân mức
 Câu hỏi chấm điểm
2.6. Kỹ thuật phỏng vấn
Kỹ thuật phỏng vấn đáp ứng các yêu cầu sau:
 Đơn giản và quen thuộc
 Tránh sự dài dòng
 Tránh câu hỏi đa nghĩa
 Tránh câu hỏi gợi ý
 Tránh câu hỏi không công bằng.

×