Tải bản đầy đủ (.pdf) (77 trang)

BÀI GIẢNG MÔN: THỐNG KÊ KINH TẾ (BẬC ĐẠI HỌC) Người biên soạn: Th.S Nguyễn Thị Phương Hảo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.35 MB, 77 trang )

TRƯỜNG ĐẠI HỌC PHẠM VĂN ĐỒNG
KHOA KINH TẾ

BÀI GIẢNG
MÔN: THỐNG KÊ KINH TẾ
(BẬC ĐẠI HỌC)

Người biên soạn: Th.S Nguyễn Thị Phương Hảo

Năm 2020


CHƯƠNG 1: GIỚI THIỆU VỀ THỐNG KÊ KINH TẾ
1.1 Thống kê và các phân nhánh của thống kê
1.1.1 Định nghĩa thống kê
Thống kê là hệ thống các phương pháp dùng để thu thập và xử lý dữ liệu nhằm
phục vụ cho quá trình nghiên cứu và ra quyết định khi dữ liệu được thu thập trong
điều kiện không chắc chắn.
“Thống kê’ có 2 nghĩa: Nghĩa thơng thường là thu thập số liệu; nghĩa rộng là
một môn khoa học về bố trí, hoạch định các quan sát và thí nghiệm; thu thập và phân
tích các số liệu và rút ra kết luận về các số liệu đã phân tích. Do đó, thống kê được coi
là một công cụ của nghiên cứu khoa học, quản lý kinh tế và quản lý xã hội. Đây chính
là “bộ đồ nghề” của các nhà nghiên cứu và lãnh đạo. Tuy nhiên, đôi khi thuật ngữ
thống kê cũng được dùng để chỉ những con số thu thập được từ hoạt động thống kê
mô tả hay thống kê suy luận trên thực tế
Cơ sở lý thuyết cho thống kê là lý thuyết xác suất và thống kê toán. Hiện nay
thống kê đã được ứng dụng rộng rãi trong rất nhiều lĩnh vực như: thống kê dân số,
thống kê xã hội, thống kê trong kinh doanh, thống kê bảo hiểm, thống kê trong giáo
dục, thống kê trong sinh học, thống kê trong y học,…Trong lĩnh vực kinh tế và kinh
doanh, thống kê đóng vai trị là cơng cụ cơ bản để phân tích thực trạng tình hình thơng
qua dữ liệu thu thập và xử lý nhằm tìm hiểu bản chất và tính quy luật của hiện tượng


trong những điều kiện không gian và thời gian cụ thể.
1.1.2 Các phân nhánh của thống kê.
Thống kê thường được phân thành 2 lĩnh vực:
- Thống kê mô tả (Descriptive statistics): là các phương pháp có liên quan
đến việc thu thập số liệu, tóm tắt,trình bày, tính tốn và mơ tả các đặc trưng khác nhau
để phản ánh một cách tổng quát đối tượng nghiên cứu
- Thống kê suy luận (Inferential statistics): là bao gồm các phương pháp ước
lượng các đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên
cứu, dự đoán hoặc đưa ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát
mẫu

1


1.2 Các khái niệm căn bản.
1.2.1 Tổng thể thống kê và đơn vị tổng thể
* Tổng thể thống kê (còn gọi là tổng thể chung) là tập hợp các đơn vị cá biệt
(hay phần tử) thuộc hiện tượng nghiên cứu, cần quan sát, thu thập và phân tích mặt
lượng của chúng theo một hay một số tiêu thức nào đó.
Ví dụ 1.1: Tổng thể các sinh viên trường đại học Phạm Văn Đồng (các sinh
viên có đặc điểm chung là sinh viên của trường….
* Đơn vị tổng thể: là từng đơn vị cá biệt cấu thành nên tổng thể thống kê
Ví dụ 1.2: trong tổng thể sinh viên trường đại học Phạm Văn Đồng thì mỗi sinh
viên là một đơn vị tổng thể…
Tuỳ theo mục đích nghiên cứu mà tổng thể xác định có khác nhau. Muốn xác
định được một tổng thể thống kê, ta phải xác định được tất cả các đơn vị tổng thể của
nó. Thực chất của việc xác định tổng thể thống kê là việc xác định các đơn vị tổng thể.
* Phân loại tổng thể thống kê
Có nhiều cách để phân loại tổng thể thống kê, cụ thể:
-


Căn cứ vào sự nhận biết các đơn vị trong tổng thể

+ Tổng thể bộc lộ: Tổng thể có ranh giới rõ ràng, có thể nhận biết được tất cả
các đơn vị bằng trực quan.
Ví dụ 1.3: Tổng thể các cơng ty có cổ phiếu niêm yết trên sàn giao dịch chứng
khốn TP. Hồ Chí Minh, tổng thể các cổ đông của công ty A…
+ Tổng thể tiềm ẩn: Tổng thể có ranh giới khơng rõ ràng, khơng nhận biết hết
được tất cả các đơn vị trong tổng thể.
Ví dụ 1.4: Tổng thể những doanh nghiệp có hoạt động làm ăn phi pháp, tổng
thể những người mê tín dị đoan…
Trong thực tế, tổng thể tiềm ẩn rất đa dạng, vì vậy cần xác định tổng thể nghiên
cứu là tổng thể bộc lộ hay tiềm ẩn để tìm cách xác định đối tượng cho phù hợp.
-

Căn cứ vào mục đích nghiên cứu

+ Tổng thể đồng chất: Bao gồm những đơn vị giống nhau về một số đặc điểm
chủ yếu có liên quan tới mục đích nghiên cứu.
Ví dụ 1.5: Sản lượng lúa của Việt Nam năm 2018
2


+ Tổng thể không đồng chất: Bao gồm những đơn vị có những đặc điểm chủ
yếu khác nhau có liên quan tới mục đích nghiên cứu.
Ví dụ 1.6: Sản lượng các loại cây năm 2018
-

Căn cứ vào phạm vi nghiên cứu


+ Tổng thể chung: Bao gồm tất cả các đơn vị thuộc đối tượng nghiên cứu.
+ Tổng thể bộ phận: Bao gồm một phần của tổng thể chung.
1.2.2 Mẫu
Mẫu là một bộ phận của tổng thể, đảm bảo được tính đại diện và được chọn ra
để quan sát và dùng để suy diễn cho toàn bộ tổng thể. Như vậy, tất cả các phần tử của
mẫu phải thuộc tổng thể, nhưng ngược lại các phần tử của mẫu thì chưa chắc thuộc
mẫu. Điều này tưởng chừng đơn giản, tuy nhiên trong một số trường hợp việc xác
định mẫu cũng có thể dẫn đến nhầm lẫn, đặc biệt là trong trường hợp tổng thể ta
nghiên cứu là tổng thể tiềm ẩn
Ngoài ra, chọn mẫu như thế nào để làm cơ sở suy diễn cho tổng thể, tức là mẫu
phải mang tính đại diện cho tổng thể. Điều này thực sự không dễ dàng, ta chỉ hạn chế
tối đa sự sai biệt này thơi chứ khơng thể khắc phục được hồn tồn
1.2.3 Tiêu thức (biến) thống kê
Là đặc điểm của đơn vị tổng thể chọn ra để nghiên cứu tùy theo mục đích
nghiên cứu khác nhau. Như vậy, tiêu thức thống kê không phải là tất cả những đặc
điểm của đơn vị tổng thể mà chỉ là những đặc điểm được chọn ra để nghiên cứu.
Ví dụ 1.7: Mỗi sinh viên là một đơn vị tổng thể có các đặc điểm như: tên, tuổi,
giới tính, điểm trung bình chung học tập.... Mỗi đặc điểm này khi được chọn ra để
nghiên cứu là một tiêu thức thống kê
Mỗi tiêu thức thống kê đều có các giá trị biểu hiện của nó, dựa vào sự biểu hiện
của nó người ta chia ra làm 2 loại:
- Tiêu thức thuộc tính: là loại tiêu thức mà biểu hiện của nó khơng phải là
những con số cụ thể mà là những tên gọi, từ ngữ dùng để phản ánh tính chất của đơn
vị tổng thể
Ví dụ 1.8: giới tính, dân tộc, tơn giáo, tình trạng hơn nhân (có gia đình hay chưa),...

3


- Tiêu thức số lượng: là loại tiêu thức mà biểu hiện của nó là những con số cụ

thể phản ánh đặc trưng của đơn vị tổng thể mà có thể cân, đong, đo, đếm được và
những con số đó được gọi là lượng biến của tiêu thức
Ví dụ 1.9: độ tuổi, số lượng công nhân, năng suất lao động, mức tiền lương,...
Có hai loại lượng biến:
- Lượng biến rời rạc: Là lượng biến mà các giá trị có thể có của nó chỉ nhận

những giá trị ngun
Ví dụ 1.10: Số sinh viên trong 1 trường đại học, số nhân khẩu trong 1 hộ gia
đình, số thành phẩm nhập kho trong 1 ngày tại một phân xưởng,…
- Lượng biến liên tục: Là lượng biến có khả năng nhận mọi giá trị trên trục số.
Ví dụ 1.11: Trọng lượng, chiều cao của 1 học sinh; năng suất lao động của một
công nhân…
* Tiêu thức chỉ có 2 biểu hiện khơng trùng nhau trên 1 đơn vị tổng thể gọi là
tiêu thức thay phiên
Ví dụ 1.12: Tiêu thức giới tính (nam – nữ), sinh tử, tiêu thức chất lượng
(đạt/không đạt)…
1.2.4 Chỉ tiêu thống kê
Là tiêu chí mà biểu hiện bằng số của nó phản ánh quy mơ, tốc độ phát triển, cơ
cấu, quan hệ tỉ lệ của hiện tượng kinh tế - xã hội trong điều kiện thời gian và không
gian cụ thể.
Ví dụ 1.13: Dân số hiện tại của Việt Nam là 96.993.385 người vào ngày
12/01/2019 theo số liệu mới nhất từ Liên Hợp Quốc. (Nguồn: Lợi nhuận của công ty B trong năm 2018 là 3 tỷ đồng,...
* Phân loại chỉ tiêu thống kê
Có nhiều cách thức phân loại chỉ tiêu thống kê khác nhau. Phân theo nội dung
phản ánh thì chỉ tiêu thống kê chia làm 2 loại:
- Chỉ tiêu khối lượng: là chỉ tiêu nêu lên các đặc điểm chung về quy mô, khối
lượng đơn vị tổng thể.
Ví dụ 1.14: chỉ tiêu số nhân khẩu, khối lượng sản phẩm, số cơng nhân, diện tích
gieo trồng, tổng số dân số....


4


- Chỉ tiêu chất lượng: là chỉ tiêu biểu hiện các tính chất, trình độ phổ biến, mối
quan hệ tổng thể.
Ví dụ 1.15: chỉ tiêu năng suất lao động, giá thành đơn vị sản phẩm,....
Trước khi tiến hành nghiên cứu thống kê việc trước tiên là phải xác định hệ
thống chỉ tiêu thống kê. Hệ thống chỉ tiêu thống kê là tập hợp các chỉ tiêu thống kê
phản ánh các mặt, các tính chất quan trọng có liên quan với nhau, bổ sung cho nhau
được gắn liền với mục tiêu nghiên cứu nhất định của một tổng thể.
1.3 Các loại thang đo trong thống kê
Để lượng hoá hiện tượng nghiên cứu, tuỳ theo tính chất của dữ liệu, thống kê
đo lường bằng 4 loại thang đo chủ yếu sau:
1.3.1 Thang đo định danh:
Thang đo định danh là thang đo dùng các mã số để phân loại các đối tượng.
Thang đo dịnh danh không mang ý nghĩa nào cả mà chỉ để lượng hố các dữ liệu cần
cho nghiên cứu. Nó thường được sử dụng cho các tiêu thức thuộc tính. Người ta
thường dùng các chữ số tự nhiên như 1, 2, 3, 4... để làm mã số.
Ví dụ 1.16: - Giới tính: người ta thường mã số nam là 1; nữ là 2.
- Tình trạng gia đình: 1: Độc thân ; 2: Kết hôn; 3: Ly dị; 4: Khác.
* Đặc điểm: Các con số trên thang đo không biểu thị quan hệ hơn kém, cao
thấp nhưng khi chuyển từ số này sang số khác thì dấu hiệu đo đã có sự thay đổi về
chất. Khơng áp dụng các phép tính khi sử dụng loại thang đo này mà chỉ đếm được tần
số xuất hiện của từng biểu hiện.
1.3.2 Thang đo thứ bậc:
Thang đo thứ bậc là thang đo sự chênh lệch giữa các biểu hiện của tiêu thức có
quan hệ thứ bậc hơn kém. Sự chênh lệch này không nhất thiết phải bằng nhau. Nó được
dùng cho cả tiêu thức thuộc tính và tiêu thức số lượng.
Ví dụ 1.17: - Tiền lương của công nhân trong doanh nghiệp hàng tháng là: <
800 ngàn đồng; từ 800-1000 ngàn đồng; từ 1000-1500 ngàn đồng và > 1500 ngàn

đồng.
- Bậc thợ (7 bậc), chất lượng sản phẩm, xếp hạng huân huy chương...
* Đặc điểm: Loại thang đo này được dùng nhiều trong nghiên cứu xã hội, đo
các tiêu thức mà các biểu hiện có quan hệ thứ tự như thái độ, quan điểm của con
5


người đối với các hiện tượng xã hội. Với thang đo này, có thể tính tốn đặc trưng
chung cho một tổng thể một cách tương đối qua tính số bình qn, cịn đối với một
đơn vị tổng thể thì khơng thực hiện được.
Ví dụ 1.18: Để đánh giá độ tự tin của bạn khi được giao một công việc mới,
người ta đưa ra một thang đo thứ bậc với 3 nấc: 1. Rất tự tin, 2. Tương đối tự tin, 3.
Không tự tin. Con số 1, 2, 3 ở đây khơng có nghĩa là bạn tự tin gấp 2, gấp 3 lần mà chỉ
biểu thị quan hệ hơn kém. Tuy nhiên, ta không thể xác định được mức độ cao thấp
giữa các nhóm, khoảng cách giữa các biểu hiện cũng không bằng nhau.
1.3.3 Thang đo khoảng:
Thang đo khoảng là thang đo thứ bậc nhưng có khoảng cách đều nhau và khơng
có điểm gốc khơng (0) tuyệt đối.
Ví dụ 1.19: Tiêu thức nhiệt độ khơng khí, 0oC là một biểu hiện; tiêu thức điểm
thi, điểm 0 là một biểu hiện chứ khơng có nghĩa là khơng có điểm.
* Đặc điểm: Có thể sử dụng các phép tính cộng, trừ và có thể tính được các đặc
trưng của dãy số như số bình qn, phương sai... nhưng khơng tính được tỷ lệ giữa các
trị số đo. Hạn chế cơ bản của thang đo khoảng là chưa có giá trị “khơng tuyệt đối” mà
chỉ có giá trị 0 quy ước.
Ví dụ 1.20: Nhiệt độ trung bình của thành phố A là 30oC, thành phố B là 10oC,
nhưng điều đó khơng có nghĩa là thành phố A nóng gấp 3 lần thành phố B.
1.3.4 Thang đo tỷ lệ:
Thang đo tỷ lệ là thang đo khoảng có điểm gốc khơng (0) tuyệt đối.
* Đặc điểm: Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường các hiện
tượng kinh tế – xã hội . Có thể thực hiện tất cả các phép tính với trị số đo và có thể so

sánh các tỷ lệ giữa các trị số đo.
1.4 Dữ liệu dùng trong thống kê
Khi nghiên cứu bất kỳ hiện tượng kinh tế nào việc đầu tiên là thu thập dữ liệu,
sau đó trình bày dữ liệu và phân tích. Dữ liệu là những sự kiện và con số được thu
thập, phân tích và tóm lược nhằm trình bày và giải thích về các hiện tượng nghiên cứu
* Phân loại dữ liệu.
Có nhiều tiêu chí để phân loại dữ liệu. Tuỳ thuộc vào mục đích, ý nghĩa và
phạm vi ứng dụng mà người ta có thể lựa chọn những tiêu thức phù hợp. Ở đây trình
bày một số phân loại dữ liệu được sử dụng chủ yếu trong nghiên cứu thống kê.
6


-

Căn cứ tính chất của thơng tin:

Có hai loại dữ liệu chủ yếu là dữ liệu định tính và dữ liệu định lượng.
* Dữ liệu định tính là dữ liệu phản ánh tính chất và sự hơn kém về tính chất của
đối tượng nghiên cứu.
Ví dụ 1.21: giới tính của sinh viên (nam, hay nữ); thời gian tự học ở nhà dài
hay ngắn
Dữ liệu định tính được thu thập dễ hơn và người ta thường dùng các thang đo
định danh hay thứ bậc để xác định.
* Dữ liệu định lượng là dữ liệu phản ánh mức độ hay mức độ hơn, kém theo
một tiêu thức số lượng nào đó của đối tượng nghiên cứu.
Ví dụ 1.22: độ tuổi của sinh viên, thời gian tự học 1 ngày, 1 tuần.
Dữ liệu định lượng trong nghiên cứu thống kê thường gặp nhiều hơn, dễ áp
dụng những phương pháp tính tốn, phân tích hơn. Khi xác định các dữ liệu định tính,
người ta thường dùng thang đo khoảng cách hay thứ bậc.
Mục đích của cách phân loại này nhằm giúp cho người nghiên cứu xác định

trước các phương pháp xử lý, tổng hợp và phân tích cần sử dụng cho từng loại dữ liệu
sao cho phù hợp và đáp ứng mục tiêu nghiên cứu đặt ra.
- Căn cứ nguồn cung cấp:
Theo nguồn cung cấp thơng tin có hai loại dữ liệu: dữ liệu thứ cấp và dữ liệu sơ cấp.
* Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn có sẵn. Những dữ liệu này
đã qua tổng hợp, xử lý cơng bố hay xuất bản.
Ví dụ 1.23: Những dữ liệu về kết quả học tập của sinh viên có thể lấy ở phòng
đào tạo hay trợ lý đào tạo của từng khoa
Dữ liệu thứ cấp có ưu điểm là thu thập nhanh, rẻ nhưng thiếu chi tiết và đôi khi
không đáp ứng đúng yêu cầu nghiên cứu.
Nguồn dữ liệu thứ cấp khá phong phú thường gặp ở các nguồn chủ yếu sau:
- Nội bộ: Các số liệu báo cáo về tình hình sản xuất, tiêu thụ, tài chính, vật tư,
nhân sự... của các phòng ban, bộ phận; các số liệu báo cáo từ các cuộc điều tra khảo
sát trước đây ở từng đơn vị (doanh nghiệp, cơ quan, ban, ngành...).

7


- Cơ quan thống kê nhà nước: Các số liệu do các cơ quan thống kê nhà nước
(Tổng cục Thống kê, Cục Thống kê, Phòng Thống kê...) cung cấp trong các niên giám
thống kê.
- Cơ quan chính phủ: Số liệu do các cơ quan trực thuộc Chính phủ (Bộ, cơ quan
ngang bộ, Uỷ ban nhân dân các cấp) công bố hay cung cấp. Các số liệu này thường chi
tiết hơn, mang tính chất đặc thù của ngành hay địa phương.
- Sách, báo, tạp chí đã xuất bản. Các số liệu này thường mang tính thời sự và
cập nhật cao, mức độ tin cậy tuỳ thuộc vào nguồn số liệu của từng tờ báo hay tạp chí;
- Các tổ chức, hiệp hội, viện nghiên cứu, trường đại học;
- Các công ty nghiên cứu và cung cấp thông tin.
* Dữ liệu sơ cấp (thơng tin gốc) là dữ liệu khơng có sẵn, dữ liệu ban đầu thu
thập trực tiếp từ đối tượng nghiên cứu.

Ví dụ 1.24: Các dữ liệu có liên quan đến việc tự học của sinh viên là các dữ
liệu sơ cấp, khơng có sẵn mà chúng ta muốn có phải điều tra từ sinh viên.
- Dữ liệu sơ cấp có ưu điểm là chi tiết, độ tin cậy cao đối với các tình huống cụ
thể. Song hạn chế của nó là thu thập tốn kém, phụ thuộc vào trình độ chủ quan của
người nghiên cứu (nhất là những tình huống dự báo).
CÂU HỎI ƠN TẬP CHƯƠNG 1
1. Trình bày các khái niệm căn bản thường được dùng trong thống kê
2. Trình bày các loại thang đo trong thống kê

8


CHƯƠNG 2: THỐNG KÊ MÔ TẢ
Dữ liệu mới thu thập được thường rất nhiều và rối rắm, khó nhận thức về hiện
tượng nghiên cứu. Các phương pháp thống kê mô tả giúp tóm lược dữ liệu, lược bỏ
những thứ rườm rà, khó hiểu, nhờ đó nhận thức được những đặc trưng cốt lõi nhất
của hiện tượng
2.1 Mô tả dữ liệu cho một tiêu thức định tính bằng bảng phân phối và biểu đồ
2.1.1 Lập bảng phân phối
- Trường hợp tiêu thức thuộc tính có ít biểu hiện: Mỗi biểu hiện của tiêu thức
có thể hình thành 1 tổ.
Ví dụ 2.1: 2 giới tính, 5 thành phần kinh tế...
- Trường hợp tiêu thức thuộc tính có nhiều biểu hiện: Ghép một số tổ nhỏ
thành tổ lớn tùy theo đặc điểm hiện tượng và yêu cầu về mức độ chi tiết khi phân tổ.
Cần bảo đảm yêu cầu các tổ nhỏ được ghép phải giống nhau hoặc gần giống nhau về
đặc điểm và tính chất. Việc ghép tổ này đạt được hai mục đích, làm cho số tổ ít đi và
đảm bảo giữa các tổ có sự khác nhau về đặc điểm, tính chất.
Ví dụ 2.2: Mặc dù chỉ có 5 thành phần kinh tế nhưng theo mục đích nghiên
cứu, ta chỉ cần phân tổ theo 2 thành phần: Nhà nước và ngồi Nhà nước.
2.1.2 Trình bày bằng biểu đồ

Phân phối của tiêu thức định tính thường được mơ tả (trình bày) bằng biểu đồ
hình trịn hay biểu đồ hình thanh. Trình bày dữ liệu trong bảng phân phối lên đồ thị
thích hợp sẽ giúp ta mơ tả tóm tắt các đặc trưng phân phối của hiện tượng nghiên cứu
bằng hình ảnh
2.2 Mô tả dữ liệu cho một tiêu thức định lượng bằng bảng phân phối và biểu đồ
2.2.1 Lập bảng phân phối
Căn cứ vào mức độ thay đổi lượng biến của tiêu thức mà ta phân ra hai trường
hợp sau:
- Trường hợp 1: Tiêu thức số lượng có ít biểu hiện
Mỗi lượng biến hình thành một tổ (số tổ bằng số lượng biến). Trường hợp này
được gọi là phân tổ không có khoảng cách tổ.

9


Ví dụ 2.3: Phân tổ cơng nhân sản suất trong một công ty dệt theo số máy do
mỗi công nhân đảm trách, như số nhân khẩu trong gia đình, Phân tổ công nhân doanh
theo bậc thợ….
- Trường hợp 2: Tiêu thức số lượng có nhiều biểu hiện
- Ta phân tổ có khoảng cách tổ và mỗi tổ có một giới hạn
+ Giới hạn trên: lượng biến nhỏ nhất của tổ
+ Giới hạn dưới: lượng biến lớn nhất của tổ
+ Tổ thiếu một trong hai giới hạn gọi là tổ mở.
+ Trị số chênh lệch giữa giới hạn trên và giới hạn dưới của mỗi tổ gọi là
khoảng cách tổ
- Cần chú ý mối liên hệ giữa lượng và chất trong phân tổ, xét cụ thể xem lượng
biến tích luỹ đến một mức độ nào đó thì chất của hiện tượng mới thay đổi và làm nảy
sinh ra một tổ khác.
- Tùy theo mục đích nghiên cứu, người ta phân ra: phân tổ có khoảng cách tổ
đều và phân tổ có khoảng cách tổ khơng đều

- Phân tổ có khoảng cách tổ đều nhau: được thực hiện với những hiện tượng
tương đối đồng nhất về mặt loại hình kinh tế xã hội và lượng biến mà sự biến đổi về
chất đều đặn từ nhỏ đến lớn, thấp đến cao có hai trường hợp như sau:
+ Đối với lượng biến liên tục, việc phân tổ gồm các bước sau đây:
3

Bước 1: Xác định số tổ 𝑛 ≈ √2 × 𝑘 , với k là số quan sát (cỡ mẫu).
Bước 2: Xác định khoảng cách tổ : ℎ =

𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛
𝑛

Trong đó: xmax và xmin tương ứng là lượng biến lớn nhất và lượng biến nhỏ nhất
của tiêu thức
Bước 3: Sắp xếp các đơn vị vào từng tổ
Lưu ý: Nếu giá trị quan sát trùng với giới hạn trên của một tổ thì nó được xếp
và tổ tiếp theo.
Ví dụ 2.4: Phân tổ 30 công nhân tại một doanh nghiệp theo tiêu thức mức thu
nhập tháng của một công nhân. Biết rằng số liệu thu thập được như sau.

10


Đơn vị: 1000 đồng
3.000

3.200

3.350


3.200

3.700

3.500

3.800

3.900

4.000

3.850

3.400

3.500

3.600

3.400

3.600

3.600

3.500

3.600


3.750

3.500

3.400

3.550

4.000

3.100

3.550

3.600

3.550

3.600

3.400

3.400

Nếu dự kiến chia thành 5 tổ thì ℎ =

4.000−3.000
5

= 200


Dựa vào h = 200 ta thành lập các tổ và sắp xếp số công nhân vào các tổ thích
hợp. Khi đó ta có bảng phân tổ công nhân theo mức thu nhập tháng:
Mức thu nhập tháng của một công nhân
(1000 đồng)

Số công nhân
(người)

Từ 3000 đến dưới 3.200

2

Từ 3.200 đến dưới 3.400

3

Từ 3.400 đến dưới 3.600

12

Từ 3.600 đến dưới 3.800

8

Từ 3.800 đến 4.000

5

Tổng


30

Nếu số tổ được phân khơng theo u cầu cho trước thì ta tính số tổ 𝑛 =
3

√2 × 𝑘 ≈ 4, sau đó tính khoảng cách tổ h và phân tổ tương tự như trên.

+ Đối với lượng biến rời rạc, các tổ được thiết lập theo quy định như sau: giới
hạn dưới của tổ sau lớn hơn giới hạn trên của tổ trước (thường là một đơn vị) và trị số
của khoảng cách tổ được xác định theo công thức dưới đây:
h=

xmax − xmin − (n − 1)
𝑛

11


Ví dụ 2.5: Có tài liệu về số cơng nhân của 20 doanh nghiệp sản xuất công
nghiệp như sau:
Doanh
nghiệp

1

2

3


4

5

6

7

8

9

10

Số công 1.200 1.304 1.500 1.670 1.400 1.430 1.350 1.240 1.700 1.800
nhân
Doanh
nghiệp

11

12

13

14

15

16


17

18

19

20

Số công 1.650 2.050 2.120 1.980 2.400 2.883 2.540 2.760 2.300 2.130
nhân
Giả sử chia 20 doanh nghiệp này thành bốn tổ có khoảng cách đều nhau theo
tiêu thức số cơng nhân, khi đó:
ℎ=

(2.883−1.200)−(4−1)
4

= 420 cơng nhân

Dựa vào h = 420, ta thành lập các tổ và sắp xếp các đơn vị tổng thể vào các tổ
thích hợp như sau:
Số cơng nhân của doanh nghiệp

Số doanh nghiệp

1.200 – 1.620

7


1.621 – 2.041

5

2.042 – 2.462

5

2.463 – 2.883

3

Tổng

20

+ Phân tổ có khoảng cách tổ khơng đều: được áp dụng khi hiện tượng có lượng
biến trên các đơn vị tổng thể biến động không đều. Khi đó ta phân tổ dựa trên việc
phân tích quan hệ lượng - chất, có nghĩa là khi lượng biến thay đổi làm cho chất thay
đổi thì phải hình thành tổ mới, còn khi lượng biến thay đổi mà chất vẫn chưa thay đổi
thì ghép các đơn vị đó vào một tổ.

12


Ví dụ 2.6: Để nghiên cứu lực lượng lao động của một nước, một địa phương
người ta phân tổ dân số theo độ tuổi như sau:
+ < 6 tuổi: giáo dục mầm non
+ 6 – 18 tuổi: giáo dục phổ thông
+ 19 – 55 tuổi: trong độ tuổi lao động

+ > 55 tuổi: ngồi độ tuổi lao động nhưng có khả năng lao động
2.2.2 Trình bày bằng biểu đồ
Phân phối của tiêu thức định lượng thường được mô tả bằng các loại biểu đồ
như biểu đồ điểm, biểu đồ phân phối, biểu đồ hình cung hay biểu đồ cành và lá
2.3 Mô tả một tiêu thức định lượng bằng các chỉ tiêu thống kê
2.3.1 Các chỉ tiêu đo lường khuynh hướng tập trung.
Khi cần nhận thức khái quát nhất về một tiêu thức định lượng điều trước tiên
chúng ta cần biết là tâm điểm của biến. Các chỉ tiêu thống kê đo lường khuynh hướng
tập trung đáp ứng yêu cầu này. Có 3 loại chỉ tiêu thường dùng nhất là số trung bình,
trung vị và mode
2.3.1.1 Số trung bình
Số bình quân cộng được tính bằng cách lấy tổng lượng biến của tiêu thức chia
cho tổng số đơn vị tổng thể (tổng các tần số).
a)Trường hợp dữ liệu mẫu
+ Với dữ liệu khơng có tần số: 𝑥̅ =

𝑥1 +𝑥1 +𝑥3 +⋯+𝑥𝑛
𝑛

=

∑𝑛
𝑖=1 𝑥𝑖
𝑛

Trong đó: - 𝑥̅ : Số trung bình mẫu
- xi : các lượng biến (i = 1, 2,...., n)
- n: số đơn vị tổng thể.
+ Với dữ liệu có tần số : 𝑥̅ =


𝑥1 ×𝑓1 +𝑥2 ×𝑓2 +⋯.+𝑥𝑛 ×𝑓𝑛
𝑓1 +𝑓2 +⋯.+𝑓𝑛

=

∑𝑛
𝑖=1 𝑥𝑖 ×𝑓𝑖
∑𝑛
𝑖=1 𝑓𝑖

Trong đó: - xi là các lượng biến (i = 1, 2,...., n)
- fi là các tần số (quyền số) của lượng biến (i = 1, 2, 3,..., n)
Ví dụ 2.7 : Có số liệu về tiền lương của 50 công nhân thể hiện như sau:

13


Tiền lương (1000 đồng) (xi )

Số công nhân (fi)

500

5

2.500

650

8


5.200

800

20

16.000

950

10

9.500

1000

7

7.000

Cộng

50

40.200

xi x fi

Tiền lương bình qn tháng của một cơng nhân :

𝑥̅ =

∑𝑛
𝑖=1 𝑥𝑖 ×𝑓𝑖
∑𝑛
𝑖=1 𝑓𝑖

=

40.200
50

= 804 (1.000 đồng)

Vậy tiền lương bình quân 1 công nhân/1 tháng là 804 ngàn đồng.
 Một số trường hợp đặc biệt:
- Với dữ liệu được phân tổ có khoảng cách tổ
∑𝑛𝑖=1 𝑥𝑖 × 𝑓𝑖
𝑥̅ =
∑𝑛𝑖=1 𝑓𝑖
Trong đó: - 𝑥𝑖 = (𝑥𝑖𝑚𝑖𝑛 + 𝑥𝑖𝑚𝑎𝑥 )/2: trị số giữa tổ i
- fi là các tần số (quyền số) của lượng biến (i = 1, 2, 3,..., n)
Ví dụ 2.8: có bảng phân phối tần số 600 người tiêu dùng
Độ tuổi

Tần số (fi)

Trị số giữa (xi)

Dưới 16


20

16-25
26-45
46-60
Trên 60

180
260
100
40

10,5
20,5
35,5
53
68

Trong đó, tổ đầu và tổ cuối gọi là tổ mở có trị số giữa được tính dựa vào khoảng
cách tổ của tổ gần chúng nhất
Trị số giữa của tổ thứ nhất: (15+(15-9))/2 =10,5
Trị số giữa của tổ cuối: (61+(61+14))/2=68
14


Tuổi trung bình của 600 người tiêu dùng
∑𝑛
𝑖=1 𝑥𝑖 ×𝑓𝑖


𝑥̅ =

∑𝑛
𝑖=1 𝑓𝑖

=

10,5×20+20,5×180+35,5×260+53×100+68×40
20+180+260+100+40

= 35,25 (tuổi)

- Trường hợp tính số trung bình có thể dùng quyền số là số tương đối kết cấu của
từng bộ phận trong tổng thể đó.
Cơng thức tính: 𝑥̅ =

∑𝑛
𝑖=1 𝑥𝑖 ×𝑓𝑖
∑𝑛
𝑖=1 𝑓𝑖

=

𝑓𝑖
∑𝑛
𝑖=1 𝑥𝑖 ×

∑ 𝑓𝑖

𝑓𝑖

∑𝑛
𝑖=1

=

∑ 𝑓𝑖

∑𝑛
𝑖=1 𝑥𝑖 ×𝑑𝑖
∑𝑛
𝑖=1 𝑑𝑖

𝑓

Trong đó: 𝑑𝑖 = ∑ 𝑖 là tỉ trọng của từng bộ phận trong tổng thể
𝑓𝑖

+ 𝑥̅ = ∑𝑛𝑖=1 𝑥𝑖 × 𝑑𝑖 : nếu di biểu hiện số lần
+ 𝑥̅ =

∑𝑛
𝑖=1 𝑥𝑖 ×𝑑𝑖
100

: nếu di biểu hiện bằng số %

Ví dụ 2.9: Có số liệu về mức lương và tỷ trọng số cơng nhân nhận mức lương đó
trong tổng số công nhân như sau:
Tiền lương (1000 đồng) (xi )


Số cơng nhân (di) (100%

500

10

650

16

800

40

950

20

1000

14

Cộng

100

Áp dụng cơng thức:
𝑥̅ =

∑𝑛

𝑖=1 𝑥𝑖 ×𝑑𝑖
100

=

500×10+650×16+800×40+950×20+1000×14
100

= 804 (1.000 đồng)

b) Trường hợp dữ liệu tổng thể
Các công thức tính số trung bình tổng thể tương tự số trung bình mẫu.Tuy nhiên
để phân biệt người ta thường dùng ký hiệu khác nhau như sau:
+ Với dữ liệu không có tần số: 𝜇̅ =

∑𝑛
𝑖=1 𝑥𝑖

15

𝑁


Trong đó: - 𝜇̅ : Số trung bình tổng thể
- xi : các lượng biến (i = 1, 2,...., n)
- N: số đơn vị tổng thể của tổng thể
+ Với dữ liệu có tần số : 𝜇̅ =

∑𝑛
𝑖=1 𝑥𝑖 ×𝑓𝑖

∑𝑛
𝑖=1 𝑓𝑖

Trong đó: - xi là các lượng biến (i = 1, 2,...., n)
- fi là các tần số (quyền số) của lượng biến (i = 1, 2, 3,..., n)
2.3.1.2 Mode (Mo)
a) Khái niệm: Mode là biểu hiện của một tiêu thức xuất hiện nhiều lần nhất
trong tổng thể hay trong một dãy phân phối
b) Cách tính mode
* Đối với dãy số lượng biến khơng có khoảng cách tổ: Mode là lượng biến có tần
số lớn nhất.
* Đối với dãy số lượng biến có khoảng cách tổ:
- Nếu các tổ có khoảng cách tổ bằng nhau thì tổ nào có tần số lớn nhất là tổ chứa
mode. Trị số mode được tính theo cơng thức
M0 = x0min + 𝑑0

𝑓0 − 𝑓0−1
(𝑓0 − 𝑓0−1 ) + (𝑓0 − 𝑓0+1 )

Trong đó: - M0 là ký hiệu của mode
- x0min: giới hạn dưới của tổ chứa M0
- d0: khoảng cách tổ chứa M0
- f0: tần số của tổ chứa M0
- f0-1: tần số của tổ đứng trước tổ chứa M0
- f0+1: tần số của tổ đứng sau tổ chứa M0
Ví dụ 2.10 : Có tài liệu về NSLĐ tháng của cơng nhân trong một doanh nghiệp
như sau:

16



NSLĐ (tấn/người) (xi)

Số công nhân (người) (fi)

40 – 45

10

45 – 50

20

50 – 55

25

55 – 60

30

60 – 65

15

Cộng

100

Yêu cầu: Tính mode về năng suất lao động tháng của công nhân

Trước hết, ta xác định được tổ có năng suất lao động từ 55 – 60 (tấn/người) là tổ
có chứa mode. Áp dụng cơng thức tính M0 ta có:
30−25

𝑀0 = 55 + 5 × (30−25)+(30−15) = 56,25 (tấn/người)
- Nếu các tổ có khoảng cách tổ khơng bằng nhau thì tổ nào có mật độ phân phối
lớn nhất tổ đó sẽ chứa mode.
Mật độ phân phối: ℎ =

𝑓
𝑑

Cơng thức tính mode được tính như trên nhưng tần số sẽ được thay bằng mật độ
phân phối. M0 = x0min + 𝑑0 (ℎ

ℎ0 −ℎ0−1
0 −ℎ0−1 )+(ℎ0 −ℎ0+1 )

Mode kém nhạy bén với sự biến thiên của tiêu thức, không nên vận dụng mode
với những dãy số lượng biến có đặc điểm phân phối khơng bình thường. Trong một số
trường hợp, một dãy số phân phối có thể có nhiều Mode, có thể lại khơng có Mode.
Khi đó ta khơng nên tính Mode

17


2.3.1.3 Số trung vị (Me)
a) Khái niệm: Số trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa
trong dãy số lượng biến. Số trung vị phân chia dãy số lượng biến làm hai phần, mỗi
phần có số đơn vị tổng thể bằng nhau.

b) Cách tính số trung vị
* Dãy số lượng biến không phân tổ: Trước hết cần sắp xếp lượng biến theo
thứ tự từ nhỏ đến lớn.
- Nếu số lượng biến lẻ thì số trung vị là lượng biến đứng ở vị trí giữa dãy số
- Nếu số đơn vị tổng thể chẳn thì số trung vị sẽ là trung bình cộng giữa hai
lượng biến của hai đơn vị đứng giữa.
* Dãy số lượng biến phân tổ
- Khơng có khoảng cách tổ: Ta xác định tổ chứa trung vị. Đó là tổ đầu tiên có
tần số tích luỹ (tần số cộng dồn) bằng hoặc vượt một nửa tổng các tần số (𝑠𝑒 ≥

∑ 𝑓𝑖
2

)

Ví dụ 2.11: Xét ví dụ về NSLĐ của cơng nhân doanh nghiệp A:
NSLĐ (Sản phẩm) xi

Số công nhân (Người) fi

Tần số tích luỹ (Si)

3.000

15

15

3.500


30

45

4.000

45

90

4.500

55

145

5.000

40

185

5.500

15

200

Tổng


200

Trung vị của dãy số lượng biến trên là 4.500 sản phẩm. Điều này có nghĩa là
50% số cơng nhân có mức NSLĐ từ 4.500 sản phẩm trở xuống và 50% số cơng nhân
có mức NSLĐ từ 4.500 sản phẩm trở lên NSLĐ

18


- Có khoảng cách tổ, cần phải xác định tổ chứa trung vị, đó là tổ đầu tiên có tần
số tích luỹ (tần số cộng dồn) bằng hoặc vượt một nửa tổng các tần số (𝑠𝑒 ≥

∑ 𝑓𝑖
2

), sau

đó tính trị số của trung vị theo công thức sau:
∑ 𝑓𝑖
− 𝑆𝑒−1
𝑀𝑒 = 𝑥𝑒𝑚𝑖𝑛 + 𝑑𝑒 × 2
𝑓𝑒
Trong đó: - Me: số trung vị
- xemin: giới hạn dưới của tổ chứa Me
- de: khoảng cách tổ có chứa Me
- fe: tần số của tổ có chứa Me
- ∑ 𝑓𝑖 : tổng các tần số
- Se-1: tổng các tần số của các tổ đứng trên tổ chứa Me
Ví dụ 2.12: Có tài liệu về năng suất lao động năm N của công nhân trong một
doanh nghiệp như sau:

NSLĐ (tấn/người) (x)

Số công nhân (người) (f)

Tần số tích luỹ

40 – 45

10

10

45 – 50

20

30

50 – 55

25

55

55 – 60

30

85


60 – 65

15

100

Cộng

100

Yêu cầu: Tìm số trung vị về năng suất lao động của công nhân của doanh
nghiệp trên.
Trước hết, ta xác định được tổ có mức năng suất lao động từ 50 – 55
(tấn/người) là tổ có số trung vị. Áp dụng cơng thức tính Me ở trên ta có:
19


𝑀𝑒 = 50 + 5 ×

100
−30
2

25

= 54 (tấn/người)

2.3.2. Các chỉ tiêu đo lường độ phân tán.
Các chỉ tiêu đánh giá độ phân tán giúp ta xem xét trình độ đại biểu của số bình
quân. Nếu trị số của các chỉ tiêu này tính ra càng lớn thì độ biến thiên của tiêu thức

càng nhiều, tổng thể càng kém đồng đều, do đó trình độ đại biểu của số bình qn
càng thấp và ngược lại.
2.3.2.1. Khoảng biến thiên của tiêu thức (toàn cự): (R)
* Khái niệm: Khoảng biến thiên của tiêu thức là độ chênh lệch giữa lượng biến
lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu.
* Công thức tính: R = xmax - xmin
R càng nhỏ thì tổng thể càng đồng đều, số bình qn có tính chất đại biểu càng
cao và ngược lại.
Ví dụ 2.13: Có tài liệu về mức năng suất lao động của công nhân ở 2 tổ sản
xuất, mỗi tổ có 5 người trong doanh nghiệp A lần lượt như sau:
Tổ 1: 40

50 60

70

80 (kg)

𝑥̅1 = 60 kg/người

Tổ 2: 58

59 60

61

62 (kg)

𝑥2 = 60 kg/người
̅̅̅


Như vậy mức năng suất lao động bình quân mỗi tổ đều là 60 kg/người, nhưng
thực ra hai tổ này không đồng đều về tay nghề. Để đánh giá mức độ biến thiên của
năng suất lao động bình quân và qua đó đánh giá tính chất đại biểu của số bình qn,
ta tính khoảng biến thiên của hai tổ:
R1 = 80 – 40 = 40 kg
R2 = 62 – 58 = 4 kg
Kết quả cho thấy R1 lớn hơn R2, có nghĩa là độ biến thiên tiêu thức trong tổ 1
lớn hơn ( hay mức năng suất lao động bình qn của các cơng nhân trong tổ 1 chênh
lệch nhiều hơn so với tổ 2), vì vậy tính chất đại biểu của số bình quân tổ 1 thấp hơn.
̅)
2.3.2.2. Độ lệch tuyệt đối bình quân (𝒅
* Khái niệm: Độ lệch tuyệt đối bình quân là số bình quân cộng của các độ lệch
tuyệt đối giữa lượng biến (xi) với số bình qn các lượng biến đó.
* Cơng thức tính:

20


n

∑ |x −x̅|
- Nếu xi khơng có tần số fi: 𝑑̅ = i=1 i
𝑛

- Nếu xi có tần số fi tương ứng: 𝑑̅ =

∑n
̅|
i=1|xi −x

∑n
i=1 fi

Trong đó: - xi: các lượng biến (i =1, 2, 3,..., n)
- x : số bình quân cộng của các lượng biến xi
- fi : các tần số
Độ lệch tuyệt đối bình quân phản ánh tốc độ biến thiên của tiêu thức chặt chẽ
hơn khoảng biến thiên của tiêu thức vì nó xét tất cả lượng biến trong dãy số. Trị số
của độ lệch tuyệt đối bình qn càng nhỏ thì tiêu thức càng ít biến thiên, tính chất đại
biểu của số bình qn càng cao và ngược lại.
Ví dụ 2.14: Từ số liệu về năng suất lao động bình quân ở hai tổ sản xuất trong
ví dụ phần trên ta tính độ lệch tuyệt đối bình quân như sau:
|40−60|+|50−60|+|60−60|+|70−60|+80−60
̅̅̅
𝑑1 =
= 12 kg/người
5

|58−60|+|59−60|+|60−60|+|61−60|+62−60
̅̅̅
𝑑2 =
= 1,2 kg/người
5

Vậy tính chất đại biểu của số bình qn tổ 2 cao hơn tổ 1.
2.3.2.3. Phương sai
* Khái niệm: Phương sai là số bình quân cộng của bình phương các độ lệch
giữa lượng biến với số bình quân của các lượng biến đó.
* Cơng thức tính:
Phương sai tổng thể (𝛔𝟐 ): 𝝈𝟐 =


∑(𝒙𝒊 − 𝝁)𝟐
𝑵

Trong đó,
𝜎 2 : phương sai của tổng thể
𝜇

: trung bình của tổng thể

xi

: Lượng biến của dãy số (với i từ 1  N)

N

: Tổng số đơn vị của tổng thể

Phương sai mẫu (𝐒𝟐 ): 𝑺𝟐 =

∑(𝒙𝒊 −𝒙
̅)𝟐
𝒏 −𝟏

Trong đó,
21


𝑆 2 : phương sai mẫu
x̅ : trung bình của mẫu

xi : Lượng biến của dãy số (với i từ 1  n)
n

: Tổng số đơn vị của mẫu (kích cỡ mẫu)

Phương sai mẫu (𝐒𝟐 ) với các lượng biến có tần số (fi):
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 × 𝑓𝑖
S =
𝑓𝑖 − 1
2

2.3.2.4. Độ lệch tiêu chuẩn
Độ lệch tiêu chuẩn là căn bậc hai của phương sai. Cơng thức tính như sau:
* Độ lệch chuẩn của tổng thể (𝝈):
∑(𝒙𝒊 − 𝝁)𝟐

𝝈=√

𝑵

Trong đó,
σ : độ lệch chuẩn của tổng thể
μ

: trung bình của tổng thể

xi

: Lượng biến của dãy số (với i từ 1  n)


N

: Tổng số đơn vị của tổng thể

* Độ lệch chuẩn của mẫu (𝑺):
S=√

∑(𝒙𝒊 − 𝒙
̅)𝟐
𝒏 −𝟏

Trong đó,
S

: độ lệch chuẩn của mẫu

x̅ : trung bình của mẫu
xi : Lượng biến của dãy số (với i từ 1  n)
n

: Tổng số đơn vị của mẫu (kích cỡ mẫu)

Độ lệch tiêu chuẩn càng lớn thì tính chất đại biểu của số bình quân càng thấp
và ngược lại.

22


2.3.2.5. Hệ số biến thiên (V)
Hệ số biến thiên là số tương đối phản ánh quan hệ so sánh giữa độ lệch tuyệt

đối bình quân hoặc độ lệch tiêu chuẩn với số bình qn cộng.
𝑑̅

𝛿

𝑥̅

𝑥̅

Cơng thức tính: 𝑉̅𝑑 = × 100 hoặc 𝑉̅𝑑 = × 100
Hệ số biến thiên được sử dụng để so sánh độ biến thiên của tiêu thức giữa các
hiện tượng khác nhau hoặc giữa các hiện tượng cùng loại nhưng có số bình qn
khơng bằng nhau. Trị số các chỉ tiêu này tính ra càng nhỏ thì tính chất đại biểu của số
bình qn càng cao và ngược lại.
Ví dụ 2.15: Chiều cao bình qn một sinh viên trong lớp học là 160 cm, độ lệch
tiêu chuẩn về chiều cao là 8 cm. Cũng trong lớp học đó, trọng lượng bình qn của
một sinh viên là 50 kg, độ lệch tiêu chuẩn về trọng lượng là 4 kg. Muốn so sánh độ
biến thiên của tiêu thức chiều cao và trọng lượng, ta tính các hệ số biến thiên sau:
̅

8

𝑥̅

160

𝑑
Về chiều cao: 𝑉̅𝑑 𝑐𝑎𝑜 = × 100 =

× 100 = 5%


𝑑̅

4

𝑥̅

50

Về trọng lượng: 𝑉̅𝑑 𝑛ặ𝑛𝑔 = × 100 =

× 100 = 8%

Như vậy trọng lượng của sinh viên trong lớp học này dao động nhiều hơn so
với chiều cao, hay chiều cao của sinh viên trong lớp đồng đều hơn so với trọng lượng.
Hệ số biến thiên càng lớn thì tính chất đại biểu của số bình quân càng thấp và
ngược lại
2.4 Các chỉ tiêu mô tả hình dáng phân phối 1 tiêu thức định lượng
Hình dáng phân phối là một trong những đặc trưng quan trọng của dãy số phân
phối. Nó cho ta hình ảnh phân phối của tổng thể trên một tiêu thức định lượng. Hình
dáng phân phối thể hiện rõ qua tính đối xứng và độ dốc của phân phối
Phân phối đối xứng (Symmetrical distribution)

Mean = Median = Mode
( ̅𝒙 = Me = Mo )
23


Phân phối lệch trái (Skewed-left distribution)


Mean < Median < Mode
( ̅𝒙 < Me < Mo )
Phân phối lệch phải (Skewed-right distribution)

Mode < Median < Mean
( ̅𝒙 < Me < Mo )
- Để mơ tả tính đối xứng của phân phối, người ta thường sử dụng hệ số
SKEWNESS (độ nghiêng)
𝑆𝐾𝐸𝑊 =
Trong đó: 𝐻 =

√𝑛(𝑛 − 1)
𝐻
𝑛−2

3
∑(𝑥𝑖 −𝑥
̅)
𝑛
2
∑(𝑥𝑖 −𝑥
̅) 3
(
)2
𝑛

Hệ số SKEW bằng không, phân phối đối xứng. Hệ số SKEW dương càng lớn,
phân phối lệch phải càng nhiều. Hệ số SKEW âm càng lớn phân phối lệch trái càng
nhiều
24



×