Tải bản đầy đủ (.docx) (42 trang)

Chiều cao trung bình của sinh viên nữ tại đh hoa sen

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (327.98 KB, 42 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC HOA SEN
KHOA KINH TẾ THƯƠNG MẠI
------------- -------------

BỘ MÔN

NGUYÊN LÝ THỐNG KÊ
NHÓM 5

CHIỀU CAO TRUNG BÌNH CỦA SINH
VIÊN NỮ TẠI ĐH HOA SEN
GIÁO VIÊN HƯỚNG DẪN: LÊ THỊ THIÊN HƯƠNG

Năm học: 2011 - 2012

1


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC HOA SEN
KHOA KINH TẾ THƯƠNG MẠI
------------- -------------

BỘ MÔN

NGUYÊN LÝ THÔNG KÊ
NHÓM 5

CHIỀU CAO TRUNG BÌNH CỦA SINH
VIÊN NỮ TẠI ĐH HOA SEN


GIÁO VIÊN HƯỚNG DẪN: LÊ THỊ THIÊN HƯƠNG

Phần dành riêng cho Khoa:
Ngày nộp đề án: ___/___/___
Người nộp đề án: (ký và ghi rõ họ tên)

NĂM HỌC 2011 – 2012

2


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

TRÍCH YẾU
Tất cả các bậc cha mẹ đều mong muốn con mình sẽ phát triển chiều cao
và khỏe mạnh. Ta đã biết chiều cao phụ thuộc khá nhiều vào gen di truyền.
Tuy nhiên, đây không phải yếu tố quyết định hoàn toàn mà còn phụ thuộc
vào nhiều yếu tố khác nhau. Để phát triển chiều cao tốt nhất ta cần hiểu thêm
các yếu tố nào ảnh hưởng đến chiều cao. Khi có điều kiện thuận lợi cho đủ
tất cả các yếu tố ta sẽ phát triển được chiều cao tối ưu của mình.
Vì vậy, nhóm chúng tôi thực hiện đề án “CHIỀU CAO TRUNG BÌNH
CỦA SINH VIÊN NỮ TẠI ĐH HOA SEN” nhằm đưa ra cái nhìn tổng quát
nhất về chiều cao và các yếu tố ảnh hưởng đến chiều cao cũng như tìm ra
biện pháp để phát triển chiều cao cũng như nâng cao sức khoẻ để thanh thiếu
niên có thể học tập và làm việc thật hiệu quả.


Trang 3


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

LỜI CẢM ƠN
Chúng tôi xin gửi lời cảm ơn chân thành đến cô Lê Thị Thiên Hương và
những giúp đỡ, góp ý giúp chúng tôi hoàn thành đề tài này một cách tốt và
hiệu quả nhất.
Nhóm chúng tôi cũng xin gửi lời cảm ơn đến khoa Kinh Tế Thương
Mại trường Đaị học Hoa Sen vì đã tạo cơ hội cho chúng tôi học tập một môn
học có tính ứng dụng cao vào thực tiễn và hỗ trợ tốt cho khả năng tổng hợp,
xử lý số liệu cho chúng tôi.
Tuy nhiên do những hạn chế về mặt kiến thức cũng như thời gian, nhóm
chúng tôi không tránh khỏi những sai sót. Rất mong sự đánh giá và góp ý
của cô.
Chúng tôi chân thành cảm ơn.
Nhóm thực hiện đề án.

Trang 4


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ

GVHD: LÊ THỊ THIÊN HƯƠNG

NHẬN XÉT
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................
..................................................................................................................................................

Trang 5


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG


DANH SÁCH SINH VIÊN
STT

MSSV

HỌ VÀ TÊN

1

101417

Lê Ngọc Bích Thủy

2

101534

Trần Thị Muội

3

101471

Võ Thị Thanh Trúc

4

101515

Phạm Trịnh Huyền Trân


5

101433

Phạm Trần Thiên Lý

6

101490

Lê Quỳnh Như

7

101073

Nguyễn Thị CẩmVân

8

101047

Nguyễn Thị Thanh Trúc

9

101402

Nguyễn Thị Nguyệt Hồng


Trang 6


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

MỤC LỤC
Contents

Trang 7


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

BẢNG PHÂN CÔNG CÔNG VIỆC
Họ tên
1. Trần Thị Muội
2. Lê Thụy Bích Thủy
3. Võ Thị Thanh Trúc
4.Phạm Trịnh Huyền Trân
5.Phạm Trần Thiên Lý
6.Lê Quỳnh Như

7.Nguyễn Thị CẩmVân
8.Nguyễn Thị Thanh Trúc
9.Nguyễn Thị Nguyệt Hồng

Trang 8

Các công việc thực hiện
Thu thập dữ liệu, viết báo cáo,tính toán
Thu thập dữ liệu,viết báo cáo,tính toán
Thu thập dữ liệu, tổng hợp số liệuchỉnh sửa báo cáo
Thu thập dữ liệu,tổng hợp số liệu
Thu thập dữ liệut,ổng hợp số liệu
Thu thập dữ liệu,tổng hợp số liệu
Thu thập dữ liệu viết báo cáo,tính toán
Thu thập dữ liệu viết báo cáo,tính toán
Thu thập dữ liệu,tổng hợp số liệu


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

BẢNG BIỂU – HÌNH ẢNH

Trang 9


CHIỀU CAO TRUNG BÌNH CỦA

SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

A. MỞ ĐẦU
1. Cơ sở lý thuyết
CHƯƠNG I. GIỚI THIỆU MÔN HỌC
I.1. KHÁI NIỆM VÀ CHỨC NĂNG CỦA THỐNG KÊ
1. Khái niệm

Có thể hiểu khái niệm thống kê trên hai góc độ:


Góc độ lý luận: Thống kê là một môn khoa học kinh tế, nghiên
cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chất của các
hiện tượng và quá trình kinh tế xã hội, phát sinh trong điều kiện
thời gian và địa điểm cụ thể.



Góc độ nghiệp vụ: Thống kê có thể hiểu là các số liệu thể hiển
thôn tin về đối tượng nghiên cứu.

Một cách tổng quát, có thể định nghĩa: Thống kê là một nhành của toán
học liên quan đến việc thu thập, phân tích và trình bày các dữ liệu. Đây
là một khoa học bao gốm một hệ thống các phương pháp từ việc thu thập,
trình bày, tóm tắt dữ liệu đến các phương pháp phân tích và dự đoán, giúp
các nhà quản lý đưa ra các quyết định.
2. Chức năng của thống kê


Quá trình nghiên cứu thống kê trải qua ba giai đoạn có quan hệ chặt chẽ và
mật thiết với nhau, trong đó gian đoạn trước làm tiền đề để thực hiện giai
đoạn sau.
(1) Giai đoạn điều tra thống kê: bao gồm ghi chép, thu thập tài liệu thống

kê.
(2) Giai đoạn tổng hợp và trình bày kết quả điều tra thu thập được.
(3) Giai đoạn phân tích và dự báo thống kê

Như vậy, thống kê có hai lĩnh vực:
Trang 10


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN



MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

Thống kê mô tả bao gồm các phương pháp thu thập trình bày dữ
liệu và tính toán các đặc trưng nhằm mô tả đối tượng nghiên
cứu.



Thống kê suy diễn bao gồm các phương pháp mô hình hòa trên
các dữ liệu quan sát để đưa ra các suy diễn về tập hợp các đơn

vị được nghiên cứu.

Thống kê mô tả và thống kê suy diễn tạo thành thống kê ứng dụng, còn
thống kê toán là lĩnh vực nghiên cứu cơ sở lý thuyết của khoa học thống kê.
I.2. CÁC KHÁI NIỆM CƠ BẠN CỦA THỐNG KÊ
1. Tổng thể , đơn vị tổng thể, mẫu

Tổng thể thống kê (hay tổng thể) là tập hợp tất cả các đối tượng mà
ta nghiên cứu. các đơn vị (hay phần tử) tạo thành tổng thể được gọi là đơn vị
tổng thể. Mẫu là một bộ phận lấy ra từ tổng thể.
2. Biến

Biến là đặc điểm của đơn vị tổng thể, được chia ra thành hai loại:


Biến định tính thể hiện tính chất của đơn vị được khỏa sát.



Biến định lượng thể hiện bằng các số.

3. Dữ liệu

Dữ liệu là kết quả quan sát được của các biến, giá trị nhận được có
thể thay đổi từ đơn vị này sang đơn vị khác. Dữ liệu cũng được phận biệt
thành hai loại: dữ liệu định tính và định lượng.
4. Tiêu thức thống kê

Tiêu thức thống kê là khái niệm dùng để chỉ các đặc điểm của đơn
vị tồng thể mà ta nghiên cứu.

a. Tiêu thức định tính là tiêu thức phản ánh tính chất của đơn

vị tổng thể, không thể hiện trực tiếp bằng các con số.
b. Tiêu thức định lượng (còn gọi là tiêu thức số lượng) là tiêu

thức có biểu hiện trực tiếp bằng con số.
Lượng biến có tể phân biệt thành hai loại:
Trang 11


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN



MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

Lượng biến rời rạc là lượng biến mà các giá trị có thể có
của nó là hữu hạn hoặc vô hạn và có thể đếm được.



Lượng biến liên tục là lượng iến mà các giá trị có thể có của
nó lấp kín cả một khoảng trên trục số.

Thông thường, các giá trị của lượng biến liên tục là các số có cả phần
nguyên và phần thập phân, còn giá trị của lượng biến không liên tục là các số
nguyên.
Các tiêu thức định tính và định lượng chỉ có hai biểu hiện không trùng nhau

trên một tổng thề được gọi là tiêu thức thay phiên.
5. Chỉ tiêu thống kê

Chỉ tiêu thống kê là các trị số phản ánh các đặc điểm, các tính chất cơ bản
của tổng thể thống kê trong điều kiện thời gian và không gian xác định.
Chỉ tiêu thống kê có thể phân biệt thành hai loại: chỉ tiêu khối lượng và chỉ
tiêu chất lượng.
a. Chỉ tiêu khối lượng là các chỉ tiêu biểu hiện sự quy mô của

tổng thể.
b. Chỉ tiêu chất lượng là các chỉ tiêu biểu hiện tính chất, trình

độ phổ biến, quan hệ so sánh trong tổng thể.
I.3. CÁC BẬC ĐO LƯỜNG VÀ THANG ĐO DỮ LIỆU

Để thực hiện nghiên cứu, trong thống kê người ta sử dụng bốn cấp bậc đo
lường theo mức độ thông tin tăng dần, đó là thang đo: định danh, thứ bậc,
khoảng và tỉ lệ.
1. Thang đo định danh (hay thang đo phân loại) là bậc thấp nhất,

không thể hiện sự hơn kém. Thang đo này được sử dụng cho
các dữ liệu định tính, chỉ khác biệt nhau về tên gọi.
2. Thang đo thứ bậc thể hiện sự hơn kém của dữ liệu nhưng

không biết chính xác mức độ hơn kém đó. Thang đo này cũng
được sử dụng cho các dữ liệu định tính.
Trang 12


CHIỀU CAO TRUNG BÌNH CỦA

SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

3. Thang đo khoảng thể hiện được mức độ hơn kém giữa các giá

trị đo lường, trong đó giá trị 0 chỉ là quy ước mà không có ý
nghĩa. Thang đo khoảng được xem là thang đo thứ bậc có
khoảng cách đều nhau. Thang đo này được sử dụng cho các dữ
liệu định lượng.
4. Thang đo tỉ lệ

là loại thang đo dùng cho các dữ liệu định

lượng, có đầy đủ các tình chất của thang đo khoảng, torng đó
giá trị 0 có nghĩa thật sự, cho phép lấy tỉ lệ so sánh giữa hai giá
trị thu thập. Đây là thang đo ở bậc cao nhất trong hệ thống
thang đo.
Trên thực tế, vấn đề thang đo khá phức tạp và ta có thể áp dụng thang đo
định tính đối với các tiêu thức định lượng và ngược lại, áp dụng thang đo
định lượng cho tiêu thức định tính. Ngay cả khi dữ liệu đã thu thập xong ta
cũng có thể chuyển đổi dữ liệu định lượng thành dữ liệu định tính.
CHƯƠNG II. THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
II.1. THU THẬP DỮ LIỆU
1. Xác định dữ liệu cần thu thập

Quá trình nghiên cứu thống kê cần phải có nhiều dữ liệu. Việc thu thập dữ
liệu đòi hỏi nhiều thời gian, công sức, chi phí. Do đó cần phải tiền hành thu
thập dữ liệu một cách hệ thống, đáp ứng được mục tiêu nghiên cứu trong khả

năng nguồn nhân lực, kinh phí và thời gian cho phép. Muốn vậy phải xác
định rõ những dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này.
2. Nguồn dữ liệu

Khi nghiên cứu, ta có thể sử dụng các dữ liệu từ những nguồn có sẵn, đã
được công bố hoặc chưa công bố, hay có thể tự mình đi thu tthập dữ liệu
mới.
Dữ liệu từ nguồn có sẵn, thường đã qua tổng hợp, xử lý, gọi là dữ liệu thứ
cấp.
Dữ liệu thu thập trực tiếp từ các đối tượng nghiên cứu gọi là dữ liệu sơ cấp.
Trang 13


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

a. Nguồn dữ liệu thứ cấp khá đa dạng, có thể là:


Các báo cáo nội bộ cơ quan, doanh nghiệp: các số liệu
báo cáo về tình hình sản xuất, tiêu thụ, tài chính,…



Các số liệu của Cơ quan Thống kê nhà nước, Cơ quan
Chính phủ: dân số, việc làm, mức sống dân cư, tài
nguyên,…




Báo, tạp chí, mạng internet,…

b. Nguồn dữ liệu sơ cấp

Dữ liệu sơ cấp được thu thập thông qua các cuộc điều tra khảo sát.


Căn cứ vào tính liên tục hay không liên tục của việc ghi chép dữ liệu,
người ta chia ra thành điều tra thường xuyên hay không thường xuyên.


Điều tra thường xuyên là tiến hành thu thập, ghi chép
số liệu về hiện tượng nghiên cứu một cách có hệ
thồng, theo sát quá trình biến động cùa hiện tượng.



Điều tra không thường xuyên là tiến hàng thu thập,
ghi chéo chỉ khi cần có nhu cầu cần nghiên cứu hiện
tượng. dữ liệu điều tra không thường xuyên phản ánh
trạng thái của hiện tượng tại một thường điểm nhất
định.



Căn cứ vào phạm vi khảo sát, người ta lại chia ra thành điều tra toàn
bộ và không toàn bộ.



Điều tra toàn bộ là tiến hành thu thập, ghi chép dữ
liệu trên tất cả các đọn vị của tổng thể.



Điều tra không toàn bộ là chỉ tiến hành thu thập trên
một số đơn vị được chọn ra từ tổn thể đang nghiên
cứu.

3. Các phương pháp thu thập dữ liệu sơ cấp
a. Thu thập trực tiếp

Trang 14

Quan sát


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN



MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

Phỏng vấn trực tiếp

b. Thu thập gián tiếp



Phỏng vấn bằng điện thoại



Phương pháp gửi thư

Ưu điểm, nhược điểm của các phương pháp thu thập thông tin trên đây có
thể tóm tắt trong bảng sau:
Bảng 1: Phương pháp thu thập thông tin
Tính chất
Linh hoạt
Khối lượng thông tin
Tốc độ thu thập thông
tin
Tỉ lệ cuâ hỏi được trả
lời
Chi phí

Phương pháp gửi

Phỏng vấn qua

Phỏng vấn trực

thư
Kém
Đầy đủ


Tel
Tốt
Hạn chế

tiếp
Tốt
Đầy đủ

Chậm

Nhanh

Nhanh

Thấp

Cao

Cao

Tiết kiệm

Tốn kém

Tốn kém

4. Các kĩ thuật chọn mẫu

Mục đích của việc chọn mẫu là đảm bảo cho mẫu được chọn thật sự phản
ánh trung thực, đại điện cho toàn bộ tổng thể.

Có hai nhóm kĩ thuật chọn mẫu là lấy mẫu xác suất (lấy mẫu ngẫu nhiên) và
phi xác suất (lấy mẫu không ngẫu nhiên).


Phương pháp lấy mẫu xác suất bao gồm các phương pháp chọn mẫu
ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn
mẫu cả khối hay nhiều giai đoạn.



Phương pháp lấy mẫu phi xác suất bao gồm các phương pháp lấy
mẫu thuận tiện, lấy mẫu định mức, lấy mẫu phán đoán. Mẫu phi xác
suất không đại diện được cho toán bộ tổng thể nhưng được chấp nhận
trong nghiên cứu khám phá và trong kiểm định giả thuyết.

II.2. TRÌNH BÀY DỮ LIỆU
Trang 15


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

1. Bảng tần số

Bảng tần số là một bảng tổng hợp, trình bày dữ liệu bằng cách phân chia
chúng thành từng nhóm (lớp) khác nhau. Bảng tần số thường bao gồm ba
cột:



Cột thứ nhất mô tả các biểu hiện hoặc các giá trị (hay khoảng giá trị)
của dữ liệu.



Cột thứ hai mô tả tần số tương ứng với các biểu hiện hoặc giá trị đó.



Cột thứ ba là các tần suất (tỉ lệ %).

a. Cách lập bảng tần số cho dữ liệu định tính

Đối với các dữ liệu định tính như giới tính, nhành học,…, ta sẽ lập bảng tần
số gồm các thông tin sau đây:


Cột thứ nhất liệt kê tất cả các biểu hiện có thể có của tập dữ liệu.



Cột thứ hai ghi tần số (số lần từng biểu hiện đó xuất hiện trong tập dữ
liệu). tổng của cột tần số phải bằng số phần tử của tập dữ liệu.



Cột thứ ba ghi tần suất (bằng cách lấy tần số chia cho số phần tử của
tập dữ liệu và nhân với 100%). Tổng của cột tần suất phải bằng 100%.


b. Cách lập bảng tần số cho dữ liệu định lượng

Có hai trường hợp: dữ liệu có ít giá trị và dữ liệu co nhiều giá trị.
(1) Trường hợp dữ liệu có ít giá trị: Bảng tần số cũng có ba cột tương tự

trường hợp dữ liệu định tính, nhưng cột thứ nhất ghi các giá trị (lượng,
biến) của dữ liệu.
(2) Trường hợp dữ liệu có nhiều giá trị: Trước hết ta phân nhóm cho các

giá trị rồi mới lập bảng tần số trên cơ sở dữ liệu đã phân nhóm.
Trên thực tế, người ta thường phân nhóm với khoảng cách đều nhau.
Giả sử mẫu dữ liệu có n phần tử, giá trị lớn nhất, nhỏ nhất của dữ liệu lần
lượt là Xmax, Xmin. Gọi k là số nhóm cần chia và h là khoảng cách giữa các
nhóm.
Khi đó, người ta thường xác định k và h bới công thức:
Trang 16


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

k = 2n ,
3

h=


X max − X min
k

Một số điều kiện phải tuân thủ khi phân nhóm:


Các nhóm không được trùng nhau, mỗi giá trị chỉ thuộc về một nhóm.



Tất cả các nhóm phải bảo đảm bao quát hết tất cả các giá trị của mẫu
số liệu.



Không có nhóm rỗng (tức là nhóm không có phần tử nào).

Chú ý: Trong bảng tần số đôi khi người ta còn thêm vào cột tần số tích lũy
(hoặc tần suất tích lũy) thể hiện số lần quan sát (hoặc % số lần quan sát)
cộng dồn đến giới hạn tr6en của một nhóm nào đó. Nói cách khác, tần số
tích lũy cho thấy có bao nhiêu quan sát bằng hoặc nhỏ hơn một vị trí nào đó
của biến khảo sát.
(3) Phân nhóm mở

Ngoài cách phân nhóm như trên ta còn có thể phân nhóm mở, trong đó nhóm
đầu tiên không có giới hạn dười và nhóm cuối cùng không có giới hạn trên,
các nhóm còn lại có khoảng cách đều hoặc không đều nhau. Mục đích của
phân nhóm mở là để nhóm đầu tiên và nhóm cuối cùng chứa các đơn vị có
giá trị đột biến và tránh việc lập quá nhiều tổ. khi tính toán đối với phân
nhóm mở người ta quy ước lấy khoảng cách của nhóm mở bằng khoảng cách

của nhóm gần nó nhất.
c. Cách lập bảng tần só kết hợp hai tiêu thức thống kê

Bảng tần số có thể có dùng để mô tả hai tiêu thức thống kê. Ngoài ra bảng
kết hợp này có thể được xoay theo chiều khác, hoặc tách riêng thông tin về
tần số, tần suất thành hai bảng riêng biệt.
2. Đồ thị thống kê các loại
a. Đồ thị thống kê cho dữ liệu định lượng
(1) Biểu đồ phân phối tần số

Trang 17


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

Biểu đồ phân phối tần số (Histogram) được sử dụng để chuyển hóa thông tin
tr6en bảng tần số thành hình ảnh trực quan. Đây là một loại đổ thị biểu diễn
sự phân phối tần số bằng các cột sao cho diện tích của cột tỉ lệ với tần số.
(2) Đa giác tần số

Phương pháp thứ hai để biểu diễn phân phối tần số bằng đồ thị là dùng đa
giác tần số. để vẽ đa giác này, ta nối các trung điểm của cạnh đỉnh các cột
trong Histogram lại với nhau bằng các đoạn thẳng. muốn đưởng biểu diễn
không có vẽ lơ lửng trên không, ta thêm vào hai bên của Histogram hai
nhóm có tần số bằng 0.
(3) Biểu đồ nhánh lá


Biểu đồ nhánh và lá (còn gọi là biểu đồ thân và lá) là một công cụ để tóm
lược và trình bày tập dữ liệu, giúp người xem thấy được dữ liệu gốc và cách
thức phân tán nó. Để trình bày dữ liệu theo phương pháp nhánh và lá, mỗi trị
số được tách thành hai phần:


Phần nhánh: bao gồm một hay nhiều chữ số đầu tiên. Phần nhánh
được đặt ở cột đầu tiên theo thứ tự tăng dần. Số nhánh được chọn sao
cho nó có ít nhánh so với số quan sát (số lá). Thông thường số nhánh
trong khoảng từ 5 đến 20 là vừa.



Phần lá: gồm các chữ số còn lại. Lá ở một nhánh cũng sắp xếp theo
thứ tự tăng dần. cũng có tể chia đôi một nhánh thành nhánh trên và
nhánh dưới khi có quá nhiều lá.

b. Đồ thị thống kê cho dữ liệu định tính
(1) Biểu đồ dạng thanh (thanh đứng hay thanh ngang)

Trên biểu đồ này, mỗi thanh đại diện cho một phân loại của biến (tiêu thức
thống kê) mà ta quan tâm, chiều dài của thanh thể hiện tần số của các quan
sát thuộc về phân loại đó. Còn chiều rộng của các thanh bằng nhau.
Không nên nhầm lẫn giữa Histogram với biểu đồ thanh đứng. đây là hai
công cụ thống kê khác nhau, thể hiện hai loại dữ liệu định lượng, định tính.
Giữa các thanh của Histogram không có khoảng cách, còn giữa các thanh
Trang 18



CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

của biểu đồ dạng thanh phải có khoảng cách vì mỗi thanh là một biểu hiện
của biến phân loại.
(2) Biểu đồ hình tròn

Thường dùng dể mô tả kết cuấ (%) của vấn đề đang nghiên cứu. Trên biểu
đồ, toàn bộ diện tích hình tròn dược chia thành nhiều mạnh nhỏ hỉnh rẻ quạt,
diện tích mỗi mảnh tương ứng vối tỉ lệ của pahn6 loại mà nó đại diện trong
toàn thể và manh một màu khác nhau. Thứ tự của các phân loại (theo chiều
kim đồng hồ) là thứ tự nó được sắp xếp trong bảng tổng hợp.
CHƯƠNG III. TÓM TẮT DỮ LIỆU – BẢNG CÁC ĐẠI LƯỢNG
THỐNG KÊ MÔ TẢ
Đối với dữ liệu định lượng, chúng ta có thể tóm tắt tốt hơn khi số lượngdữ
liệu lớn, đó là dùng các đại lượng thống kê mô tả. Các đại lượng này được
chia thành hai nhóm: nhóm các đại lượng thể hiện mức độ tập trung của dữ
liệu và nhóm thể hiện độ phân tán của dữ liệu. Ở nhóm thứ nhất ta có trung
bình cộng (được sử dụng nhiều nhất), mốt, turng vị. Ở nhóm thứ hai ta có
khoảng biến thiên, độ lệch tuyệt đối bình quân, phương sai, độ lệch chuẩn
(được sử dụng nhiều nhất) và hệ số biến thiên.
III.1. CÁC ĐẠC TRƯNG ĐO LƯỜNG KHUYNH HƯỚNG TẬP

TRUNG
1. Trung bình cộng (Arithmetic mean)

Trung bình cộng được xác định bằng cách cộng tất cả các giá trị của từng

phần tử (các quan sát), sau đó đem chia cho tổng số phần tử (tổng số quan
sát).
Có hai loại turng bình cộng là trung bình cộng đơn giản (mean) và trung bình
cộng có trong số (weighted mean).
a. Trung bình cộng đơn giản

Trang 19

Trung bình tổng thể:


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

Giả sử tổng thể có N phần tử (quan sát), X i là giá trị của phần tử thứ i. Khi
1 N
µ = ∑ Xi
N i =1
đó trung bình cộng của tổng thể là
(1)


Trung bình mẫu

Giả sử mẫu có n phần tử (hay còn nói cỡ mẫu là n), khi đó trung bình cộng

của mẫu (hay trung bình mẫu) là


X=

1 n
∑ Xi
n i =1

(2)

b. Trung bình cộng có trọng số

Đây là trường hợp đặc biệt của trung bình cộng đơn giản khi giá trị X i xuất
hiện nhiều lần. Giả sử giá trị X i xuất hiện fi lần, i = 1, 2,…, k (ta nói fi là

k

X=

∑X
i =1
k

trọng số hay tần số của giá trị X i ). Khi đó,

∑f
i =1

f

i i


k

i

(3) với

∑f
i =1

i

=n

là số

phần tử của mẫu.
Chú ý: trường hợp dữ liệu phân nhóm có khoảng cách thì turng bình mẫu

k

X =

được tính gần đúng bởi công thức

∑x f
i =1
k

i i


∑f
i =1

i

với

xi =

X imax + X imi n
2

là trị số

giữa của các nhóm i ( X imax , X imi n là giới hạn trên, giới hạn dưới của nhóm i) và
fi là tần số của nhóm i
c. Đặc điểm của trung bình cộng

Trang 20


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

Trung bình cộng thường rất nhạy cảm với các đột biến (giá trị quá lớn




hoặc quá nhỏ), giá trị trung bình sẽ kém tiêu biểu nếu trong dãy số có các giá
trị đột biến.
Trung bình cộng được sử dụng để so sánh giữa hau hay nhiều tổng



thể.
Tổng độ lệch giữa các giá trị X i với giá trị trung bình X bằng 0, nghĩa


n



∑ (X
i =1

i

− X) = 0
2. Mốt (Mode)

Khái niệm
Mốt là giá trị xuất hiện nhiều nhất trong một dãy số, kí hiệu là Mo.
b) Cách xác định mốt
(1) Trường hợp dữ liệu không phân nhóm: Mốt là giá trị có tần số lớn nhất.
(2) Trường hợp dữ liệu phân nhóm có khoảng cách đều nhau: Trước hết
a)


cần xác định nhóm chứa mốt là nhóm có tần số lớn nhất. Trị số của mốt
được xác định gần đúng bởi công thức:
M 0 = X M 0 min + hM 0 .

Trong đó X M 0 min

f M 0 − f M 0 −1
( f M 0 − f M 0 −1 ) + ( f M 0 − f M 0 +1 )

(5)
là giới hạn dưới của nhóm chứa M 0 ; hM 0 là khoảng cách

của nhóm chứa M 0 ; f M 0 −1 là tần số của nhóm đứng trước nhóm chứa M 0 ;

f M 0 là tần số của nhóm chứa M 0 ; f M 0 +1 là tần số của nhóm đứng sau nhóm

(3)

chứa M 0 .
Trường hợp dữ liệu phân nhóm có khoảng cách không đều: Mốt vẫn
được tính theo công thức (5) nhưng việc xác định nhóm có mốt không
căn cứ vào tần số mà căn cứ vào mật độ phân phối. (Mật độ phân phối =

-

Tần số: khoảng cách nhóm).
c) Đặc điểm của mốt
Mốt là đặc trưng đo lường khuynh hướng tập trung không bị ảnh hưởng
bởi các giá trị đột biến.


Trang 21


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

-

Mốt có thể xác định cho dữ liệu sử dụng các thang đo khác như thang đo

-

định danh, thang đo thứ bậc.
Khác với trung bình cộng và trung vị, một tập sữ liệu có thể không xác
định được mốt vì không có giá trị nào xuất hiện nhiều nhất. Ngược lại, có
một số trường hợp có nhiều mốt.
3. Trung vị (Median)

Trong một tập dữ liệu đã được sắp xếp theo thứ tự tăng dần thì trung vị, kí
hiệu Me , là giá trị đứng giữa của tập dữ liệu. Nói cách khác, trung vị chia
dãy số làm hai phần, mỗi phần có số đơn vị tổng thể bằng nhau.
a) Cách xác định trung vị:
(1) Xác định trung vị cho dữ liệu không phân nhóm
-

Trường hợp số phần tử của mẫu n là số lẻ: M e =


X n +1
2

(trung vị là giá trị

n +1
đứng giữa, tức là ở vị trí thứ 2 trong dãy các giá trị tăng dần của mẫu

số liệu).
Xn + Xn
2

2

+1

-

Trường hợp n là số chẵn: M e =

(2)

hai giá trị đứng giữa trong dãy số trên).
Xác định trung vị cho dữ liệu phân nhóm có khoảng cách

2

(trung vị là trung bình cộng của


Với dữ liệu đã phân nhóm, trung vị được xác định một cách xấp xỉ qua các
bước sau:
Bước 1: Tính tần số tích lũy.
Bước 2: Xác định nhóm chứa trung vị là nhóm có tần số tích lũy bằng (hoặc
n +1
vừa đủ lớn hơn) 2

Bước 3: Áp dụng công thức
n
− S M e −1
X M e min + hM e . 2
f Me
Me =
(6)
Trang 22


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

trong đó X M e min là giới hạn dưới của nhóm chứa M e ; hM e là khoảng cách của
nhóm chứa M e ; S M e −1 là tần số tích lũy của nhóm đứng trước nhóm chứa M e ;

f M e là tần số của nhóm chứa M e .
4. Tứ phân vị - thập phân vị

Tứ phân vị, thập phân vị là chỉ tiêu đo lường độ phân tán chứ không phải chỉ

tiêu đo lường khuynh hướng tập turng. Tuy nhiên, vì cách tính của chúng
tương tự cách tính trung vị, hơn nữa phân vị thứ hai của tứ phân vị chính là
trung vị, nên ta kết hợp xét tứ phân vị và thập phân vị trong mục này.
Tứ phân vị chia dãy số lượng biến thành bốn phần, mỗi

a.

phần có số đơn vị bằng nhau. Cách xác định tứ phân vị như sau:
(1) Đối với dữ liệu không phân nhóm: dãy số lượng biến có ba tứ phân vị

là:
n +1
 Q1 : tứ phân vị thứ nhất là lượng biến đứng ở vị trí thứ 4
2(n + 1) n + 1
=
 Q2 : tứ phân vị thứ hai chính là số trung vị, đứng ở vị trí
4
2
3(n + 1)
 Q3 : tứ phân vị thứ ba là lượng biến đứng ở vị trí thứ
4

Nếu n+1 không chia hết cho 4 thì tứ phân vị được xác định bằng cách thêm
n + 1 1 3(n + 1)
3
=3
=9
vào. Chẳng hạn, với n = 12 (đơn vị) , ta có 4
4 ,
4

4 . Do đó, tứ
1
phân vị thứ nhất bằng lượng biến ở vị trí thứ ba cộng với 4 giá trị chênh

lệch giữa lượng biến ở vị trí thứ ba và thứ tư. Còn tứ phân vị thứ ba bằng
3
lượng biến ở vị trí thứ chín cộng với 4 giá trị chênh lệch giữa lượng biến ở

vị trí thứ chín và thứ mười.
Trang 23


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

(2) Đối với dữ liệu phân nhóm có khoảng cách:

3n
n
− S Q3 −1
− SQ1 −1
4
4
Q1 = X Q1 min + hQ1 .
Q3 = X Q3 min + hQ3 .
f Q1
f Q3

;

(7)

Trong đó X Qi min là giới hạn dưới của nhóm chứa Qi ; hQi là khoảng cách của
nhóm chứa Qi ; SQi −1 là tấn số tích lũy của nhóm đứng trước nhó chứa Qi ; f Qi
là tấn số của nhóm chứa Qi .
Thập phân vị chia dãy số lượng biến thành mười phần,

b.

mỗi phần có số đơn vị bằng nhau. Cách tính thập phân vị tương tự cách tính
tứ phân vị. ta có công thức sau đây:
n
n
− S D1 −1
− S D 2 −1
10
10
D1 = X D1 min + hD1
D2 = X D2 min + hD2
f D1
f D2
;
;…

Tứ phân vị, thập phân vị được sử dụng trong thực tế khi người ta muốn biết
mức đạt cao nhất của ¼ hay 1/10 số đơn vị xếp từ thấp lên, hoặc mức dạt
thấp nhất của ¼ hay 1/10 số đơn vị tiến tiến xếp từ trên xuống.
III.2. CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ PHÂN TÁN


Số trung bình, số turng vị và mốt mới chỉ cho ta biết được giá trị trung
tâm, mức độ đại diện của hiện tượng mà chưa phản ánh đầy đủ các tính
chất đặc thù của dãy số lượng biến. Do vậy, ngoài các đặc trưng đo lường
khuynh hướng tập trung, ta cần đánh giá độ phân tán (độ biến thiên) của
dữ liệu.
Khoảng biến thiên (Range) kí hiệu R, là chênh lệch giữa giá

1.

trị lớn nhất và giá trị nhỏ nhất của dãy lượng biến R = X max − X min (1)
Khoảng biến thiên càng nhỏ thì tổng thể càng đồng đều, số turng bình càng
có tính đại diện cao và ngược lại.

Trang 24


CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN

MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG

Nhược điểm của khoảng biến thiên là chỉ phụ thuộc vào giá trị lớn nhất và
giá trị nhỏ nhất của dãy lượng biến.
Độ trải giữa (Interquartile range) kí hiệu RQ , là chênh lệch

2.

giữa tứ phân vị thứ ba và tứ phân vị thứ nhất RQ = Q3 − Q1 (2)

Độ trải giữa thể hiện độ phân tán của 50% dữ liệu giữa của dãy số.
Độ lệch tuyệt đối trung bình (Mean absolute deviation) kí

3.

hiệu d , là số trung bình cộng của các độ lệch tuyệt đối giữa các lượng biến

và số trung bình cộng của các lượng biến đó. Ta có công thức:

d=

1 n
∑ xi − X
n i =1

k
1 k
d = ∑ xi − X f i
n = ∑ fi
n i =1
hoặc
trong đó
i =1

Độ lệch tuyệt đối trung bình càng nhỏ, tổng thể càng đồng đều, tính chất đại
diện của số trung bình càng cao. Độ lệch tuyệt đối trung bình có ưu điểm
hơn khoảng biến thiên vì nó xét đến tất cả các lượng biến trong dãy số.
Phương sai (Variance) là số trung bình cộng của bình phương

4.


các độ lệch giữa các lượng biến và số trung bình cộng của các lượng biến đó.
Cách xác định phương sai
1 k
1 k 2
2
σ = ∑ ( X i − µ ) fi = ∑ X i fi − µ 2
N i =1
N i =1
 Phương sai tính từ tổng thể chung:
2

k

trong đó f i là tần số của giá trị X i và

Trang 25

N = ∑ fi
i =1

là số phần tử của tổng thể.


×