Tải bản đầy đủ (.pdf) (17 trang)

Những con số ước lượng cụ thể thời gian sử dụng mạng xã hội, mức chi phí hàng tháng để sử dụng sóng 3G, Wifi và sự ảnh hưởng của mạng xã hội với kết quả học tập của sinh viên

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (720.16 KB, 17 trang )

TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
KHOA KHÁCH SẠN – DU LỊCH
----------------

BÀI THẢO LUẬN
LÝ THUYẾT XÁC XUẤT VÀ THỐNG KÊ TOÁN
Đề tài: Tiến hành khảo sát điều tra mẫu về các bạn sinh viên ĐHTM
giải quyết các vấn đề sau:
1. Ước lượng thời gian truy cập mạng xã hội hàng ngày của các bạn
2. Uớc lượng mức chi phí hàng tháng để sử dụng sóng 3G, Wifi
3. So sánh kết quả học tập giữa nhóm có thời gian truy cập mạng xã
hội trên 4h và từ 4h trở xuống.
Nhóm thực hiện : Nhóm 1
Lớp HP : 2078AMAT0111
GVHD : Mai Hải An
Hà Nội,2020


LTXSTK

GVHD: Mai Hải An

LỜI NĨI ĐẦU
Thống kê học có thể được định nghĩa một cách khái quát như khoa học, kỹ thuật
hay nghệ thuật của việc rút ra thông tin dữ liệu quan sát, nhằm giải quyết các bài toán từ
thực tế cuộc sống. Việc rút ra thơng tin đó có thể là kiểm định một giả thiết khoa học, ước
lượng một đại lượng chưa biết hay dự đoán một sự kiện trong tương lai.
Phương pháp ước lượng bằng khoảng tin cậy sẽ giúp chúng ta ước lượng một tham
số ɵ của một đại lượng ngẫu nhiên gốc X trên một đám đong nào đó, với sai số ε và chỉ ra
khả năng mắc sai lầm khi ước lượng là bao nhiêu. Kể cả khi nghiên cứu trên mẫu có kích
thước nhỏ thì ước lượng khoảng tin cậy cũng sẽ cho kết quả với sai số khá nhỏ. Bằng


phương pháp ước lượng khoảng tin cậy, ta có thể giải quyết các bài toán thống kê thường
gặp trong cuộc sống.
Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thiết thống kê là một bộ
phận quan trọng của thống kê tốn. Ta có thể đưa ra các giả thuyế thống kê, đó là giả
thuyết ta đang nghi ngờ và một giả thuyế trái với giả thuyết gốc. Tiến hành công việc theo
quy tắc hay thủ tục để từ một mẫu cụ thể cho ta đi đến quyết định chấp nhận hay bác bỏ
một giả thuyết thống kê.
Thống kê nói chung hay bài tốn ước lượng và kiểm định nói riêng có ứng dụng
rộng rãi trong thực tế và đời sống. Hiện nay, việc sử dụng mạng xã hội hàng ngày của
sinh viên và vấn đề ảnh hưởng của nó đến kết quả học tập của sinh viên đang có xu hướng
tăng nhanh. Với mục tiêu để mọi người có cái nhìn chính xác hơn về 2 sự việc trên, sau
khi thực hiện cuộc điều tra nhỏ trong phạm vi trường Đại học Thương Mại, bài thảo luận
mơn học lí thuyết xác suất và thống kê sau đây sẽ đưa ra những con số ước lượng cụ thể
thời gian sử dụng mạng xã hội, mức chi phí hàng tháng để sử dụng sóng 3G, Wifi và sự
ảnh hưởng của mạng xã hội với kết quả học tập của sinh viên .
Do thời gian, điều kiện và khả năng có hạn, bài thảo luận nhóm chúng em khơng
tránh khỏi những sai sót. Rất mong nhận được sự góp ý chia sẻ từ phía giảng viên, các
bạn sinh viên để bài thảo luận nhóm được hồn thiện hơn!
Tập thể nhóm 1 xin chân thành cảm ơn!
1. Tính cấp thiết của đề tài nghiên cứu:
Ngày nay xu thế phát triển của thế giới, những ứng dụng của ngành khoa học xác
suất thống kê ngày càng trở nên quan trọng trong hầu hết mọi lĩnh vực từ khoa học cơng
nghệ đến kinh tế, chính trị và đời sống hàng ngày. Việc nghiên cứu các số liệu trở nên cần
thiết hơn nhằm có thể đưa ra những con số biết nói giúp chúng ta trong công việc nghiên
cứu khoa học và xã hội để từ đó đưa ra những điều chỉnh hợp lý đưa thực tiễn cuộc sống
vào nghiên cứu khoa học và vận dụng những thành tựu đạt được nhằm xây dựng xã hội
tốt đẹp hơn.
Công nghệ thông tin phát triển kéo theo việc sử dụng mạng xã hội trở thành một
phần không thể thiếu đối với con người nhất là với giới trẻ. Sự xuất hiện của mạng xã hội
với những tính năng mới đã đem lại cho con người nhiều sự trải nghiệm đầy thú vị. Vì

vậy ở một khía cạnh nào đó, bộ phận sinh viên đã biết cách sử dụng mạng xã hội một
Nhóm 1

Trang 2


LTXSTK

GVHD: Mai Hải An

cách hiệu quả như giảm stress sau những ngày học tập và làm việc căng thẳng. Tuy nhiên
bên cạnh những mặt tích cực kể trên thì cũng còn nhiều hệ lụy mà mạng xã hội mang lại
là sinh viên dành thời gian quá nhiều cho việc “nghiện online”, sa đọa vào cuộc sống
ảo.... Để từ đó ảnh hưởng đến sức khỏe cũng như kết quả học tập khơng như mong muốn,
sao nhãng việc học.
Từ đó, nhóm thảo luận môn Lý thuyết xác suất thống kê bọn em đã lựa chọn đề tài
nghiên cứu về vấn đề truy câp mạng xã hội hàng ngày của sinh viên. Qua số liệu thống kê
online đã thu thập được ta có thể ước lượng tỷ lệ sinh viên sử dụng mạng xã hội, mức chi
phí hàng tháng cho việc sử dụng mạng để so sánh kết quả học tập giữa nhóm có thời gian
truy cập Internet trên 4 giờ và từ 4 giờ trở xuống.

2. Mục tiêu, mục đích nghiên cứu
- Mục đích nghiên cứu
Nghiên cứu về vấn đề sử dụng mạng xã hội của sinh viên và ảnh hưởng của
vấn đề này đến kết quả học tập của các bạn.
- Mục tiêu nghiên cứu
Tìm hiểu những kiến thức căn bản nhất về thời gian sử dụng mạng xã hội hàng
ngày của sinh viên. Tìm hiểu mức chi phí các bạn sinh viên chi trả cho song 3G, Wifi
hàng tháng và so sánh kết quả học tập giữa nhóm có thời gian truy cập Internet trên
4h và từ 4h trở xuống.


CHƯƠNG 1 : CƠ SỞ LÝ THUYẾT
I. Ước lượng các tham số của đại lượng ngẫu nhiên
1. Ước lượng điểm
a. Khái niệm
Giả sử cần ước lượng tham số 𝜃 ( 𝐸(𝑋) = 𝜇, 𝑣𝑎𝑟 (𝑋) = 𝜎 2 ) của ĐLNN 𝑋 trên 1
đám đơng nào đó
B1: Ta lấy mẫu ngẫu nhiên 𝑊 = (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) với n khá lớn.
XDTK:

𝜃𝑡𝑛
= 𝑓(𝑥1 , 𝑥2 , . . , 𝑥𝑛 ) phù hợp với tham số 𝜃
B2: Lấy mẫu cụ thể 𝑛 = (𝑥1 , 𝑥2 , … , 𝑥𝑛 )

Tính tốn 𝜃𝑡𝑛
= 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 )

B3: Lấy 𝜃 ≈ 𝜃𝑡𝑛
làm ước lượng điểm cho tham số 𝜃

𝜃 ∗ được gọi là ước lượng điểm của 𝜃.
b.Các tiêu chuẩn đánh giá bản chất tốt của ước lượng
- Ước lượng khơng chệch
Nhóm 1

Trang 3


LTXSTK


GVHD: Mai Hải An

Thống kê 𝜃 ∗ được gọi là ước lượng không chệch của 𝜃 nếu 𝐸(𝜃 ∗ ) = 𝜃
Ngược lại ta nói 𝜃 ∗ là ước lượng chệch của 𝜃
- Ước lượng vững
Thống kê 𝜃 ∗ được gọi là ước lượng vững của 𝜃 nếu với ∀𝜀 > 0 ta có:
lim 𝑃(| 𝜃 ∗ − 𝜃|< 𝜀) = 1
𝑛→+∞

- Ước lượng kết quả
Thống kê 𝜃 ∗ được gọi là ước lượng kết quả của 𝜃 nếu nó là ước lượng khơng
chệch và có phương sai nhỏ nhất so với các ước lượng không chệch khác trên cùng
1 mẫu
2. Ước lượng bằng khoảng tin cậy
2.1. Ước lượng kỳ vọng toán của đại lượng ngẫu nhiên
Xét các đại lượng ngẫu nhiên 𝑋 có kỳ vọng tốn 𝜃 ( 𝐸(𝑋) = 𝜇 𝑣𝑎𝑟 (𝑋) = 𝜎 2 ), trong
đó có 𝜇 chưa biết cần ước lượng
Để ước lượng cho 𝜇 ta xét bài toán bằng 3 trường hợp
- Trường hợp 1: 𝑋~𝑁(𝜇, 𝜎 2 ), trong đó 𝜎 2 đã biết
2

𝜎
B1: vì 𝑋~𝑁(𝜇, 𝜎 2 ) nên 𝑋̅~𝑁(𝜇, )
𝑛

XDTK: 𝑈 =

𝑋̅−𝜇
𝜎/√𝑛


~𝑁(0,1)

B2: Đưa ra khoảng tin cậy
𝛼
- Khoảng tin cậy đối xứng (𝛼1 = 𝛼2 = )
2

Với độ tin cậy 𝛾 = 1− ∝ cho trước, ta xác định được 𝑢 sao cho
𝑃(− 𝑢𝛼 /2 - < 𝑈 < 𝑢𝛼 /2 ) = 𝛾 = 1 − 𝛼
Thay U vào biến đổi tương đương có
𝑃(𝑋̅ − 𝜀 < < 𝑋̅ + 𝜀) = 𝛾

Khoảng tin cậy được xác định của 𝜇 là (𝑋̅ − 𝜀; 𝑋̅ + 𝜀)
Với 𝜀 = 𝑢𝛼 /2 ×

𝜎
√𝑛

= Khoảng tin cậy phải (𝛼1 = 0, 𝛼2 = 𝛼), ước lượng 𝜇𝑚𝑖𝑛
Với độ tin cậy 𝛾 = 1−∝ ta xác định được giá trị 𝑢∝ sao cho
𝑃(𝑈 < 𝑢𝛼 ) = 𝛾
𝜎
𝑃 (𝜇 > 𝑋̅ − 𝑢𝛼 × ) = 𝛾
√𝑛

- Khoảng tin cậy phải của 𝜇 là (𝑋̅ − 𝑢𝛼 ×
Nhóm 1

𝜎
√𝑛


; +∞)
Trang 4


LTXSTK

GVHD: Mai Hải An

- Khoảng tin cậy trái (𝛼1 = 𝛼, 𝛼2 = 0), ước lượng 𝜇𝑚𝑎𝑥
Với độ tin cậy 𝛾 = 1 − 𝛼 ta xác định được giá trị 𝑢𝛼 sao cho
𝑃(𝑈 > −𝑢𝛼 ) = 𝛾
𝜎
 𝑃 (𝜇 < 𝑋̅ + 𝑢𝛼 × ) = 𝛾
√𝑛

Khoảng tin cậy trái của 𝜇 là (−∞, 𝑋̅ + 𝑢∝ ×



𝜎
√𝑛

)

- Trường hợp 2: chưa biết QLPP của x, n>30
2

𝜎
B1: 𝑛 > 30 nên 𝑋̅~𝑁(𝜇, )

𝑛

XDTK: 𝑈 =

𝑋̅−𝜇
𝜎
√𝑛

~ 𝑁(0,1)

B2, B3 tương tự trường hợp 1
Chú ý: Nếu chưa biết vì 𝑛 > 30 nên ta lấy 𝜎 ≈ 𝑆 ′
- Trường hợp 3: X~𝑁(𝜇, 𝜎 2 ), 𝜎 2 chưa biết, 𝑛 < 30
B1: Vì 𝑋~𝑁(𝜇, 𝜎 2 ) nên XDTk: 𝑇 =

𝑋̅−𝜇
𝑆′
√𝑛

~𝑇 (𝑛−1)

B2: Đưa ra khoảng tin cậy
𝛼
- Khoảng tin cậy đối xứng (𝛼1 = 𝛼2 = )
2

Với độ tin cậy 𝛾 = 1 − 𝛼 ta tìm đk 𝑡𝛼𝑛−1
2

𝑃(𝑇 < 𝑡∝𝑛−1 ) = 𝛾

𝑃 (−𝑡𝛼𝑛−1 < 𝑇 < 𝑡𝛼𝑛−1 ) = 𝛾
2

2


𝑆
- Khoảng tin cậy phải của 𝜇là (𝑋̅ − 𝑡𝛼𝑛−1 . ; +∞)
√𝑛

- Khoảng tin cậy trái 𝛼1 = 𝛼; 𝛼2 = 0, Ước lượng 𝜇𝑚𝑎𝑥
Với độ tin cậy 𝛾 = 1 − 𝛼 ta tìm được 𝑡𝛼𝑛−1
𝑃(𝑇 > −𝑡𝛼𝑛−1 ) = 𝛾


𝑆
 𝑃 (𝜇 < 𝑋̅ + 𝑡𝛼𝑛−1 . ) = 𝛾
𝑛




𝑆
- Khoảng tin cậy trái của 𝜇 là (−∞; 𝑋̅ + 𝑡𝛼𝑛−1 . )
𝑛


2.2 Ước lượng tỷ lệ
- Xét 1 đám đơng có tỷ lệ phần tử mang dấu hiệu A


Nhóm 1

Trang 5


LTXSTK

GVHD: Mai Hải An

𝑀
𝑁
Do N khá lớn nên p chưa biết cần ước lượng
𝑛
B1: Lấy mẫu kích thước N khá lớn, 𝑓 = 𝐴
𝑝=

𝑛

Vì n khá lớn nên 𝑓~𝑁 (𝑝,
XDTK: 𝑈 =

𝑓−𝑝
𝑝𝑞

𝑝𝑞
𝑛

)

~ 𝑁(0,1)


√𝑛

B2: Đưa ra khoảng tin cậy
𝛼

- Khoảng tin cậy đối xứng (𝛼1 = 𝛼2 = )
2
Với độ tin cậy 𝛾 = 1 − 𝛼 ta tìm được 𝑢∝ sao cho:
2

𝑃(−𝑢𝛼 /2 < 𝑈 < 𝑢𝛼 /2 ) = 𝛾
 𝑃(𝑓 − 𝜀 < 𝑝 < 𝑓 + 𝜀) = 𝛾
Với 𝜀 = 𝑢𝛼 /2 . √

𝑝𝑞
𝑛

- Khoảng tin cậy đối xứng của p là (𝑓 − 𝜀; 𝑓 + 𝜀)
- Khoảng tin cậy phải (𝛼1 = 0, 𝛼2 = 𝛼).
Ước lượng 𝑝𝑚𝑎𝑥, 𝑓𝑚𝑖𝑛, 𝑀𝑚𝑎𝑥, 𝑁𝑚𝑖𝑛, 𝑛𝐴 𝑚𝑖𝑛
Với độ tin cậy 𝛾 = 1 − 𝛼 ta tìm được 𝑢𝛼 sao cho
𝑃(𝑈 > −𝑢𝛼 ) = 𝛾
𝑃(𝑝 < 𝑓 + 𝑢𝛼 . √

𝑝𝑞
𝑛

)= 𝛾


- Khoảng tin cậy trái của p là (0 ; 𝑓 + 𝑢𝛼 . √

𝑝𝑞
𝑛

)

2.3 Ước lượng phương sai của đại lượng ngẫu nhiên phân phối chuẩn
Xét ĐLNN X phân phối chuẩn có 𝐸(𝑋) = 𝜇 và 𝑣𝑎𝑟(𝑋) = 𝜎 2
Trong đó 𝜎 2 chưa biết, cần ước lượng
B1: Vì 𝑋~𝑁(𝜇, 𝜎 2 )
XDTK: 𝑋 2 =

(𝑛−1)×𝑆 ′2
𝜎2

~𝑋 2(𝑛−1)

B2: Đưa ra khoảng tin cậy
𝛼
- Khoảng tin cậy 2 phía của 𝜎 2 (𝛼1 = 𝛼2 = )
2

2(𝑛−1)

2(𝑛−1)

Với độ tin cậy 𝛾 = 1 − 𝛼 ta tìm được phân vị 𝑥1−𝛼/2 , 𝑥𝛼/2
Nhóm 1


sao cho:
Trang 6


LTXSTK

GVHD: Mai Hải An
2(𝑛−1)

2(𝑛−1)

𝑃(𝑥1−𝛼/2 < 𝑋 2 < 𝑥𝛼/2
(𝑛−1)×𝑆 ′2

𝑃 (

2(𝑛−1)

𝑥𝛼/2

< 𝜎2 <

(𝑛−1)×𝑆 2
2(𝑛−1)
𝛼
1−
2

𝑥


)=𝛾

(𝑛−1)×𝑆 ′2

- Khoảng tin cậy 2 phía của 𝜎 2 (

)=𝛾

2(𝑛−1)

𝑥𝛼/2

;

(𝑛−1)×𝑆 2
2(𝑛−1)
𝛼
1−
2

𝑥

)

2
- Khoảng tin cậy phải của 𝜎 2 (𝛼1 = 0; 𝛼2 = 𝛼), Ướ𝑐 𝑙ượ𝑛𝑔 𝜎𝑚𝑖𝑛
2(𝑛−1)

Với độ tin cậy 𝛾 = 1 − 𝛼 ta tìm được phân vị của 𝑥𝛼
2(𝑛−1)


𝑃 (𝑥𝛼
𝑃 (𝜎 2 >

(𝑛−1)×𝑆 ′
2(𝑛−1)

𝑥𝛼

sao cho:

> 𝑋2) = 𝛾

)=𝛾

- Khoảng tin cậy phải của 𝜎 2 (

(𝑛−1)×𝑆 ′
2(𝑛−1)

𝑥𝛼

; +∞)

- Khoảng tin cậy trái của 𝜎 2 (𝛼1 = 0; 𝛼2 = 0)
2
Ước lượng 𝜎𝑚𝑎𝑥
Với độ tin cậy 𝛾 = 1 − 𝛼 ta tìm được 𝑓𝑛
2(𝑛−1)


𝑃 (𝑋 2 > 𝑥1−𝛼
𝑃 (𝜎 2 <

(𝑛−1)×𝑆 ′
2(𝑛−1)

𝑥1−𝛼

)=𝛾

)=𝛾

Khoảng tin cậy trái của 𝜎 2 (0 ;

(𝑛−1)×𝑆 ′
2(𝑛−1)

𝑥1−𝛼

)

II.Kiểm Định giả thuyết thống kê

1. Giả thuyết thống kê
Một giả thuyết thống kê (statistical hypothesis) là giả thuyết về quy luật phân phối
xác suất của ĐLNN X, về giá trị tham số của ĐLNN hoặc về tính độc lập của các
ĐLNN.
Giả thuyết được đưa ra kiểm định được gọi là giả thuyết gốc Ho. Một giả thuyết
khác với Ho được gọi là đối thuyết H1. Ho và H1 lập thành cặp giả thuyết thống kê
và đươck lựa chọn theo nguyên tắc: nếu chấp nhận Ho thì bác bỏ H1 và ngược lại.

Việc tiến hành theo quy tắc hay thủ tục nào đó để từ mẫu cun thể cho phép ta quyết
định chấp nhận hay bác bỏ Ho được gọi là kiểm định giả thuyết thống kê.
2. Quy trình kiểm định một giả thuyết thống kê.

Nhóm 1

Trang 7


LTXSTK

GVHD: Mai Hải An

Các nhà thống kê tuân theo một quá trình chuẩn mực để đưa ra quyết định bác bỏ
giả thuyết Ho hay không, dựa trên một dữ liệu mẫu. Quá trình này gọi là kiểm định
giả thuyết (hypothesis testing), bao gồm 4 bước sau đây:
- Đặt ra các giả thuyết. Công việc của bước này là chỉ ra đâu là giả thuyết không,
đâu là giả thuyết nghịch. Các giả thuyết được đặt ra theo cách loại trừ lẫn nhau.
Đó là, nếu cái này đúng thì cái kia phải sai.
- Xây dựng một kế hoạch phân tích. Kế hoạch phân tích mơ tả cách sử dụng dữ
liệu mẫu ra sao để đánh giá giả thuyết không. Đánh giá thường tập trung xung
quanh một thống kê mẫu đơn (single test statistic).
- Phân tích dữ liệu mẫu. Tìm các giá trị của thống kê mẫu (trung bình, tỉ lệ, tstatistic, z-score…) được mơ tả trong kế hoạch phân tích.
- Đọc hiểu kết quả. Áp dụng các quy tắc quyết định được mơ tả trong kế hoạch
phân tích. Nếu kết quả thu được khơng khớp với giả thuyết khơng thì bác bỏ
giả thuyết này.
3. Các loại sai lầm khi kiểm định
- Sai lầm loại 1 (Type I error). Lỗi loại 1 xảy ra khi các nhà nghiên cứu bác bỏ
một giả thuyết khơng trong khi nó đúng. Xác xuất gặp phải lỗi loại 1 được gọi
là mức ý nghĩa. Xác suất này cũng được gọi là alpha, thường đc ký hiệu là α

- Lỗi loại 2 (Type II error). Lỗi loại 2 xảy ra khi các nhà nghiên cứu chấp nhân
một giả thuyết khơng trong khi nó sai. Xác suất mắc phải lỗi loại 2 được gọi
là Beta, đc ký hiệu là β..
4. Các quy tắc đưa ra quyết định.
Để đưa ra được quyết đinh bác bỏ giả thuyết Ho, các nhà thống kê cần dựa vào
những quy tắc nhất định. Những quy tắc này được liệt kê trong kế hoạch phân.
- Lấy mẫu ngẫu nhiên W= ( X1,X2,…,Xn)
- XDTK: G= f( X1,X2,…,Xn,)
- Từ đám đông ta lấy ra một mẫu cụ thể kích thước n và tính gtn
+ Nếu gtn thuộc W thì bác bỏ Ho và chấp nhận H1
+ Nếu gtn khơng thuộc W thì chưa có cơ sở bác bỏ Ho
5. Các bài toán cần kiểm định
5.1. Kiểm định giả thuyết về kì vọng tốn của ĐLNN
*Bài tốn: Xét ĐLNN X , có E(X) = μ, Var(X) = σ; μ chưa biết.
Từ cơ sở nào đó người ta đặt giả thuyết 𝐻0 : 𝜇 = 𝜇0 . Nghi ngờ GT trên với
mức ý nghĩa α ta kiểm định 1 trong 3 bài toán sau:
𝐻 : 𝜇 = 𝜇0
𝐻 : 𝜇 = 𝜇0
𝐻 : 𝜇 = 𝜇0
BT1: { 0
BT2: { 0
BT3: { 0
𝐻1 : 𝜇 ≠ 𝜇0
𝐻1 : 𝜇 > 𝜇0
𝐻1 : 𝜇 < 𝜇0
* Các trường hợp giải bài toán
- TH1: X tuân theo chuẩn, tham số đã biết
- TH2: Chưa biết quy luật phân phối của X, n> 30
- TH3: X tuân theo chuẩn, tham số đã biết, n< 30
Nhóm 1


Trang 8


LTXSTK

GVHD: Mai Hải An

* Các bước giải bài toán kiểm định (TH2, BT1)
B1: Xây dựng tiêu chuẩn kiểm định
𝜎2
Vì 𝑛 > 30 nên 𝑋̅ ≅ 𝑁(𝜇; )
XDTCKĐ 𝑈 =

𝑋̅−𝜇0
𝜎
√𝑛

𝑛

Nếu 𝐻0 đúng 𝑈 ≅ 𝑁(0; 1)

B2: Tìm miền bác bỏ
𝐻 : 𝜇 = 𝜇0
BT1: { 0
𝐻1 : 𝜇 ≠ 𝜇0
Với mức ý nghĩa 𝛼 ta tìm được phân vị 𝑈𝛼
2

𝑃(|𝑈| > 𝑈𝛼 )= 𝛼 tương đương 𝑊𝛼 = {𝑈𝑡𝑛 : |𝑈𝑡𝑛 | > 𝑈𝛼 }

2

2

B3: Với mẫu cụ thể tính
𝑢𝑡𝑛 =

𝑥̅ − 𝜇0
𝜎
√𝑛

Kết luận theo Quy tắc kiểm định
+ Nếu 𝑢𝑡𝑛 ϵ Wα ∶ Bác bỏ 𝐻0 , chấp nhận H1 .
+ Nếu 𝑢𝑡𝑛 ɇ Wα ∶ Chưa có cơ sở bác bỏ 𝐻0 .
Lưu ý: Nếu 𝜎 chưa biết, vì n > 30 nên ta lấy 𝜎 ≈ 𝑠
5.2. Kiểm định giả thuyết về tỉ lệ của đám đông
* Bài tốn: xét đám đơng có tỉ lệ phần tử mang dấu hiệu A là p, p chưa biết.
Từ cơ sở nào đó người ta đặt giả thuyết 𝐻0 : 𝑝 = 𝑝0 . Nghi ngờ GT trên với mức
ý nghĩa α ta kiểm định 1 trong 3 bài toán sau:
𝐻 : 𝑝 = 𝑝0
𝐻 : 𝑝 = 𝑝0
𝐻 : 𝜇 = 𝜇0
BT1: { 0
BT2: { 0
BT3: { 0
𝐻1 : 𝑝 ≠ 𝑝0
𝐻1 : 𝑝 > 𝑝0
𝐻1 : 𝑝 < 𝑝0
* Các bước giải bài tốn kiểm định(BT1)
B1: Chọn mẫu kích thước n khá lớn. Gọi f là tỉ lệ phần tử mang dấu hiệu A trên

mẫu ngẫu nhiên kích thước n.
Xây dựng tiêu chuẩn kiểm định
B2: Tìm miền bác bỏ
B3: Với mẫu cụ thể tính giá trị thực nghiệm và kết luận theo Quy tắc kiểm định.
5.3. Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn
* Bài toán: Xét ĐLNN X, với X phân phối chuẩn với E(X)=μ,
Var(X)=𝜎 2 , 𝜎 2 chưa biết.
Từ cơ sở nào đó người ta đặt giả thuyết 𝐻0 : 𝜎 2 = 𝜎 2 0 . Nghi ngờ GT trên với
mức ý nghĩa α ta kiểm định 1 trong 3 bài toán sau:
𝐻0 : 𝜎 2 = 𝜎 2 0
𝐻0 : 𝜎 2 = 𝜎 2 0
𝐻0 : 𝜎 2 = 𝜎 2 0
BT1: {
BT2: {
BT3: {
𝐻1 : 𝜎 2 ≠ 𝜎 2 0
𝐻1 : 𝜎 2 > 𝜎 2 0
𝐻1 : 𝜎 2 < 𝜎 2 0
Nhóm 1

Trang 9


LTXSTK

GVHD: Mai Hải An

* Các bước giải bài toán kiểm định
B1: Xây dựng tiêu chuẩn kiểm định
B2: Tìm miền bác bỏ

B3: Tính tốn với mẫu cụ thể và kết luận
-----------------------------------MẪU KHẢO SÁT VẤN ĐỀ SỬ DỤNG MẠNG XÃ HỘI CỦA SINH VIÊN ĐH
THƯƠNG MẠI

Câu 1: Hiện tại bạn có đang sử dụng mạng xã hội khơng?
Có (Tiếp tục trả lời)
Khơng (Dừng trả lời)
Câu 2: Trung bình mỗi ngày bạn dành bao nhiêu phút sử dụng mạng xã hội:
0-30
30-60
60-90
90-120
120-150
150-180
180-210
210-240
240-270
270-300
300-330
330-360
360-390
390-420
420-450
450-480
Câu 3: Mức chi phí bạn bỏ ra để sử dụng sóng 3G/Wifi là bao nhiêu?
Câu 4: Kết quả học tập (GPA) của bạn hiện giờ là bao nhiêu?

Nhóm 1

Trang 10



LTXSTK

GVHD: Mai Hải An

CHƯƠNG 2 : GIẢI BÀI TOÁN VÀ KẾT LUẬN
Đề tài: Tiến hành khảo sát điều tra mẫu về các bạn sinh viên ĐHTM giải quyết các
vấn đề sau:
1. Ước lượng thời gian truy cập mạng xã hội hàng ngày của các bạn
2. Uớc lượng mức chi phí hàng tháng để sử dụng song 3G, Wifi
3. So sánh kết quả học tập giữa nhóm có thời gian truy cập mạng xã
hội trên 4h và từ 4h trở xuống.

1. Bài toán ước lượng thời gian sử dụng mạng xã hội trung bình hằng ngày của
các bạn sinh viên:
*Kết quả khảo sát:

n= 225
γ=95%
Bài toán 1: Điều tra ngẫu nhiên 225 sinh viên trường Đại học Thương Mại thấy
cả 225 bạn đều đang sử dụng mạng xã hội. Với độ tin cậy 95% hãy ước lượng
thời gian sử dụng mạng xã hội hàng ngày của các bạn?
*Giái quyết bài toán :
Gọi X là thời gian truy cập mạng xã hội hàng ngày của sinh viên.
Gọi ̅
X là thời gian truy cập mạng xã hội hàng ngày của sinh viên trên mẫu.
Gọi μ là thời gian truy cập mạng xã hội hàng ngày của sinh viên trên đám đông.
2


σ
Do n= 225 >30 → ̅
X~ N(μ; ) nên U~ 𝑁( 0; 1).
n

XDTK : U =
Nhóm 1

̅ −μ
X
s′

× √n~N(0,1)
Trang 11


LTXSTK

GVHD: Mai Hải An

Chọn phân vị: U1−α = −Uα và Uα
2

2

2

P (-𝑈𝛼 < U < 𝑈𝛼)=1-𝛼 = 𝛾
2


2

Thay U vào được:
̅ – Uα⁄
→P (X
2

s′

<μ<̅
X +Uα⁄2

√n

s′

.)= 1-α = γ

√n

Khoảng tin cậy đối xứng của μ là: (𝑋̅ – 𝑈𝛼⁄2 .

𝑠′
√𝑛

;𝑋̅ +𝑈𝛼⁄2 .

𝑠′
√𝑛


.)

̅
X=
75+585+1350+2100+3915+4620+6825+5175+4590+1425+2205+2070+3750+810+2175+465
225

=

187.267
̅ 2=
X
1125+26325+101250+220500+528525+762300+1330875+1164375+1170450+406125+694575+714150+1406250+328050+946125+216225
225

= 44521
Mà 𝑠 ′ = √

n
n−1

̅ 2 − (X
̅)2 =√225 × (44521 − 187.2672 ) = 97.439
(X

𝛼 = 0.05 → 𝑈𝛼⁄2
𝑋̅ – 𝑈𝛼⁄2 .
𝑋̅ +𝑈𝛼⁄2 .

𝑠′

√𝑛
𝑠′
√𝑛

224

=U0.025 =1.96

= 187.267 − 1.96 ×
= 187.267 + 1.96 ×

97.439
√225
97.439
√225

≈ 174.535
≈ 200

 Khoảng tin cậy (174.535;200 )
Vậy với độ tin cậy 95% ta có thể nói thời gian truy cập mạng xã hội trung bình hàng
ngày của sinh viên nằm trong khoảng (174.535 phút ; 200 phút)
2. Bài tốn ước lượng mức chi phí hàng tháng để sử dụng sóng 3G, Wifi của các
bạn sinh viên:
*Kết quả khảo sát:

Nhóm 1

Trang 12



LTXSTK

GVHD: Mai Hải An

n= 225
γ=95%
Bài toán 2: Điều tra ngẫu nhiên 225 sinh viên trường Đại học Thương Mại thấy
cả 225 bạn sử dụng mạng xã hội. Uớc lượng mức chi phí trung bình hàng tháng
để sử dụng sóng 3G, Wifi của các bạn.
*Giải quyết bài toán:
Gọi X là mức chi phí hàng tháng để sử dụng 3G và wifi của sinh viên.
Gọi ̅
X là mức chi phí trung bình để sử dụng 3G và wifi của sinh viên trên mẫu.
Gọi μ là mức chi phí trung bình để sử dụng 3G và wifi của sinh viên trên đám đông.
σ2
Do n= 225 >30 → ̅
X~ N(μ; ) nên U~ 𝑁( 0; 1).
n

̅ −μ
X

XDTK : U =

s′

× √n~N(0,1)

Chọn phân vị: U1−α = −Uα và Uα

2

2

2

P (-𝑈𝛼 < U < 𝑈𝛼)=1-𝛼 = 𝛾
2

2

Thay U vào được:
̅ – Uα⁄
→P (X
2

s′

<μ<̅
X +Uα⁄2

√n

s′

.)= 1-α = γ

√n

Khoảng tin cậy đối xứng của μ là: (𝑋̅ – 𝑈𝛼⁄2 .

̅
X=

𝑠′

;𝑋̅ +𝑈𝛼⁄2 .

√𝑛
0+870+850+2280+3075+4680+800+1200+1950+1000
225

𝑠′
√𝑛

.)

= 74.244

0+26100+42500+136800+230625+421200+80000+144000+292500+200000
̅
X 2=
= 6994.33
225

Mà 𝑠 ′ = √

n
n−1

̅ 2 − (X

̅)2 =√225 × (6994.33 − 74.2442 ) = 38.585
(X

𝛼 = 0.05 → 𝑈𝛼⁄2
𝑋̅ – 𝑈𝛼⁄2 .
𝑋̅ +𝑈𝛼⁄2 .
Nhóm 1

𝑠′
√𝑛
𝑠′
√𝑛

224

=U0.025 =1.96

= 74.244 − 1.96 ×
= 74.244 + 1.96 ×

38.585
√225

38.585
√225

≈ 69.202
≈ 79.286
Trang 13



LTXSTK

GVHD: Mai Hải An

 Khoảng tin cậy (69.202 ; 79.286 )
Vậy với độ tin cậy 95% ta có thể nói rằng mức chi phí trung bình hàng tháng để sinh
viên sử dụng 3G và wifi nằm trong khoảng (69.202 nghìn đồng ; 79.286 nghìn đồng)
3. Bài tốn so sánh kết quả học tập giữa nhóm có thời gian truy cập Internet
trên 4h và từ 4h trở xuống
*Kết quả khảo sát:
❖ Kết quả học tập của các bạn truy cập mạng Internet từ 4h trở xuống:

❖ Kết quả học tập của các bạn truy cập mạng Internet trên 4h:

*Giải quyết bài toán:
- Lấy mức ý nghĩa 𝛼 = 0.05
- Số sinh viên truy cập mạng Internet từ 4h trở xuống 𝑛1 = 171
- Số sinh viên truy cập mạng Internet trên 4h 𝑛2 = 54
❖ Kết quả học tập của các bạn truy cập mạng Internet từ 4h trở xuống:

↔ 𝐸(𝑋)1 = 𝜇1 =
9×2.2+20×2.4+18×2.5+15×2.6+17×2.7+22×2.9+16×3+11×3.2+10×3.3+5×3.5+9×3.6+7×3.7+4×3.8+5×3.9+3×4.0
171

2.925

Nhóm 1

Trang 14


=


LTXSTK

GVHD: Mai Hải An

↔ 𝐸(𝑋 2 )1 =

9×2.22 +20×2.42 +18×2.52 +15×2.62 +17×2.72 +22×2.92 +16×32 +11×3.22 +10×3.32 +5×3.52 +9×3.62 +7×3.72 +4×3.82 +5×3.92 +3×42
171

8.7876

→ 𝑉𝑎𝑟(𝑋)1 = 𝛿12 = 𝐸(𝑋 2 )1 − (𝐸(𝑋)1 )2 ≈ 0.232
❖ Kết quả học tập của các bạn truy cập mạng Internet trên 4h:

↔ 𝐸(𝑋)2 = 𝜇2 =
2×2.6+1×2.7+3×2.9+5×3.1+5×3.2+8×3.3+9×3.5+11×3.6+5×3.7+4×3.8×1×4.0
54

≈ 3.394

↔ 𝐸(𝑋 2 )2 =

2×2.62 +1×2.72 +3×2.92 +5×3.12 +5×3.22 +8×3.32 +9×3.52 +11×3.62 +5×3.72 +4×3.82 +1×42
54

=


11.619
→ 𝑉𝑎𝑟(𝑋)2 = 𝛿22 = 𝐸(𝑋 2 )2 − (𝐸(𝑋)2 )2 ≈ 0.1
• Giả sử kết quả học tập trung bình của sinh viên truy cập internet từ 4h trở
xuống nhỏ hơn kết quả học tập trung bình của sinh viên truy cập internet trên
4h.
• Gọi 𝑋1 , 𝑋2 lần lượt là kết quả học tập trung bình của nhóm truy cập internet
từ 4h trở xuống và nhóm truy cập internet trên 4h.
• Với mức ý nghĩa 𝛼 = 0.05 cần kiểm định :
𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 < 𝜇2
• XDTCKD: 𝑈 =

𝑋̅1 −𝑋̅2
2

2

𝑛1

𝑛2

𝛿
𝛿
√ 1+ 2

• Nếu 𝐻0 đúng thì 𝑈~𝑁(0; 1). Khi đó, ta tìm được 𝑢𝛼 sao cho
𝑃(𝑈 < −𝑢𝛼 ) = 𝛼
• Vì 𝛼 khá bé nên theo ngun lí xác suất nhỏ, ta có miền bác bỏ:


Nhóm 1

Trang 15

=


LTXSTK

GVHD: Mai Hải An

𝑊𝛼 = {𝑢𝑡𝑛 : 𝑢𝑡𝑛 < −𝑢𝛼 }, 𝑡𝑟𝑜𝑛𝑔 đó: 𝑢𝑡𝑛 =

𝑥̅1 −𝑥̅2
2

2

𝑛1

𝑛2

𝛿
𝛿
√ 1+ 2

• Ta có: 𝑢𝛼 = 𝑢0.05 = 1.65
𝑥̅ 1 −𝑥̅ 2

𝑢𝑡𝑛 =



𝛿2
1
𝑛1

𝛿2
+ 2
𝑛2

=

2,925−3,394
0,232 0,1
+
171 54



≈ −8.28 < −1.65 = −𝑢𝛼

→ 𝑢𝑡𝑛 ∈ 𝑊𝛼 , 𝑛ê𝑛 𝑐ℎấ𝑝 𝑛ℎậ𝑛𝐻1 , 𝑏á𝑐 𝑏ỏ 𝐻0
Vậy với mức ý nghĩa 𝛼 = 0.05, có thể kết luận rằng kết quả trung bình học tập của
sinh viên truy cập Internet từ 4h trở xuống nhỏ hơn kết quả học tập trung bình của
sinh viên truy cập Internet trên 4h.

PHẦN IV : KẾT LUẬN
Khi nghiên cứu đề tài, nhóm đã chọn ngẫu nhiên ra 225 bạn sinh viên của
trường đại học Thương Mại để tiến hành khảo sát và có thể đưa ra kết luận chung
cho toàn bộ sinh viên của trường với độ tin cậy 95% và mức ý nghĩa 5%. Mặc dù là

nghiên cứu nhỏ nhưng nó gắn liền với thực tế cao.
Thời gian truy cập mạng xã hội trung bình hàng ngày của sinh viên nằm trong
khoảng từ 174.535 phút (2.9h) đến 200 phút (3.3h). Một con số khá lớn chứng tỏ
phần đơng sinh viên u thích và sử dụng thưởng xuyên mạng xã hội, mạng xã hội
trở thành một phần không thể thiếu do trong thời đại công nghệ thông tin vô cùng
phát triển hiện nay, các mối quan hệ xã hội và học tập, nghiên cứu, làm việc hay giải
trí đều cần phải sử dụng mạng xã hội để cập nhật tin tức, kiến thức, xu thế, kết nối
bạn bè, gia đình, cộng đồng,...
Mức chi phí trung bình hàng tháng để sinh viên sử dụng 3G và wifi nằm trong
khoảng từ 69.202 nghìn đồng đến 79.286 nghìn đồng. Đây là một mức chi phí khá
thấp, phù hợp với điều kiện kinh tế của phần đông sinh viên.

Nhóm 1

Trang 16


LTXSTK

GVHD: Mai Hải An

Kết quả trung bình học tập của sinh viên truy cập Internet từ 4h trở xuống
thấp hơn kết quả học tập trung bình của sinh viên truy cập Internet trên 4h. Do đó,
có thể thấy được thời gian truy cập mạng xã hội nhiều hơn ảnh hưởng tích cực đến
kết quả trung bình học tập của sinh viên.
Tóm lại sau một thời gian làm việc tích cực của nhóm đã thu thập được số liệu
và bằng phương pháp thống kê toán qua hướng dẫn của giảng viên bộ mơn, nhóm đã
hồn thành bài thảo luận với kết quả ước lượng với độ tin cậy là 95% và mức ý nghĩa
5% thì thời gian truy cập mạng xã hội trung bình hàng ngày của sinh viên nằm trong
khoảng (174.535 phút ; 200 phút); Mức chi phí trung bình hàng tháng để sinh viên

sử dụng 3G và wifi nằm trong khoảng (69.202 nghìn đồng ; 79.286 nghìn đồng) và
kết quả trung bình học tập của sinh viên truy cập Internet từ 4h trở xuống thấp hơn
kết quả học tập trung bình của sinh viên truy cập Internet trên 4h.

Nhóm 1

Trang 17



×