Tải bản đầy đủ (.docx) (45 trang)

nghiên cứu sự ảnh hưởng của lượng khí CO2 do con người thải ra đến nhiệt độ trung bình của trái đất và diện tích băng ở bắc cực

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (931.98 KB, 45 trang )

Chương I: Mở đầu
1.1 Đặt vấn đề
Khí hậu là trạng thái khí quyển ở nơi nào đó, được đặc trưng bởi các
trị số trung bình nhiều năm về nhiệt độ, độ ẩm, lượng mưa, lượng
bốc thoát hơi nước, mây, gió...Như vậy, khí hậu phản ánh giá trị
trung bình nhiều năm của thời tiết và nó thường có tính chất ổn
định, ít thay đổi.
Trong lịch sử địa chất của trái đất chúng ta, sự biến đổi khí hậu đa
từng nhiều lần xẩy ra với những thời kỳ lạnh và nóng kéo dài hàng
vạn năm mà chúng ta gọi là thời kỳ băng hà hay thời kỳ gian băng.
Thời kỳ băng hà cuối cùng đa xay ra cách đây 10.000 năm và hiện
nay là giai đoạn ấm lên của thời kỳ gian băng. Xét về nguyên nhân
gây nên sự thay đổi khí hậu này, chúng ta có thể thấy đó là do sự
tiến động và thay đổi độ nghiêng trục quay trái đất, sự thay đổi quỹ
đạo quay của trái đất quanh mặt trời, vị trí các lục địa và đại dương
và đặc biệt là sự thay đổi trong thành phần khí quyển.
Trong khi những nguyên nhân đầu tiên là những nguyên nhân hành
tinh, thì nguyên nhân cuối cùng lại có sự tác động rất lớn của con
người mà chúng ta gọi đó là sự làm nóng bầu khí quyển hay hiệu
ứng nhà kính.Có thể hiểu sơ lược là: nhiệt độ trung bình của bề mặt
trái đất được quyết định bởi sự cân bằng giữa hấp thụ năng lượng
mặt trời và lượng nhiệt trả vào vũ trụ. Khi lượng nhiệt bị giữ lại nhiều
trong bầu khí quyển thì sẽ làm nhiệt độ trái đất tăng lên. Chính
lượng khí CO2 chứa nhiều trong khí quyển sẽ tác dụng như một lớp
kính giữ nhiệt lượng tỏa ngược vào vũ trụ của trái đất. Cùng với khí
CO2 còn có một số khí khác cũng được gọi chung là khí nhà kính như
NOx, CH4, CFC. Với những gia tăng mạnh mẽ của nền sản xuất công
nghiệp và việc sử dụng các nhiên liệu hoá thạch (dầu mỏ, than đá..),
nghiên cứu của các nhà khoa học cho thấy nhiệt độ toàn cầu sẽ gia
tăng từ 1,4 oC đến 5,8 oC từ 1990 đến 2100 và vì vậy sẽ kéo theo
những nguy cơ ngày càng sâu sắc đối với chất lượng sống của con


người.
Sự biến đổi khí hậu toàn cầu đang diễn ra ngày càng nghiêm trọng.
Biểu hiện rõ nhất là sự nóng lên của trái đất, là băng tan, nước biển
dâng cao; là các hiện tượng thời tiết bất thường, bao lũ, sóng thần,
động đất, hạn hán và giá rét kéo dài… dẫn đến thiếu lương thực,
thực phẩm và xuất hiện hàng loạt dịch bệnh trên người, gia súc, gia
cầm…
Đứng trước tình hình đó, nhiều công trình khoa học đa nghiên cứu
về ảnh hưởng của các tác nhân con người đến sự biến đổi khí


hậu.Mà lượng khí thải mà con người thải ra trong quá trình sinh hoạt,
sản xuất nắm một vai trò rất lớn.Qua các số liệu thu thập được từ
các nhà khoa học đi trước, nhóm 22 lớp Hệ thống thông tin trường
Đại học Công Nghiệp Hà Nội sẽ nghiên cứu sự ảnh hưởng của lượng
khí CO2 do con người thải ra đến nhiệt độ trung bình của trái đất và
diện tích băng ở bắc cực.

1.2 Mục đích và mục tiêu nghiên cứu.
- Mục đích nghiên cứu của đề tài là tổng hợp một chuỗi dữ liệu về
lượng khí thải CO2, nhiệt độ trung bình của trái đất và diệt tích bang
ở bắc cực.Xác định ảnh hưởng giữa lượng khí CO2 do còn người thải
ra đến nhiệt độ trung bình của trái đất và qua đó biểu hiện lên ở
diện tích băng ở vùng bắc cực.Từ kết quả nghiên cứu, đưa là sự cảnh
báo đối với sự nóng lên cảu trái đất và đưa ra lời kêu gọi hành động
để chống lại sự biến đổi khí hậu.
- Mục tiêu của dự án là nêu ra được các yếu tố lượng chất thải CO2
do con người thải ra ảnh có ảnh hưởng đến sự nóng lên của trái đất
và hiện tượng băng tan ở hai cực hay không và nếu ảnh hưởng thì
ảnh hưởng như thế nào.Qua đó đưa ra được các số liệu cụ thể và lời

cảnh báo về vấn đề nóng lên của trái đất.
1.3 Ý nghĩa của đề tài
Vấn đề khí hậu đang là một vấn đề rất đáng quan tâm đối với tất
cả các quốc gia trên thế giới. Do hoạt động sinh hoạt và sản xuất
của con người đa thải ra bầu khí quyển môt lượng lớn khí CO2, một
tác nhân chính gây nên hiện tượng hiệu ứng nhà kính và làm trái đất
nóng dần lên. Đứng trước vấn đề đó nhóm 22 lớp Hệ thống thông tin
trường Đại học công nghiệp hà nội đa tiến hành nghiên cứu , phân
tích ảnh hưởng của lượng khí thải CO2 đến môi trường trái đất, qua
đó hiểu rõ hơn tầm quan trong của việc bảo vệ môi trường nói chung
cũng như vấn đề cắt giảm lượng khí CO2 nói riêng.
-Về lý luận, kết quả của đề tài cung cấp số liệu về sự biến động
của nhiệt độ trung bình trái đất, diện tích băng ở Bắc cực cũng như
lượng khí thải CO2 mà con người thải ra từ năm 1979 đến năm 2010.
-Về thực tiễn, kết quả của đề tài cung cấp những căn cứ khoa
học để dự đoán tác động của lượng khí thải CO2 đến khí hậu trái đất
qua đó đưa ra lời cảnh báo đến các nước có lượng khí thải lớn.


CHƯƠNG II
ĐỐI TƯỢNG, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu của đề tài là lượng khí thải CO2, nhiệt độ
trung bình trái đất và diện tích băng tại bắc cực. Các số liệu được lấy
từ Compiled by Earth Policy Institute from F. Fetterer, K. Knowles, W.
Meier, and M. Savoie, "Sea Ice Index," (Boulder, CO: National Snow
and Ice Data Center) và CO2 Emissions from Fuel Combustion (2012
Edition), IEA, Paris.Thời gian nghiên cứu bắt đầu từ 1/2013, kết thúc
vào 5/2013.

2.2 Nội dung nghiên cứu
Nội dung nghiên cứu bao gồm:
Lượng khí thải CO2 trên thế giới từ 1979 đến 2010.
Nhiệt độ trung bình trái đất từ 1979 đến 2010.
Diện tích băng trung bình hằng năm ở Bắc cực.
Mối liên hệ giữa lượng khí thải CO2 đến nhiệt độ trung bình trái
đất.
5. Ảnh hưởng của lượng khí thải CO2 và nhiệt độ trung bình trái
đất đến diện tích băng trung bìn hằng năm ở Bắc cực.
6. Đưa ra một số nhận xét và đề xuất.
1.
2.
3.
4.

2.3 Phương pháp nghiên cứu
2.3.1 Cơ sở khoa học


Cơ sở khoa học của phương pháp là dựa trên những số liệu
thống kê đáng tin cậy của các nhà khoa học trên thế giới qua các
phương pháp phân tích đánh giá để đưa ra kết luận cuối cùng.Các
nhà khoa học trên thế giới đa chứng minh rằng lượng khí thải CO2
do con người tạo ra là nguyên nhân chính gây ra hiện tượng nhà
kính làm cho trái đất nóng lên.Nhiệt độ bề mặt trái đất được tạo nên
do sự cân bằng giữa năng lượng mặt trời đến bề mặt trái đất, và
năng lượng bức xạ của trái đất vào khoảng không gian giữa các
hành tinh. Trong khi đó, bức xạ của trái đất với nhiệt độ bề mặt trung
bình +16°C là sóng dài có năng lượng thấp, dễ dàng bị khí quyển giữ
lại. Các tác nhân gây ra sự hấp thụ bức xạ sóng dài trong khí quyển

là khí CO2, bụi, hơi nước, khí mêtan, khí CFC v.v... Kết quả của sự
của sự trao đổi không cân bằng về năng lượng giữa trái đất với
không gian xung quanh, dẫn đến sự gia tăng nhiệt độ của khí quyển
trái đất. Hiện tượng này diễn ra theo cơ chế tương tự như nhà kính
trồng cây và được gọi là Hiệu ứng nhà kính.

H2.1 khí thải CO2 từ quá trình sản xuất
Hiệu ứng nhà kính làm cho nhiên độ kề mặt của trái đất tăng lên
và do đó sẽ làm băng tan chảy và mực nước biển dâng cao. Điều
này có thể khiến nhiều vùng sản xuất lương thực trù phú, các khu
đông dân cư, các đồng bằng lớn, nhiều đảo thấp sẽ bị chìm dưới lòng
đại dương.


H2.2 Nhiệt độ trái đất

Sự nóng lên của trái đất sẽ làm thay đổi điều kiện sống bình thường
của các sinh vật, nhiều loai vật có thể bị tiêu diệt. Trái đất nóng lên
cũng khiến cho hoạt động sản xuất bị ảnh hưởng, nhiều loại bệnh tật
mới sẽ xuất hiện, dịch bệnh lan tràn, sức khỏe con người bị suy giảm


H2.3 Hiện tượng băng tan do trái đất nóng lên
2.3.2 Thu thập và xử lý số liệu
- Dữ liệu về nhiệt độ cà diện tích băng ở bắc cực được lấy từ
nsidc.org, National Snow and Ice Data Center là một trung tâm hỗ
trợ nghiên cứu địa cực và nghiên cứu sự phát triển của các sinh vật ở
nhiệt độ thấp. NSIDC lưu trữ và phân phối dữ liệu băng và các thông
tin về tuyết phủ, lở tuyết, song băng….NSIDC là một phần của viện
nghiên cứu khoa học môi trường thuộc Đại học Colorado Hoa Kỳ, và

liên kết hợp tác với Quản lý khí quyển quốc gia trung tâm dữ liệu địa
vật lý đại dương.
- Dữ liệu về lượng khí thải CO2 được lấy từ www.iea.org.
International Energy Agency (cơ quan năng lượng quốc tế), là một tổ
chức đa chính phủ được thành lập trong cuộc khủng hoảng dầu năm
1973-1974 nhắm cố vấn chính sách năng lượng cho các quốc gia
thành viên để đảm bảo năng lượng đáng tin cậy, giá cả phải chăng
và sạch cho công dân của họ.

Chương III

KẾT QUẢ NGHIÊN CỨU VÀ ĐÁNH GIÁ

3.1 Cơ sở lý thuyết
3.1.1 Phân tích theo chuỗi thời gian
3.1.1.1. Định nghĩa:
Chuỗi tuần tự theo thời gian là một chuỗi các gía trị của một đại
lượng nào đó
được ghi nhận tuần tự theo thời gian.
3.1.1.2.Các thành phần của chuỗi tuần tự theo thời gian


Các nhà thống kê thường chia chuỗi tuần tựtheo thời gian ra làm 4
thành phần:
-

Thành phần xu hướng dài hạn (long-term trend

component)
- Thành phần mùa (Seasonal component)

- Thành phần chu kỳ(Cyclical component)
- Thành phần bất thường (irregular component)
a. Thành phần xu hướng dài hạn:
Thành phần này dùng đểchỉxu hướng tăng giảm của đại lượng X
trong khoảng
thời gian dài. Vềmặt đồthịthành phần này có thểdiễn tảbằng một
đường thẳng hay
bằng một đường cong tròn (Smooth curve).

b. Thành phần mùa:
Thành phần này chỉ sự thay đổi của đại lượng X theo các mùa trong
năm (có thể
theo các tháng trong năm)


c. Thành phần chu kỳ:
Thành phần này chỉ thay đổi của đại lượng X theo chu kỳ. Sự khác
biệt của thành
phần này so với thành phần mùa là chu kỳ của nó dài hơn một năm.
Để đánh gía thành
phần chu kỳ các giá trị của chuỗi tuần tự theo thời gian sẽ được
quan sát hằng năm.

d. Thành phần bất thường:
Thành phần này dùng để chỉ những sự thay đổi bất thường của các
gía trị trong
chuỗi tuần tự theo thời gian. Sự thay đổi này không thể dự đoán
bằng các số liệu kinh



nghiệm trong qúa khứ, về mặt bản chất này không có tính chu kỳ.
3.1.1.3 Mô hình hóa việc dự báo gía trịcủa đại lượng X
3.1.1.3.1 Mô hình nhân: ( Multiplicative model).

Xt: Giá trị của đại lượng X ở thời điểm t
Tt: Giá trị của thành phần xu hướng ở thời điểm t. Tt có cùng đơn vị
với Xt
St, Ct, It: là các hệ số đánh giá ảnh hưởng của các thành phần mùa,
thành phần
chu kỳ và thành phần bất kỳ đến gía trị của X ở thời điểm t.
Trong thực tế việc xác định It rất khó khăn nên thường được bỏ qua,
khi đó:

3.1.1.3.2 Mô hình cộng(Additive model)

Xt: giá trị của đại lượng X ở thời điểm t
Tt, St, Ct, It: Giá trị của thành phần xu hướng, mùa, chu kỳ và bất
thường ở thời
điểm t.
Trong thực tế, để dự báo giá trị của đại lượng X ta có thể phối hợp
cả2 loại mô
hình trên.
3.1.1.4 Dự báo:
a. Khái niệm chung:
Dự báo là khả năng nhận thức được sự vận động của các đối tượng
nghiên cứu
trong tương lai dựa trên sự phân tích chuỗi thông tin quá khứ và hiện
tại. Cho đến nay,
nhu cầu dự báo đa trở nên hết sức cần thiết ởmỗi lĩnh vực.



b.Bản chất và các khái niệm liên quan đến dự báo:
-Tiên đoán(Predicting) là đoán trước sự vận động của đối tượng
nghiên cứu trong tương lai. Đó là kết quả nhận thức chủ quan của
con người dựa trên một số cơ sở nhất định. Có thể nêu mức độ tiên
đoán ở 3 khía cạnh.
+) Tiên đoán không tưởng:
Đó là những tiên đoán không có cơ sở khoa học, chỉ dựa trên những
mối liên hệ
không tưởng thiếu căn cứ.
+) Tiên đoán kinh nghiệm:
Đó là những tiên đoán dựa trên chuỗi thông tin lịch sử. Mức độ ít
nhiều có cơ sở
khách quan, tuy nhiên có nhược điểm là loại tiên đoán này không
giải thích được xu thế vận động của đối tượng nghiên cứu và đa số
dừng lại ở bước định tính.
+) Tiên đoán khoa học:
Đó là tiên đoán dựa trên phân tích mối liên hệqua lại giữa các đối
tượng nghiên
cứu và phương pháp xửlý thông tin khoa học nhằm phát hiện tính
quy luật của đối tượng.
-Dự báo(Forecasting) là tiên đoán khoa học mang tính xác suất
và tính phương án trong khoảng thời gian hữu hạn về tương lai phát
triển của đối tượng nghiên cứu.
+) Tính xác suất :
Do dự báo dựa trên việc xử lý chuỗi thông tin bao gồm cả 2 yếu
tố xu thế phát
triển và yếu tố ngẫu nhiên, vì vậy kết quả dự báo so với thực tế có
sự chên lệch mang tính xác suất.
+) Tính chất phương án:

Dự báo được thể hiện bằng nhiều dạng kết quả có thể xảy ra trong
tương lai (dạng
định tính, dạng định lượng, dạng khoảng, dạng điểm, …)
+) Tính chất thời gian hữu hạn:


Sự chênh lệch giữa thời điểm dự báo và thời điểm hiện tại được gọi
là khoảng
cách dự báo(tầm xa dự báo l), khoảng cách này không thể tùy tiện
mà nó phụ thuộc vào mức độ ổn định của đối tượng nghiên cứu
trong quá trình phát triển . Vì vậy dự báo được tiến hành với khoảng
cách dự báo thích hợp tương ứng một khoảng thời gian hữu hạn nào
đó.
c. Phân loại dự báo:
+) Dựa vào thời gian :
Căn cứ vào khoảng cách dự báo, người ta chia dự báo thành 2 loại
chính:
- Dự báo ngắn hạn :Khoảng cách dự đoán ngắn hạn dùng cho
cấp quản lý trung
bình và thấp, cho chiến lược tức thời.
- Dự báo dài hạn : Khoảng cách dự báo dài dùng cho quản lý cấp
cao, cho các
đối tượng nghiên cứu mang tầm cỡ chiến lược.
+) Dựa theo kết quả:
- Dự báo điểm :Kết quả dự báo được thể hiện bằng một giá trị duy
nhất.

Ft+l : giá trị dự báo thời điểm t+l.
- Dự báo khoảng : Kết quả dự báo được thể hiện dưới dạng khoảng
tin cậy với

xác suất xảy ra được chủ định.

+) Dựa theo đối tượng nghiên cứu:
- Dự báo tài nguyên.
- Dự báo khoa học kỹ thuật.
- Dự báo dân số lao động.
- Dự báo xa hội.


- Dự báo thị trường…
d. Các bước dự báo:
Công tác dự báo gồm 4 bước:
B1: Thu thập số liệu
Yêu cầu phải có số liệu
- Chính xác
- Đúng mục đích dự báo
Đây là phần khó khăn và tốn thời gian.
B2: Xử lý sơ bộ số liệu:
- Bỏ những số liệu không cần thiết, không chính xác.
- Bổ sung những số liệu còn thiếu.
- Chia tập số liệu thành 2 nhóm : nhóm đầu và nhóm kiểm tra.
B3: Lựa chọn phương pháp và xây dựng mô hình dự báo
- Phương pháp dự báo được chọn sao cho phù hợp với số liệu thuộc
nhóm đầu
và với đối tượng nghiên cứu.
- Lập mô hình dự báo sao cho sai số dự báo là nhỏ nhất. Sai số dự
báo được
kiểm định bởi nhóm số liệu kiểm tra.
B4: Dự báo:
- Từ mô hình dự báo xác định giá trị dự báo

- Phân tích kết quả nhận được.
3.1.2 Phân tích hồi quy đơn biến
3.1.2.1 Khái niệm
-Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến(biến
phụ thuộc hay còn gọi là biến được giải thích) vào một hay nhiều
biến khác(biến độc lập hay còn gọi là biến giải thích) với ý tưởng cơ
bản là ước lượng(hay dự đoán) giá trị trung bình của biến phụ thuộc
trên cơ sở các giá trị đa biết của biến độc lập.
3.1.2.2 Lý thuyết chung


Mô hình hồi qui tuyến tính (từ nay sẽ viết tắt là HQTT) phát biểu
rằng: Gọi là đo lường của đối tượng i (i = 1, 2, 3, …, n) của một biến
phụ thuộc, và là đo lường của một biến độc lập cũng của đối
tượng i, mối liên hệ tuyến tính giữa hai biến có thể mô tả bằng
phương trình với hai thông số α và β như sau:

Trong đó, α và β là hai tham số của mô hình hồi qui tuyến tính cần
ước tính từ số liệu quan sát được, và ε1 là phần dư, tức phần không
thể tiên lượng bằng đo lường của biến số độc lập. Mô hình trên chỉ
hợp lí khi các giả định sau đây đúng:
(i)
Giá trị của x không chịu ảnh hưởng sai số đo lường (random
error);
(ii)
ε1 tuân theo luật phân phối chuẩn với trung bình 0 và
phương sai;
(iii)

ε1 không có tương quan gì với x; và


(iv)
các giá trị nối tiếp của ε1 (chẳng hạn như ε1 và ε2) độc lập
với nhau.
Với các giả định trên, và bởi vì hai tham số α và β là bất biến, cho
nên, cho một đo lường của x chúng ta có thể ước tính trị số kì vọng
(hay nói rõ hơn là số trung bình) của y như sau:

Vấn đề đặt ra là cho một loạt số liệu (x 1,y1) , (x2,y2), . . . , (xn,yn), hai
tham số α và β nên ước tính như thế nào. Phương pháp Phương
pháp bình phương nhỏ nhất (còn gọi là least squares method) là
phương pháp tốt nhất để ước tính hai tham số đó. Theo phương
pháp này, chúng ta cần tìm hai ước số a và b (tương đương với α và
β ) sao cho tổng số bình phương giữa giá trị quan sát (y i) và giá trị
tiên đoán ( ) là thấp nhất, nói cách khác, chúng ta tối thiểu hóa:


Hóa ra, muốn tối thiểu hóa Q chúng ta chỉ cần giải hệ phương trình
đơn giản sau đây:

Chú ý rằng, trong các phương trình trên,
là số trung bình
của biến số x và y. Xin nhắc lại rằng chúng ta không biết được giá trị
của a và b, mà chỉ có thể ước tính chúng, và ước số của hai tham số
này chính là α và β . Thuật ngữ thống kê gọi a là intercept,
và b là gradient hay slope. Như chúng ta thấy qua phương trình
trên, intercept chính là giá trị của y khi x = 0.
Công thức [4] cho thấy ước số b chỉ đơn giản bằng hiệp biến
của x và y chia cho phương sai của y. Tuy các công thức này mới
nhìn qua có vẻ rắc rối, nhưng trong thực tế thì rất đơn giản, bạn đọc

chỉ cần một máy tính cầm tay (calculator) hay tốt hơn nữa phần
mềm Excel cũng có thể tính rất dễ dàng.
3.1.2.3 Kiểm định giả thuyết về a và b
Quay lại với mô hình y1= α + βx1 + ε1 , chúng ta có thể rút ra vài
nhận xét như sau: Nếu β=0, thì phương trình đơn giản thành y1= α +
ε1, tức là không có mới tương quan nào giữa x và y; nhưng
nếu β≠0 (tức có thể âm hay dương) thì mối liên hệ giữa x và y hiện
hữu. Do đó, kiểm định mô hình hồi qui tuyến tính tập trung vào
kiểm định giá thuyết β=0. Để kiểm định giả thuyết này, chúng ta
cần tính toán phương sai của b (vì nên nhớ rằng b là ước số của β).
Chúng ta biết rằng là số trung bình của vòng eo, và phương sai
của vòng eo, trước khi biết cân nặng, có thể ước tính như sau:


Công thức trên còn được gọi là phương sai vô điều kiện, Nhưng
trong mô hình [1], như vừa đề cập trên,
chính là vòng
eo trung bình với điều kiện xi. Chính vì thế mà phương sai
của y (kí hiệu s2) với điều kiện biết cân nặng được ước tính bằng
cách thay thế

:

(Chú ý rằng mẫu số là n – 2, chứ không phải n – 1, vì đây là phương
sai được ước tính với 2 tham số a và b,cho nên n phải trừ cho 2).
Gọi ei là độ khác biệt giữa vòng eo thực tế và vòng eo tiên đoán:

Trong thuật ngữ thống kê học, ei còn được gọi là “residual”. Phương
sai trong phương trình [6] có thể viết lại như sau:


s2 chính là ước số của

trong mô hình [1]

Sau vài thao tác đại số, có thể chứng minh rằng phương sai
của b và a có thể viết như sau:

và:


Khi n (số đối tượng tương đối lớn), b tuân theo luật phân phối chuẩn
với số trung bình là và phương sai như trình bày trong [8]. Do đó,
kiểm định giả thuyết β = 0 có thể dựa vào tỉ số Tb sau đây:

(Chú ý, sx chính là độ lệch chuẩn của x). Nếu β = 0 thì Tb tuân theo
luật phân phối t với bậc tự do là n – 2.
Ngoài ra, kiểm định giả thuyết α = 0 cũng có thể tính toán qua tỉ
số Ta như sau:

Nếu α = 0 thì t tuân theo luật phân phối t với bậc tự do là n – 2.
3.1.2.4 Phân tích phương sai
Một trong những mục đích của phân tích hồi qui tuyến tính là tìm
hiểu xem biến độc lập có thể giải thích bao nhiêu phần trăm độ biến
thiên của biến phụ thuộc. Trong ví dụ này, cụ thể là chúng ta muốn
biết bao nhiêu phần trăm của độ biến thiên (hay khác biệt) giữa các
cá nhân về vòng eo có thể giải thích bằng cân nặng. Cụm từ căn
bản ở đây là “biến thiên” (thuật ngữ thống kê học là variation).
Chú ý rằng mỗi cá nhân có 3 giá trị: vòng eo thực tế yi, vòng eo tiên
đoán bằng cân nặng
, và vòng eo trung bình của quần thể

liên hệ giữa ba giá trị này có thể mô tả như sau:

. Mối

Nói cách khác, độ khác biệt giữa vòng eo của một cá nhân và số
trung bình là tổng số khác biệt của: (a) giữa giá trị tiên đoán và số
trung bình (
đoán

.

), và (b) giữa giá trị thực tế và giá trị tiên


Do đó, một chỉ số có thể đo lường độ biến thiên của một biến là tổng
bình phương của biến đó. Nói cách khác, nếu yi là vòng eo của từng
cá nhân i và
hiệu SST):

là vòng eo trung bình, thì tổng bình phương là (kí

Trong mô hình [1], chúng ta có là giá trị tiên đoán của yi sau khi
“điều chỉnh” cho cân nặng (xi), cho nên, cùng một logic như trên, có
thể nói rằng tổng biến thiên của vòng eo mà mô hình [1] có thể giải
thích được là (kí hiệu SSR):

Và phần còn lại, tức phần biến thiên của vòng eo không thể giải
thích bằng mô hình [1] là (kí hiệu SSE):

Do đó, qua mối liên hệ [9], chúng ta có thể chứng minh rằng:


SST = SSR + SSE

hay:
Chúng ta thấy để ước tính SST, chúng ta phải “tiêu” ra một tham số
(số trung bình), cho nên bậc tự do (degrees of freedom) của SST là n
– 1. Do đó, số trung bình bình phương (mean squares)
là MST = SST / (n –1). Để tính SSE, chúng ta phải cần đến hai tham
số (a và b), cho nên bậc tự do của SSE là n – 2; do đó, số trung bình
bình phương là MSE = SSE / (n – 2). Các chỉ số này có thể tóm lược
trong một bảng phân tích phương sai (analysis of variance) như sau:
Bảng 4. Phân tích phương sai cho mô hình hồi qui tuyến tính
Nguồn biến thiên

Bậc
tự
(degrees
freedom)

do Tổng
bình Trung bình bình
of phương (sum of phương (mean
squares)
squares)


Hồi qui (regression) 1

MSR = SSR / 1


Phần dư (residual) n – 2

MSE = SSE / (n
– 2)

Tổng số biến thiên n – 1

Kiểm định F
Để kiểm định ý nghĩa thống kê của giả thuyết = 0, chúng ta đa làm
quen với tỉ số Tb. Nhưng còn một kiểm định tương đương khác là
kiểm định F, với công thức sau đây:

Thật ra, F như định nghĩa trong công thức [15] chính là bình phương
của Tb.
Hệ số xác định (coefficient of determination)
Bởi vì tổng số biến thiên là SST, và trong số này, biến thiên có thể
giải thích qua mô hình hồi qui tuyến tính [1] là SSR, cho nên chúng
ta có thể ước tính số phần trăm mà mô hình có thể giải thích tổng
biến thiên của y. Hệ số này được gọi là hệ số xác định và kí hiệu là
R 2:

Nhìn qua mối liên hệ [13], chúng ta dễ dàng thấy R 2 có giá trị từ 0
đến 1. Nếu R2 = 0, mô hình hồi qui tuyến tính coi như vô dụng, vì
không giải thích phần trăm nào biến thiên của y. Nếu R2= 1 hay gần
1, mô hình hồi qui tuyến tính có thể tiên đoán chính xác giá trị
của y.
Tuy nhiên cần phải nhấn mạnh rằng một mô hình với R 2 cao không
có nghĩa là rằng mô hình tốt. Thật vậy, R2có thể cao nếu b cao hay
biến độc lập có range (day số) lớn. Ngoài ra, R2 có thể cao khi mô
hình tuyến tính được áp dụng cho một mối liên hệ phi tuyến tính.



3.1.2.5 Phân tích phần dư và kiểm tra giả định
Như đề cập trên, phần dư (residual) là độ khác biệt giữa giá trị thực
tế và giá trị tiên đoán của biếnphụ thuộc:
. Phần dư rất
quan trọng cho việc thẩm định tính hợp lí và độ chính xác của mô
hình tiên đoán. Xin nhắc lại rằng mô hình hồi qui tuyến tính mà
chúng ta áp dụng trong Ví dụ 1 chỉ có giá trị khoa học nếu mô hình
này đáp ứng những giả định sau đây:
1. Mối liên hệ giữa cân nặng và vòng eo (biến độc lập và biến phụ
thuộc, hay x và y) phải là mối liên hệ tuyến tính, tức tuân thủ theo
một đường thẳng;
2. Phương sai của y không thay đổi tùy theo giá trị của x; hay nói
cách khác, phần dư ei không biến chuyển một cách có hệ thống với
xi ;
3. Biến phụ thuộc y (hay ei) tuân theo luật phân phối chuẩn; hay một
cách tương đương;
4. Các giá trị của ei không liên quan nhau.
Để kiểm định những giả định trên, một số biểu đồ sau đây có thể áp
dụng:

o

Biểu đồ ei và
để tìm xem có các giá trị “outlier” (tức những
giá trị mà mô hình không tiên đoán chính xác), và xem mô hình
có vi phạm giả định 1 và 2 hay không.

o


Biểu đồ so sánh giá trị quan sát của e i và giá trị kì vọng (dựa
vào luật phân phối chuẩn) của e i để kiểm tra xem giả định 3 có
đáp ứng hay không.

o

Biểu đồ ei và x để kiểm tra xem có cần hoán chuyển x hay
không.

Tuy nhiên, phương sai của ei không cố định. Do đó, các nhà nghiên
cứu khuyến cáo chúng ta nên sử dụngphần dư chuẩn hóa (thuật
ngữ thống kê là standardised residuals). Phần dư chuẩn hóa (kí
hiệu ri) được định nghĩa như sau: lấy phần dư e i chia cho độ lệch
chuẩn của mô hình:


Với cách hoán chuyển này, r i sẽ có giá trị trung bình là 0 và phương
sai bằng 1. Chúng ta có thể sử dụng r i để kiểm tra các giả định của
mô hình hồi qui tuyến tính.

3.1.3 Hồi quy đa biến
3.1.3.1 Khái niệm
Hồi qui bội là mô hình mở rộng của hồi qui đơn, mô hình có nhiều
hơn một biến. Trong mô hình hồi qui bội ta nghiên cứu mối quan hệ
giữa biến phụ thuộc Y và một số biến giải thích X1, X2,…, Xn. Mô
hình hồi quy tuyến tính đa biến có công thức tổng quát như sau:

Xt1 được đặt bằng 1 để có được “tung độ gốc”. Chữ t nhỏ biểu thị số
lần quan sát và có giá trị từ 1 đến n.



3.1.3.2 Phương trình chuẩn.
Mỗi X cho trước sao cho
với mỗi i từ 1 đến k và
mỗi s, t từ 1 đến n. Vì vậy, mỗi biến độc lập được giả định là không
liên hệ với tất cả các số hạng sai số. Trong trường hợp của thủ tục
bình phương tối thiểu thông thường (OLS), chúng ta định nghĩa tổng
của bình phương sai số là:

3.1.3.3 Giả định mô hình
(1) Các biến độc lập của mô hình không có sự phụ thuộc tuyến tính hoàn hảo,

nghĩa là không thể tìm được bộ số thực (λ1,λ2,...,λk) sao cho

với mọi i.
Giả định này còn được được phát biểu là “ không có sự đa cộng tuyến hoàn hảo trong
mô hình”.
(2) Số quan sát n phải lớn hơn số tham số cần ước lượng k.
(3) Biến độc lập Xi phải có sự biến thiên từ quan sát này qua quan sát khác hay
Var(Xi)>0.
3.1.3.4 Ước lượng tham số mô hình hồi quy bội
-Từ số liệu mẫu chúng ta ước lượng hồi quy tổng thể.
Hàm hồi quy mẫu

Phương pháp bình phương tối thiểu
Chọn β1, β2, …, βk sao cho

đạt cực tiểu.
Điều kiện cực trị của



(
-Ước lượng tham số cho mô hình hồi quy ba biến
Hàm hồi quy tổng thể

Hàm hồi quy mẫu
ˆ = βˆ + βˆ X + βˆ X + e
Y
i
1
2 2 ,i
3 3,i
i

Nhắc lại các giả định
(1)

Kỳ vọng của sai số hồi quy bằng 0:

(2)

Không tự tương quan:

(3)

Phương sai đồng nhất:

(4)
(5)

(6)

, i≠j
cov( e , X

) = cov( e , X ) = 0

i
2 ,i
i
3, i
Không có tương quan giữa sai số và từng Xm:
Không có sự đa cộng tuyến hoàn hảo giữa X2 và X3.
Dạng hàm của mô hình được xác định một cách đúng đắn.
Với các giả định này, dùng phương pháp bình phương tối thiểu ta nhận được ước
lượng các hệ số như sau.

(4.10)


- Phân phối của ước lượng tham số
ˆ
Trong phần này chúng ta chỉ quan tâm đến phân phối của các hệ số ước lựơng β 2



. Hơn nữa vì sự tương tự trong công thức xác định các hệ số ước lượng nên

ˆ
chúng ta chỉ khảo sát β2 . Ở đây chỉ trình bày kết quả1.


( )

ˆ
là một ước lượng không chệch : E β 2 = β 2
n

( )

var βˆ 2 =

∑x
i =1

2
3,i



 

 ∑ x 22,i  ∑ x 32,i  −  ∑ x 2,i x 3,i 
 i =1
 i =1
  i =1

n

n


n

2

σ2

Nhắc lại hệ số tương quan giữa X2 và X3 :
Đặt

( )

var βˆ 2 =

= r23 biến đổi đại số ta được
1

∑ x (1 − r )
n

i =1

2
2 ,i

σ2

2
23

Chúng ta có thể rút ra một số kết luận như sau:

(1) Nếu X2 và X3 có tương quan tuyến tính hoàn hảo thì

=1. Hệ quả là

vô cùng lớn hay ta không thể xác định được hệ số của mô hình hồi
quy.
(2) Nếu X2 và X3 không tương quan tuyến tính hoàn hảo nhưng có tương quan
ˆ

tuyến tính cao thì ước lượng β 2 vẫn không chệch nhưng không hiệu quả.
Những nhận định trên đúng cho cả hồi quy nhiều hơn ba biến.
3.2 Áp dụng vào dữ liệu thu thập được
1


3.2.1 Phân tích các thành phần riêng rẽ
3.2.1.1 Lượng khí thải CO2
Các chuyên gia cho rằng sự tích tụ CO2 trong không khí chính là
nguyên nhân chính dẫn đến sự ấm lên của trái đất, tạo ra hiệu ứng
nhà kính. Đây là một vấn đề lớn của môi trường kể từ khi con người
thực hiện cuộc cách mạng công nghiệp.

H3.1 Khí thải CO2 trong quá trình sản xuất

Year

CO2

1979
1980

1981
1982
1983
1984
1985
1986
1987
1988
1989
1990

Million tonnes
18 196
18 042
17 817
17 617
17 736
18 316
18 623
18 993
19 639
20 336
20 734
20 974


1991
1992
1993
1994

1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010

21
21
21
21
21
22
22
22
22
23
23
24
25

26
27
28
29
29
28
30

130
060
148
286
844
527
733
817
959
509
695
076
142
379
187
084
033
483
947
276

Bảng: Lượng khí thải CO2 từ 1979 đến 2010 (triệu tấn)



×