Tải bản đầy đủ (.pdf) (97 trang)

Ứng dụng mô hình hồi quy đa biến (MLR) để ước lượng chi phí xây dựng cho công trình trường học tại long an

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.58 MB, 97 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
**‫٭‬

‫٭٭٭‬

LÊ THANH TÒNG

ỨNG DỤNG MÔ HÌNH HỒI QUY ĐA BIẾN
(MLR) ĐỂ ƯỚC LƯỢNG CHI PHÍ XÂY
DỰNG CHO CÔNG TRÌNH TRƯỜNG HỌC
TẠI LONG AN

LUẬN VĂN THẠC SĨ XÂY DỰNG CÔNG TRÌNH DÂN DỤNG VÀ
CÔNG NGHIỆP

TP. Hồ Chí Minh, năm 2016


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

CHƯƠNG 1: ĐẶT VẤN ĐỀ
1.1 Giới thiệu chung:

Hình 1.1 Vị trí khu vực nghiên cứu
(Nguồn : Google Maps 2016)
Long An là phần đất khá đặc biệt chuyển tiếp giữa Đông Nam Bộ và Tây
Nam Bộ nên được xác định là vùng có vai trò chiến lược phát triển nền kinh
tế và nguồn nhân lực. Cho nên việc xây dựng và sữa chữa các cơ sở, trung


tâm giáo dục hiện nay được quan tâm rất nhiều để tập trung phát triền nguồn
nhân lực trên địa bàn Tỉnh
Trong giai đoạn chuẩn bị cho một dự án xây dựng, một trong những điều
quan trọng nhất là ước lượng chi phí xây dựng một cách hợp lý. Điều này
giúp các chủ đầu tư chủ động được nguồn vốn, đầu tư hiệu quả, tránh lãng
phí. Trong khi dự toán chi phí xây dựng công trình phải dựa trên khối lượng,
đơn giá xây dựng, các chỉ tiêu kinh tế- kỹ thuật, nhân công, máy móc thi
công… nên phải mất rất nhiều thời gian.
Nghiên cứu này nhằm mục đích phát triển các mô hình dựa trên phân
tích thống kê, mà đại diện cho nghiên cứu này là phân tích hồi quy đa biến,
Lê Thanh Tòng

Trang 1


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

nhằm xác định các nhân tố ảnh hưởng và ước lượng được chi phí xây dựng
ban đầu cho các công trình trường học.
Cho đến nay, đã có rất nhiều nghiên cứu sử dụng các phân tích thống kê
để ước lượng chi phí cho các công trình xây dựng như: Ước tính chi phí sơ bộ
cho các công trình công cộng ở bán đảo Malaysia [11]; Mô hình dự báo thời
gian và chi phí xây dựng thực tế [20]; Sử dụng mô hình hồi quy bôi dự báo
chi phí xây dựng [6]…Tuy nhiên, chưa có nghiên cứu nào về hồi quy đa biến
để ước lượng chi phí cho các công trình trường học ở Long An.
1.2. Xác định các vấn đề nghiên cứu:
1.2.1 Lý do nghiên cứu:
Để xác định chi phí xây dựng cho các công trình trường học (đa số từ

vốn ngân sách nhà nước) được lập theo các phương pháp sau [21]:
- Phương pháp khối lượng và đơn giá xây dựng.
- Phương pháp tổng khối lượng hao phí vật liệu, nhân công, máy thi công
và bảng giá tương ứng.
- Phương pháp suất chi phí xây dựng công trình với các chỉ tiêu kinh tế kỹ thuật tương tự đã thực hiện.
- Phương pháp phù hợp với tính chất và đặc điểm xây dựng công trình.
Tuy nhiên, các phương pháp trên vẫn còn nhiều bất cập trong các suất
vốn đầu tư, các dạng công trình trong suất đầu tư vốn chưa đầy đủ, tốn nhiều
thời thực hiện.
Các dự toán công trình hiện nay được lập căn cứ trên khối lượng các
công việc xác định theo thiết kế kỹ thuật, đơn giá xây dựng công trình… nên
phải tốn rất nhiều thời gian.Việc nghiên cứu sử dụng các dữ liệu từ quá khứ
thông qua các phân tích thống kê, để đưa ra các mô hình dự báo chi phí xây
dựng cho các công trình xây dựng có ý nghĩa rất quan trọng, giúp các chủ đầu

Lê Thanh Tòng

Trang 2


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

tư quản lý tốt chi phí đầu tư, tránh những điều chỉnh, phát sinh gây nhiều lãng
phí.
1.2.2 Các câu hỏi nghiên cứu:
- Các nhân tố nào sẽ ảnh hưởng đến chi phí xây dựng cho các công trình
trường học?
- Có thể dùng công cụ nào để tìm ra và phân tích các nhân tố ảnh hưởng

đến chi phí, cách thực hiện thế nào?
- Dùng các công cụ và kiểm định thống kê nào để xây dựng mô hình ước
lượng được chi phí xây dựng cho các công trình trường học? Mô hình
ước lượng sai lệch với giá trị thực tế như thế nào ?
1.3 Các mục tiêu nghiên cứu.
- Xác định các nhân tố ảnh hưởng đến chi phí xây dựng cho các công trình
trường học để thu thập dữ liệu cho các biến đầu vào.
- Từ các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học,
xác định các nhân tố chính để đưa vào mô hình.
- Thiết lập mô hình hồi qui đa biến để ước lượng chi phí xây dựng cho các
công trình trường học.
1.4 Phạm vi nghiên cứu.
Nội dung nghiên cứu của luận văn được thực hiện trong phạm vi sau:
- Phạm vi của luận văn chỉ được giới hạn ở các dự án công trình trường
học sử dụng vốn ngân sách (Tiểu học, Trung học cơ sở, Trung học phổ
thông) trên địa bàn Tỉnh Long An.
- Số liệu thu thập trong luận văn vào khoảng tháng 2/2015; các số liệu
được lấy từ các công trình trường học ở Long An.
- Dữ liệu nghiên cứu là các dữ liệu công trình trường học của giai đoạn
kết thúc dự án.

Lê Thanh Tòng

Trang 3


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh


1.5 Đóng góp của nghiên cứu nghiên cứu.
Hiện nay trên thế giới và Việt Nam đã có nhiều nghiên cứu liên quan đến
ứng dụng hồi quy đa biến, để ước lượng chi phí thông qua việc khai thác các
dữ liệu quá khứ. Nghiên cứu này đóng góp thêm một tình huống ứng dụng để
ước lượng chi phí nữa trong xây dựng công trình trường học.
Về mặt lý luận : Nghiên cứu này góp phần vào sự hiểu biết tốt hơn các
nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học. Đồng thời mở
ra một triển vọng ước lượng chi phí xây dựng không chỉ dựa vào các phương
pháp do nhà nước ban hành mà còn dựa vào các giá trị hiện thực của các dự
án đã xây dựng.
Về mặt thực tiễn : Nghiên cứu sử dụng các dữ liệu từ quá khứ thông qua
các phân tích thống kê, để đưa ra các mô hình dự báo chi phí xây dựng giúp
các chủ đầu tư ước lượng chi phí khách quan, quản lý tốt chi phí đầu tư ban
đầu, tránh những điều chỉnh, phát sinh gây nhiều lãng phí.

Lê Thanh Tòng

Trang 4


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

CHƯƠNG 2: TỔNG QUAN
2.1 Phân tích hồi quy đa biến:
2.1.1 Khái niệm:
Phân tích hồi quy đa biến là một công cụ thống kê dùng để mô tả mối liên
hệ giữa một biến phụ thuộc (Y) và các biến độc lập (Xi). Phương trình mô tả
có dạng như sau:

Yi = 0 + 1X1i + 2X2i + … +kXpi + ei

(2.1)

Trong đó:
- Y: là biến phụ thuộc
- 0: là tung độ gốc
- Xpi : là các biến độc lập thứ p tại quan sát thứ i
- k là các hệ số hồi quy riêng phần (Partial regression coefficients)
- ei là một biến độc lập ngẫu nhiên (yếu tố nhiễu) có phân phối chuẩn với
trung bình là 0 và phương sai không đổi 2.
Mô hình hồi quy tuyến tính bội giả định rằng biến phụ thuộc có phân
phối chuẩn đối với bất kỳ sự kết hợp nào của các biến độc lập trong mô hình.
Để tránh hiên tượng đa cộng tuyến, trong phân tích hồi quy cần phải xem xét
mối tương quan tuyến tính giữa các biến [6].
2.1.2 Các giả định trong phân tích hồi quy:
Phân tích hồi quy không phải chỉ là mô tả lại các dữ liệu đã quan sát, mà
từ các kết quả quan sát trong tập mẫu phải được suy rộng cho mối liên hệ giữa
các biến trong tổng thể. Các kết quả trong phân tích hồi quy được chấp nhận
và diễn giải thông qua các giả định cần thiết. Nếu các giả định bị vi phạm thì
các kết quả trong phân tích hồi quy không đáng tin cậy nữa. [6]

Lê Thanh Tòng

Trang 5


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh


2.1.2.1 Giả định độc lập
Các giá trị (Y) độc lập thống kê với nhau, tức là các quan sát này không
bị ảnh hưởng bởi các quan sát khác [6].
2.1.2.2 Giả định phân phối chuẩn và phương sai bằng nhau
Nếu các biến độc lập(X) được đưa vào với bất kì giá trị nào thì phân phối
của biến phụ thuộc (Y) cũng đều là phân phối chuẩn, trung bình của (Y) tại
một giá trị (X) cụ thể là μ (Y/X) và phương sai không đổi [6].
Cơ sở để xem xét vấn đề này cần phải quan sát biều đồ phân tán phần dư
với mỗi biến, hoặc đối với giá trị ước lượng Ŷ. Nếu đồ thị phân tán của phần
dư không theo một quy luật nào, dữ liệu là độc lập, đồ thị không phân bố dày
đặc thì khả năng diễn đạt của mô hình đáng tin cậy [10].
2.1.2.3 Giả định tuyến tính
Nếu mối liên hệ không phải là quan hệ tuyến tính, mà trong phân tích dữ
liệu ta dùng quan hệ tuyến tính để mô tả dữ liệu thì sẽ không có ý nghĩa. Cho
nên cần thiết phải kiểm tra điều kiện đủ thẳng thông qua các biểu đồ phân tán
(Scatterplot) của biến phụ thuộc (Y) với mỗi biến độc lập (X) phải đủ thẳng ở
điều kiện chấp nhận được [10].
2.1.3 Các thông số trong phân tích hồi quy:
Hệ số tương quan bội R (Coefficient of correlation): là hệ số thể hiện mức
độ chặt chẽ của mối liên hệ giữa 2 biến định lượng
N

 (X
R 






 X )(Y  Y )

i 1
N

 (X



(2.2)



 X ) 2 (Y  Y ) 2

i 1

- R nhận giá trị trong [-1, 1]
- R=0 thì 2 biến không tồn tại mối liên hệ tuyến tính nào, dấu (+) hoặc (-)
Lê Thanh Tòng

Trang 6


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

thể hiện mối liên hệ đồng biến hoặc nghịch biến [6].
Hệ số xác định R2 (Coefficient of determination): Dùng để đo mức độ phù

hợp của phương trình hồi quy với các số liệu quan sát được:
n

R2  1

RSS
1
TSS



^

(Y i  Y i ) 2

i 1
n



__

(Yi  Y )

(2.3)

2

i 1


- R2 có khuynh hướng tăng lên khi số lượng biến độc lập giải thích trong
mô hình tăng lên. R2 nhận giá trị trong [0,1] và R2 càng tiến về một thì
phương trình hồi quy càng phù hợp với tập dữ liệu
Hệ số xác định hiệu chỉnh

R

2
a d j

(Adjusted R squared): Dùng để phản ánh

sát hơn mức độ phù hợp của mô hình hồi quy đa biến. Giá trị R Squared Adj
không nhất thiết tăng lên khi nhiều biến được thêm vào phương trình hồi quy,
vì nó không phụ thuộc vào độ lệnh phóng đại của R2 [6].
R a2d j  R 2 

p (1  R 2 )
N  P 1

(2.4)

Hệ số hồi quy riêng phần βk: Hệ số này cho biết ảnh hưởng của các thay đổi
một đơn vị trong Xk đối với giá trị trung bình của biến phụ thuộc (Y) khi loại
trừ ảnh hưởng của các biến độc lập khác [6].
Hệ số beta: Độ lớn của các hệ số phụ thuộc vào đơn vị đo lường của các biến,
để so sánh các hệ số của các biến độc lập với cần phải quy đổi các biến độc
lập về cùng đơn vị. Một cách khác có thể làm cho các hệ số so sánh được với
nhau là tính trọng số beta, đó là hệ số của biến độc lập (X) khi tất cả dữ liệu
trên các biến được biểu diễn bằng đơn vị đo lường độ lệch chuẩn.

 k  Bk

Sk
SY

(2.5)

Sk là độ lệch chuẩn của biến độc lập thứ k [6].

Lê Thanh Tòng

Trang 7


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

Hệ số tương quan từng phần (part correlation coefficients)

R c2h a n g e

: là hệ

số tương quan giữa (Y) và (Xk) khi ảnh hưởng tuyến tính của các biến độc lập
khác đối với biến độc lập Xk bị loại bỏ [6]
(2.6)

R c2h a n g e  R 2  R (2k )


Độ chấp nhận của biến (Tolerance): Được sử dụng đo lường hiện tượng đa
cộng tuyến và được định nghĩa bằng 1

 R

2
k

, trong đó

R k2

là hệ số tương quan

bội khi biến độc lập Xk được dự đoán từ các biến độc lập còn lại. Nếu độ chấp
nhận của một biến nhỏ, thì nó gần như là một kết hợp tuyến tính của các biến
độc lập, đó là dấu hiệu đa cộng tuyến [6].
Hệ số phóng đại phương sai VIF (variance inflation factor): là nghịch đảo
của độ chấp nhận VIF 

1
1  Rk2

và hiện tượng đa cộng tuyến xảy ra khi VIF >10.

2.2 Các nghiên cứu tương tự đã được công bố:
Để ước lượng chi phí xây dựng cho các công trình, có rất nhiều nghiên
cứu sử dụng mô hình hồi quy đa biến để ước lượng chi phí đầu ra dựa trên các
biến đầu vào như:
 Al-Momani, [1] đã thu thập dữ liệu 125 dự án quá khứ từ năm 19841994. Sử dụng mô hình hồi quy đa biến để phân tích các dữ liệu thu

thập được
Y: Chi phí xây dựng.
X1: Chi phí xây dựng theo hợp đồng.
X2: Thay đổi thiết kế
X3: Diện tích sàn /m2.
X4: Ngày hoàn thành thực tế.
X5: Ngày hoàn thành dự kiến.
X6: Thời gian chậm tiến độ
X7: Giá thầu cao nhất
Lê Thanh Tòng

Trang 8


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

X8: Giá thầu thấp nhất
- Kết quả : Xác định được các yếu tố ảnh hưởng và ước lượng được chi
phí xây dựng cho các công trình trường công lập ở Jordan
Log Yi= 1.574+ 0.277logXi1+ 0.03logXi2+ 0.717logXi3

(2.7)

Với hệ số xác định R2 =0.88 và tất cả các hệ số có mức độ ý nghĩa là
99.9% độ tin cậy.
 Attalla, [2] dự báo độ lệch chi phí xây dựng trong các dự án tái xây
dựng sử dụng mạng nơ-ron nhân tạo và hồi quy đa biến.
- Thông tin thu thập được thông qua một cuộc khảo sát các chuyên gia

xây dựng từ 50 dự án tái thiết.
- Đối với từng dự án có độ lệch chi phí thực tế so với chi phí dự toán.
- Dựa trên các thông tin thu thập đã xác định được 36 yếu tố có tác động
trực tiếp đến chi phí xây dựng của các dự án tái thiết
- Sử dụng phân tích thống kê hồi quy và ANN để phát triển các mô hình
dự đoán
- Kết quả : Nghiên cứu đã góp phần tìm ra các lý do dẫn đến sự sai lệch
chi phí của các dự án tái thiết và có thể định lượng các độ lệch chi phí
này.
 Kim, [8] So sánh mô hình ước lượng chi phí xây dựng dựa trên phân
tích hồi quy, ANN và trường hợp cơ sở
- Thông qua chi phí xây dựng thực tế của 530 dự án dân dụng từ năm
1997 đến năm 2000 ở Seoul, Hàn Quốc. Trong 530 dự án được chia
ngẫu nhiên thành 480 bộ dùng để huấn luyện và 50 bộ dùng để kiểm
tra.
- Kết quả : Sau khi kiểm tra 40 bộ dữ liệu trong 50 bộ dữ liệu dùng để
kiểm tra thì tỉ lệ sai số tuyệt đối trung bình là 6.95, 2.97, 4.81. Dựa vào
kiểm định phương sai thì mô hình ANN cho kết quả ước lượng tốt nhất.

Lê Thanh Tòng

Trang 9


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

 David, [5] Nghiên cứu phát triền mô hình hồi quy tuyến tính để dự báo
chi phí xây dựng dựa trên 286 bộ dữ liệu đã được thu thập tại Anh. Hai

phương pháp phân tích đã được thực hiện là forward và backward
stepwise, đưa ra được 6 mô hình và xác định được 41 biến độc lập
trong đó có 5 biến xuất hiện trong cả 6 mô hình là :
X1: Tổng diện tích sàn
X2: Chức năng công trình
X3: Thời gian hoàn thành công trình
X4: Hệ thống cơ điện
X5: Lắp đặt đường ống
Mô hình tốt nhất là mô hình log chi phí với phương pháp backward
R2=0.661, MAPE= 19.3%
 Lưu Nhất Phong [10] Nghiên cứu sử dụng mạng nowrron nhân tạo và
hồi quy đa biến xây dựng mô hình dự báo tổng mức đầu tư. Dữ liệu thu
thập từ 33 dự án xây dựng công trình giao thông tại Bình Định từ năm
2000 đến năm 2009 (3 dự án dùng để kiểm tra và 30 dự án dùng làm bộ
dữ liệu xây dựng mô hình) và tìm ra được 7 nhân tố ảnh hưởng đến
tổng mức đầu tư xây dựng công trình giao thông đường bộ bằng phân
tích hồi quy đa biến
X1: Thời gian thực hiện dự án.
X2: Chiều dài tuyến đường.
X3: Số lượng cống bê tông cốt thép thoát nước trên tuyến.
X4: Số lượng cầu bản bê tông cốt thép thoát nước trên tuyến.
X5: Số lượng cầu dầm bê tông cốt thép thoát nước trên tuyến.
X6: Bề rộng nền đường.
Lê Thanh Tòng

Trang 10


Luận Văn Thạc Sỹ Xây Dựng


GVHD: TS. Đinh Công Tịnh

X7: Bề rộng mặt đường.
Mô hình tốt nhất theo phương pháp Stepwise là:
Tongmuc = 0,149Snen +78,081Lcaudam+22,493Lcong

(2.8)

Kết quả R2=0.86 và MAPE= 2.59%
 Nguyễn Thanh Trúc [14] Nghiên cứu sử dụng phân tích hồi quy đa biến
để xây dựng mô hình ước lượng chi phí cho các dự án công trình
trường học.Nghiên cứu khảo sát được thực hiện với 44 ứng viên tham
gia trả lời bảng câu hỏi và tìm được 6 nhân tố. Dữ liệu thu thập từ 27
công trình xây dựng trường học tại tỉnh Vĩnh Long từ năm 2007 đến
2014
X1: Tổng diện tích xây dựng
X2: Số tầng cao
X3: Số phòng học
X4: Phương án gia cố nền móng
X5: Vị trí xây dựng
X6: Loại mái
Mô hình thu được
Y= -216,010+ 7,036X1-545,190X2-119,436X3+2118,815X4
Kết quả R Adjusted Square =0,971 và MAPE = 12,01%
 Nguyễn Hữu Phúc [13] Nghiên cứu sử dụng phân tích hồi quy đa biến
và mô hình ANN để dự báo thời gian thi công của công trình cầu
đường bộ. Thông qua cuộc khảo sát 20 ứng viên đã tìm được 12 nhân
tố chính. Dữ liệu thu thập từ 44 dự án xây dựng cầu đường bộ từ năm
2000 đến năm 2014


Lê Thanh Tòng

Trang 11


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

Kết quả mô hình ANN dự báo tốt hơn MLR với R Square = 0,9045 và
MAPE=5,28%

Lê Thanh Tòng

Trang 12


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
3.1. Quy trình nghiên cứu.
XÁC ĐỊNH ĐỀ TÀI
Thông qua các nghiên cứu trước đây, tạp chí, tài liệu để
xác định các nhân tố
Ý kiến GVHD
Tham khảo ý kiến chuyên gia, bảng câu hỏi để tìm ra các
nhân tố chính bằng các phân tích thống kê
Thu thập và xử lý số liệu

Linear
Regression
Xây dựng mô hình hồi qui

Đánh giá sự phù hợp của mô hình dựa trên các kiểm định
thống kê
Đánh giá kết quả hồi qui
Kết luận và kiến nghị
Hình 3.1 Quy trình nghiên cứu
(Nguồn: Bài giảng phương pháp nghiên cứu khoa học, Lưu 2014)
3.2. Xác định các nhân tố ảnh hưởng đến chi phí xây dựng công trình
trường học.
Các nhân tố ảnh hưởng đến chi phí xây dựng công trình được dựa trên
các nghiên cứu tương tự đã được công bố:
Nguyễn Thanh Trúc (2014) dùng mô hình hồi quy để ước lượng chi phí xây
dựng cho công trình trường học ở Vĩnh Long với 6 biến đầu vào:
1. Tổng diện tích xây dựng

Lê Thanh Tòng

Trang 13


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

2. Số tầng cao
3. Số phòng học
4. Vị trí xây dựng

5. Phương án gia cố nền móng
6. Loại mái
Al-Momani (1996) đã thu thập dữ liệu 125 dự án quá khứ từ năm 1984- 1994.
Sử dụng mô hình hồi quy đa biến để phân tích các dữ liệu thu thập được
1. Chi phí xây dựng theo hợp đồng.
2. Thay đổi thiết kế
3. Diện tích sàn /m2.
4. Ngày hoàn thành thực tế.
5. Ngày hoàn thành dự kiến.
6. Thời gian chậm tiến độ
7. Giá thầu cao nhất
8. Giá thầu thấp nhất
Nguyễn Hữu Thức (2010) đã xác định chi phí xây dựng công trình cao ốc
thông qua 16 nhân tố:
1. Tổng diện tích sàn.
2. Tổng diện tích sàn phần văn phòng.
3. Tổng diện tích sàn phần thương mại.
4. Tổng diện tích sàn phần căn hộ.
5. Tổng diện tích phần hầm.
6. Số tầng.
7. Tổng chiều cao phần thân.
8. Tổng chiều cao phần hầm.
9. Loại kết cấu phần thân.
10. Loại kết cấu phần sàn.
11. Loại kết cấu phần móng.

Lê Thanh Tòng

Trang 14



Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

12. Số lượng thang máy.
13. Số tầng hầm.
14. Loại cao ốc văn phòng.
15. Vị trí xây dựng.
16. Cảnh quang xung quanh.
Thông qua việc tham khảo các nghiên cứu trên và tham khảo ý kiến của 7
chuyên gia trong các lĩnh vực thiết kế, thi công, giám sát…hoạt động trong
các dự án xây dựng công trình dân dụng trên 10 năm, từ đó xác định được 14
nhân tố sau ảnh hưởng chi phí xây dựng công trình trường học:
1. Tổng diện tích phòng học
2. Tổng diện tích phòng thí nghiệm, thực hành bộ môn
3. Tổng diện tích phòng hành chánh quản lý
4. Tổng diện tích hội trường, nhà thi đấu
5. Tổng diện tích công trình phụ
6. Thời gian thực hiện dự án
7. Giải pháp kết cấu móng
8. Diện tích sân đường
9. Số tầng
10. Loại kết cấu mái
11. Vị trí xây dựng
12. Chiều dài cổng, hàng rào
13. Cấp công trình
14. Khối lượng san nền
3.3. Các công cụ nghiên cứu.


Lê Thanh Tòng

Trang 15


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

Bảng 3.1 Các công cụ nghiên cứu
Trình tự thực hiện
Xác định các nhân tố ảnh hưởng

Công cụ nghiên cứu
- Thông qua các nghiên cứu trước

chi phí xây dựng công trình

đây, tạp chí, tài liệu, ý kiến của các

trường học

chuyên gia

Xác định các nhân tố chính

- Bảng câu hỏi
- Phân tích thống kê của phần mềm
SPSS


Phân tích mô hình hồi qui và kiểm

- Sử dụng công cụ Linear

định mô hình

Regression của phần mềm SPSS

3.4. Thiết kế bảng câu hỏi.
3.4.1 Quy trình thiết kế bảng câu hỏi:
Đọc những bài báo và nghiên cứu
trước
Nhận dạng các nhân tố ảnh hưởng
đến chi phí

Tham khảo ý kiến
chuyên gia

Xác định được các nhân tố chính
đưa vào bảng câu hỏi
Xây dựng bảng câu hỏi và chuyển
đến đối tượng khảo sát
Thu thập lại bảng câu hỏi
Hình 3.2 Quy trình thiết kế bảng câu hỏi
(Nguồn: Bài giảng phương pháp nghiên cứu khoa học, Lưu 2014)
3.4.2 Cấu trúc của bảng câu hỏi
Cấu trúc bảng câu hỏi được chia làm 3 thành phần chính:

Lê Thanh Tòng


Trang 16


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

Phần 1: Giới thiệu thông tin về cá nhân và định hướng cho các ứng
viên hiểu được các vấn đề, mục đích của việc khảo sát giúp cho các
ứng viên trả lời phù hợp với kinh nghiệm và hiểu biết của bản thân.
Phần 2: Sử dụng thang đo tỷ lệ Likert với các mức độ ảnh hưởng từ 1
đến 5. Thông qua điểm từ bảng câu hỏi sẽ đánh giá các yếu tố ảnh
hưởng đến chi phí xây dựng cho các công trình trường học.
Phần 3:Các thông tin cá nhân của người tham gia khảo sát
Chi tiết của bảng câu hỏi được trình bày ở phụ luc 1
3.5 Thiết kế mẫu
3.5.1 Khung lấy mẫu.
Dữ liệu sơ cấp được thu thập thông qua các bảng câu hỏi được gửi trực
tiếp đến các cá nhân hoạt động trong các lĩnh vực thiết kế, thi công, tư vấn
thiết kế, giám sát, thẩm định dự án… nhằm mục đích xác định các nhân tố
chính trong 14 nhân tố và mức độ ảnh hưởng của các yếu tố này đến chi phí
xây dựng cho các công trình trường học.
3.5.2 Xác định kích thước mẫu.
Để đảm bảo ý nghĩa về mặt thống kê thì kích thước mẫu phải đủ lớn. Số
lượng mẫu cho phân tích hồi quy n= 50+ 8*m với m: số biến độc lập
(Comrey, 1973; Roger, 2006). Mẫu khảo sát dùng bảng câu hỏi dự kiến với
kích thước khoảng 100 mẫu.
3.5.3 Phương pháp lấy mẫu
Thu thập dữ liệu quá khứ: Phương pháp lấy mẫu được chọn là phương
pháp lấy mẫu thuận tiện trên các dữ liệu của chủ đầu tư.

Khảo sát bằng bảng câu hỏi: theo phương pháp thuận tiện từ các kĩ sư.
Phương pháp này được sử dụng rất nhiều, tuy nhiên về mặt thống kê không
thể xác định mức độ chính xác vì không biết được sai số lấy mẫu[11].
Lê Thanh Tòng

Trang 17


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

3.6 Thang đo và độ tin cậy của thang đo
Thang đo tỷ lệ Likert với mức độ từ 1 đến 5 dùng để hỏi người khảo sát
về mức độ đồng ý. Thông qua hệ số Cronbach Alpha để đánh giá mức độ chặt
chẽ của các mục câu hỏi trong thang đo. Các điểm số trong bảng câu hỏi cũng
sẽ được tính toán và xếp hạng dựa trên giá trị trung bình.Từ đó xác định các
nhân tố ảnh hưởng chính đến vấn đề khảo sát.
3.7 Thu thập dữ liệu
Thu thập dữ liệu dùng trong nghiên cứu này dựa trên 2 nguồn dữ liệu:
- Dữ liệu sơ cấp: là các dữ liệu từ bảng câu hỏi được gửi trực tiếp đến
các đối tượng phù hợp với vấn đề khảo sát. Sau khi nhận lại các bảng
câu hỏi sẽ thu được các nhân tố chính ảnh hưởng đến chi phí xây
dựng cho công trình trường học.
- Dữ liệu thứ cấp: là các dữ liệu trong quá khứ từ các công trình
trường học (TH, THCS, THPT).
3.8 Phân tích dữ liệu
Từ các dữ liệu sơ cấp được thu thập thông qua bảng câu hỏi, sau khi tiến
hành làm sạch và mã hóa thông tin sẽ nhập vào phần mềm SPSS Version 22.
- Đánh giá độ tin cậy của thang đo thông qua hệ số Cronbach Alpha

- Tính toán điểm trung bình và xếp hạng các nhân tố dựa trên điểm
trung bình để chọn ra các nhân tố chính ảnh hưởng đến chi phí xây
dựng cho các công trình trường học
3.9 Thiết lập mô hình hồi quy đa biến
3.9.1 Phương pháp lựa chọn biến [6].
Để xây dựng được mô hình hồi quy đa biến hợp lý thì việc xác định các
biến độc lập để dự báo tốt cho biến phụ thuộc là cần thiết.Các phương pháp
lựa chọn biến phổ biến trong SPSS
Lê Thanh Tòng

Trang 18


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

Phương pháp đưa dần vào (forward selection):
- là phương pháp đưa dần vào và biến đầu tiên được xem xét khi đưa
vào phương trình có tương quan thuận hay nghịch lớn nhất với biến
phụ thuộc. Kiểm định F đối với giả thuyết hệ số của biến đưa vào
bằng 0 sẽ được tính toán và so sánh với 2 tiêu chuẩn: F ≥ FIN (F-toenter) hoặc F ≤ PIN (Probability of F- to –enter)
- Biến đầu tiên được chọn là biến thỏa mãn tiêu chuẩn và xem xét các
biến đưa vào tiếp theo. Nếu các biến tiếp theo có hệ số tương quan
riêng lớn trong mô hình hồi quy giữa biến phụ thuộc và các biến độc
lập còn lại thì sẽ loại bỏ biến đầu tiên.Quá trình này sẽ được lặp lại
khi không còn biến nào thỏa thỏa tiêu chuẩn vào.
Phương pháp loại trừ dần (backward elimination)
- Là phương pháp đưa tất cả các biến vào mô hình và sẽ loại bỏ dần
bằng 2 tiêu chuẩn FOUT (F-to-remove) hoặc POUT (Probability of

F-to-remove)
- Nếu biến thỏa F ≥ FOUT hoặc F ≤ POUT thì biến đó sẽ được giữ lại.
Biến có hệ số tương quan từng phần nhỏ nhất sẽ được kiểm tra đầu
tiên, nếu biến này không thỏa tiêu chuẩn thì phương trình sẽ tính toán
lại, quá trình này được lặp lại cho đến khi không còn biến nào vi
phạm tiêu chuẩn
Phương pháp lựa chọn từng bước (Stepwise selection)
- Là phương pháp phổ biến nhất và nó phối hợp cả 2 phương pháp
forward và backward
- Biến độc lập mà giải thích tốt nhất cho biến phụ thuộc sẽ được thêm
vào đầu tiên
- Các biến tiếp theo được chọn dựa trên sự đóng góp gia tăng của
chúng cho biến thứ nhất.

Lê Thanh Tòng

Trang 19


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

- Để tránh việc trùng lặp của 1 biến đưa vào thì giá trị PIN hay FIN > FOUT
3.9.2 Kiểm định các giả thuyết của mô hình hồi quy [6].
3.9.2.1

Kiểm định về sự phù hợp của mô hình:


- Khi xây dựng mô hình hồi quy mà các hệ số đứng trước biến độc lập
đều bằng không (β 1= β2 =β3…=β n=0) thì phương trình hồi quy mẫu
là không phù hợp vì các biến độc lập không ảnh hưởng đến biến phụ
thuộc.
- Kiểm định F được dùng trong bảng phân tích phương sai để kiểm
định giả thuyết về sự phù hợp của mô hình được xây dựng so với mô
hình tổng thể
3.9.2.2

Kiểm định về ý nghĩa các hệ số hồi quy riêng phần βk

- Là hệ số cho biết ảnh hưởng của các thay đổi một đơn vị trong Xk
đối với giá trị trung bình của biến phụ thuộc Y khi loại trừ ảnh hưởng
của các biến độc lập khác.
- Trị thống kê t được dùng cho kiểm định giả thuyết này.Nếu kết quả
kiểm định không đủ bác bỏ H0 thì mô hình hồi quy đã xây dựng
không có căn cứ nào cho thấy βk ≠ 0.Tuy nhiên vẫn không thể khẳng
định biến độc lập Xk không có ảnh hưởng đến biến phụ thuộc Y.
3.9.2.3 Kiểm định giả thuyết về tầm quan trọng của các biến
- Hệ số tầm quan trọng của một biến được đặc trưng bởi R square
change và được xác định khi đưa thêm biến vào phương trình hồi
quy mẫu
Fchange 

Lê Thanh Tòng

2
R change
( N  p  1)


q (1  R 2 )

(3.1)

Trang 20


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

Với N là số dữ liệu quan sát, q là số biến đưa vào, p là số biến độc
lập trong mô hình
3.9.3 Kiểm định các giả định của mô hình hồi quy.
3.9.3.1 Giả định độc lập của sai số
Các giá trị (Y) độc lập thống kê với nhau, tức là các quan sát này không
bị ảnh hưởng bởi các quan sát khác [6].
Giả định về sai số thực ei cho nó là biến ngẫu nhiên, độc lập (các phần
dư không có mối tương quan) có phân phối chuẩn với giá trị trung bình bằng
0 và phương sai không đổi σ2
Đại lượng thống kê Durbin-Watson (d) dùng để kiểm định tương quan
các sai số kề nhau
N

 E
d 

i

 E i 1 


2

(3.2)

i2

N

 E 
2
i

i2

3.9.3.2 Giả định phân phối chuẩn của phần dư
Mô hình hồi quy lý tưởng là với bất kì giá trị nào của biến phụ thuộc thì
phần dư đều tuân theo phân phối chuẩn
Việc sử dụng sai mô hình, phương sai không phải là hằng số thì phần dư
có thể không tuân theo phân phối chuẩn
Để khảo sát sự phân phối của phần dư có thể sử dụng 2 biểu đồ là: Biểu
đồ tần suất Histogram hoặc biểu đồ tần suất Q-Q plot
3.9.3.3 Giả định phương sai của sai số không đổi
Nếu sai số của phần dư tăng hoặc giảm cùng với giá trị của các biến độc
lập thì mô hình hồi quy tuyến tính bội có thể có phương sai thay đổi. Hiện
tượng phương sai thay đổi làm cho mô hình ước lượng bằng phương pháp
bình phương bé nhất không hiệu quả.
Lê Thanh Tòng

Trang 21



Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

Để kiểm tra phương sai không đổi thì phần dư phải phân bố xung quanh
giá trị trung bình trong phạm vi không đổi.
3.9.3.4 Giả định liên hệ tuyến tính
Nếu các mối liên hệ không phải là quan hệ tuyến tính, mà trong phân
tích dữ liệu ta dùng quan hệ tuyến tính để mô tả dữ liệu thì sẽ không có ý
nghĩa.Cho nên cần phải kiểm tra giả định liên hệ tuyến tính
Sử dụng biểu đồ phân tán Scatter plot để kiểm tra điều kiện khá thẳng
của biến phụ thuộc với mỗi biến độc lập.
3.9.3.5 Giả định không có mối tương quan giữa các biến độc lập
Hiện tượng đa cộng tuyến xảy ra khi các biến độc lập có mối tương quan
chặt chẽ với nhau sẽ làm tăng độ lệch chuẩn của các hệ số trong mô hình hồi
quy, đồng thời làm giảm trị thống kê t.Vì thế cần phải kiểm tra giả định không
có mối tương quan giữa các biến độc lập
3.9.4 Các bước xây dựng mô hình hồi quy đa biến
Bước 1: Thu thập và xử lý các dữ liệu sơ cấp, thứ cấp
Bước 2: Tiến hành phân tích tương quan giữa các biến
Bước 3: Phân tích lựa chọn biến ( forward selection, backward
elimination, Stepwise selection, Enter)
Bước 4: Kiểm định các giả thuyết của mô hình hồi quy
Bước 5: Kiểm định các giả định của mô hình hồi quy
Bước 6: Đánh giá mô hình hồi quy

Lê Thanh Tòng


Trang 22


Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

CHƯƠNG 4: XÂY DỰNG MÔ HÌNH HỒI QUY ĐA BIẾN
4.1. Xác định các nhân tố chính ảnh hưởng đến chi phí xây dựng công
trình trường học.
4.1.1 Dữ liệu sơ cấp

Là các bảng câu hỏi khảo sát được gửi trực tiếp đến các kĩ sư xây dựng.
Tổng số bảng câu hỏi được phát đi là 100, kết quả thu lại được sau khi kiểm
tra là 96 bảng câu hỏi, tỉ lệ là 96 %
Hình 4.1 thể hiện kinh nghiệm của các ứng viên tham gia trong cuộc
phỏng vấn.Kết quả phỏng vấn là đáng tin cậy thông qua thời gian làm việc
của ứng viên trên 5 năm chiếm 60%, ứng viên từ 3 đến 5 năm chiếm 22% và
ứng viên dưới 3 năm là 18%

Hình 4.1 Kinh nghiệm của ứng viên trong cuộc khảo sát
4.1.2 Đánh giá độ tin cậy thang đo

Kết quả tổng hợp bảng câu hỏi khảo sát được trình bày trong phụ lục 2.
Từ kết quả tổng hợp của bảng câu hỏi khảo sát. Tiến hành phân tích đánh
giá độ tin cậy của thang đo.

Lê Thanh Tòng

Trang 23



Luận Văn Thạc Sỹ Xây Dựng

GVHD: TS. Đinh Công Tịnh

Bảng 4.1 Kết quả phân tích Cronbach Alpha
Kí hiệu

Tương quan

Cronbach

giữa mục hỏi

Alpha nếu

và tổng các

loại bỏ

biến còn lại

mục hỏi

Tổng diện tích phòng học

0,406

0,796


Tongdientich

Tổng diện tích phòng thí

0,471

0,792

phongthuchanh

nghiệm, thực hành bộ môn

Tongdientich

Tổng diện tích phòng hành

0,430

0,795

phongquanly

chánh quản lý

Tongdientich

Tổng diện tích hội trường,

0,447


0,793

hoitruong

nhà thi đấu

Tongdientich

Tổng diện tích

0,418

0,795

congtrinhphu

Công trình phụ

Thoigian

Thời gian thực hiện dự án

0,481

0,790

Giaiphapmong

Giải pháp kết cấu móng


0,336

0,801

Dientich

Diện tích sân đường

0,424

0,795

Sotang

Số tầng

0,387

0,797

Ketcaumai

Loại kết cấu mái

0,424

0,795

Vitrixaydung


Vị trí xây dựng

0,615

0,776

Chieudaicong

Chiều dài cổng, hàng rào

0,353

0,802

Capcongtrinh

Cấp công trình

0,390

0,798

Khoiluong

Khối lượng san nền

0,430

0,794


Tongdientich

Tên biến

phonghoc

sanduong

hangrao

sannen
Cronbach Alpha= 0,806
Lê Thanh Tòng

Trang 24


×