Tải bản đầy đủ (.pdf) (136 trang)

Ứng dụng hệ thống nơron mờ dự đoán tính khả thi thiết kế các dự án xây dựng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.23 MB, 136 trang )

Luận văn thạc sĩ

Chương 1. ĐẶT VẤN ĐỀ
1.1 Giới thiệu:
Việt Nam từ những năm đổi mới đến nay, có tốc độ phát triển kinh tế rất cao.
Cụ thể năm 2005, mức tăng trưởng đạt 8,43%, năm 2006 đạt %, dự kiến năm 2007
đạt trên 8%. Cùng với sự tăng trưởng kinh tế nhanh là sự chuyển dịch thay đổi trong
cơ cấu nền kinh tế giữa các ngành: nông nghiệp, công nghiệp – xây dựng và dịch
vụ. Từ một đất nước có nền kinh tế chủ yếu la nơng nghiệp, đang dịch chuyển dần
sang nền kinh tế có ngành cơng nghiệp – xây dựng phát triển. Với năm 1990, tỷ
trọng ngành công nghiệp xây dựng chiếm 22,67%, đến năm 2005 đạt 41,03%.
Trong đó, lĩnh vực xây dựng chiếm 3-5% tỷ trọng của nền kinh tế.
Tuy nhiên, xét về khía cạnh tăng trưởng, chúng ta nghiên về tăng trưởng theo
chiều rộng, chủ yếu dựa vào tăng trưởng vốn, lao động, … hơn là tăng trưởng theo
chiều sâu, tức là nâng cao năng suất các nhân tố tổng hợp. Đây là dạng tăng trưởng
khơng bền vững, có nguy cơ bị tụt hậu. Ngành xây dựng dù đã được đầu tư xây
dựng và đổi mới, nhưng hiện tại trình độ của nước ta cịn rất thấp. Tỷ trọng doanh
nghiệp có cơng nghệ cao đạt khoảng 20,6%, thấp xa so các nước như Philipines là
29,1%, Indonesia là 29,7%, Thái Lan là 30,8%, Malaysia là 51,1%, Singapore là
73%.
Trong bối cảnh Việt Nam vừa gia nhập WTO, ta vừa có những cơ hội để
phát triển đất nước, nhưng cũng có nhiều nguy cơ thách thức, nhất là đối với các
doanh nghiệp trong nước. Nếu không kịp đổi mới từ khoa học công nghệ, cung cách
quản lý, nâng cao nằn suất, hạ giá thành sản phẩm, … thì sẽ khơng cạnh tranh nổi
với doanh nghiệp nước ngồi. Hiện nay nhiều doanh nghiệp Việt Nam ngày càng
nhận thức được cần phải đổi mới để nâng cao chất lượng doanh nghiệp như việc áp
dụng các hệ thống quản lý chất lượng như tiến tiến như ISO 9000, ISO 14000, SA
9000, OHSAS 18000, … đồng thời cũng áp dụng các mô hình cải tiến hệ thống
quản lý như: Cân bằng điểm (Balanced scorecard), Chuẩn so sánh (Benchmarking),
Quản lý quan hệ khách hàng (CRM), Quản trị tri thức doanh nghiệp (KM), …


Trang 1


Luận văn thạc sĩ

Ngành xây dựng không phải là ngoại lệ, nhất là hiện nay có nhiều doanh
nghiệp nước ngồi hoạt động ở Việt Nam, có sự cạnh tranh rất lớn. Muốn tồn tại và
phát triển, ta phải đổi mới tồn diện.
1.2 Cơ sở hình thành đề tài:
Cùng với sự phát triển của nền kinh tế, nguồn vốn đầu tư cho ngành xây
dựng tăng lên rất nhanh, để quản lý nguồn vốn này thật sự rất khó khăn và thách
thức đối với các nhà quản lý. Trong từng dự án, những vấn đề thường gặp là: dự án
bị trì hỗn, vượt chi phí, tai nạn lao động, chất lượng kém và tranh chấp giữa các
bên tham gia, … Nó địi hỏi sự hợp tác của các thành tham gia như chủ đầu tư, đơn
vị thiết kế, nhà thầu xây dựng.
Theo nghiên cứu của Nguyễn Duy Long, Đỗ Thị Xuân Lan (2003) về các
yếu tố thành công của dự án xây dựng, có 20 nhân tố sau tác động đến sự thành
cơng của dự án, trong đó năm nhân tố rất quan trọng là (1) giám đốc dự án đủ năng
lực, (2) đảm bảo tài chính cho dự án, (3) ban QLDA đủ năng lực, (4) sự quyết tâm
thực hiện dự án, (5) vật tư đáp ứng đầy đủ. Rõ ràng các yếu tố này đều liên quan
đến con người, cho thấy con người đóng vai trị quyết định trong việc thành cơng
hay thất bại của dự án.
Do đó, một dự án thành cơng địi hỏi năng lực kinh nghiệm của các bên tham
gia. Trong đó, nhân tố “thiết kế” cũng được đánh giá khá cao. “Thiết kế” cũng là
một áp lực chính cho sự thành cơng của dự án. Vài khảo sát gần đây chứng minh
ảnh hưởng tiêu cực của thiết kế kém đến toàn bộ dự án. Davis (1989) đã nhận thấy
những lỗi thiết kế, thay đổi thiết kế, bỏ sót thiết kế tạo nên khoảng 10% của tồn bộ
chi phí dự án, trong khi đó những lỗi do xây dựng chỉ chiếm khoảng 2% của tồn
chi phí dự án. Nghiên cứu của CII đã báo cáo rằng giai đoạn thiết kế chi tiết là
nguồn gốc chủ yếu của việc trễ tiến độ dự án, khoảng một nữa mục tiêu và phát

triển thay đổi bắt nguồn do thiết kế chi tiết. Báo cáo cũng chỉ ra rằng những lỗi do
thiết kế là nguồn gốc của việc làm lại hơn là do chủ đầu tư và các nhà thầu xây
dựng.

Trang 2


Luận văn thạc sĩ

Trong tiến trình phát triển của một dự án bao gồm các giai đoạn: lập kế
hoạch dự án, thiết kế chi tiết, xây lắp, nghiệm thu vận hành. Thì giai đoạn thiết kế
đóng vai trị chuyển đổi ý tưởng của chủ đầu tư thành hồ sơ thiết kế kỹ thuật chi tiết
và được chuyển đến các bên tham gia dự án, phục vụ cho các giai đoạn tiếp theo của
dự án. Do đó, giai đoạn thiết kế nếu kém sẽ dẫn đến vượt chi phí, tiến độ dự án, gây
ra hiệu quả đầu tư thấp.
Đầu ra của thiết kế chính là “performance” (sự thực hiện thiết kế). Thuật
ngữ “performance” được sự quan tâm đặc biệt trong lĩnh vực cơng nghiệp xây
dựng, mặt dù sự giải thích nó có thể khác nhau giữa những người thực tế làm trong
lĩnh vực này. Maloney (1990) đã phát biểu rằng thuật ngữ này ngụ ý vài khía cạnh
bao gồm: sự có hiệu lực, hiệu quả, chất lượng, năng suất, chất lượng của cơng việc,
sáng kiến và tính sinh lời. Mặt cho những chỉ dẫn hay phép đo lường đặc biệt dùng
cho việc định nghĩa thuật ngữ “performance”, nó tạo thành một phần tử tới hạn của
việc quản lý và điều khiển dự án.
Ở đây cần phân biệt “sự thực hiện thiết kế” và “năng suất thiết kế”.
- Năng suất thiết kế là một thuật ngữ được sử dụng thường xuyên trong hệ
thống điều khiển thiết kế và tổ chức thiết kế. Định nghĩa cổ điển của năng suất là
mối quan hệ giữa số lượng đầu vào và đầu ra. Tuy nhiên, đơn vị đầu ra của thiết kế
là những bản vẽ và chi tiết kỹ thuật, khơng biểu hiện được tồn bộ của tiến trình
thiết kế. Đầu ra và đầu vào chủ yếu của hoạt động thiết kế là thông tin. Hoạt động
thiết kế là lấy nhu cầu của khách hàng làm chức năng của sản phẩm cuối cùng. Kỹ

thuật và những ý kiến nghề nghiệp tạo nên giá trị thêm vào, nó trở thành sản phẩm
đầu ra của hoạt động thiết kế.
- Sự thực hiện thiết kế là một thuật ngữ tổng quát hơn năng suất thiết kế.
Tổng quan của sự đo lường sự thực hiện thiết kế gồm các mục có thể được nghiên
cứu: sự có hiệu lực, hiệu quả, chất lượng, năng suất, chất lượng của công việc, tính
sinh lợi và sự đổi mới.

Trang 3


Luận văn thạc sĩ

Do tính chất quan trọng được phân tích trên đối với thiết kế, hiển nhiên việc
dự đốn tính khả thi của thiết kế là vấn đề rất cần thiết. Vài nghiên cứu trước đây đã
đề cập đến vấn đề tăng năng suất và chất lượng thiết kế bằng cách sử dụng vài kỹ
thuật đặc biệt. Tuy nhiên, việc thiết kế của một dự án là một hệ thống rất phức tạp,
từ đó thiếu một phương pháp có hệ thống để dự đốn tính khả thi của thiết kế làm
cơ sở để cải tiến thiết kế, tránh các vấn đề ảnh hưởng đến hiệu quả đầu tư của dự án.
Ứng dụng mạng nơron mờ dự đốn tính khả thi của thiết kế là một hệ thống
tự động giải quyết các vấn đề của mối quan hệ phức tạp của các đầu vào thiết kế.
1.3 Mục tiêu nghiên cứu
- Xác định các nhân tố ảnh hưởng đến giai đoạn thiết kế chi tiết và định ra dự
báo mối quan hệ giữa những đầu vào thiết kế và đầu ra thực hiện thiết kế.
- Ứng dụng kiến thức và lý thuyết hệ thống nơron mờ trong việc dự đoán sự
thực hiện thiết kế.
- Phân tích và so sánh với phương pháp hồi quy tuyến tính.
- Xây dựng thuật tốn và chương trình tin học để dự đốn đo lường tính khả
thi của thiết kế.
1.4 Giới hạn nghiên cứu
- Nghiên cứu những loại dự án thuộc lĩnh vực công nghiệp và xây dựng, thực

hiện từ năm 2000 – 2007. Số dự án thu thập dữ liệu là 50 dự án.
- Dữ liệu rất khó đầy đủ và chính xác do khó thu thập dữ liệu trong thời gian
tương đối ngắn. Hơn nữa thật khó khăn để thu thập dữ liệu của tồn bộ vịng đời dự
án từ khâu lập kế hoạch đến khâu quyết tốn cơng trình. Ngay cả dữ liệu dự án đầu
tiên đối với giai đoạn hoạt động đã tiêu phí hầu hết thời gian thực hiện nhiệm vụ
nghiên cứu. Đồng thời thông tin về năng lực của các chủ đầu tư, các đơn vị tư vấn
thiết kế hay đơn vị thi công tham gia dự án thường bị bóp méo.

Trang 4


Luận văn thạc sĩ

Chương 2. SƠ LƯỢC CÁC NGHIÊN CỨU TRƯỚC ĐÂY
Trong phần này ta sẽ xem xét lại các nghiên cứu trước đây để có cái nhìn cơ
bản về sự thực hiện thiết kế. Đầu tiên, xem xét ảnh hưởng của hoạt động thiết kế
đến đầu ra của dự án và sự cần thiết để dự đoán sự thực hiện của thiết kế. Thứ hai,
kiểm soát những vấn đề thực tế tồn tại đối với vấn đề đang nghiên cứu. Cuối cùng,
tóm tắt sự chấp nhận của việc sử dụng mạng nơron nhân tạo và logic mờ trong quản
lý xây dựng.
2.1 Ảnh hưởng của hoạt động thiết kế đến dự án xây dựng:
Đối với một dự án, hoạt động thiết kế chính diễn ra trong suốt giai đoạn thiết
kế chi tiết gồm: sự hoàn tất mục tiêu, hồ sơ thiết kế chi tiết, ước lượng chi phí chi
tiết, tiến độ chi tiết và cách hồn thành cơng việc. Những hoạt động thiết kế khác
của giai đoạn lập kế hoạch tiền dự án và giai đoạn mời thầu: kế hoạch mục tiêu, kế
hoạch thực hiện dự án, chiến lược xây dựng, đặc điểm kỹ thuật vật liệu, khả năng
nhà thầu, sự ước lượng giá thầu (Chang et al 2001).
Khảo sát gần đây trong lĩnh vực công nghiệp xây dựng được thực hiện bởi
Georgy, Chang và Walsh (2000) cũng đã nhận ra một vài yếu tố ảnh hưởng đến
hoạt động thiết kế trong việc thi hành dự án.

- Cuộc khảo sát đã báo cáo rằng chi phí liên kết chặt với giai đoạn thiết kế
chi tiết, tiêu phí khoảng 14% của tồn chi phí dự án. Nó cũng chỉ ra rằng giai đoạn
thiết kế chi tiết của những các dự án được khảo sát là nguồn gốc của việc trễ tiến
độ, thay đổi dự án và việc làm lại.
- Theo cuộc khảo sát, những dự án trung bình có khoảng 18% việc trễ trong
giai đoạn thiết kế chi tiết. Giai đoạn này cũng là nguồn gốc cho khoảng 48% của
toàn bộ số thay đổi mục tiêu và khoảng 56% của toàn bộ số những thay đổi triển
khai. Chi phí thực ảnh hưởng ảnh hưởng của các hai những thay đổi mục tiêu và
những thay đổi triển khai trong suốt giai đoạn thiết kế chi tiết được chỉ ra lớn hơn
bất kỳ giai đoạn nào của dự án.

Trang 5


Luận văn thạc sĩ

- Cuộc khảo sát cũng nhận ra rằng việc vượt chi phí do cơng việc làm lại
trung bình khoảng 4,1% của chi phí tồn dự án, những lỗi và những bỏ sót thiết kế
chiếm khoảng 33% tồn bộ công việc làm lại xảy ra. Nếu những thay đổi thiết kế
cũng được kể đến, công việc làm lại do thiết kế chia sẽ 39% của tồn bộ cơng việc
làm lại xảy ra, trội hơn tổng số công việc làm lại gây ra bởi chủ đầu tư và những
nhà thầu xây dựng kết hợp lại.
Ảnh hưởng của những hoạt động thiết kế đối với việc thi hành của những dự
án xây dựng đòi hỏi phải nghiên cứu để cải tiến đầu ra của những hoạt động thiết
kế. Những phương pháp dự đoán sự thực hiện thiết kế cần được nghiên cứu để cải
tiến công việc này.
2.2 Đo lường sự thực hiện thiết kế:
Một số lý thuyết đã chỉ ra cách để đo lường sự thực hiện thiết kế. Hầu hết chỉ
ra cái chung của sự thực hiện thiết kế là tỷ lệ của giờ làm việc thiết kế / bản vẽ
(Tucker và Scarlett 1986). Sự thực hiện tương phản với tiến độ là cái nhìn rộng hơn,

nó chỉ ra mức độ của lời hứa với thời gian hồ sơ thiết kế phát hành (Bolte 1986).
Trong một nghiên cứu khác, Armentrout (1986) đã định nghĩa lời hứa như là
một bảo đảm để cung cấp một sảm phẩm phân phối hay hoàn thành một mốc của dự
án cho khách hàng bởi một một ngày đặt biệt và chỉ ra rằng sự thành công của một
tổ chức thiết kế được đo lường trên quy mô lớn là làm thế nào để làm tốt lời hứa đối
với khách hàng. Nghiên cứu này đề cao một hệ thống quản lý lời hứa được thi hành
và cải tiến mức độ lời hứa.
Khái niệm sự có hiệu lực của thiết kế được đề nghị trong báo cáo của
Construction Industry Institute (CII), (Tucker và Scarlatt 1986) và bảy tiêu chuẩn
được sử dụng để ước lượng sự sự có hiệu lực thiết kế. Những tiêu chuẩn này là sự
chính xác của tài liệu thiết kế, tính khả thi của tài liệu thiết kế, chi phí thiết kế, kinh
nghiệm thiết kế, tiết kiệm trong thiết kế, sự thực hiện tương phản với thiết kế và dễ
dàng khởi động.

Trang 6


Luận văn thạc sĩ

Armentrout (1986) đã đưa ra danh sách ba loại chỉ số cho việc đo lường sự
thực hiện thiết kế của một dự án là: so sánh bên ngồi với những cơng ty thiết kế
khác thực hiện dự án tương tự, so sánh bên trong (phí tổn, ngồi giờ, nhân lực, ... )
và đo lường dự án / khách hàng (sự thực hiện trên tiến độ, chi phí và chất lượng).
Những đo lường này thì đặc biệt cho những dự án năng lượng và không phân loại
đo lường đầu vào và đầu ra. Do đó thiếu sự hiểu biết mối quan hệ giũa những đầu
vào và những đầu ra.
Chalabi (1987) đã nhận ra bảy phạm vi tổng quát mô tả chất lượng của công
việc thiết kế, dựa trên một cuộc khảo sát những chủ đầu tư, kỹ sư và người thiết kế.
Phạm vi đã nhận ra là: tiến độ dự án cuối cùng, chi phí dự án cuối cùng, kinh
nghiệm, chất lượng của thiết kế, thiết lập khởi động, sự thực hiện và sự an toàn. Họ

bắt đầu nhận ra những đầu vào của chủ đầu tư tư tiến trình lập kế hoạch hầu như
ảnh hưởng trực tiếp đối với những phạm vi này, cũng như việc sử dụng một phương
pháp khảo sát chất lượng. Theo cách này, họ đã nhận ra ảnh hưởng của đầu vào của
chủ đầu tư và công việc của những giai đoạn trước đó trong tiến trình để thực hiện
thiết kế của người kỹ sư. Những tác giả này đã chỉ ra sự phân biệt giữa năng suất và
có hiệu lực, năng suất có quan hệ với việc dùng những nguồn tài nguyên để hồn
thành một nhiệm vụ, sự có hiệu lực có quan hệ với sự thích hợp của cơng việc đã
làm lại sau khi nó đã được hồn thành.
Wuellner (1990) đã nêu ra một danh sách kiểm tra cho việc ước lượng sự
thực hiện của công ty tư vấn thiết kế đối với một dự án. Danh sách kiểm tra bao
gồm những đo lường sự thực hiện trong những loại của nghề nghiệp, chất lượng của
thiết kế / phục vụ, tính sinh lợi, quản lý rũi ro, sự kết dính giữa tiến độ và ngân sách,
và sự thỏa mãn của khách hàng.
Fergusson và Teicholz (1996) đã phát triển một chỉ số chất lượng để đo
lường sự thỏa mãn hay không thỏa mãn của chủ đầu tư với sự có hiệu lực chi phí
của thiết kế và xây dựng. Từ danh sách 32 đặc điểm, sáu mục được nhận ra từ một
đo lường tổng kết (hay một chỉ số đa hợp) là: sự an toàn, sự đáng tin cậy, khả năng

Trang 7


Luận văn thạc sĩ

để tránh sự thất bại, phân loại những hệ thống điều khiển (DCS), huấn luyện người
điều khiển, và những đặc điểm kỹ thuật sản phẩm đầu ra.
Thiết kế là một tiến trình có hệ thống với đầu vào và đầu ra. Đo lường sự
thực hiện thiết kế đề cặp đến khía cạnh đầu ra. Khả năng để thực hiện thành công
những hoạt động thiết kế một dự án dựa trên những biến đầu vào dự án khác nhau
(những điều kiện và thuộc tính của dự án), nó thì cần thiết đối với đầu ra sự thực
hiện thiết kế. Thiếu một lược đồ thích hợp có thể phân tích mối quan hệ nhân – quả

giữa đầu vào thiết kế và đầu ra sư thực hiện.
Ở Việt Nam, các nghiên cứu cũng đã nêu ra tính chất quan trọng của thiết kế,
tìm ra một số nhân tố ảnh hưởng, nhưng chưa có xem xét các quan hệ giữa các yếu
tố trong việc thực hiện thiết kế.
Từ đó, thật cần thiết để nghiên cứu tìm ra các nhân tố ảnh hưởng, dự đoán sự
thực hiện thiết kế để các bên tham gia dự án xem xét trong việc thực hiện dự án, có
điều chỉnh những yếu tố trên để đem lại hiệu quả cao nhất.
2.3 Việc sử dụng mạng nơron nhân tạo và logic mờ trong quản lý xây dựng:
Mạng nơron nhân tạo thì được nghiên cứu áp dụng rất nhiều trong lĩnh vực
xây dựng, từ việc dự đoán tiến độ, chi phí, đấu thầu, ... “ANNs và xây dựng” trong
dữ liệu thư viện cung cấp cho chúng ta một danh sách dài các tài liệu nghiên cứu.
- Ở nước ngồi: ước lượng và dự đốn năng suất lao động (Chao và
Skibniewski 1994); ước lượng chi phí (Li, Shen và Love 1999); mức độ và phân
phối tài nguyên (Elazouni 1997); đấu thầu (Moselhi 1993)
- Ở Việt Nam: chọn thầu (Phạm Trường Giang 2003); năng suất lao động
(Nguyễn Nam Cường 2007); chi phí (Phan Đăng Khoa 2006) ...
Cịn đối với Logic mờ, hiện nay cũng được áp dụng rất nhiều trong lĩnh xây
dựng: tiến độ (Lại Hải Đăng 2006); đấu thầu (Nguyễn Thái Quài 2007) ...
Việc hợp nhất của ANNs và hệ thống điều khiển mờ, qua những hệ thống
nơron mờ, cho phép chúng cải thiện sức mạnh của hai kỹ thuật ở cùng thời gian. Đó

Trang 8


Luận văn thạc sĩ

là, ANNs cung cấp kết cấu quan hệ và khả năng học đối với hệ thống điều
khiển mờ, trong khi hệ thống điều khiển mờ cung cấp cho ANNs với những suy
nghĩ và lý luận quy tắc mờ bậc cao. Những kết quả đạt được ở sự hợp nhất ANNs
và hệ thống điều khiển mờ có thể được miêu tả ở ba loại:

1. Hệ thống mờ nơron: loại này nhằm mục đích cung cấp cho hệ thống điều
khiển mờ phương pháp tự động điều chỉnh tiêu biểu của ANNs, nhưng ngoài sự
thay chức năng của hệ thống điều khiển mờ.
2. Mạng nơron mờ: loại này giữ lại sở hữu và cấu trúc cơ bản của ANNs và
mờ hóa một vài phần tử mạng.
3. Hệ thống lai nơron mờ: loại này hợp nhất hai kỹ thuật trong những chuỗi
hay trong sự tương đương thu được những lợi ích chắc chắn đặc biệt đối với vấn đề
quan tâm.

Trang 9


Luận văn thạc sĩ

Chương 3. LÝ THUYẾT NEURON MỜ
3.1 Nền tảng của neuron mờ
3.1.1 Mạng neuron nhân tạo ( Artifitial Neural Network)
Mạng neuron nhân tạo được xem như một mô hình tốn học đơn giản mơ
phỏng bộ não con người. Mạng được xây dựng từ ý tưởng đầu tiên của Mc. Culloch
& Pitts (1943).
Thành phần cơ bản của mạng neuron gồm có phần tử xử lý, mơ hình kết nối
và chuong trình huấn luyện mạng.
−1
x1

θ1

v11

z1

x2

v12
v 21

f a(f)
w1

v13
f a(f)

v 22
v14
x3

v 23

z2
f a(f)

y

w2
θ

v 24
θ 21

x4


−1

−1

Hình 3.1 : Cấu tạo của mạng neuron nhân tạo.

Phần tử xử lý
Mỗi neuron được cấu tạo từ nhiều thân neuron. Mỗi thân neuron là một phần
tử xử lý. Mỗi phần tử xử lý có vai trị tổng hợp các thơng tin từ nguồn bên ngồi
hoặc từ các phần tử xử lý khác và truyền đạt lại các thông tin lên phần tử xử lý tiếp
nhận.
Mỗi phần tử xử lý có nhiều đầu vào và một đầu ra. Để kết hợp các đầu vào
của phần tử xử lý, một hàm tổng hợp f có chức năng tổng hợp tất cả các thơng tin từ
các nguồn bên ngồi hoặc từ nhiều phần tử xử lý khác gửi đến và để truyền thông

Trang 10


Luận văn thạc sĩ

tin đến mỗi phần tử xử lý sau đó, một hàm tác động hay cịn gọi là hàm truyền đạt
a(f) có nhiệm vụ xử lý thơng tin và truyền đi.
Hàm tổng hợp
Nếu xj là đầu vào từ mơi trường bên ngồi hoặc đầu ra của một phần tử xử lý
thứ j, wij là trọng số kết nối giữa xj và phần tử xử lý thứ i và θI là giá trị ngưỡng của
phần tử xử lý thứ i, thì hàm tổng hợp fi để kết hợp tất cả các thông tin từ các đầu
vào của phần tử xử lý i được định nghĩa một trong các dạng như sau :
Hàm tổng hợp tuyến tính :
m


f=

w ij × x j − θ i

j =1

Hàm tổng hợp phi tuyến bình phương:
m

f=

∑ w ij × x 2j − θ i
j =1

Hàm tác động
Kết hợp đầu ra của phần tử xử lý thứ i là một hàm tác động còn gọi là hàm
truyền đạt a(f). Một số hàm truyền được sử dụng :
Hàm bậc thang đơn vị :
1
a(f) = 
0

f ≥0
f <0

Hàm signum :
1
a(f) = 
− 1


f ≥0
f <0

Hàm tuyến tính : a(f) = f
Hàm Unipolar sigmoid : a(f) =

1
1 + e −λf

Trang 11


Luận văn thạc sĩ

Hàm Bipolar sigmoid : a(f) =

2
−1
1 + e −λf

Mơ hình kết nối
Thành phần quan trọng thứ hai của mạng neuron nhân tạo đó là mơ hình kết
nối. Trên cơ sở mơ hình kết nối, mạng neuron nhân tạo có thể phân thành hai loại
đó là mạng truyền thẳng (feedforward network) và mạng hồi tiếp (feedback
network).
Mạng truyền thẳng được xây dựng bằng cách: Đầu ra của neuron ở lớp đứng
trước là đầu vào của các neuron lớp đứng sau.
Mạng hồi tiếp được xây dựng: Các đầu ra của neuron của lớp được định
hướng lùi về làm đầu vào cho các neuron ở cùng lớp hay lớp đứng trước nó.


Hình 3.2 : Mạng truyền thẳng nhiều lớp.

Hình 3.3 : Mạng hồi tiếp nhiều lớp.

Nếu mạng hồi tiếp mà các đầu ra của các đầu ra của lớp neuron đầu ra là các
đầu vào của lớp neuron đầu vào thì được gọi là mạng hồi quy hay mạng hồi tiếp
vòng kín. Ban đầu mạng nhận các đầu vào từ mơi trường ngồi, sau đó thơng qua
việc huấn luyện các đầu ra cũng là chính là đầu vào của mạng.

Trang 12


Luận văn thạc sĩ

Hình 3.4: Mạng hồi quy nhiều lớp.

3.1.2 Luật học thông số tổng quát cho các mạng neuron nhân tạo
Thành phần quan trọng thứ ba của mạng neuron đó là việc huấn luyện mạng
hay cịn gọi là việc học cho mạng sử dụng các luật học khác nhau. Có hai cách học
khác nhau trong mạng neuron nhân tạo : Học thông số (parameter learning) và học
cấu trúc (structure learning).
Học thông số là phương pháp học bằng cách cập nhật trọng số kết nối và học
cấu trúc là phương pháp học bằng cách thay đổi bên trong cấu trúc mạng bao gồm
số các phần tử xử lý và các mơ hình kết nối mạng.
Giả sử có n phần tử xử lý trong một mạng neuron nhân tạo và mỗi phần tử
xử lý có chính xác m trọng số thích nghi. Ma trận trọng số W được định nghĩa bằng:
w1T   w11 w12
 T 
w2  w21 w22
W=   = 

  
  
 wT   w
 n   n1 wn2
Trong đó:

w1m 
w2 m 



wnm 

wi = (wi1, wi2, …, wim), i = 1, 2 …n
n : là vectơ trọng số của phần tử xử lý thứ i

wij : là trọng số để kết nối phần tử xử lý thứ j và phần tử xử lý thứ i.
Giả sử ta đã có ma trận trọng số mong muốn W chứa tất cả các phần tử thích
nghi của mạng. Vấn đề đặt ra là tìm cách nào để tìm ra một ma trận trọng số thực sự

Trang 13


Luận văn thạc sĩ

của mạng xấp xỉ với ma trận W trong q trình xử lý thơng tin ? Để làm được điều
này, luật học thông số tổng quát được phát triển nhằm cập nhật ma trận trọng số sao
cho có được một ma trận trọng số thực sự của mạng xấp xỉ với ma trận trọng số
mong muốn của mạng.
Một cách tổng qt, học thơng số có thể chia làm ba chế độ học: Học giám

sát, học củng cố và họ không giám sát.
Học giám sát
Trong cách học giám sát, mạng neuron nhân tạo được cung cấp một dãy các
cặp đầu vào, đầu ra mong muốn : (x(1), d(1)), (x(2), d(2)), …, (x(k), d(k)). Khi mỗi đầu
vào x(k) được đặt vào mạng thì đầu ra mong muốn tương ứng d(k) và đầu ra mong
muốn d(k) được giám sát trong khâu phát sinh tín hiệu sai số. Trọng số kết nối giữa
các neuron trong mạng này sẽ được cập nhật sử dụng tín hiệu sai lệch này sao cho
đầu ra thật sự của mạng sẽ tiến đến đầu ra mong muốn của mạng

X
(Đầu vào)

Mạngneuron
W

Tín hiệu sai số

Y (Đầu ra thực sự)

Khâu phát tsin
hiệu sai số

d (đầu ra mong muốn)

Hình 3.5 : Mô tả cách học giám sát của một mạng neuron nhân tạo

Học củng cố
Trong cách học giám sát ta giả định mỗi đầu ra mong muốn của mạng phải
được biết trước cho mỗi đầu vào của mạng. Tuy nhiên, trong một vài tình huống
nào có thể thiếu thơng tin chi tiết : mạng vẫn được cung cấp các mẫu đầu vào mong

muốn nhưng mạng không được cung cấp rõ ràng các mẫu đầu ra mong muốn. Học
dựa trên cơ sở loại các thông tin đánh giá đúng hay sai từ thông tin hồi tiếp từ đầu ra

Trang 14


Luận văn thạc sĩ

của mạng được gọi là học củng cố và thống tin hồi tiếp được gọi là thông tin củng
cố.

X
(Đầu vào)

Mạng neuron
W

Tín hiệu tăng cường

Y (Đầu ra thực sự)

Khâu phát tín
hiệu sai số

Tín hiệu cũng cố

Hình 3.6 : Mô tả cách học củng cố của một mạng neuron nhân tạo

Học củng cố là một dạng học có giám sát vì mạng vẫn nhận một vài thơng tin
hồi tiếp từ mơi trường của nó.

Học khơng giám sát
Trong cách học khơng giám sát, khơng có bất kỳ một thơng tin hồi tiếp nào
từ môi trường để xác nhận kết quả đầu ra đúng hay sai. Trong cách học này, mạng
chỉ được cung cấp các mẫu đầu vào và mạng tự điều chỉnh các trọng số kết nối giữa
các neuron trong mạng bằng cách sử dụng các mẫu đầu ra thực sự của mạng.

X
(Đầu vào)

Mạng neuron
W

Y (Đầu ra thực sự)

Hình 3.7 : Mô tả cách học không giám sát của một mạng neuron nhân tạo

Trong các mơ hình học trên, giá trị ngưỡng θ của neuron thứ i có thể được
đưa vào việc học. Nó được xem như là một trọng số Wmi bằng cách gán cho vectơ
đầu vào xm giá trị cố định : xm = -1.

Trang 15


Luận văn thạc sĩ

x1
x2
xn = -1

wi1

wi2

Neuron i
yi

win = θ
∆wi
r

x

Bộ phát sinh tín
hiệu học

di

η
Hình 3.8 : Mơ tả luật học thơng số tổng quát cho một phần tử xử lí thứ i

Luật học trọng số tổng quát trong các mạng neuron được định nghĩa như sau:
∆wi(t) = ηrX(t).
Trong đó : ∆wi(t) là sự gia tăng của vectơ trọng số tại mỗi bước học.
η: hằng số học (learning constant) để xác định tốc độ học trong mạng.
Do vậy, tại bước học t+1 vectơ trọng số có thể cải tiến bằng cơng thức :
wi(t+1) = wi(t) + ηrX(t).
Nếu là chế độ học giám sát thì tín hiệu học r được biểu diễn bằng một hàm
có dạng tổng quát :
r = fr (wi, X, di) = di - yi
Nếu là chế độ học củng cố thì tín hiệu học r được biểu diễn bằng một hàm
có dạng tổng quát :

r = fr (wi, X, di) = di
Nếu là chế độ học không giám sát thì tín hiệu học r được biểu diễn bằng một
hàm có dạng tổng quát :
r = fr (wi, X, di) = yi

Trang 16


Luận văn thạc sĩ

Nếu việc học được thực hiện liên tục, phương trình dưới đây được dùng để
cập nhật vectơ trọng số tại thời điểm (t+1)
∂wi (t )
∂t

= ηrX (t )

Khả năng tính tốn và biểu diễn phụ thuộc dữ liệu của mạng Neuron: mạng
Neuron truyền thẳng chỉ đơn thuần tính tốn các tín hiệu ra dựa trên các tín hiệu vào
và các trọng số liên kết Neuron đã được xác định sẵn trong mạng. Do đó chúng
khơng có trạng thái bên trong nào khác ngoài vector trọng số W. Đối với mạng quy
hồi, trạng thái bên trong của mạng được lưu giữ tại các ngưỡng của các Neuron. Nói
chung, các mạng qui hồi có thể khơng ổn định, thậm chí rối loạn theo nghĩa, khi cho
vector giá trị đầu vào X nào đó, mạng cần phải tính tốn rất lâu, thậm chí có thể bị
lặp vơ hạn trước khi đưa ra được kết quả mong muốn. Quá trình học của mạng quy
hồi cũng phức tạp hơn nhiều. Tuy vậy, các mạng quy hồi có thể cho phép mơ phỏng
các hệ thống tương đối phức tạp trong thực tế.
Xác định cấu trúc mạng tối ưu:
Lựa chọn sai cấu trúc mạng có thể dẫn tới hoạt động mạng trở nên kém hiệu
quả. Nếu ta chọn mạng quá nhỏ có thể chúng không biểu diễn được sự phụ thuộc dữ

liệu mong muốn. Nếu chọn mạng quá lớn để có thể nhớ được tất cả các mẫu học
dưới dạng bảng tra, nhưng hoàn tồn khơng thể tổng qt hố được cho những tín
hiệu vào chưa biết trước. Nói cách khác, cũng giống như trong các mơ hình thống
kê, các mạng Neuron có thể đưa tới tình trạng q thừa tham số.
Bài tốn xác định cấu trúc mạng tốt có thể xem như bài tốn tìm kiếm tối ưu
trong khơng gian tham số, có thể áp dụng các cơ chế tìm kiếm kinh điển theo
gradient hay các giải thuật di truyền, lập trình tiến hố,… Tuy vậy, khơng gian tham
số có thể rất lớn và để xác định một trạng thái W trong không gian đòi hỏi phải
huấn luyện mạng, do vậy rất tốn thời gian. Có thể áp dụng tư tưởng tìm kiếm leo đồi
(hill-climbing) nhằm sửa đổi một cách có lựa chọn, mang tính địa phương cấu trúc
hiện có. Có 02 cách làm:

Trang 17


Luận văn thạc sĩ

ü Hoặc bắt đầu vói một mạng lớn, sau đó giảm nhỏ xuống
ü Hoặc bắt đầu với một mạng nhỏ, sau đó tăng dần lên
Một kỹ thuật khác có thể áp dụng gọi là: “Tổng thương tối ưu” nhằm loại bỏ
một số liên kết trọng số trong mạng dựa trên cách tiếp cận lý thuyết thông tin. Đơn
giản nhất là các liên kết có trọng số bằng 0. quá trình cứ tiếp tục như vậy. Thực
nghiệm chỉ ra rằng, kỹ thuật này có thể loại trừ tới ¾ các liên kết, do đó nâng cao
đáng kể hiệu quả của mạng.
Ngoài việc loại trừ các liên kết Neuron thừa, người ta có thể vứt bỏ những
Neuron khơng đóng góp vào q trình thực hiện của mạng.
Giải thuật “lợp ngói” là một biến thể của kỹ thuật tăng trưởng mạng xuất
phát từ cấu hình ban đầu tương đối nhỏ, ý tưởng ở đây là xác định một cấu hình
mạng cho phép tính đúng các mẫu học đã biết. Sau đó mỗi khi thêm dần mẫu học
mới, mạng được phép thêm một số Neuron cho phép đoán đúng kết quả học hiện tại

và quá trình cứ như vậy tiếp tục.
Mạng Neuron lan truyền ngược (Back-propagation neural network):
Mạng Neuron nhiều lớp lan truyền ngược là một giải pháp hữu hiệu cho việc
mơ hình hố, đặc biệt đối với các q trình phức tạp hoặc các cơ chế chưa được biết
rõ ràng. Nó khơng địi hỏi bất kỳ sự hiểu biết trước về các dạng hàm cũng như các
tham số. Thực tế nó hoạt động như một hộp đen, với một số đủ lớn các trọng số
(weight) mạng hồn tồn có đủ độ tự do để biểu diễn mối quan hệ giữa các đại
lượng vào và ra. Mạng sử dụng tập quá trình thực nghiệm cho quá trình học hay quá
trình điều chỉnh các trọng số. Việc xác định mơ hình đơn giản là lựa chọn một cấu
trúc mạng và cho mạng học số liệu. Q trình học có thể tốn thời gian song một khi
đã ổn định, việc dự báo trở nên rất nhanh.
Mạng Neuron lan truyền ngược ln có một lớp vào, một lớp ra và khơng có
hoặc có các lớp ẩn. Các Neuron trên các lớp được xếp tuyến tính, số lượng neuron
của lớp vào bằng số biến của vectơ vào, số neuron của lớp ra bằng số biến của vectơ
ra, các lớp của mạng được nối với nhau một cách đầy đủ. Ngoài ra, trên các lớp trừ

Trang 18


Luận văn thạc sĩ

lớp ra có thêm một tham số điều khiển (bias). Số lớp cũng như số lượng các neuron
trên mỗi lớp tuỳ thuộc vào từng ứng dụng, trên thực tế việc xây dựng mạng dựa trên
việc thử và sai (trial and error). Các mạng được sử dụng trong thực tế thường chỉ
gồm 03 lớp: lớp vào, lớp ra và một lớp ẩn.
Cấu trúc mạng Neuron truyền thẳng nhiều lớp lan truyền ngược (the backpropagation algorithm – the multilayer feedforward networks):

Hình 3.9: Cấu trúc mạng Neuron truyền thẳng nhiều lớp lan truyền ngược

Mạng với R Neuron đầu vào p1, p2, …, pR , mỗi một Neuron đầu vào ứng với

một trọng số w: w1, w2, …, wR, tham số điều khiển b(bias) và hàm truyền f (transfer
function).
Hàm truyền thường được sử dụng là hàm log-sigmoid (logsig):

Hình 3.10: Hảm truyền logsig

Trang 19


Luận văn thạc sĩ

Ngồi ra người ta cịn các hàm sau:

Hình 3.11: Hảm truyền Tan-Sigmoid

Hình 3.12: Hảm truyền tuyến tính

Hàm truyền sigmoid sẽ xuất ra trị của mạng trong khoảng giới hạn nhỏ, cịn
khi sử dụng hàm truyền tuyến tính (linear) sẽ cho giá trị bất kỳ.
Thuật học Back-Propagation
Thuật toán Back-propagation được sử dụng để điều chỉnh các trọng số kết
nối sao cho tổng sai số E nhỏ nhất.
n

E=

∑ (t ( x , w) − y ( x ))
i =1

Trong đó:


i

2

i

t(xi,w) : giá trị thực của tập mẫu.
y(xi)

: giá trị xuất ra của mạng.

Mỗi Neuron đều có giá trị vào và ra, mỗi giá trị vào đều có một trọng số để
đánh giá mức độ ảnh hưởng của giá trị vào đó. Thuật học back-propagation sẽ điều
chỉnh các trọng số đó để cho giá trị ej = tj – yj là nhỏ nhất.

Trang 20


Luận văn thạc sĩ

Các bước thực hiện của thuật học Back-propagation:
Ø

Bước 1: Xác định giá trị các trọng số ban đầu cho tất cả các đầu
vào của từng Neuron. Giá trị trọng số này không thực sự quan
trọng lắm đối với quá trình học nhưng phải được gán bằng các số
ngẫu nhiên, tuy nhỏ nhưng không đồng đều bằng 0.

Ø


Bước 2: Tính tốn giá trị xuất ra của mạng.

Ø

Bước 3: Tính tốn giá trị sai số E của mạng.

Ø

Bước 4: So sánh giá trị sai số E của mạng với giá trị sai số mong
muốn ε.

Ø

Bước 5: Cập nhật lại trọng số mới rồi trở lại bước 2 cho đến khi
đạt giá trị sai số mong muốn.

Trước hết ta phải xác định vị trí của mỗi neuron. Neuron nào là của lớp ẩn và
neuron nào là của lớp xuất. Ta cần biết các ký hiệu:
wij : vector trọng số của neuron j số đầu vào i.
uj : vector giá trị kết xuất của neuron trong lớp j

Hình 3.13 : Mơ hình tính tốn một neuron

Giá trị sai số của neuron j tại vòng lặp thứ n: ej(n) = tj(n) – yj(n) ;
Tổng bình phương sai số của mạng neural : E(n) =

Trang 21

1 k 2

∑ e j ( n) ;
2 j =1


Luận văn thạc sĩ

Tại neuron j ta có tổng trọng số vector đầu vào: uj(n) =

p

∑ w .x ( n ) ;
i =0

ij

i

Giá trị kết xuất của neuron j: yj(n) = f j (u j (n)) ;
Tính tốn giá trị đạo hàm sai số cho mỗi neuron wij :
∂E (n) ∂E (n) ∂e j (n) ∂y j (n) ∂u j (n)
;
=
∂wij (n) ∂e j (n ) ∂y j (n) ∂u j (n) ∂wij (n)

Ta có:
1 k 2
∑ e j ( n)
2 j =1
∂E (n)
=

= ∂e j (n) ;
∂e j (n)
∂e j (n)
∂e j (n )
∂y j (n)
∂y j (n)
∂u j (n)

=

∂ (t j (n) − y j (n))
∂y j (n)

= −1 ;

= f j′(u j (n)) ;
p

∂u j (n )
∂wij (n)


=

∂ (∑ wij .xi (n))
i =0

∂wij (n)

= xi ( n ) ;


∂E (n)
= −e j (n). f ′(u j (n)).xi (n) ;
∂wij (n)

Giá trị điều chỉnh trọng số:
∆wij = −η

∂E (n)
= −η .e j (n). f ′(u j (n)).xi (n) ;
∂wij (n )

∂E(n)
∂E(n) ∂ej (n) ∂y j (n)
=−
= ej (n). f ′(u j (n)) ;
∂wij (n)
∂ej (n) ∂y j (n) ∂u j (n)

Đặt

δj = −

Ta có:

∆wij = −η .δ j (n).xi (n ) ;

Từ đó ta có cơng thức điều chỉnh trọng số:
wij (n + 1) = wij (n) + ∆wij (n) ;


Như vậy quá trình điều chỉnh trọng số có thể được xác định theo các cơng
thức trên, tuy nhiên ta cần phải xác định vị trí của neuron thuộc lớp nào (lớp ẩn hay
lớp xuất). Điều này rất quan trọng trong việc tính tốn δj cho từng hệ số điều chỉnh
trọng số.

Trang 22


Luận văn thạc sĩ

Hình 3.14: Mơ hình tính tốn mạng neural tổng quát

Trường hợp 1: Nếu neuron j là nút xuất:
Ta có:

δk = −

∂E(n)
∂E(n) ∂ek (n) ∂yk (n)
=−
= ek (n). fk′(uk (n))
∂wjk (n)
∂ek (n) ∂yk (n) ∂uk (n)

⇒ ∆w jk = η .δ k (n ). y j (n) ;

Trường hợp 2: Nếu neuron j là nút ẩn:
δj =−

Trong đó:


Khi đó:

∂E (n )
∂E ( n)
∂E ( n) ∂y j (n)
f ′(u j (n));
=−
=−
∂wij ( n)
∂y j ( n) ∂u j ( n)
∂y j (n)

E ( n) =

1 q 2
∑ ek (n) ;
2 k =1

∂E (n)
=
∂y j (n)

∂(

1 q 2
∑ ek (n)) q ∂ek (n)
2 k =1
= ∑ ek
;

∂y j (n )
∂y j (n)
k =1

∂ek (n) ∂ek (n) ∂uk (n)
=
;
∂y j (n) ∂uk (n ) ∂y j (n)
∂ek (n) ∂(tk (n) − yk (n)) ∂(tk (n) − fk (uk (n)))
=
=
=− fk′(uk (n)) ;
∂uk (n)
∂uk (n)
∂uk (n)
m

Mà ta có:

uk (n ) = ∑ w jk (n ) y j (n ) ;
j =0

m



∂uk (n)
=
∂y j (n)


∂(∑ w jk (n) y j (n))
j =0

∂y j (n)

= w jk (n) ;

q
∂E (n)
= −∑ ek (n) f k′(uk (n )) w jk (n) ;
∂y j (n)
k =1

Trang 23


Luận văn thạc sĩ

δk = −


∂E (n)
= ek (n). f k′(uk (n )) ;
∂w jk (n)

q
∂E (n)
= −∑ δ k (n) w jk (n) ;
∂y j (n)
k =1

q

Cho nên:

δ j (n) = f ′(u j (n))∑ δ k (n) w jk (n) ;
k =1

Từ những cơng thức tính trên ta có thể tổng quát như sau:

Ø Nếu neuron j là nút xuất: δ j = e j (n). f j′(u j (n)) ;
Ø Nếu neuron j là nút ẩn :

q

δ j (n) = f ′(u j (n))∑ δ k (n) w jk (n) ;
k =1

Tùy theo từng dạng hàm lan truyền ta có thể tính tốn các giá trị điều chỉnh
trọng số cho từng trọng số tương ứng theo thuật học Back-propagation.

Trang 24


Luận văn thạc sĩ

NHẬP TẬP MẪU
(inputs, Targets)

CHỌN THÔNG SỐ


Sai số ε

HIỆU CHỈNH
TRỌNG SỐ

E>ε

TÍNH GIÁ TRỊ NÚT
XUẤT (outputs)

n

E = ∑(t( xi , w) − y(xi ))

2

i =1

E <= e

XUẤT TRỌNG SỐ
Hình 3.15: Sơ đồ thực hiện Training Back-propagation

3.1.3 Giải thuật giảm gradient (sleepest gradient) :
Giải thuật giảm gradient là một trong những giải thuật dùng để cập nhật
trọng số trong các luật học có giám sát nêu trên.
Đây là giải thuật giải lặp, trong đó J : là hàm mục tiêu.

Trang 25



×