1
TÓM TẮT CHUYÊN ĐỀ
CƠ SỞ DỮ LIỆU
TÊN CHUYÊN ĐỀ
ỨNG DỤNG KHAI PHÁ DỮ LIỆU TỐI ƯU HIỆU SUẤT LÒ HƠI CÔNG
NGHIỆP
I. Thông tin chung
1. Họ và tên: Nguyễn Minh Tâm.
2. Mã số sinh viên: CH0601062
3. Chuyên đề: Cơ sở dữ liệu
4. Tên đề tài luận văn:
“Ứng dụng kỹ thuật mạng Noron trong khai phá dữ liệu tối ưu hiệu suất lò
hơi ở nhà máy Đạm Phú Mỹ”
5. Giảng viên hướng dẫn: TS Quản Thành Thơ, Khoa
KH&KT Máy Tính, trường ĐH Bách
Khoa thành phố HCM.
II. Nội dung thực hiện
1. Tình hình nghiên cứu chuyên đề trong nước và ngoài nước
Tình hình nghiên cứu trong nước: mạng noron và khai phá dữ liệu là hai lĩnh vực đã
được nghiên cứu nhiều ở nước ta, tuy nhiên, việc ứng dụng cả hai kỹ thuật này vào thực
tế, nhất là trong lĩnh vực công nghiệp nặng, thì theo khảo sát hiện nay, chưa có một công
trình nghiên cứu nào được công bố rộng rãi.
Tình hình nghiên cứu nước ngoài: hiện tại, chuyên đề này rất
được quan tâm, mới
đây, trong hội thảo khách hàng của hãng General Electric vào tháng 08 năm 2008,
Stephen Kwan đã giới thiệu phần mềm Kn3, phần mềm chuyên dụng trong tối ưu nhà
máy năng lượng và các ứng dụng khác nhằm làm tăng hiệu suất, giảm khí thải ô nhiễm
môi trường. Phần mềm này có mô hình nghiên cứu
2
Với bộ quản trị dữ liệu giúp khai phá dữ liệu, mạng noron mô hình hóa đối tượng,
bảng tập luật và các thuật toán di truyền xác định luật điều khiển, tạo tri thức, bộ điều
khiển đa biến thực hiện tối ưu…
Zhe Song and Andrew Kusiak trong hội thảo Constraint-Based Control of Boiler
Efficiency: A Data-Mining Approach, FEBRUARY 2007.
Andrew Kusiak, Zhe Song trong bài báo Combustion Efficiency Optimization and
Virtual Testing: A Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL
INFORMATICS, VOL. 2, NO. 3, AUGUST 2006.
Xu hướng nghiên cứu thật ra là một dạng của phương pháp đ
iều khiển công nghệ tiên
tiến ( Advanced Process Control). APC hiện đang được áp dụng rất phổ biến trong các
nhà máy lọc dầu, nhà máy Amonia và các nhà máy hóa chất.
2. Mục tiêu nghiên cứu và phương pháp thực hiện
2.1. Mục tiêu
Tối ưu hiệu suất lò hơi trong công nghiệp bằng phương pháp mạng noron và
gom cụm trong khai phá dữ liệu.
2.2. Nội dung thực hiện
Khái quát quy trình khai phá dữ liệu như sau:
3
Lưu đồ giải thuật của quá trình tối ưu
2.2.1 Tạo dấu hiệu điều khiển với thuật toán gom cụm K-means
- Một trong các giải thuật K-means cải tiến được dùng để quyết định luật điều khiển,
phân loại trọng tâm và các giá trị liên quan, để tối ưu hiệu suất.
N
Y
Dữ liệu vận hành của lò hơi lấy từ hệ thống DCS
- Mô hình hoá lò hơi bằng hàm đa biến y=f(x1,x2,x3…) bằng mạng
noron.
- Xây dựng cơ sở tri thức chứa các mẫu dấu hiệu điều khiển bằng thuật
toán khai phá dữ liệu
GIAI ĐOẠN HỌC
- Hệ thống sẽ đưa ra thông số hiệu chỉnh cho nhân viên vận hành đặt lại vào
hệ thống DCS, những thay đổi thông số này nằm trong khoảng rất nhỏ cho
phép nhằm bảo đảm không gây thay đổi đột ngột cũng như luôn luôn kiểm
soát được côn
g
n
g
hệ.
GIAI ĐOẠN HIỆN THỰC
-Các thông số tối ưu hệ thống được đưa vào hàm điều khiển
để thực nghiệm kiểm tra tính chính xác cũng như tính toán
hiệu quả.
GIAI ĐOẠN KIỂM THỬ
- Các thay đổi sau một khoảng thời gian nhất
định, được kiểm tra bằng cách đánh giá lại hiệu
suất và so sánh với tình t
r
ạ
n
g
trước đó.
KIỂM TRA KẾT QUẢ
Y
HOÀN THÀNH
N
4
- Dấu hiệu điều khiển được xây dựng từ các trọng tâm và dùng cho tối ưu thời gian
thực của quá trình cháy. Một dấu hiệu điều khiển bao gồm một tập giá trị của các
thông số điều khiển được và không điều khiển được, hiệu suất cháy tương ứng, và
các liệt kê liên quan như độ hỗ trợ ( số lượng các điểm trong cụ
m…) và độ tin cậy
(sự thay đổi của các điểm dữ liệu trong cụm).
- Phương pháp tối ưu hiệu suất sẽ điều chỉnh các thông số điều khiển được dựa trên
các dấu hiệu điều khiển được lưu trong cơ sở tri thức.
2.2.2 Rời rạc dữ liệu:
- Trong khi thực hiện quá trình tối ưu, để đạ
t được kết quả tốt nhất, cần phải rời rạc
hóa giá trị của hiệu suất thành các giá trị thuộc các mức. Ví dụ hiệu suất hiện tại của
lò hơi luôn dao động trong khoảng từ 86% đến 88%, thì ta sẽ chia các giá trị này
thành mười mức.
- Khi đó, một điểm vận hành trong thời gian thực P1 nào đó với hiệu suất e1 sẽ được
hệ thống xem xét có trọ
ng số khoảng cách Euclidean gần nhất với dấu hiệu điều
khiển CS(i) nào đó theo công thức
mà hiệu suất ei>e1 thì sẽ hiệu chỉnh bộ thông số điều khiển của P1 thành Pi.
2.2.3 Xây dựng dấu hiệu điều khiển:
a. Chế độ học offline:
- Trong chế độ này, dấu hiệu điều khiển được xây dựng trên dữ liệu lịch sử. Việc học
trải qua bốn bước cơ bản sau:
• Bước 1: Tiền xử lý tín hi
ệu thô: loại nhiễu, đổi thang đo, loại bỏ các giá trị sai, rời
rạc hóa các giá trị hiệu suất.
• Bước 2: Nhóm các điểm dữ liệu tiền xử lý thành mười nhóm ứng với mười mức
hiệu suất, kèm theo tập dữ liệu liên quan (gồm các thông số điều khiển được và
không điều khiển được).
• Bước 3: Với mỗi tập dữ liệu
ở bước hai, dùng thuật toán gom cụm K-means để tạo
tập trọng tâm. Giá trị của K được quyết định dựa vào số lượng các điểm của mức
hiệu suất đó, ví dụ là 5% số lượng điểm. Ngoài ra, các phương pháp khác cũng có
thể cân nhắc, ví dụ như độ lệch…
• Bước 4: Lưu các dấu hiệu điều khiển đã tính toán trên vào bộ cơ sở tri thứ
c, với
điều kiện nó khác với những bộ dữ liệu hiện hữu đã được lưu. Việc kiểm tra này
được xác định bởi hệ số chấp nhận sự giống nhau do ta xác định.
b. Chế độ học Online:
- Trong chế độ này, dấu hiệu điều khiển có thể thu thập và cập nhật liên tục trong khi
tối ưu hiệu suất quá trình cháy. Dữ liệu vận hành thực tế được lựa chọn và tiền xử
lý. Để lựa chọn cài đặt điều khiển run time, cơ sở tri thức sẽ tìm kiếm dấu hiệu điều
khiển giống điểm đang xét nhất mà có cùng mứ
c hiệu suất, nếu dấu hiệu gần nhất
được tìm thấy, thì dấu hiệu tương ứng được thống kê, như độ lệch chuẩn, số lượng
đại diện, trong cụm được cập nhật.
2.2.4 Xây dựng chiến lược điều khiển:
- Để tăng hiệu suất vận hành, một điểm dữ liệu i với tập dữ liệu p(i) trong dữ liệu vận
hành run time được hệ thống xem xét tìm một dấu hiệu điều khiển trong cơ sở tri
5
thức CS
i
có thông số “gần giống” p(i) nhất mà hiệu suất cao hơn, sẽ tác động thay
đổi thông số của p(i) bằng bộ thông số của chính nó. Và ngược lại, nếu p(i) có hiệu
suất cao hơn thì tập dữ liệu p(i) sẽ được cập nhật vào cơ sở tri thức CS(i) thay cho
p(i), đây chính là tính năng tự học của hệ thống, luôn cập nhật tri thức để đáp ứng
với thay đổi công nghệ
-
Có ba chiến lược điều khiển để chọn lựa dấu hiệu điều khiển như mong muốn được
xác định: bảo thủ, trung hòa và cầu tiến.
2.2.5 Mô hình hóa lò hơi:
Mặc dù mạng nơron thì không thích hợp lắm cho điều khiển quá trình cháy thời gian
thực, nhưng rất hữu ích cho quá trình xấp xỉ các hàm phi tuyến có thứ nguyên cao.
Ta xem lò hơi với các phương trình phản ứng bên trong như một h
ộp đen, với các thông
số công nghệ đầu vào và đầu ra
Lò hơi này được mô hình thành một phương trình đa biến
Y=f(x1, x2,…xj,….xn)
với xi, i=(1 n) là các thông số công nghệ đầu vào.
2.2.6 Tối ưu hiệu suất cháy thời gian thực:
- Vấn đề cơ bản là tối ưu hiệu suất thời gian thực với những chức năng thay đổi mục
tiêu (2) và ràng buộc vận hành(3,4).
Trong đó, E(t) là hiệu suất lò hơi ở thời điểm t
- Mạng nơron sẽ được huấn luyện trong một ngày, khoảng 1,1440 record (thời gian
lấy mẫu là một phút). Mô hình mạng nơron được dùng để dự báo hiệu suất lò hơi
sau khi các thông số điều khiển được đã được cập nhật tùy thuộc vào những cài đặt
điều khiển tối ưu đã sinh ra từ mô hình l
ập trình tuyến tính. Với các thông số duy trì
ổn định không đổi, hiệu suất lò hơi dự báo bởi mạng nơron sẽ quay về lại thành đầu
vào mạng nơron để dự báo hiệu suất lò hơi ở mức kế tiếp.
3.Tài liệu tham khảo
• Stephen Kwan, Kn3 – Power Plant Optimization and Other Applications, OC User
Conference, Kuala Lumpur, August 2008
Các phản ứng
công nghệ
lò hơi
Nước vào (T,P,F )
Fuel gas vào (T,P,F )
:
Hơi ra (T,P,F)
:
Hiệu suất lò hơi
y
x2
y1=f1(x1,x2 ,xi, xn)
x1
:
xn
:
Mô hình hóa
6
• Zhe Song and Andrew Kusiak,Constraint-Based Control of Boiler Efficiency: A
Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL
INFORMATICS, VOL. 3, NO. 1, FEBRUARY 2007
• * Andrew Kusiak, Zhe Song, Combustion Efficiency Optimization and Virtual
Testing: A Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL
INFORMATICS, VOL. 2, NO. 3, AUGUST 2006.
• TS Đỗ Phúc, Chuyên đề khai phá dữ liệu và nhà kho dữ liệu, Trường đại học
CNTT, 2004.
• Định nghĩa lò hơi />.
• Tài liệu hướng dẫn của phần mềm Matlab.
III. Kết quả và kiến nghị
3.1. Kết quả đạt được (tham khảo bài báo)
• Dự báo chính xác hiệu suất từ mạng Noron
• Kết quả tối ưu nâng được hiệu suất từ 1 đến 1.5 % trong điều kiện test
3.2. Kiến nghị
- Đề tài đang được xin làm đề tài nghiên cứu khoa học tại Nhà máy Đạm Phú Mỹ,
KCN Phú Mỹ 1, Tân Thành, Bà Rịa Vũng Tàu với ứng dụng thực tiễn tối ưu hiệu suất lò
hơi Marchi công suất 140 tấn/giờ, được điều khiển hoàn toàn tự động bằng bộ điều khiển
logic khả trình PLC và hệ điều khiển phân tán DCS
- Hoàn thành luận văn tốt nghiệp “
Ứng dụng kỹ thuật mạng Noron trong khai phá
dữ liệu tối ưu hiệu suất lò hơi ở nhà máy Đạm Phú Mỹ”