Tải bản đầy đủ (.pdf) (7 trang)

CẢI TIẾN LUẬT HỌC CỦA FUZZY ART VÀ ỨNG DỤNG VÀO PHÂN ĐOẠN CÁC ẢNH MÀU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (659.56 KB, 7 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

<b>CẢI TIẾN LUẬT HỌC CỦA FUZZY ART VÀ ỨNG DỤNG VÀO PHÂN ĐOẠN </b>


<b>CÁC ẢNH MÀU </b>



<b>Nông Thị Hoa*, Nguyễn Xuân Hưng </b>


<i><b>Trường Đại học Công nghệ thơng tin & Truyền thơng - ĐH Thái Ngun </b></i>


TĨM TẮT


Fuzzy Adaptive Resonance Theory (Fuzzy ART) là mạng nơ-ron nhân tạo dùng cho nhiệm vụ
phân cụm dữ liệu với hai ưu điểm nổi bật gồm học trực tuyến và tính tốn đơn giản. Tuy nhiên,
luật học của Fuzzy ART lại học chưa hiệu quả một số mẫu huấn luyện. Trong bài báo này, chúng
tôi đề xuất một luật học cải tiến cho Fuzzy ART để nâng cao chất lượng kết quả của q trình học.
Để chứng minh tính hiệu quả của luật học đề xuất, các thực nghiệm được làm để giải quyết bài
toán phân đoạn các ảnh màu. Kết quả thực nghiệm cho thấy FuzzyART với luật học đề xuất phân
đoạn tốt hơn các mơ hình so sánh.


<i><b>Từ khoá: Fuzzy ART, luật học, phân đoạn ảnh, mạng nơ-ron nhân tạo, xử lý ảnh</b></i>


GIỚI THIỆU CHUNG*


Fuzzy ART là một mạng nơ-ron nhân tạo có
nhiều ưu điểm và có khả năng ứng dụng rộng
rãi. Fuzzy ART có khả năng học trực tuyến
nên Fuzzy ART có thể học dữ liệu mới liên
tục mà không cần học lại các mẫu đã học như
đa số các mơ hình học máy khác. Fuzzy ART
có cấu tạo và hoạt động đơn giản. Fuzzy ART
khơng dùng đến các tính tốn phức tạp và số
lượng tính tốn ít nên tốc độ xử lý của Fuzzy
ART thường nhanh hơn các mạng nơ-ron


nhân tạo khác. Hơn nữa, Fuzzy ART cịn
dùng các tính chất tập mờ để thu hẹp miền giá
trị của các tham số dùng trong mơ hình. Do
Fuzzy ART giải quyết các bài toán phân cụm
hay phân lớp dữ liệu nên Fuzzy ART được áp
dụng vào nhiều hệ thống thực trong công
đoạn tiền xử lý dữ liệu. Do đó, chúng tơi tập
trung vào cải tiến Fuzzy ART để khai thác
các điểm mạnh của mơ hình.


Phân đoạn ảnh là một thao tác thực hiện việc
phân vùng ảnh thành các vùng rời rạc và đồng
nhất. Vì thế, phân đoạn ảnh thường là bước
tiền xử lý trước khi thực hiện các thao tác như
nhận dạng đối tượng, biểu diễn đối tượng, nén
ảnh, hay truy vấn ảnh. Do đó, phân đoạn ảnh là
bài toán được nhiều nhà khoa học quan tâm và
có tính ứng dụng cao. Vì vậy, chúng tôi chọn
ứng dụng phân đoạn ảnh để kiểm tra tính hiệu
quả của Fuzzy ART với luật học cải tiến.



*<sub> Tel: 01238 492484, Email: </sub>


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

các thực nghiệm với nhiệm vụ phân đoạn các
ảnh màu được làm để so sánh kết quả phân
đoạn của Fuzzy ART với luật học đề xuất với
các kỹ thuật điển hình của các phương thức
phân đoạn khác.



Cấu trúc của bài báo gồm 6 phần. Trong Phần
II, các nghiên cứu liên quan được tổng kết.
Phần III mô tả cấu trúc và hoạt động của
Fuzzy ART. Phần IV trình bày chi tiết luật
học đề xuất. Các kết quả thực nghiệm được
thể hiện và phân tích cụ thể trong Phần V.
Cuối cùng là một vài kết luận và hướng phát
triển của bài báo này.


CÁC NGHIÊN CỨU LIÊN QUAN


Các mơ hình Fuzzy ART được đưa ra để cải
thiện khả năng phân cụm dữ liệu. G.A.
Capenter và đồng nghiệp [1] đưa ra Fuzzy
ARTMAP cho việc học các cụm nhận dạng
và các ánh xạ đa chiều các mẫu vào nhị phân
hay tương tự. Mơ hình này cực tiểu lỗi dự
đốn và cực đại sự tổng qt hóa các mẫu. Do
đó, hệ thống tự học số cụm ít nhất đạt u cầu
về độ chính xác. Việc dự đốn được cải thiện
do việc huấn luyện hệ thống nhiều lần với
nhiều thứ tự khác nhau của tập dữ liệu vào,
sau đó chọn một. Chiến lược này có thể dùng
để ước lượng dự đoán với các tập mẫu huấn
luyện không đầy đủ hay các tập mẫu nhỏ và
nhiễu. C. Lin và đồng nghiệp [7] đưa ra thuật
toán học theo cấu trúc hoặc học theo tham số
để xây dựng ANN truyền thẳng nhiều tầng
cho nhận dạng các thành phần của bộ điều
khiển. Do đó, nhóm tác giả đưa ra thuật tốn


học dựa vào Fuzzy ART để chia khơng gian
dữ liệu vào-dữ liệu ra một cách linh động dựa
vào sự phân bố của dữ liệu. Thuật toán này
phối hợp học theo tham số của mạng lan
truyền ngược và học cấu trúc của thuật toán
Fuzzy ART. Hơn nữa, thuật toán này điều
chỉnh các hàm thành viên, và tìm ra các luật
logic mờ thích hợp. H. Isawa và đồng nghiệp
[5] đưa ra một bước thêm, học nhóm, cho
Fuzzy ART để thu được kết quả phân cụm
hiệu quả hơn. Đặc trưng quan trọng của học


</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>

và thông tin xác xuất được dùng để cải thiện
khả năng phân lớp.


MƠ HÌNH FUZZY ART


<i>Cấu trúc Adaptive Resonance Theory ART) </i>


Cấu trúc chung của mạng ART được thể hiện
trong Hình 1.



<i><b>Hình 1: Cấu trúc của một ART đơn giản </b></i>


Một mạng ART điển hình có hai tầng: tầng dữ
liệu vào (F1) và tầng dữ liệu ra (F2). Tính động
của mạng được điều khiển bởi hai hệ thống con:
hệ thống chú ý và hệ thống định hướng.


<i>Thuật toán Fuzzy ART </i>



Fuzzy ART là một ART mà mẫu vào và véc
tơ trọng số của các cụm được thể hiện ở dạng
tập mờ. Do đó, có thể dễ dàng lựa chọn giá trị
cho các tham số của mơ hình dựa vào các
thuộc tính về hình học của tập mờ. Hơn nữa,
có thể sử dụng nhiều thao tác linh hoạt trên
tập mờ trong các hoạt động của mơ hình.
Hoạt động của Fuzzy ART được trình bày chi
tiết trong [2] với bốn bước như sau:


<b>Input: tập các mẫu huấn luyện với mỗi mẫu </b>


<i><b>được ký hiệu I với I=(I</b>1, I2,…,IM). </i>


<i><b>Output: véc tơ trọng số ứng với cụm i có </b></i>


<b>dạng Wi</b><i>=(Wi1, Wi2,…,WiM). </i>


<i>Ba tham số của Fuzzy ART: chọn α > 0, tốc </i>
<i>độ học β ∈ [0, 1], ngưỡng ρ ∈ [0, 1]. </i>


<b>Bước 1: Khởi tạo véc tơ trọng số. </b>


<i><b>Mỗi cụm j có một véc tơ trọng số W</b></i><b>j</b>=


<i>(Wj1,..., WjM</i>). Số các cụm tiềm năng N là


bất kỳ. Khởi tạo



(1)
và mỗi cụm được coi là chưa hình thành. Sau
khi một cụm được chọn để mã hóa, cụm được
<i>hình thành. Wji</i> là không tăng dần theo thời


<i>gian nên các Wji<b> hội tụ tới một giới hạn. </b></i>


<b>Bước 2: Lựa chọn một cụm chiến thắng. </b>


<i><b>Với mỗi dữ liệu vào I và cụm j, hàm chọn T</b>j</i>


được định nghĩa bởi


(2)
với phép toán trong logic mờ được định nghĩa:


(3)
và dạng được định nghĩa:


(4)
<i>Để đơn giản, Tj<b>(I) được viết là T</b>j</i> khi mẫu


<b>vào I cố định. Sự chọn cụm được gắn chỉ số </b>
<i>bằng j, với </i>


(5)


<i>Nếu có nhiều hơn một Tj là cực đại thì cụm j </i>


với chỉ số nhỏ nhất được chọn.



<b>Bước 3: Kiểm tra trạng thái của mạng là cộng </b>


<b>hưởng hay thiết lập lại. </b>
Cộng hưởng xuất hiện nếu


(6)


Sau đó việc học sẽ diễn ra.
Thiết lập lại xuất hiện nếu


(7)
<i>Sau đó, giá trị của hàm chọn TJ được thiết lập </i>


-1 cho các biểu diễn mẫu vào để ngăn sự lựa
chọn lại mẫu vào trong quá trình tìm kiếm.
<i>Một chỉ số mới j được chọn bởi Công thức </i>
<i>(5). Quá trình tìm kiếm tiếp tục cho đến khi j </i>
được chọn thỏa mãn Cơng thức (6). Nếu
khơng có cụm đang tồn tại nào thỏa mãn thì
<i>một cụm mới j được sinh ra và đặt </i>


<b>Bước 4: Học dữ liệu huấn luyện. </b>


<i>Véc tơ trọng số của cụm J được cập nhật bởi: </i>


</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

LUẬT HỌC CẢI TIẾN CHO MƠ HÌNH
FUZZY ART


<i>Ý tưởng </i>



Luật học đề xuất thể hiện trọng số của các
cụm được tăng/giảm khi học mỗi mẫu huấn
luyện để cụm chiến thắng thích nghi được với
mẫu vào. Sự ảnh hưởng của mỗi mẫu huấn
luyện được thể hiện bởi tham số tốc độ học.


<i>Nội dung luật học </i>


Sau khi Fuzzy ART chọn được một cụm
chiến thắng, việc học mẫu huấn luyện hiện
<i>tại diễn ra. Giả sử, cụm chiến thắng là cụm j. </i>
Trước tiên, tính sự tăng giá trị bé nhất (MDI)
và sự giảm giá trị bé nhất (MDD) của mẫu
vào hiện tại so với trọng số của cụm chiến
thắng theo các công thức sau:


(9)


(10)
<i><b>với M là số phần tử của mẫu vào I. </b></i>


<i>Thực hiện cập nhật trọng số cho cụm j theo </i>
công thức dưới đây:


(11)
với là tham số tốc độ học.


<i>Thảo luận </i>



Ưu điểm của luật học cải tiến là mọi mẫu
huấn luyện đều làm thay đổi trọng số của các
cụm được chọn. Do đó, mọi mẫu huấn luyện
đều được lưu lại ở trọng số của các cụm.
Sự ảnh hưởng của mỗi mẫu huấn luyện
được thể hiện bởi tham số tốc độ học .
Giá trị của cần được chọn đủ nhỏ để đảm
bảo mọi mẫu huấn luyện đều được học mà
không giảm chất lượng của kết quả học khi
mẫu học là mẫu dị thường.


KẾT QUẢ THỰC NGHIỆM


<i>Chuẩn bị dữ liệu </i>


Các thực nghiệm được làm trên ba ảnh màu
chuyên dùng cho các thực nghiệm về xử lý


ảnh. Cả ba ảnh đều có các vùng màu gần
giống nhau và đan xen. Do đó, việc phân
đoạn ảnh sẽ phức tạp hơn. Kích thước các ảnh
được co lại thành 180x180. Mỗi ảnh được
chuyển thành một ma trận hai chiều tương
ứng với kích thước ảnh. Mỗi phần tử của ma
trận chứa ba giá trị ứng với các thành phần
RGB. Hình 2 thể hiện các ảnh gốc trước khi
phân đoạn.


(a) (b) (c)



<i><b>Hình 2: Các ảnh gốc dùng cho thực nghiệm </b></i>


<i><b>Kết quả thực nghiệm của Fuzzy ART cải tiến </b></i>


Đầu tiên, nhóm điều chỉnh giá trị của các
tham số để tìm ra các giá trị thích hợp sao cho
kết quả phân đoạn các ảnh màu đạt cao nhất.
Hình 3 thể hiện kết quả phân đoạn của ba ảnh
với các bộ giá trị khác nhau của các tham số.
Dữ liệu từ hàng thứ nhất trong Hình 3 cho
thấy sự thay đổi giá trị của tham số tốc độ học
có ảnh hưởng lớn đến chất lượng phân
đoạn. Giá trị của càng nhỏ thì kết quả phân
đoạn càng tốt như trong Hình 3(1c) và Hình
3(1d). Ngược lại, giá trị của càng lớn thì kết
quả phân đoạn càng giảm. Trong Hình 3(1b),
vùng má được xem như giống màu với vùng
râu quanh mồm của chú khỉ.


Tương tự với kết quả ra của bức tranh cơ gái
và các loại ớt. Trong Hình 3(2b), phần tóc và
da phía dưới đi mũ khơng được phân đoạn
tốt bằng Hình 3(2c) và Hình 3(2d). Hình
3(3b), Hình 3(3c), và Hình 3(3d) cho biên
vùng giống nhau nhưng Hình 3(3b) coi quả ớt
dài màu vàng nhạt và quả ớt tròn màu xanh
đậm là cùng màu.


Từ kết quả thực nghiệm cho thấy, Fuzzy ART
với luật học cải tiến phân đoạn hiệu quả các ảnh


màu có biên mờ khi thiết lập tham số tốc độ học


bằng các giá trị nhỏ khoảng 1.5*10-6.


<i><b>So sánh với một số kỹ thuật phân đoạn khác </b></i>


</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

ngưỡng, phân đoạn không giám sát, và phân
đoạn theo vùng. Một kỹ thuật điển hình đại
diện cho ba nhóm trên được chọn để thực
nghiệm gồm: phương thức của Otsu [10],
thuật toán Kmean [8], và phương thức
Watershed [9]. Các kỹ thuật được chạy trên
Matlab và được điều chỉnh các tham số cho
đến khi tìm được giá trị thích hợp cho việc
phân đoạn các ảnh gốc đã chọn.


Kết quả của phương thức Otsu với các giá trị
tham số khác nhau được thể hiện trong Hình
4. Dữ liệu trong Hình 4 cho thấy Hình 4(1c),
Hình 4 (2c), và Hình 4 (3c) cho kết quả phân
đoạn tốt nhất.


<i><b>Hình 3: Kết quả phân đoạn của Fuzzy ART với </b></i>
<i>luật học cải tiến. Ảnh đầu mỗi dòng là ảnh gốc và </i>
<i>ba ảnh tiếp theo là kết quả phân đoạn ứng với giá </i>


<i>trị của ba tham số </i>


Kết quả phân đoạn tốt nhất của cả 4 kỹ thuật
được trình bày trong bảng 1. Dữ liệu trong


bảng 1 cho thấy Fuzzy ART với luật học cải
tiến phân đoạn tốt nhất do vẫn phát hiện rõ
các biên và sự phân bố các vùng màu giống
với ảnh gốc nhất. Phương thức của Otsu phát
hiện biên khá tốt nhưng sự phân bố các vùng
màu có sai khác với ảnh gốc. Màu viền mũ và
màu đuôi mũ coi là giống nhau và màu của
quả ớt tròn màu đỏ cũng giống màu quả ớt
tròn màu xanh đậm. Thuật toán Kmean phát
hiện biên tốt nhưng phân bố các vùng mầu sai
khác nhiều so với ảnh gốc. Một số phân đoạn
bị mất đi nhiều pixel trong khi một số phân


đoạn khác có quá nhiều pixel nên chỉ tạo ra
hai vùng màu chính gồm ssáng và tối trong cả
ba ảnh. Thuật toán Watershed cho kết quả
thấp nhất do không phát hiện tốt cả biên và sự
phân bố các vùng màu.


<i><b>Hình 4: Kết quả phân đoạn của phương thức </b></i>
<i>Otsu. Ảnh đầu mỗi dòng là ảnh gốc và ba ảnh tiếp </i>


<i>theo là kết quả phân đoạn ứng với giá trị trong </i>
<i>hàm strel() của Mathlab. </i>


KẾT LUẬN


Trong bài báo này, một luật học cải tiến cho
Fuzzy ART được trình bày. Luật học đề xuất
tiến hành thay đổi trọng số của phân cụm


chiến thắng bằng việc tăng/giảm một lượng
dựa vào sự chênh lệch giá trị của mẫu vào và
véc tơ trọng số của cụm. Ưu điểm của luật
học này là học mọi mẫu huấn luyện. Các thực
nghiệm được làm cho nhiệm vụ phân đoạn
các ảnh màu cho thấy Fuzzy ART với luật
học cải tiến phân đoạn tốt hơn các mô hình
được so sánh.


Trong thời gian tới, các thực nghiệm được mở
rộng với các tập ảnh lớn hơn và cần tiến hành
so sánh với nhiều phương pháp phân đoạn
ảnh khác.


LỜI CẢM ƠN


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

TÀI LIỆU THAM KHẢO


1. G.A. Capenter, S. Grossberg, N. Markuron
(1992), “Fuzzy ARTMAP-an addaptive resonance
architecture for incremental learning of analog
<i>maps”, The International Joint Conference on </i>
<i>Neural Networks, vol. 3. </i>


2. G. A. Carpenter, S. Grossberg, D. B. Rosen,
“Fuzzy ART : Fast Stable Learning and
Categorization of Analog Patterns by an Adaptive
<i>Resonance System”, Pergamon Press-Neural </i>
<i>network, vol. 4, 1991, pp. 759–771. </i>



3. K.L. Chu, M. Ali, S.L. Wei (2013), “A Novel
Complex-Valued Fuzzy ARTMAP for Sparse
Dictionary Learning”, <i>Neural </i> <i>Information </i>
<i>Processing, LNCS, Vol 8226, pp. 360-368. </i>
4. K.L. Chu, L.S. Wei, S. Manjeevan, L. Einly
(2015), ”Probabilistic ensemble Fuzzy ARTMAP
optimization using hierarchical parallel genetic
<i>algorithms”, Neural Computing and Applications, </i>
Vol. 26(2), pp. 263-276.


5. H. Isawa, H. Matsushita, Y. Nishio (2008),
“Improved Fuzzy Adaptive Resonance Theory
Combining Overlapped Category in Consideration
<i>of Connections”, IEEE Workshop on Nonlinear </i>
<i>Circuit Networks, pp. 8–11. </i>


6. H. Isawa, M. Tomita, H. Matsushita, Y. Nishio
(2007), “Fuzzy Adaptive Resonance Theory with
Group Learning and its Applications”,
<i>International Symposium on Nonlinear Theory </i>
<i>and its Applications, vol. 1, pp. 292–295. </i>


7. C. Lin, C. Lin, C.S. G. Lee (1995), “Fuzzy
adaptive learning control network with on-line
<i>neural learing”, Elsevier Science-Fuzzy sets and </i>
<i>Systems, vol. 71, pp. 25–45. </i>


8. S.P. Lloyd (1982), "Least Squares Quantization
<i>in PCM." IEEE Transactions on Information </i>
<i>Theory. Vol. 28, pp. 129–137. </i>



9. F. Meyer (1994), "Topographic distance and
<i>watershed lines," Signal Processing , Vol. 38, pp. </i>
113-125.


10. N. Otsu (1979), "A Threshold Selection
<i>Method from Gray-Level Histograms," IEEE </i>
<i>Transactions on Systems, Man, and Cybernetics, </i>
Vol. 9, No. 1, pp. 62-66.


11. W.Y. Shen, Y.S. Keem, Y.J. Hwa, T.C.Shing
(2014) ,”A Truly Online Learning Algorithm
using Hybrid Fuzzy ARTMAP and Online
Extreme Learning Machine for Pattern
<i>Classification”, Neural Processing Letters, doi </i>
10.1007/s11063-014-9374-5.


12. A. Yousuf, Y.L. Murphey (2010), “A Supervised
Fuzzy Adaptive Resonance Theory with Distributed
<i>Weight Update”, The 7th International Symposium </i>
<i>on Neural Network , Springer, vol. Part I, LNCS, no. </i>
6063, pp. 430–435.


13. V. Vidya, T.R. Indhu, V. K. Bhadran, R.
Ravindra Kumar (2013), “Malayalam Offline
Handwritten Recognition Using Probabilistic
Simplified Fuzzy ARTMAP”, <i>Intelligent </i>
<i>Informatics, Advances in Intelligent Systems and </i>
<i>Computing, Volume 182, pp 273-283. </i>



<i><b>Bảng 1: Kết quả phân đoạn của các kỹ thuật </b></i>


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

SUMMARY


<b>IMPROVING THE LEARNING RULE OF FUZZY ART </b>
<b>AND APPLYING FOR COLOR IMAGE SEGMENTATION </b>


<b>Nong Thi Hoa*, Nguyen Xuan Hung </b>


<i>College of Information and Communication Technology - TNU</i>


Fuzzy Adaptive Resonance Theory (Fuzzy ART) is an artificial neural network applied to cluster
data. Two important advantages include leaning on-line and simple computation. However, the
learning rule of Fuzzy ART ineffectively learns some training patterns. In this paper, we propose
an improved learning rule to increase the quality of learning results. To prove the effectiveness of
the proposed learning rule, experiments are conducted to solve the color image segmentation.
Experiment results show that Fuzzy ART with the impoved learning rule clusters better than
compared techniques.


<i><b>Keywords: Fuzzy ART, learning rule, image segmentation, artificial neural network, image </b></i>
<i>processing </i>




</div>

<!--links-->

PHÂN TÍCH HỒI QUY - TƯƠNG QUAN VÀ ỨNG DỤNG TRONG PHÂN TÍCH CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN TỔNG TỶ SUẤT SINH
  • 21
  • 3
  • 9
  • ×