Tải bản đầy đủ (.pdf) (7 trang)

Ví dụ minh hoạ thuật toán

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (181.6 KB, 7 trang )

™

Ví dụ minh hoạ thuật tốn
Ví dụ như chúng ta có một vài đối tượng (4 kiểu của thuốc) và mỗi

đối tượng có hai thuộc tính hoặc đặc tính như biểu diễn theo bảng sau. Mục
đích của chúng ta là nhóm các đối tượng đó lại vào trong K = 2 nhóm
medicine cơ bản trên hai với hai đặc tính pH và weight index.
Feature 1 (X):
Object

Feature 2 (Y): pH

weight index

Medicine A

1

1

Medicine B

2

1

Medicine C

4


3

Medicine D

5

4

Mỗi loại Medicine diễn một điểm với hai đặc trưng (X,Y) như biểu diễn
trên toạ độ như sau:


1) Bước 1
Giá trị ban đầu của các trọng tâm: Giả sử chúng ta sử dụng medicine
A và medicine B như các trọng tâm ban đầu. Đưa vào C1, C2 biểu diễn toạ
độ của các trọng tâm đó là: C1= (1,1), C2= (2,1).

2) Bước 2
Object-Centroid distance: Chúng ta tính tốn khoảng cách giữa nhóm
trọng tâm đến mỗi đối tượng. Sử dụng cách

tính khoảng cách của

Euclidean. Sau đó ta đưa ra ma trận:

D0 =

0 1 3,61

C1 = (1,1) group-1


5

C2 = (2,1) group -2

1 0 2.83 4.24
A B
1
1

2
1

C

D

4 5
3 4

X


Y

Mỗi cột trong ma trận khoảng cách tượng trưng cho đối tượng. Dòng
đầu của ma trận khoảng cách tương ứng với khoảng cách của mỗi đối tượng
đến trọng tâm đầu tiên và dòng thứ hai là khoảng cách của mỗi đối tượng
đến trọng tâm thứ hai.
Ví dụ, khoảng cách từ Medicine C = (4, 3) đến trọng tâm đầu tiên C1 =

(1,1) là:

(4 − 1)2 + (3 − 1)2 = 3.61 và khoảng cách của nó đến trọng tâm thứ

hai C2 = (2,1) là

(4 − 2)2 + (3 − 1)2 = 2.83

3) Bước 3
Objects clustering: Chúng ta gán mỗi đối tượng cơ sở với khoảng cách
nhỏ nhất. Bởi vậy, machine A được gán đến nhóm 1, machine B được gán
đến nhóm 2, machine C đến nhóm 2 và machine D đến nhóm 2. Phần tử
của ma trận nhóm theo là 1 nếu chỉ nếu các đối tượng được gán đến nhóm
đó.

G0 =

1 0
0 1

0
1

0
1

Group -1
Group -1

A B C D


4) Bước 4
Lặp lại 1, determine deteroids: bây giờ chúng ta tính tốn các
trọng tâm mới của mỗi nhóm cơ sở trên những thành viên mới. Nhóm 1 chỉ
có một thành viên bởi vậy trọng tâm chính là nó. Nhóm 2 bây giờ có ba


thành viên, bởi vậy trọng tâm là trung bình toạ độ giữa ba thành viên: C2 =
⎛ 2 + 4 + 5 1+ 3 + 4 ⎞
,


3
3



5) Bước 5
Lặp lại bước 1, Object-centroids distances: Bước tiếp theo là tính
tốn khoảng cách của tất cả các đối tượng đến các trọng tâm mới. Tương tự
bước 2, chúng ta có khoảng cách ma trận lặp lại 1 là:
0

1

1

3,61

5


C1 = (1,1) group -1

D =
3.14 2.36 0.47
A
1
1

B
2
1

C
4
3

1.89
D
5
4

C2 =

(

11 8
,
3 3


) group -2

X
Y

6) Bước 6
Lặp lại bước 1, Objects clustering: Tương tự bước 3, chúng ta gán mỗi
đối tượng cơ sở trong khoảng cách nhỏ nhất. Cơ sở trong khoảng cách


matrix mới, chúng ta di chuyển machine B đến Group 1 trong khi tất cả các
đối tượng khác còn lại. Nhóm ma trận được biểu diễn theo:

G1 =

1
0

1
0

0
1

0
1

A

B


C

D

group - 1
group -2

7) Bước 7
Lặp lại bước 2, determine centroids: Bây giờ chúng ta lặp lại bước 3 để
tính tốn các trọng tâm cơ sở trên các phân nhóm của bước trước. Nhóm 1
và nhóm 2 có hai thành viên bởi vậy các trọng tâm mới là



C1 =

(

1+ 2 1+1
,
2
2

C2 =

(

4+5 3+ 4
,

2
2

8) Bước 8

) = ⎛⎜1 1 ,1⎞⎟
⎝ 2 ⎠

) = ⎛⎜ 4 1 ,3 1 ⎞⎟
⎝ 2

2⎠


Lặp lại bước 2, Object-centroids distrances: chúng ta có khoảng
cách ma trận mới tại bước 2 như:

D2 =

0.5

0.5

3,20 4.61

4.30

3.54

0.71 0.71


1
2

C1= (1 ,1) group -1
1
2

C1= (1 ,1) group -2

9) Bước 9
Lặp lại bước 2, Objects clustering: Làm lại, chúng ta gán mỗi đối
tượng cơ sở trên khoảng cách nhỏ nhất.
1
0
A

1
0
B

0
1
C

group - 1

0
1
D


group -2

Chúng ta thu được kết quả là việc so sánh các nhóm của phép lặp
cuối cùng và phép lặp này biểu thị rằng các đối tượng không dời chuyển
sang bất cứ nhóm nào. Bởi vậy việc tính tốn của k-Mean clustering có thể
được nghiên cứu sự ổn định của nó. Kết quả cuối cùng khi gom nhóm.

Feature 1 (X):

Feature 2

Group

weight index

(Y): pH

(result)

Medicine A

1

1

1

Medicine B


2

1

1

Medicine C

4

3

2

Medicine D

5

4

2

Object




×