CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.88 MB, 168 trang )

Trang 2<div class="page_container" data-page="2">

Chương 1: Tập mờ và phân bố khả năng ...19

1. Biểu diễn tập mờ và phân bố khả năng ...19

</div>Trang 3<div class="page_container" data-page="3">

2.3. Thông tin khơng chắc chắn...37

3. Mơ hình cơ sở dữ liệu hướng đối tượng mờ ...38

3.1. Đối tượng mờ ...38

3.2. Lớp mờ ...40

3.3. Mối quan hệ đối tượng/lớp mờ ...42

3.4. Các phân cấp thừa kế mờ ...49

3.4.1. Phân cấp thừa kế trong các lớp ngoại diên ...50

3.4.2. Phân cấp thừa kế trong các lớp nội hàm ...51

3.4.3. Đa thừa kế mờ ...53

3.5. Mơ hình lớp đối tượng mờ ...54

3.6. Biểu diễn cơ sở dữ liệu hướng đối tượng mờ ...56

4. Kết luận chương 2 ...59

Chương 3: Phụ thuộc hàm mờ và các dạng chuẩn của lược đồ cơ sở dữ liệu hướng đối tượng mờ ...60

1. Phụ thuộc hàm mờ và các luật suy dẫn ...60

1.1. Sự tương tự của hai giá trị thuộc tính ...60

1.2. Phụ thuộc hàm mờ trong lớp đối tượng ...63

1.3. Tách các thuộc tính kiểu bộ theo phụ thuộc hàm mờ ..65

1.4. Các luật suy dẫn trên các phụ thuộc hàm mờ ...66

1.5. Khóa của lớp đối tượng mờ ...68

2. Phụ thuộc phương thức ...70

3. Phép tách lớp đối tượng mờ không mất thông tin ....71

</div>Trang 4<div class="page_container" data-page="4">

4.1. Các dạng chuẩn đối tượng mờ ...72

4.1.1. Dạng chuẩn đối tượng mờ 1 (1FONF) ...73

4.1.2. Dạng chuẩn đối tượng mờ 2 (2FONF) ...75

4.1.3. Dạng chuẩn đối tượng mờ 3 (3FONF) ...77

4.2. Chuẩn hóa lớp đối tượng mờ ...78

4.2.1. Thuật tốn chuẩn hóa lớp về 1FONF ...78

4.2.2. Thuật tốn chuẩn hóa lớp về 2FONF ...82

4.2.3. Thuật tốn chuẩn hóa lớp về 3FONF ...85

5. Kết luận chương 3 ...88

Chương 4: Truy vấn cơ sở dữ liệu hướng đối tượng mờ ...89

1. Sự tương tự của hai đối tượng mờ ...89

1.1. Sự tương tự của hai đối tượng trong cùng một lớp mờ ...89

1.2. Sự tương tự của hai đối tượng mờ thuộc hai lớp khác nhau: lớp cha và lớp con ...90

2. Truy vấn CSDL hướng đối tượng mờ ...92

</div>Trang 5<div class="page_container" data-page="5">

2.2.1. Mối quan hệ đối tượng/lớp ...99

2.4. Phép kết nối ngoài mờ đầy đủ ... 114

3. Phụ thuộc hàm đối tượng mờ ... 117

4. Quan hệ mờ biểu diễn một bộ phận của trạng thái s(S) ...122

5. Các dạng phụ thuộc hàm đối tượng mờ ...127

6. Các FOFD không chuẩn tắc và đồ thị lược đồ mờ phân nhánh ...134

7. Các luật suy dẫn cho các FOFD cục bộ ...138

8. Các luật suy dẫn cho các FOFD toàn cục...140

8.1. Luật phản xạ ...140

</div>Trang 6<div class="page_container" data-page="6">

8.3. Luật tăng trưởng ...143

Tài liệu tham khảo chính của tác giả ...158

Tài liệu tham khảo của cac tác giả khác ...160

</div>Trang 7<div class="page_container" data-page="7">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

DANH MỤC CÁC THUẬT NGỮ

Đại số kết hợp mờ Fuzzy association algebra

Độ bao hàm ngữ nghĩa Semantic inclusion degree

Đồ thị lược đối tượng mờ Fuzzy object schema Graph

Mối quan hệ nhị nguyên Binary relationship

Mối quan hệ thừa kế Inheritance relationship

Mối quan hệ đối tượng/lớp Object/Class relationship

Mối quan hệ kết hợp mờ Fuzzy association relationship

Mối quan hệ kết nhập mờ Fuzzy aggregation relationship

Mối quan hệ tổng quát hóa Fuzzy generalization relationship

Phân cấp thừa kế mờ Fuzzy inheritance hierarchy

</div>Trang 8<div class="page_container" data-page="8">

BẢNG CÁC KÝ HIỆU, TỪ VIẾT TẮT

ODMG (Object Database Management Group)

Nhóm quản trị CSDL đối tượng, tổ chức đề xuất mơ hình ODMG và ngơn ngữ OQL

OID (Object Identifier) Định danh đối tượng

OODB (Object Oriented Database) Cơ sở dữ liệu hướng đối tượng

FOODB (Fuzzy Object Oriented Database)

Cơ sở dữ liệu hướng đối tượng mờ

SQL (Structured Query Language) Ngơn ngữ truy vấn có cấu trúc

NF2 (Non-First Normal Relational Database Model )

Mơ hình dữ liệu quan hệ không ở 1NF

FOFD (Fuzzy Object Functional Dependency)

Phụ thuộc hàm đối tượng mờ

UML (Unified Modeling Language) Ngôn ngữ mô hình hợp nhất

FONF (Fuzzy Object Normal Form) Dạng chuẩn đối tượng mờ

</div>Trang 9<div class="page_container" data-page="9">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜDANH SÁCH BẢNG

Bảng 1.1. Một quan hệ giống nhau ...26Bảng 5.1. Một quan hệ mờ biểu diễn các đối tượng ...113Bảng 5.2. Các quan hệ giống nhau ...114Bảng 5.3. Một quan hệ mờ được kết nối từ Rext(O3) và Rext(r2) ...117

Bảng 5.4: Một quan hệ mờ được tham chiếu bởi f ...128

Bảng 5.5: Các quan hệ mờ được tham chiếu bởi FOFD

không chuẩn tắc với đồ thị FOFD phân nhánh ...136

Bảng 5.6: Quan hệ mờ Rfo ...142

Bảng 5.7: Một quan hệ mờ biểu diễn trạng thái lược đồ

được tham chiếu bởi FOFD g1 ...146

Bảng 5.8: Một quan hệ mờ biểu diễn trạng thái lược đồ

được tham chiếu bởi FOFD g2 ...146

</div>Trang 10<div class="page_container" data-page="10">

DANH SÁCH HÌNH VẼ

Hình 1.1. Giá, nhân và lát cắt α của tập mờ F ... 22

Hình 1.2. Hàm thuộc của số mờ “gần Y” ... 29

Hình 1.3. Hàm thuộc của số mờ “tối thiểu Y”. ... 30

Hình 1.4. Hàm thuộc của số mờ “tối đa Y” ... 30

Hình 2.1. Đồ thị lược đồ mờ của CSDL Nguồn nhân lực ..57

Hình 2.2. Đồ thị lược đồ đối tượng mờ của CSDL Nguồn nhân lực ... 58

Hình 5.4. Một phụ thuộc hàm đối tượng mờ ... 121

Hình 5.5. Đồ thị lược đồ mờ của CSDL hướng đối tượng mờ và trạng thái lược đồ mờ phân nhánh ... 136

Hình 5.6. Một đồ thị lược đồ mờ của CSDL hướng đối tượng mờ ... 141

Hình 5.7. Sự vi phạm tính chất tồn ánh của FOFD thu được bởi luật bắc cầu ... 150

</div>Trang 11<div class="page_container" data-page="11">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜMỞ ĐẦU

C

ác hệ thống và mơ hình dữ liệu như quan hệ, mạng, phân cấp đã phát triển thành công nghệ cơ sở dữ liệu, đặc biệt là mơ hình dữ liệu quan hệ do Codd E. F. đề xuất vào năm 1970. Những kết quả nghiên cứu đạt được trên mơ hình này khơng những tạo nền tảng về lý thuyết CSDL, mà còn mang tính ứng dụng cao với hàng loạt hệ quản trị CSDL thương mại ra đời vào cuối thập niên 70 và đầu thập niên 80 như Oracle, SQL, DB2, … Tuy nhiên, chúng vẫn tồn tại một số hạn chế khi các ứng dụng đòi hỏi CSDL được thiết kế và cài đặt ở mức phức tạp hơn. Ví dụ, các CSDL thiết kế cho hệ thống để giải quyết những bài tốn trong cơng nghiệp, các thực nhiệm khoa học, truyền thông, các hệ thống thông tin địa lý và hệ thống đa phương tiện với sự tích hợp âm thanh, hình ảnh, ... Những chương trình ứng dụng phức tạp thường có các yêu cầu và các đặc trưng khác so với các ứng dụng thương mại truyền thống như cấu trúc của các đối tượng phức tạp hơn, các giao tác có khoảng thời gian tồn tại dài hơn, các kiểu dữ liệu mới để lưu trữ các đối tượng phức tạp của thế giới thực, nhất là cần định nghĩa được các tác vụ phù hợp cho những ứng dụng xác định. Các mô hình CSDL hướng đối tượng được đề xuất để giải quyết các vấn đề phức tạp của những hệ thống ứng dụng đó. Tiếp cận hướng đối tượng tạo ra tính mềm dẻo để xử lý các yêu cầu mà không bị hạn chế bởi các kiểu dữ liệu và tậng dụng các ngơn ngữ truy vấn sẵn có trong các hệ thống CSDL truyền thống. Tuy nhiên, trong thực tế, dữ liệu của đối tượng không

</div>Trang 12<div class="page_container" data-page="12">

phải lúc nào cũng bao gồm những thông tin đầy đủ và chính xác. Vì vậy, người ta mong muốn có những mơ hình CSDL cho phép biểu diễn, thao tác trên những thông tin không chắc chắn, không chính xác nhằm thể hiện được thế giới thực một cách xác thực hơn.

Mơ hình cơ sở dữ liệu quan hệ truyền thống và các mở rộng liên quan đến việc xử lý, biểu diễn dữ liệu không chắc chắn, khơng chính xác của nó vẫn khơng đáp ứng u cầu trong việc đặc tả các đối tượng phức hợp với thơng tin khơng chắc chắn, khơng chính xác. Chẳng hạn, mở rộng mơ hình CSDL quan hệ khơng ở dạng chuẩn 1 (cịn gọi là mơ hình dữ liệu quan hệ NF2) bởi Yazici và các cộng sự [43] cho phép biểu diễn và thao tác trên dữ liệu không chắc chắn, phức tạp trong các cơ sở dữ liệu. Các phép tốn đại số quan hệ, ngơn ngữ truy vấn dữ liệu có cấu trúc tựa SQL cũng được đưa ra trong mơ hình này. Mơ hình dữ liệu quan hệ NF2 mở rộng có khả năng đáp ứng một số yêu cầu ứng dụng phức tạp, chẳng hạn các hệ thống tự động văn phòng, các hệ thống phục hồi thông tin và các hệ thống CSDL chun gia. Hạn chế của mơ hình dữ liệu quan hệ NF2 mở rộng liên quan đến việc biểu diễn các mối quan hệ phức hợp giữa các đối tượng và các thuộc tính, khơng hỗ trợ các khái niệm cơ bản của phương pháp hướng đối tượng như phân cấp lớp, thừa kế, lớp cha/lớp con. Vì vậy, để đặc tả dữ liệu không chắc chắn và các thuộc tính có giá trị phức hợp cũng như các mối quan hệ phức tạp giữa các đối tượng, các nghiên cứu gần đây đã tập trung vào việc xây dựng các mơ hình cơ sở dữ liệu hướng đối tượng với thông tin không chắc

</div>Trang 13<div class="page_container" data-page="13">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

chắn, khơng chính xác gọi chung là mơ hình CSDL hướng đối tượng mờ.

Hiện này, trên thế giới đã có nhiều cách tiếp cận khác nhau để giải quyết vấn đề nêu trên. Zacari và Milano (1990) [47] lần đầu tiên giới thiệu về thông tin không đầy đủ (chẳng hạn

như các giá trị null) trong các CSDL hướng đối tượng, trong

đó phân biệt lược đồ không đầy đủ và các đối tượng với thông tin khơng đầy đủ. Từ đó, việc hợp nhất thơng tin không đầy đủ và không chắc chắn trong các cơ sở dữ liệu hướng đối tượng đã nhận được sự quan tâm ngày càng nhiều, trong đó tính mờ được xem xét ở cả mức thể hiện đối tượng và mức phân cấp lớp. Dựa trên quan hệ tương tự, George và các đồng nghiệp (1996) [21] sử dụng khái niệm phạm vi giá trị của thuộc tính để biểu diễn tập các giá trị cho phép của thuộc tính của lớp. Độ thuộc thành viên của đối tượng thuộc vào lớp phụ thuộc vào mức độ bao hàm của các giá trị thuộc tính của đối tượng trong phạm vi giá trị của thuộc tính trong lớp. Các phân cấp lớp mạnh hay yếu được xác định dựa trên sự tăng hay giảm đều theo độ thuộc thành viên của một lớp con vào trong các lớp cha của nó. Mơ hình CSDL hướng đối tượng mờ được G. Bordogna và các cộng sự (1999) [20] đề xuất bằng cách mở rộng mơ hình đối tượng dựa trên đồ thị. Mức độ mờ được biểu

diễn bởi các từ chỉ mức độ, chẳng hạn như {rất thấp, thấp, trung bình, cao, rất cao}, nó có thể được kết hợp với thể hiện

mối quan hệ cũng như mối quan hệ giữa một đối tượng với một lớp. Các lớp mờ và các phân cấp lớp mờ cũng được mơ tả trong CSDL. Một mơ hình cơ sở dữ liệu UFO (Uncertainly and

</div>Trang 14<div class="page_container" data-page="14">

Fuzziness in an Object-Oriented) được đề xuất bởi Gyseghem và de Caluwe (1998) [23] để biểu diễn thông tin không chắc chắn và mờ lần lượt theo lý thuyết tập mờ và tập mờ tổng quát. Hành vi và cấu trúc của đối tượng có thể được xác định khơng đầy đủ cho phép đặc tả được các thể hiện của các đối tượng một cách tự nhiên như trong thế giới thực. Các dạng thừa kế như thừa kế bộ phận, thừa kế theo điều kiện và đa thừa kế cũng được hỗ trợ trong các phân cấp mờ. Dựa trên lý thuyết khả năng, tính khơng rõ ràng và khơng chắc chắn được biểu diễn trong các phân cấp lớp bởi Dubois, Prade và Rossazza (1991) [16], trong đó, phạm vi giá trị của thuộc tính lớp con được xác định bằng cách giới hạn phạm vi giá trị của thuộc tính lớp cha, mức độ bao hàm của một lớp con vào trong một lớp cha phụ thuộc vào mức độ bao hàm giữa các phạm vi giá trị của các thuộc tính. Ở trong nước, Cao Hồng Trụ (2001) [48] giới thiệu một mơ hình hướng đối tượng mờ và khơng chắc chắn, trong đó mỗi tính chất lớp (một thuộc tính hoặc một phương thức) có thể chứa các tập mờ như một họ các phân bố xác suất, độ thuộc thành viên của lớp và khả năng sử dụng các tính chất lớp được xác định bởi cận trên và cận dưới của xác suất. Trên cơ sở mơ hình CSDL được đề xuất, tác giả đã sử dụng ngơn ngữ lập trình logic hướng đối tượng mờ FRIL++ để xây dựng một lược đồ CSDL mờ ứng dụng.

Trở ngại lớn nhất trong việc phát triển các hệ thống CSDL hướng đối tượng mờ đó là chưa có một mơ hình dữ liệu chuẩn đầy đủ hay cơ sở toán học thống nhất cho việc biểu diễn và xử lý dữ liệu đối tượng mờ. Như đã đề cập ở trên, các nghiên cứu

</div>Trang 15<div class="page_container" data-page="15">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

về mơ hình CSDL hướng đối tượng mờ chủ yếu tập trung vào việc mở rộng mơ hình dữ liệu rõ đã có theo các cách tiếp cận khác nhau và cho phép biểu diễn, thao tác trên dữ liệu mờ. Do đó, các mơ hình CSDL mờ này cũng chỉ thống nhất trên một tập các khái niệm chung nhất (tập lõi) trong mô hình hạt nhân của ODMG [11, 12]. Có thể thấy rằng, các kết quả nghiên cứu trên CSDL hướng đối tượng mờ ln được xem xét với một mơ hình cụ thể, các kết quả này sẽ giải quyết cho một lớp các bài toán với một tập con các khái niệm, tính chất đặc trưng hướng đối tượng đã được cài đặt trên mơ hình. Như vậy, việc chọn lựa một mơ hình dữ liệu để nghiên cứu các vấn đề trong CSDL hướng đối tượng mờ là rất quan trọng. Mơ hình CSDL hướng đối tượng mờ với dữ liệu được biểu diễn bởi phân bố khả năng được đề xuất bởi ZongMin Ma [51], ngoài việc đảm bảo các khái niệm, tính chất cốt lõi của mơ hình CSDL hướng đối tượng rõ, nó cịn giải quyết được tương đối đầy đủ tính mờ của đối tượng, lớp, tính mờ trong mối quan hệ giữa đối tượng và lớp, giữa lớp cha và lớp con. Vì vậy, chúng tơi sử dụng mơ hình này để thực hiện các nghiên cứu về các phụ thuộc dữ liệu của các đối tượng mờ.

Trong cơ sở dữ liệu quan hệ mờ, các cơng trình nghiên cứu về các phụ thuộc dữ liệu tương đối đầy đủ, có thể kể đến các kết quả của Raij K. V. S. N và Mazumdar [34], của Bhattachajee T. K và Mazumdar [9]. Dựa trên khái niệm phụ thuộc hàm mờ, các nghiên cứu của nhóm tác giả Chen G. Q, Kerre E. E, và Vandenbulcke J. liên quan đến các dạng chuẩn lược đồ quan hệ mờ, thuật toán tách lược đồ quan hệ về các dạng chuẩn mờ,

</div>Trang 16<div class="page_container" data-page="16">

thuật tốn tìm bao đóng, … được triển khai một cách cụ thể và khá sâu sắc [13, 14]. Tương tự như trong CSDL quan hệ, các nhà thiết kế CSDL hướng đối tượng cũng cần có kỹ thuật thiết kế dạng chuẩn để giải quyết các vấn đề tiềm ẩn liên quan đến sự dư thừa dữ liệu cũng như đảm báo tính nhất quán trong hệ thống CSDL. Từ những năm 1980 đến nay đã có nhiều tiếp cận khác nhau trong việc chuẩn hóa các lớp đối tượng trong các lược đồ CSDL hướng đối tượng rõ, các dạng chuẩn đối tượng được đề xuất dựa trên phụ thuộc hàm giữa các thuộc tính trong lớp với các dạng chuẩn tương tự như các dạng chuẩn trong CSDL quan hệ [7, 8, 24, 42] hoặc được chuẩn hóa dựa trên các ràng buộc trong lược đồ CSDL như ràng buộc phụ thuộc đường dẫn, phụ thuộc cục bộ, phụ thuộc tồn cục [41]. Có thể thấy, phụ thuộc dữ liệu là nền tảng lý thuyết để xác định các dạng chuẩn của lược đồ CSDL nhằm hạn chế đến mức thấp nhất sự dư thừa dữ liệu, ngun nhân chính phá vỡ tính tồn vẹn dữ liệu trong các hệ thống CSDL. Một cách tự nhiên, chúng ta cũng cần có những nghiên cứu sâu sắc về phụ thuộc dữ liệu trong CSDL hướng đối tượng mờ nhằm hỗ trợ cho việc thiết kế các CSDL ứng dụng cũng như đảm bảo tính tồn vẹn dữ liệu trong việc cập nhật dữ liệu.

Nội dung cuốn sách tập trung trình bày các nghiên cứu về các phụ thuộc dữ liệu trong CSDL hướng đối tượng mờ. Các vấn đề liên quan đến mục tiêu nghiên cứu được chúng tơi trình bày trong cuốn sách này bao gồm:

Nghiên cứu sự tương tự ngữ nghĩa (thông tin) giữa hai dữ liệu mờ với nhiều kiểu dữ liệu khác nhau được cung cấp bởi

</div>Trang 17<div class="page_container" data-page="17">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

mơ hình CSDL hướng đối tượng. Tiếp theo, nghiên cứu các dạng phụ thuộc dữ liệu trong CSDL hướng đối tượng với dữ liệu mờ được biểu diễn theo phân bố khả năng, cụ thể đó là các phụ thuộc dữ liệu giữa các thuộc tính trong một lớp đối tượng và các phụ thuộc dữ liệu giữa các đối tượng trong lược đồ cơ sở dữ liệu hướng đối tượng mờ.

Nghiên cứu, đề xuất các dạng chuẩn đối tượng mờ và các giải thuật chuẩn hóa lớp đối tượng về các dạng chuẩn để giải quyết các dị thường dữ liệu khi cập nhập dữ liệu, nhằm đảm bảo tính tồn vẹn dữ liệu trong CSDL hướng đối tượng mờ.

Nghiên cứu đề xuất phương thức tính giá trị chân lý của các mẫu kết hợp mờ trong đại số kết hợp mờ. Từ đó, đánh giá độ tin cậy của kết quả truy vấn trên CSDL hướng đối tượng mờ theo đại số kết hợp mờ.

Bố cục của cuốn sách được tổ chức như sau: Phần mở đầu, năm chương và phần kết luận.

Chương 1 trình bày khái qt về các kiến thức tốn học làm nền tảng cho việc nghiên cứu cơ sở dữ liệu mờ cũng như xây dựng các mơ hình cơ sở dữ liệu mờ. Nội dung cụ thể của chương này gồm: các khái niệm, các phép toán cơ bản của tập mờ, phân bố khả năng và phương thức tính độ tương tự ngữ nghĩa của hai giá trị mờ.

Chương 2 trình bày một cách tổng quan về cơ sở dữ liệu hướng đối tượng mờ. Quan trọng hơn, trong chương này trình bày cụ thể mơ hình cơ sở dữ liệu hướng đối tượng với dữ liệu mờ được biểu diễn bởi phân bố khả năng, trong đó đề cập đến

</div>Trang 18<div class="page_container" data-page="18">

các khái niệm về đối tượng mờ, lớp mờ, phân cấp thừa kế mờ và mơ hình lớp mờ. Phần cuối của chương giới thiệu hai cách biểu diễn lược đồ cơ sở dữ liệu hướng đối tượng mờ theo đồ thị lược đồ mờ và đồ thị lược đồ đối tượng mờ.

Chương 3 giới thiệu các nghiên cứu về phụ thuộc dữ liệu trong lớp đối tượng mờ. Dựa vào độ đo độ tương tự ngữ nghĩa giữa hai giá trị mờ mở rộng trên quan hệ giống nhau để xác định mức độ tương tự ngữ nghĩa giữa hai giá trị thuộc tính của hai đối tượng với các kiểu dữ liệu khác nhau và định nghĩa khái niệm phụ thuộc hàm cho các thuộc tính của lớp, các dạng chuẩn đối tượng mờ, xây dựng thuật tốn chuẩn hóa lớp đối tượng để đưa về các dạng chuẩn lớp đối tượng.

Chương 4 trình bày cách thức xác định giá trị chân lý của các mẫu kết hợp mờ trong đại số kết hợp mờ. Trên cơ sở đó, việc truy vấn cơ sở dữ liệu hướng đối tượng dựa theo đại số kết hợp mờ cũng được chỉ ra, độ tin cậy của kết quả truy vấn được thể hiện qua giá trị chân lý của mẫu kết hợp mờ kết quả.

Chương 5 nghiên cứu về phụ thuộc hàm đối tượng xác định các ràng buộc giữa các thuộc tính và các kiểu đối tượng trong một cơ sở dữ liệu hướng đối tượng mờ. Chúng được xem như một trong các công cụ để nhận biết đối tượng trong cơ sở dữ liệu hướng đối tượng mờ, hỗ trợ cho việc truy vấn dữ liệu và kiểm tra tính tồn vẹn dữ liệu trong các CSDL ứng dụng. Nội dung cụ thể bao gồm: khái niệm phụ thuộc hàm đối tượng mờ, các dạng phụ thuộc hàm đối tượng khác nhau trong một trạng thái lược đồ cơ sở dữ liệu và các luật suy dẫn cho phụ thuộc hàm đối tượng mờ.

</div>Trang 19<div class="page_container" data-page="19">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜChương 1

TẬP MỜ VÀ PHÂN BỐ KHẢ NĂNG

1. Biểu diễn tập mờ và phân bố khả năng

Năm 1965, Lofti Zadeh công bố bài báo “Tập mờ” trên Tạp chí Information and Control (Zadeh, 1965). Ý tưởng nổi bật của khái niệm tập mờ của Zadeh là từ những khái niệm trừu

tượng về ngữ nghĩa của thông tin mờ, không chắc chắn như trẻ, nhanh, cao-thấp, xinh đẹp.., ơng đã tìm ra cách biểu diễn nó

bằng một khái niệm toán học, được gọi là tập mờ, như là một sự khái quát trực tiếp của khái niệm tập hợp kinh điển.

Cho U là một tập hợp và F là một tập con của U. Một phần từ x của U có thuộc F hay khơng, có thể mơ tả bởi một hàm

thuộc µF:

Trong tập con mờ, hàm thuộc của một phần tử nào đó của

F không chỉ nhận giá trị trong {0, 1} mà có thể nhận giá trị

trong khoảng [0, 1].

Định nghĩa 1.1 [45]: Cho U là một vũ trụ các đối tượng

(sau đây gọi tắt là vũ trụ), một tập mờ F trên U xác định bởi

hàm thuộc µF : →U [0,1], gán cho mỗi phần tử x của U một

độ thuộc µF(x)để chỉ độ thuộc của x vào tập mờ F. Tập mờ F được biểu diễn dưới dạng:

Nếu x ∉F

</div>Trang 20<div class="page_container" data-page="20">

Định nghĩa 1.2 [45]: Tập mờ F được gọi là chuẩn nếu tồn

tại ít nhất một phần tử x ∈ U sao cho µF( =x) 1.

Định nghĩa 1.3 [45]: Tập mờ F của vũ trụ U là lồi nếu và

chỉ nếu ∀ x1, x2 ∈ U và λ ∈[0, 1] sao cho µF(λx1 + (1 - λ)x2) ≥

Ví dụ 1.1: Cho U là tập các tiền lương 2.0 triệu đồng, 2.5

triệu đồng, 4.0 triệu đồng, 3.5 triệu đồng và 5.0 triệu đồng. Một

giá trị mờ tiền lương “cao” có thể được mơ tả bởi tập mờ F là

tập hợp các tiền lương “cao” như sau:

F = {0.5/2.0 triệu đồng, 0.6/ 2.5 triệu đồng, 0.8/4.0 triệu

đồng, 0.7/3.5 triệu đồng, 1.0/5.0 triệu đồng}

Trong đó,

µ

F(2.0 triệu đồng) = 0.5,

µ

F(2.5 triệu đồng) = 0.6,

µ

F(3.5 triệu đồng) = 0.7,

µ

F(4.0 triệu đồng) = 0.8,

µ

F(5.0 triệu đồng) = 1.

Khi µF(xi) được xem như là độ đo khả năng mà một biến

X nhận giá trị xi, ở đây, X có các giá trị trong U, một giá trị mờ

được mô tả bởi phân bố khả năng πX [50].

{ Fx1 x1 Fx2 x2 Fxnxn

</div>Trang 21<div class="page_container" data-page="21">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

xi. Cho πX,Flần lượt là biểu diễn phân bố khả năng và tập mờ cho một giá trị mờ, khi đó πX =F[34].

2. Các đặc trưng của tập mờ

Những đặc trưng quan trọng của một tập mờ F của U là

những đặc trưng chỉ rõ nó khác với tập con thơng thường của

Định nghĩa 1.5 [1]: Giá của F, ký hiệu supp(F), là tập các

phần tử có giá trị hàm thuộc lớn hơn 0. Có nghĩa là supp(F) = {x ∈ U |µF( >x) 0}.

Định nghĩa 1.6 [1]: Chiều cao của F, ký hiệu h(F), là giá

trị hàm thuộc lớn nhất mà một phần tử của U thuộc F. h(F) =

)(supx∈U µFx .

Định nghĩa 1.7 [1]: Hạt nhân của F, ký hiệu, ker(F), là

tập các phần tử có giá trị hàm thuộc bằng 1: ker(F) = {x ∈ U |

1)( =xF

Khi tập U là hữu hạn, ta còn đặc trưng tập mờ F của U bởi

lực lượng của nó, chỉ rõ độ thuộc tổng thể mà các phần tử của

U thuộc F.

Định nghĩa 1.8 [1] Lát cắt α của F là tập các phần tử mà

có giá trị hàm thuộc lớn hơn α (lớn hơn hoặc bằng α), trong đó 0 ≤ α < 1 (0 < α ≤ 1) được gọi là lát cắt α mạnh (yếu) của F, được ký hiệu lần lượt như sau:

α+ = x∈Ux >

})(|

</div>Trang 22<div class="page_container" data-page="22">

xác định như sau: |F|=

∑

x∈UµF(x).

Nếu F là tập con thơng thường của U, chiều cao của nó

bằng 1; nó được chuẩn hóa và đồng nhất với giá và hạt nhân của nó; lực lượng của nó chính là số phần tử của tập hợp theo định nghĩa cổ điển.

Ví dụ 1.2: Gọi U là tập các nước, chẳng hạn U = {Anh,

Pháp, Mỹ, Nhật, Italia, Thụy Sĩ}, được ký hiệu theo thứ tự là A, P, M, N, I, T là tập các nước có thể là nơi cư trú của một cá nhân cho trước. Ta có thể định nghĩa các tập mờ với hàm thuộc tương ứng với những mong muốn cư trú của cá nhân:

Ta có: h(F2) = 1 (tập mờ F2 được chuẩn hóa), supp(F2) =

{A, P, T}, ker(F2) = {A, T},| F2 | = 2.7. Tập mờ F2 thể hiện việc chọn A hay T để cư trú, chấp nhận P có chừng mực hơn.

Hình 1.1: Giá,

nhân và lát cắt α của tập mờ F

</div>Trang 23<div class="page_container" data-page="23">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ3. Nguyên lý mở rộng của Zadeh

Nguyên lý mở rộng được giới thiệu bởi Zadeh (1975) đã được coi là một trong những ý tưởng cơ bản nhất của lý thuyết tập mờ. Bằng cách cung cấp một phương pháp tổng quát, nguyên lý mở rộng đã được sử dụng rộng rãi để mở rộng các khái niệm tốn học khơng mờ. Ý tưởng là tạo ra một tập mờ từ một số tập mờ đã cho thông qua một ánh xạ.

Nguyên tắc mở rộng của Zadeh cũng có thể được gọi là nguyên tắc tối đa-tối thiểu. Gọi X1, X2, ..., Xn và Y là các tập

thông thường, f là ánh xạ từ X1 x X2 x ... x Xn đến Y sao cho y

= f(xl, x2, ..., xn), P(Xi) và P(Y) lần lượt là tập lũy thừa (tập các tập con) của Xi và Y(0 ≤ i ≤ n). Ở đây, P(Xi) = {C|C ⊆ Xi} và P (Y)

= {D|D ⊆ Y}. Khi đó f tạo ra một ánh xạ từ P(X1) x P(X2) x ... x P(Xn) đến P(Y) với

f(C1, C2, ..., Cn) = {f (xl, x2, ..., xn)| xi ∈ Ci, 0 ≤ i ≤ n}, trong đó Ci ⊆ Xi, 0 ≤ i ≤ n

Đặt F(Xi) là lớp của tất cả các tập mờ trên Xi, tức là F(Xi) = {}, 0 ≤ i ≤ n và F(Y) là lớp của tất cả các tập mờ trên Y, tức là

F(Y) = {}, khi đó f tạo ra ánh xạ từ F(X1) x F(X2) x ... x F(Xn) đến F(Y) sao cho với mọi Ai ∈ F(Xi), f(Al , A2, ..., An) là một tập mờ trên Y với



</div>Trang 24<div class="page_container" data-page="24">

4. Các phép toán trên tập mờ4.1. Các phép toán tập hợp

Tương tự như lý thuyết tập hợp, trên tập mờ cũng có một số phép tốn như: bằng nhau, giao, hợp, phần bù, chứa, … [1]. Các phép toán này được định nghĩa sao cho chúng tương đương với các phép toán cổ điển của lý thuyết tập hợp khi các hàm thuộc chỉ lấy những giá trị 0 hoặc 1.

Định nghĩa 1.10 [1]: Cho F1 và F2 là hai tập mờ trên vũ

trụ U với hàm thuộc lần lượt là µF1,µF2.

(1): F1 bằng F2, ký hiệu F1 = F2, nếu ∀x∈U,µF1(x)=µF2(x).

(2): F1 chứa F2, ký hiệu F1 ⊇ F2, nếu ∀x∈U,µF1(x)≥µF2(x).

(3): Hợp của hai tập mờ F1 và F2 của U, ký hiệu F1 ∪ F2, là một tập mờ trên U với hàm thuộc xác định bởi:

F1∩ 2( )=min(µ 1( ), µ 2( )),∀ ∈

(5): Phần bù của một tập mờ F1, ký hiệu F1, là một tập mờ trên

U với hàm thuộc được xác định bởi: F (x)=1− F1(x), ∀x∈U

Tương tự như lý thuyết tập hợp cổ điển, các phép toán tập

hợp trong lý thuyết tập mờ thỏa mãn các tính chất sau. Cho F1, F2, F3 là các tập mờ trên vũ trụ U:

(1) Luật giao hoán: F1 ∪ F2 = F2 ∪ F1; F1 ∩ F2 = F2 ∩ F1.(2) Luật kết hợp: F1 ∪ (F2 ∪ F3 ) = (F1 ∪ F2 ) ∪ F3 ; F1 ∩ (F2 ∩ F3 ) = (F1 ∩ F2 ) ∩ F3;

</div>Trang 25<div class="page_container" data-page="25">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

(3) Luật phân phối: F1 ∪ (F2 ∩ F3 ) = (F1 ∪ F2 ) ∩ (F1 ∪ F3 ); F1 ∩ (F2 ∪ F3 ) = (F1 ∩ F2 ) ∪ (F1 ∩ F3 );(4) Luật hấp thụ: F1 ∪ (F1 ∩ F2 ) = F1; F1 ∩ (F1 ∪ F2 ) = F1;(5) Luật lũy đẳng: F1 ∪ F1 = F1; F1 ∩ F1 = F1;

phân bố khả năng, mức độ πA bao hàm ngữ nghĩa πB, ký hiệu SID(πA, πB), được xác định như sau:

Ví dụ 1.3: Cho vũ trụ U = {a, b, c, d, e, f, g, h, i, j, g}. π1

= {0.4/a, 0.7/ b, 1.0/c, 1.0/d, 0.8/e, 0.5/f} và π2 = {0.5/b, 0.8/c,

1.0/d; 1.0/e; 0.8/f, 0.6/g, 0.4/h} là hai dữ liệu mờ trên U. Khi

đó, mức độ π1 bao hàm ngữ nghĩa π2 được xác định như sau:SID(π1, π2) = (0.0 + 0.5 + 0.8 + 1.0 + 0.8 + 0.5 + 0.0 + 0.0 + 0.0 + 0.0)/(0.5 + 0.8 + 1.0 + 1.0 + 0.8 + 0.6 + 0.4) = 3.6/5.1 = 0.706.

Tương tự, mức độ π2 bao hàm ngữ nghĩa π1 là SID(π2, π1) = 3.6/4.4 = 0.818.

)

</div>Trang 26<div class="page_container" data-page="26">

Với một quan hệ giống nhau Res(Resemblance relation)

trên miền U, α (0≤ α ≤ 1) là một giá trị ngưỡng trên Res, mức

độ πA bao hàm ngữ nghĩa πB theo quan hệ Res được xác định như sau:

Trong đó, một quan hệ giống nhau Res trên U là một ánh xạ: U × U  [0,1] thỏa mãn hai tính chất sau:

(1) ∀ x ∈ U, Res(x, x) = 1 (tính phản xạ)

(2) ∀ x, y ∈ U, Res(x, y) = Res(y, x) (tính đối xứng)

Ví dụ 1.4: Cho π1 = {1.0/a, 0.95/b, 0.9/c} và π2 = {0.95/a,

0.9/b, l.0/d, 0.3/e} là hai dữ liệu mờ trên miền U = {a, b, c, d, e, f} và Res là một quan hệ giống nhau trên U (như Bảng 1.1).

Một giá trị ngưỡng α = 0.9 của quan hệ giống nhau Res. Khi đó:SIDα(π1, π2) = {0.95 + 0.9 + 0.9}/{0.95 + 0.9 + 1.0 + 0.3} = 0.873,SIDα(π2, π1) = {0.95 + 0.9 + 0.9}/{1.0 + 0.95 + 0.9} = 0.965,

Bảng 1.1: Một quan hệ giống nhau

Định nghĩa 1.12 [50]: Với πA và πB là hai dữ liệu mờ, mức

∑

1 , ;Re ( , )

)(/))(),((

</div>Trang 27<div class="page_container" data-page="27">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

độ tương tự ngữ nghĩa giữa hai dữ liệu mờ πA và πB , ký hiệu SE(πA, πB) và được xác định như sau:

SE(πA, πB) = min(SID(πA, πB), SID(πB, πA))

Ví dụ 1.5: Mức độ tương tự ngữ nghĩa giữa hai dữ liệu mờ

π1 và π2 trong Ví dụ 1.3 là SE(π1, π2) = min(0.706, 0.818) = 0.706.Mức độ tương tự ngữ nghĩa giữa hai dữ liệu mờ πA và πBtheo quan hệ giống nhau Res được xác định như sau:

(1) A ≈β B nếu SE(A, B) ≥ β;(2) A ≈β B nếu SE(A, B) < β;

(3) A >β B nếu SE(A, B) > β và max(supp(A)) > max(supp(B));(4) A <β B nếu SE(A, B) < β và max(supp(A)) < max(supp(B));(5) A ≥β B nếu A ≈β B hoặc A >β B;

</div>Trang 28<div class="page_container" data-page="28">

cao” hoặc “ít nhiều cao” được mơ tả bởi một số mờ với một

hàm thuộc. Tuy nhiên, hàm thuộc khơng được định nghĩa mà được tính tốn thơng qua các hàm thuộc của các tập mờ đơn

giản tương ứng. Để xác định hàm thuộc của tập mờ được sửa đổi, một số luật ngữ nghĩa được sử dụng. Cho F là một tập mờ được biểu diễn bởi một số mờ trong vụ trụ U và hàm thuộc µF: U  [1, 0], ta có các luật sau:

(1) Luật co (concentration): µrất F: (µF(x))2;

Tổng quỏt: àrt rt rt F: (àF(x))2 ì (s ln “rất”);

(2) Luật giãn nở: µít nhiều F: (µF(x))1/2;

- Tập mờ phức hợp (compound fuzzy set) chẳng hạn “trẻ” ∩ “cao” được biểu biễn bởi các tập mờ đơn giản hay các tập

mờ được sửa đổi được kết nối với nhau bởi phép hợp (∪), phép giao (∩) hoặc các phép liên kết bổ trợ khác.

Tổng quát, kết quả của các phép toán quan hệ mờ cho lại

giá trị Boolean mờ. Chúng có thể kết hợp với các phép tốn not (¬), and (∧), or (∨) tạo ra biểu thức logic phức hợp. Các biểu

thức logic như thế có thể được sử dụng để biểu diễn các điều kiện logic cho việc thu hồi thông tin, … Trong các định nghĩa của các phép toán quan hệ mờ được đề cập ở trên, hai giá trị

logic cổ điển true (T) và false (F) cũng được sử dụng bởi vì sử

dụng phép so sánh với các giá trị ngưỡng.

Trong các phép toán quan hệ của tập mờ có thể là các quan

hệ mờ chẳng hạn (not) gần, (not) tối thiểu, (not) tối đa, … với

các giá trị rõ. Nếu xem các quan hệ mờ như các phép toán và các giá trị rõ như các số hạng, khi đó, ta có biểu thức quan hệ

</div>Trang 29<div class="page_container" data-page="29">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

Aθ~Y, trong đó A là một thuộc tính, θ~ là một quan hệ mờ, Y

là giá trị rõ và θ~Y là một số mờ với hàm thuộc được xác định

1βYx −

Hàm thuộc của số mờ “gần Y” có thể được biểu diễn như

hình sau:

Hình 1.2: Hàm thuộc của số mờ “gần Y”

Và hàm thuộc của “not gần Y” được xác định: µnot gần Y(x) =1-

Yx −

ω≤ −

= − < <

tốithiểu

</div>Trang 30<div class="page_container" data-page="30">

Hàm thuộc của số mờ “tối thiểu Y” có thể được biểu diễn

như hình sau:

Hình 1.3: Hàm thuộc của số mờ “tối thiểu Y”

Và hàm thuộc của “not tối thiểu Y” được xác định:

- Với số mờ “tối đa Y”, δ là một giá trị ngưỡng, hàm thuộc của “tối đa Y” trên vũ trụ U được xác định như sau:

Hàm thuộc của số mờ “tối đa Y” có thể được biểu diễn

như hình sau:

Hình 1.4: Hàm thuộc của số mờ “tối đa Y”

µnot tối thiểu Y(x) =1 - µtối thiểu Y(x)

tốiđa

</div>Trang 31<div class="page_container" data-page="31">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

Và hàm thuộc của “not tối đa Y” được xác định: µnot tối đa Y(x)= 1 - µtối đa Y(x)

Các quan hệ mờ “gần”, “not gần”, “tối thiểu”, “tối đa”, “not tối thiểu” có thể xem lần lượt như “phép bằng mờ”, “phép khác mờ”, “lớn hơn hoặc bằng mờ”, “nhỏ hơn hoặc bằng mờ”, “phép nhỏ hơn mờ”. Với các quan hệ mờ và các giá trị rõ, một điều kiện truy vấn mờ với các phép tốn mờ có dạng: Aθ~Y.

được định nghĩa như sau:

A ∧~ B: min(µA(x), µB(x)), x ∈ U.

Phép hoặc mờ (∨~): Kết quả của phép hoặc mờ là một giá trị Boolean mờ. Cho A: µA(x) và B: µB(x) là hai giá trị Boolean mờ được biểu diễn bởi tập mờ trên cùng vũ trụ U, phép hoặc mờ được nh ngha nh sau:

A ơ~ B: max(àA(x), àB(x)), x U.

Phép phủ định mờ (¬~): Kết quả của phép phủ định mờ là một giá trị Boolean mờ. Cho A: µA(x) một giá trị Boolean mờ được biểu diễn bởi tập mờ trên vũ trụ U, phép phủ đinh mờ

</div>Trang 33<div class="page_container" data-page="33">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

Mơ hình CSDL hướng đối tượng mờ được đề xuất bởi M. Umano và các cộng sự [32], trong đó giá trị của các thuộc tính đối tượng là các giá trị mờ với một hệ số chắc chắn, và một ngôn ngữ thao tác dữ liệu trên mơ hình này.

Mơ hình CSDL hướng đối tượng mờ và không chắc chắn được đề xuất bởi Gyseghem và Caluwe [23], đặc tả tính mờ và không chắc chắn bằng cách sử dụng lần lượt các tập mờ và phân bố khả năng. Hành vi và cấu trúc của đối tượng có thể được định nghĩa khơng đầy đủ, từ đó định nghĩa được một thể

</div>Trang 34<div class="page_container" data-page="34">

mức độ, chẳng hạn như {khơng, rất thấp, thấp, trung bình, cao, rất cao, hồn toàn}, kết hợp với thể hiện mối quan hệ giữa các

đối tượng với một lớp. Các khái niệm lớp mờ, phân cấp lớp mờ và các phép toán được định nghĩa dựa trên đồ thị để chọn, duyệt CSDL hướng đối tượng mờ được sử dụng để biểu diễn và xử lý các thông tin mờ.

Dựa trên quan hệ tương tự, phạm vi của các giá trị thuộc tính được sử dụng để biểu diễn tập các giá trị cho phép của một thuộc tính trong một lớp được trình bày trong [21]. Độ thuộc thành viên của đối tượng thuộc vào một lớp được tính dựa trên mức độ bao hàm các giá trị thuộc tính của đối tượng vào trong các phạm vi giá trị thuộc tính của lớp. Phân cấp lớp mạnh hay yếu được xác định dựa vào sự tăng đều hay giảm đều theo độ thuộc thành viên của một lớp con vào trong lớp cha của nó.

Dựa vào lý thuyết khả năng, tính mơ hồ được biểu diễn trong phân cấp lớp, các miền mờ của các thuộc tính lớp con được xác định bằng cách thu hẹp miền của các thuộc tính của lớp cha, mức độ bao hàm của lớp con trong lớp cha được xác định dựa trên mức độ bao hàm các miền mờ của các thuộc tính của lớp cha đối với các miền mờ của các thuộc tính của lớp con [16]. Cũng dựa trên phân bố khả năng, trong [51] một số khái niệm chính trong CSDL hướng đối tượng chẳng hạn đối

</div>Trang 35<div class="page_container" data-page="35">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

tượng, các mối quan hệ đối tượng/lớp, lớp con/lớp cha và đa thừa kế được đưa ra trong môi trường thông tin mờ. Một mơ hình dữ liệu tổng qt và các phép tốn cho CSDL hướng đối tượng mờ đã được phát triển.

Việc lựa chọn một mơ hình CSDL hướng đối tượng mờ mà có khả năng đặt tả được các đối tượng chứa nhiều loại thông tin mờ khác nhau cũng như các mối quan hệ (mờ hay rõ) giữa chúng là công việc cần thiết để thực hiện các nghiên cứu liên quan đến các phụ thuộc dữ liệu và mở rộng các kết quả trên CSDL hướng đối tượng mờ. Trong chương này, chúng tơi giới thiệu một mơ hình CSDL hướng đối tượng mờ với dữ liệu được biểu diễn bởi phân bố khả năng được đề xuất bởi ZongMin Ma [51], mơ hình này cho phép ta thiết kế được một lược đồ CSDL biểu diễn được một cách đầy đủ các thể hiện mờ của các đối tượng và các mối quan hệ mờ trong thế giới thực. Vì vậy, nó được chọn làm mơ hình cơ sở để tiến hành các nghiên cứu được đặt ra. Ngoài ra, việc sử dụng phân bố khả năng cho phép ta biểu diễn một cách linh hoạt nhiều loại dữ

liệu như: dữ liệu rõ, dữ liệu chưa biết, dữ liệu khơng có thơng tin, dữ liệu khơng chắc chắn.

2. Thơng tin khơng hồn hảo trong mơ hình hóa CSDL

Một trong những lĩnh vực nghiên cứu chủ yếu trong cơ sở dữ liệu là tiếp tục phát triển các kết quả đã đạt được trong các mơ hình CSDL truyền thống với một tập các khái niệm có ngữ nghĩa mở rộng. Một trong các yêu cầu không được giải quyết đầy đủ bởi các mơ hình truyền thống, đó là việc biểu diễn và xử lý thơng tin khơng chính xác và khơng chắc chắn. Các mơ

</div>Trang 36<div class="page_container" data-page="36">

hình truyền thống giả định rằng mơ hình cơ sở dữ liệu phản ánh một cách chính xác thế giới thực, dữ liệu được lưu trữ là được xác định, chính xác và đầy đủ. Tuy nhiên, trong thực tế cuộc sống, nhiều khi các giả định này khơng được thỏa đáng. Vì vậy, trong những năm gần đây, các mơ hình dữ liệu khác nhau được đề xuất để giải quyết các loại đặc trưng của dữ liệu bởi lý thuyết tập mờ.

Trong các hệ thống CSDL, ta quan tâm tới ba loại thông tin khơng hồn hảo sau: thơng tin sai lệch, thơng tin khơng chính xác, thơng tin khơng chắc chắn.

2.1. Thơng tin sai lệch

Thông tin sai lệch là loại thông tin khơng hồn hảo đơn giản nhất. Thơng tin của cơ sở dữ liệu là sai lệch khi nó khác với “thông tin thực” (true information).

Mọi sai số lớn hay nhỏ của thơng tin đều làm tổn hại đến tính tồn vẹn của CSDL và không dung thứ được. Một loại

thông tin sai lệch quan trọng là sự không nhất qn. Đơi khi

cùng một khía cạnh của thế giới thực được biểu diễn nhiều lần trong cùng một CSDL hay trong nhiều CSDL khác nhau. Khi các biểu diễn thơng tin xung đột nhau, khơng thể hịa hợp được thì thơng tin đó là khơng nhất qn. Trong việc tích hợp thơng tin từ nhiều CSDL khác nhau, các vấn đề về sự không nhất quán của thông tin phải được quan tâm một cách đầy đủ.

2.2. Thông tin khơng chính xác

Thơng tin trong CSDL là khơng chính xác khi nó biểu diễn một tập các giá trị có thể, và giá trị thực là một phần tử của tập

</div>Trang 37<div class="page_container" data-page="37">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

đó. Như vậy, thơng tin khơng chính xác khơng phải là thông tin sai lệch và không làm phương hại tới tính tồn vẹn của CSDL.

Sau đây là một số thơng tin khơng chính xác đặc trưng:- Thơng tin dạng tuyển, chẳng hạn tuổi của Nam hoặc là 35 hoặc là 36.

- Thông tin âm, chẳng hạn tuổi của Nam không phải là 30.- Thông tin khoảng/miền, chẳng hạn tuổi của Nam nằm trong khoảng từ 35 đến 40 hoặc tuổi của Nam lớn hơn 35.

- Thông tin với các cận, sai số, chẳng hạn tuổi của Nam là 30±1.

2.3. Thông tin không chắc chắn

Tri thức của chúng ta về thế giới thực (chính xác hoặc khơng chính xác), đơi khi không thể được phát biểu với một mức độ chân lý tuyệt đối, và đòi hỏi ta phải xác định giá trị chân lý về thông tin được phát biểu. Thông tin với độ chắc chắn nhất định không phải là thông tin sai lệch và không làm phương hại tới tính nhất quán của cơ sở dữ liệu.

Phát biểu “tuổi của Nam hoặc là 35 hoặc là 36” thể hiện tính khơng chính xác, trong khi phát biểu “tuổi của Nam có khả năng là 35” lại thể hiện tính khơng chắc chắn.

Đơi khi, một giá trị chính xác có thể kéo theo sự kém chắc chắn, nhưng chừng nào giá trị đó được thay thế bằng các giá trị càng dần kém chính xác thì độ chắc chắn sẽ tăng dần và cuối cùng đạt cực đại với một giá trị có độ “chính xác cực tiểu”

(một giá trị null chẳng hạn).

</div>Trang 38<div class="page_container" data-page="38">

(1) Mỗi giá trị OID chỉ được sử dụng duy nhất một lần; nghĩa là, thậm chí một đối tượng khi bị xóa khỏi CSDL thì giá trị OID của nó cũng không được gán cho đối tượng nào khác.

(2) Giá trị OID của một đối tượng không thay đổi, điều này bảo đảm tính duy nhất của mỗi đối tượng. Do đó, một hệ thống CSDL hướng đối tượng phải có cơ chế tạo ra các OID và bảo đảm tính bất biến của nó.

Từ hai tính chất này nói lên rằng, OID khơng phụ thuộc vào giá trị thuộc tính của bất kỳ của đối tượng nào, bởi vì giá trị của thuộc tính có thể thay đổi và chỉnh sửa.

Nói chung, OID cũng khơng dựa trên địa chỉ vật lý của đối tượng trong kho lưu trữ, bởi vì địa chỉ vật lý có thể thay

</div>Trang 39<div class="page_container" data-page="39">

CÁC PHỤ THUỘC DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ

đổi sau mỗi lần tổ chức lại CSDL về phương diện vật lý. Tuy nhiên, một số hệ thống vẫn có thể sử dụng địa chỉ vật lý làm OID để tăng hiệu quả truy vấn đối tượng. Nếu địa chỉ vật lý của một đối tượng thay đổi, một con trỏ gián tiếp có thể được đặt tại địa chỉ trước đó để cho biết vị trí vật lý mới của đối tượng. Thông thường, các hệ thống CSDL hướng đối tượng sử dụng số nguyên lớn (long integer) để biểu diễn giá trị của OID, và sau đó sử dụng một bảng băm (hash table) để ánh xạ giá trị OID đến địa chỉ vật lý hiện tại của đối tượng.

Một đối tượng trong CSDL mà có ít nhất một thuộc tính có giá trị là một tập mờ, thì đối tượng đó là một đối tượng mờ

[49]. Một cách hình thức, mỗi đối tượng mờ o của lớp mờ C được biểu diễn bởi bộ ba (id, v, µo), trong đó id là định danh đối tượng, xác định duy nhất một đối tượng và một bộ v = <a1, a2,…, an> với ai là giá trị mờ hoặc rõ của đối tượng o tại thuộc tính Ai, được gọi là giá trị (trạng thái) của đối tượng o, µo là độ thuộc thành viên của đối tượng o vào lớp đối tượng C, µo

∈[0, 1]. Đối tượng rõ là một trường hợp riêng của đối tượng

mờ với µo = 1.

Tương tự như trong mơ hình dữ liệu hướng đối tượng

rõ, hai đối tượng o1(id1, v1, µo1) và o2(id2, v2, µo2) được gọi là đồng nhất nếu như chúng có cùng định danh đối tượng, ký

hiệu id1 ≡ id2, hai đối tượng được gọi là tương tự nhau về giá

trị nếu độ tương tự của hai bộ v1 và v2 lớn hơn hoặc bằng một ngưỡng β cho trước.

Đặt I là tập các định danh đối tượng của các đối tượng trong hệ thống CSDL hướng đối tượng mờ, mỗi phần tử của

</div>Trang 40<div class="page_container" data-page="40">

I xác định duy nhất một đối tượng, A là tập hữu hạn các

tên thuộc tính của các đối tượng trong hệ thống, và null là một

giá trị đặc biệt biểu diễn một giá trị không xác định. DOM là tập hợp các miền giá trị nguyên thủy (giá trị có kiểu integer, boolean, float, string) và các miền giá trị mờ (biểu diễn bởi phân bố khả năng). Họ các giá trị mờ (rõ) trên I , ký hiệu

val(I ) được xác định như sau (3), [4]:

(iii) Nếu id ∈ I thì id ∈ Val(I)

(iv) Tập {vi | vi ∈ Val(I), (i = 1, ..., n)}∈ Val(I) và

(v) Nếu vi ∈ Val(I), (i = 1, ..., n) và tập các tên

thuộc tính rời nhau {Ai | Ai, Aj ∈ A (i ≠ j ⇒ Ai ≠ Aj), (i, j = 1, ..., n)} thì bộ [A1 : v1, ..., An : vn] ∈ Val(Oid) (được gọi là

giá trị bộ) và {v1, v2, v3, ..., vn} ∈ Val(I) (được gọi là giá trị

tập)

3.2. Lớp mờ

Các đối tượng có cùng đặc tính và hành vi ứng xử được tập hợp lại tạo thành các lớp trong các phân cấp. Về mặt lý thuyết, một lớp có thể được xác định dựa theo hai cách tiếp cận [30]:

(1) Lớp ngoại diên (extensional class) - lớp được định nghĩa bởi danh sách các đối tượng, giống với bảng trong mơ hình quan hệ.

(2) Lớp nội hàm (intensional class) - lớp được định nghĩa

</div>