Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (269.28 KB, 6 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
<b>Vũ Đức Thi </b>
Đại học Quốc gia Hà Nội
<i> </i>
<i><b>TÓM TẮT: Việc nghiên cứu các tập rút gọn trong lí thuyết tập thơ nói chung và các tập rút gọn trong bảng quyết định nhất </b></i>
<i>quán nói riêng được nhiều nhà khoa học trên thế giới thực hiện. Đối với bảng quyết định nhất quán, chúng ta đã có một thuật tốn có độ phức tạp thời gian tính đa thức tìm một tập rút gọn bất kỳ. Đồng thời, việc tìm các thuộc tính dư thừa (thuộc tính không tham gia một tập rút gọn nào) cũng được thực hiện bởi một thuật tốn thời gian tính đa thức. Tuy vậy, việc tìm tất cả các tập rút gọn trong bảng quyết định nhất quán là bài toán có độ phức tạp thời gian tính hàm mũ. Chúng tơi chỉ ra rằng việc tìm tập rút gọn có lực lượng bé nhất không thể thực hiện được bằng một thuật tốn có thời gian tính đa thức. Có nghĩa là cho đến nay, việc tìm tập này là khơng khả thi trên hệ thống máy tính. Đặc biệt, người ta đã chứng minh được việc nghiên cứu các tập rút gọn trong bảng quyết định nhất quán tương đương với việc nghiên cứu hệ Sperner. Đây là hệ tổ hợp đã được nhiều nhà khoa học trên thế giới nghiên cứu và phát triển. </i>
<i> Trong bài báo này, chúng tơi chứng minh bài tốn xây dựng bảng quyết định nhất quán từ hệ Sperner K cho trước sao cho tập các rút gọn của nó chính là K có độ phức tạp hàm mũ. </i>
<i><b>Từ khóa: Sperner system, reduct set, consistent decision table. </b></i>
Việc tìm kiếm các tập rút gọn đóng vai trị quan trọng trong việc xử lí thơng tin trên bảng quyết định. Mục tiêu của rút gọn thuộc tính là loại bỏ các thuộc tính dư thừa để tìm ra các thuộc tính cơ bản phục vụ cho việc xử lí thơng tin. Về thực chất, việc rút gọn thuộc tính là tìm tập con nhỏ nhất của tập các thuộc tính để bảo tồn thơng tin phân lớp trên bảng quyết định. Trong bài báo này chúng tôi chỉ đề cập tới các bảng quyết định nhất quán. Trên thực tiễn, tùy theo từng bài toán cụ thể, chúng ta có thể chuyển bảng quyết định khơng nhất qn về bảng quyết định nhất quán. Mục tiêu chính của bài báo này là chứng minh xuất phát từ hệ Sperner K cho trước, bài toán xây dựng bảng quyết định nhất quán sao cho tập các rút gọn của nó chính là K có độ phức tạp hàm mũ.
Trước hết chúng tơi trình bày một số các khái niệm cơ bản cần thiết cho việc trình bày các kết quả chính của bài báo
<i><b>1. Những khái niệm cơ bản </b></i>
Mục này cung cấp một số khái niệm cơ bản được dùng trong bài báo. Các khái niệm này có thể xem trong [ 1, 3, 4, 6].
<i><b>Định nghĩa 1.1. Hệ thông tin là một bộ bốn S = ( U, A, V, f ) trong đó U là tập hữu hạn, khác rỗng các đối </b></i>
<i>tượng; A là tập hữu hạn, khác rỗng các thuộc tính; <sub>a</sub></i>
Thơng thường D = {d} chứa một thuộc tính.
<b>Định nghĩa 1.3. Cho bảng quyết định nhất quán</b>
- với mọi cặp đối tượng u, v thì R(u) = R(v) kéo theo D(u) = D(v);
- với mọi E là tập con thực sự của R thì tồn tại cặp u, v để E(u) = E(v) không kéo theo.
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">Cho
m<i>ột dãy ký tự có dạng A</i>→<i> B với A, B </i>⊆<i> R. PTH A</i>→<i> B thỏa mãn quan hệ r trên R nếu </i>
<i>Rõ ràng là F<sub>r </sub></i>là m<i>ột họ f trên R. Nếu F là một họ f trên R thì có một quan hệ r trên R sao cho F<small>r</small> = F. Ký hi</i>ệu
<i>Sơ đồ quan hệ (SĐQH) s là một cặp </i>
hiệu
<i>. </i>Tương tự ký hiệu
Cho
Dễ thấy
thi<i>ểu của quan hệ r (hoặc SĐQH s) thì </i>
các phản khóa. Nếu
<i>s), hay </i>
<small>−−</small>
<small>−−</small>
Chúng ta có thể thấy khái niệm tập tối thiểu của thuộc tính trên quan hệ r tương đương khái niệm tập rút gọn trong bảng quyết định nhất quán.
<i><b>2. Kết quả </b></i>
Trong phần này, chúng tơi trình bày các kết quả của bài báo. Đầu tiên, chúng tơi trình bày một bổ đề cần thiết sau.
<b>Bổ đề 2.1. [5] Cho bảng quyết định nhất quán</b>
<b>Định lí 2.2. [2] Cho trước bảng quyết định DS = (U, C ∪ {d}, V, f) thì (K</b><small>d</small><sup>r</sup>) <sup>-1</sup> là hệ Sperner trên C. Ngược lại nếu K là hệ Sperner trên C thì tồn tại một bảng quyết định nhất quán DS = (U, C ∪ {d}, V, f) để K= (K<small>d</small><sup>r</sup>) <sup>-1</sup>.
Trên cơ sở Định lí 2.2, nếu K là hệ Sperner trên C. Giả sử K = { A<small>1</small>,…,A<sub>m</sub> }. Chúng ta xây dựng bảng quyết định DS = (U, C∪{d}, V, f) như sau:
U = {u<sub>0</sub>, u<sub>1</sub>,…, u<sub>m</sub>} với mọi c ∈ C : c(u<small>0</small>) = 0 và d(u<sub>0</sub>) = 0. Với mọi i, i = 1,…m và c là phần tử của C. Chúng ta đặt c(u<small>i</small>) = 0 nếu c ∈ A<small>i</small>. Ngược lại c(u<small>i</small>) = i. Đặt d(u<small>i</small>) = i. Với R = C ∪ {d}.
Có thể thấy K= (K<small>dr</small>
) <sup>-1</sup> .
Sau đây, chúng tôi đưa ra một thuật tốn từ một hệ Sperner bất kỳ tìm tập phản khóa của nó.
<b>Thuật tốn 2.3 [8] (Tìm tập phản khóa) </b>
Vào: 𝐾 = {𝐵<small>1</small>, … , 𝐵<small>𝑛</small>} là hệ Sperner trên R. Ra: 𝐾<small>−1</small>
Bước 1: Ta đặt 𝐾<small>1</small>= {𝑅 − {𝑎}: 𝑎 ∈ 𝐵<small>1</small>}. Hiển nhiên 𝐾<small>1</small>= {𝐵<small>1</small>}<small>−1</small><sub>. </sub>
Bước q+1: (q < m). Ta giả thiết rằng 𝐾<small>𝑞</small>= 𝐹<small>𝑞</small> ∪ �𝑋<small>1</small>, … , 𝑋<small>𝑡𝑞</small>�, ở đây 𝑋<small>1</small>, … , 𝑋<small>𝑡𝑞</small><sup> ch</sup>ứa 𝐵<small>𝑞+1</small><sup> và </sup>𝐹<small>𝑞</small>=�𝐴 ∈ 𝐾<small>𝑞</small>∶ 𝐵<small>𝑞+1</small> ⊈ 𝐴�. Đối với mỗi i (i = 1, ..., 𝑡<small>𝑞</small><sup>) ta tìm các ph</sup>ản khóa của �𝐵<small>𝑞+1</small>� trên 𝑋<small>𝑖</small>tương tự như 𝐾<small>1</small><sup>. Kí pháp </sup>chúng là 𝐴<sub>1</sub><small>𝑖</small>, … , 𝐴<sub>𝑟𝑖</sub><small>𝑖</small> . Đặt 𝐾<sub>𝑞+1</sub>= 𝐹<sub>𝑞</sub> ∪ � 𝐴<small>𝑖</small><sub>𝑝</sub>∶ 𝐴 ∈ 𝐹<sub>𝑞</sub> 𝑘é𝑜 𝑡ℎ𝑒𝑜 𝐴<sub>𝑝</sub><small>𝑖</small> ⊄ 𝐴 , 1 ≤ 𝑖 ≤ 𝑡<sub>𝑞</sub>. 1 ≤ 𝑝 ≤ 𝑟<sub>𝑖</sub>�. Cuối cùng ta đặt 𝐾<small>−1</small>= 𝐾<sub>𝑚</sub>.
<b>Định lý 2.4 [8] </b>
Với mọi q (1 ≤ 𝑞 ≤ 𝑚), 𝐾<small>𝑞</small> = �𝐵<small>1</small>, … , 𝐵<small>𝑞</small>� <small>−1</small>có nghĩa là 𝐾<small>𝑚</small>= 𝐾<small>−1</small><sub>. </sub>
Rõ ràng, K và 𝐾<small>−1</small>là xác định duy nhất lẫn nhau và từ định nghĩa của 𝐾<small>−1</small><sub> có th</sub>ể thấy thuật tốn của chúng ta không phụ thuộc vào thứ tự của dãy 𝐵<small>1</small>, … , 𝐵<small>𝑚</small>. Đặt 𝐾<small>𝑞</small>= 𝐹<small>𝑞</small> ∪ �𝑋<small>1</small>, … , 𝑋<small>𝑡𝑞</small>� và 𝑙<small>𝑞</small><sup> (</sup>1 ≤ 𝑞 ≤ 𝑚 − 1) là số các phần tử 𝐾<small>𝑞</small><sup>. </sup>
Trên cơ sở này ta có:
<b>Mệnh đề 2.5. </b>
Độ phức tạp thời gian tồi nhất của Thuật toán 2.3 là Θ(|𝑅|<small>2</small>∑<small>𝑚−1</small>𝑡<sub>𝑞</sub>. 𝑢<sub>𝑞</sub>)<small>𝑞−1</small> <sup>. </sup>Ở đây: 𝑢<small>𝑞</small>= �<sup>𝑙</sup><sub>1 , 𝑛ế𝑢 𝑙</sub><sup>𝑞</sup><sup>− 𝑡</sup><sup>𝑞</sup><sup> , nếu 𝑙</sup><sup>𝑞</sup> <sup>> 𝑡</sup><sup>𝑞</sup><sup> </sup>
<small>𝑞</small>= 𝑡<sub>𝑞</sub>
Rõ ràng trong mỗi bước thuật tốn ta có 𝐾<small>𝑞</small><sup> là h</sup>ệ Sperner trên R. Ta biết rằng ([8]) kích thước của hệ Sperner bất kỳ trên R không vượt quá 𝐶<small>𝑛</small><sup>[𝑛/2]</sup><sup>, </sup>ở đây n = |𝑅|. Có thể thấy 𝐶<small>𝑛</small><sup>[𝑛/2]</sup><sup> x</sup>ấp xỉ bằng 2<small>𝑛+1/2</small><sub>/(</sub>𝛱. 𝑛<small>1/2</small><sub>). T</sub>ừ đó độ phức tạp thời gian tồi nhất của thuật tốn trên khơng nhiều hơn hàm số mũ theo n. Trong trường hợp mà 𝑙<small>𝑞</small>≤ 𝑙<sub>𝑚</sub> (q = 1,..., m-1), dễ thấy rằng độ phức tạp thuật tốn khơng lớn hơn Θ(|𝑅|<small>2 </small>|𝐾| |𝐾<small>−1</small>|<small>2</small>). Như vậy, trong các trường hợp này độ phức tạp của Thuật tốn 2.3 tìm 𝐾<small>−1</small>là đa thức theo |𝑅|, |𝐾|, 𝑣à |𝐾<small>−1</small>|. Có thể thấy nếu số lượng các phần tử của K là nhỏ thì Thuật tốn 2.3 rất hiệu quả, nó chỉ đòi hỏi thời gian đa thức theo |𝑅|.
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4"><b>Định lí 2.6 [9]. Cho trước bảng quyết định nhất quán DS = (U, C ∪ {d}, V, f) thì </b>
DS = (U, C ∪ {d}, V, f) để K= PRED (C).
Trên cơ sở Định lí 2.2, Thuật tốn 2.3, Định lí 2.6, chúng ta có kết quả sau:
<b>Thuật toán 2.7. (Xây dựng bảng quyết định) </b>
Vào: K = { A<sub>1</sub>,…,A<sub>p</sub> } là một hệ Sperner trên C = {c<small>1</small>, ..., c<sub>n</sub>}
Ra: Bảng quyết định nhất quán DS = (U, C ∪ {d}, V, f) sao cho K= PRED (C) Bước 1: Trên cơ sở thuật toán 2.3, từ K chúng ta xây dựng tập phản khóa K<small>-1</small> . Giả sử K<small>-1</small>
= { B<small>1</small>,...,B<small>m</small>}.
Bước 2: Chúng ta xây dựng bảng quyết định nhất quán DS = ( U, C∪{d}, V, f) như sau:
U = {u<sub>0</sub>, u<sub>1</sub>,…, u<sub>m</sub>} với mọi c ∈ C : c(u<small>0</small>) = 0 và d(u<sub>0</sub>) = 0. Với mọi i, i = 1,… m và c là phần tử của C. Chúng ta đặt c(u<small>i</small>) = 0 nếu c ∈ B<small>i</small>. Ngược lại c(u<small>i</small>) = i. Đặt d(u<small>i</small>) = i.
Có thể thấy, trên cơ sở Bổ đề 2.1 và Định lí 2.2, chúng ta có K<small>-1</small>
= (K<small>d</small><sup>r</sup>) <sup>-1</sup>. Trên cơ sở này và dựa trên định nghĩa của hệ Sperner, tập phản khóa và định nghĩa các tập rút gọn của bảng quyết định nhất quán, chúng ta có K = PRED (C).
Từ Mệnh đề 2.5, do phải xây dựng tập K<small>-1</small> từ K, chúng ta thấy độ phức tạp tồi nhất của thuật toán này là hàm
<b>mũ với lực lượng của C. </b>
K = { A<sub>1</sub>,…,A<sub>p</sub> } là m<i>ột hệ Sperner trên C và K = PRED (C) thì K</i><small>-1 = </small> M<sub>d</sub><i> </i>
<b>Nhận xét 2.9. Cho bảng quyết định nhất quán</b>
Cho K là một hệ Sperner trên C và K = PRED (C).
R = X<sub>1</sub> X<sub>2</sub> … X<sub>m</sub> W trong đó: |X<small>i</small>| = 3, X<sub>i</sub>∩ X<small>j</small> = ∅, m = [ n/3], |W| = 0, hoặc |W| = 1, hoặc |W| = 2.
Xét K = {A : |A| = 2, A là tập con thực sự của X<small>i</small> với một i nào đó } nếu |W| = 0.
K = {A : |A| = 2, A là tập con thực sự của X<small>i</small> với một i nào đó với 1 < i < m-1 hoặc A là tập con thực sự của X<small>i</small>
Chúng ta có thể thấy |K<small>-1</small>| > 3 <sup>[n/4]</sup>. Như vậy |K<small>-1</small>| là hàm mũ với n.Kết quả đã được chứng minh.
<b>Định lí 2.11. Bài tốn cho trước một hệ Sperner K trên </b>
Theo Nhận xét 2.9, nếu chúng ta đặt t = min { m: | U | = m, ở đây DS = < U, C {d}, V, f > có K = PRED
<i>(C)}. Khi đó (2 | K</i><small>-1</small>| ) <sup>½</sup> < t. Có nghĩa là từ cách phân đoạn trên chúng ta có t > 3 <small>[n/8]</small> .
Như vậy, đối với tập thuộc tính C không rỗng bất kỳ ta luôn chỉ ra một hệ Sperner K trên C có lực lượng tuyến tính với n, thì mọi bảng quyết định nhất qn DS = (U, C {d}, V, f) sao cho PRED (C) = K có lực lượng của U luôn là hàm mũ theo lực lượng của C.
Kết quả đã được chứng minh.
<b>Lời cảm ơn: Chúng tôi xin cảm ơn sự tài trợ của đề tài” Nghiên cứu thiết kế xây dựng bức tường lửa chuyên </b>
dụng tích hợp kỹ thuật mật mã của ngành Cơ yếu” mã số 01/2018/KCM.
<b>TÀI LIỆU THAM KHẢO </b>
[1] Demetrovics J., Thi V. D., Quang H. M., Anh N. V. “An Method to reduce the size of consistent decision tables”. Acta Cybernetica V 23, pp. 1039- 1054, 2018.
[2] Demetrovics J., Thi V. D., Duong T. H., Giang N. L. “On the time complexity of the problem related to reduct of consistent decision tables”. SERDICA J. of computing. Bugarian Academy of Sciences Vol. 9, No. 2, pp. 101-110, 2015.
[3] Demetrovics J. and Thi V.D., “Some remarks on generating Armstrong and inferring functional dependencies relation”, Acta Cybernetica 12, pp. 167-180, 1995.
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">[4] Nguyen Long Giang, Vu Duc Thi, “Some Problems Concerning Condition Attributes and Reducts in Decision Tables”, Proceeding of the Fifth National Symposium Fundamental and Applied Information Technology Research (FAIR), Bien Hoa, Dong Nai, pp. 142-152, 2011.
[5] Nguyễn Long Giang, Vũ Đức Thi, “Thuật tốn tìm tất cả các rút gọn trong bảng quyết định”, Tạp chí Tin học và Điều khiển học, T.27, S.3, tr. 199-205, 2011.
[6] Pawlak Z., “Rough sets: Theoretical Aspects of Reasoning About Data”, Kluwer Academic Publishers, 1991. [7] Vũ Đức Thi, “Một vấn đề thuật toán liên quan đến tập rút gọn trong bảng quyết định nhất quán”. Kỷ yếu hội nghị
quốc gia về nghiên cứu cơ bản và ứng dụng công nghệ thông tin lần thứ XI, Hà Nội, tr. 150-157, 2018. [8] Vu Duc Thi, “Minimal keys and antikeys”, Acta Cybernetica 7, 4, pp. 361-371, 1986.
[9] Vũ Đức Thi, “Về một vấn đề tương đương liên quan đến tập rút gọn trong bảng quyết định” Kỷ yếu hội nghị nghiên cứu cơ bản và ứng dụng công nghệ thông tin - FAIR 12, Đại học Huế, trang 534- 538, 2019.
<b>ON THE PROBLEM RELATED TO BULLD THE CONSISTENT DECISION TABLES </b>
</div>