Tải bản đầy đủ (.pdf) (26 trang)

Nghiên Cứu Ứng Dụng Giải Pháp Phân Tán Dữ Liệu Quản Lý Đào Tạo Tín Chỉ Trong Các Trường Cao Đẳng Cộng Đồng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.83 MB, 26 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

LÝ VĂN KIÊN

NGHIÊN CỨU ỨNG DỤNG GIẢI PHÁP

PHAN TAN DU LIEU QUAN LÝ DAO TẠO TÍN CHÍ TRONG CAC TRUONG CAO DANG CONG DONG

<small>Chuyên ngành: Khoa học máy tính</small>

Mã số: 60.48.01.01

TOM TAT LUẬN VĂN THẠC SĨ

HÀ NỘI - 2015

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<small>Luận văn được hoàn thành tại:</small>

HỌC VIEN CƠNG NGHỆ BƯU CHÍNH VIÊN THONG

Người hướng dẫn khoa học: TS. TRÀN THIỆN CHÍNH

<small>Phản biện 1: TS. Tạ Quang Hùng</small>

<small>Phản biện 2: TS. Hoàng Lê Minh</small>

<small>Luận văn sẽ được bảo vệ trước Hội đông châm luận văn thạc sĩ tại Học viện Cơng</small>

<small>nghệ Bưu chính Viễn thơng</small>

<small>Vào lúc: 13 giờ 45 ngày 27 tháng 02 năm 2016</small>

<small>Có thê tìm hiệu luận văn tại:</small>

<small>- Thư viện của Học viện Cơng nghệ Bưu chính Viễn thơng</small>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

MỞ ĐẦU

Trong những năm gần đây, thuật ngữ Hệ phân tán (Distributed System) đã trở nên gần

<small>gũi với những người làm công tác tin học. Việc ứng dụng hệ tin học phân tán vào các lĩnh vực</small>

đời sống xã hội, vào các ngành kinh tế, hàng không, giáo dục, y tế, hành chính, viễn thơng, thương mại điện tử... ngày càng phát triển mạnh. Hiện nay, nước ta đã và đang có rất nhiều nghiên cứu nham phát triển và hoàn thiện các hệ thống dữ liệu phân tán nhăm phát triển ứng dụng trong nhiều lĩnh vực khác nhau.

Một trong các nghiên cứu đó là xây dựng hệ thống cơ sở dit liệu (CSDL) phân tán

quan lý đào tạo theo tin chỉ trong các trường Cao dang Cộng đồng Việt Nam. Dao tạo theo

tín chỉ có rất nhiều ưu điểm: Hiệu quả đào tạo cao, có tính mềm dẻo và khả năng thích ứng

cũng như đạt hiệu quả cao về mặt quản lý... Tuy nhiên, khi áp dụng phương pháp này thì

khối lượng cơng việc phải quản lý của nhà trường tăng lên rất lớn, nếu như trong phương pháp học theo niên chế lay nguyên don là lớp thì trong phương pháp học theo tin chi lay nguyên đơn là sinh viên. Như vậy công việc của người quản lý tăng lên gấp bội. Ví dụ, một

trường Cao dang Cộng đồng có khoảng 2.500 sinh viên các hệ dao tạo, thì việc quản lý một cách chặt chẽ và hợp lý đến từng sinh viên như: Quản lý hồ sơ, q trình học tập theo từng

tín chỉ, khen thưởng, kỷ luật, điểm, thời khóa biéu cá nhân, học phi, học lại sẽ rat phức tap.

Thực tế, nhiều trường đã xây dựng các phần mềm đào tạo tín chỉ dựa trên hệ quản trị

CSDL tập trung, nhưng khối lượng dữ liệu được sử dụng trong mỗi năm học rất lớn và ngày một tăng, dan tới thời gian truy xuất dữ liệu rất lâu, CSDL bị ngừng trệ phục vụ, thậm chi là mat dữ liệu khi có sự cơ xảy ra, có nghĩa là độ sẵn sàng phục vụ của CSDL khơng cịn nữa, gây

ảnh hưởng đến hiệu quả của quan lý dao tạo. Mặt khác việc quản ly dữ liệu tập trung cũng cần

phải triển khai hệ thống máy chủ, hạ tang mạng gây tốn kém nhiều chi phi và mức độ an tồn

cho dữ liệu khó có thé được đảm bảo. Những hạn chế này đã được khắc phục trong các hệ

<small>CSDL phân tan, đảm bảo dữ liệu ln có tính sẵn sảng, tin cậy, an tồn và bảo mật.</small>

Mơ hình hoạt động của các trường Cao đăng Cộng đồng Việt Nam hiện nay khá đa

dạng ngành nghề đào tạo, đa dạng lĩnh vực hoạt động và đa dạng đối tượng đảo tạo. Với

mục đích là tạo cơ hội học tập cho tat cả mọi người ở các trình độ khác nhau. Do đó, việc

xây dựng hệ thống CSDL phân tán để hỗ trợ cho quản lý đào tạo tín chỉ, phù hợp với mơ hình hoạt động trong các trường Cao dang Cộng đồng hiện nay là van đề cấp thiết. Bản thân

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

tác giả hiện đang công tác tại trường Cao đăng Cộng đồng Hà Tây một thành viên trong hiệp hội các trường Cao dang Cộng đồng Việt Nam.

Vì vậy, để góp phần phục vụ cho cơng tác quản lý trong đào tạo của Trường, tác giả đã lựa chọn đề tài “Nghiên cứu ứng dụng giải pháp phân tán dữ liệu quản lý đào tạo tín

chỉ trong các trường Cao đẳng Cộng đồng".

Nội dung luận văn gồm ba chương:

Chương 1 - Tổng quan về cơ sở dữ liệu phân tán: Trong chương này sẽ thảo luận về một số các đặc điểm chính của CSDL phân tán, hệ quản trị CSDL phân tán, rút ra những ưu điểm của CSDL phân tán trong thiết kế CSDL. Các loại truy xuất, mức trong suốt và an

<small>toàn CSDL phân tán.</small>

Chương 2 - Phương pháp thiết kế cơ sở dữ liệu phân tán quan lý đào tạo tín chỉ trong các trường Cao dang Cộng đồng: Chương này trình bày về mơ hình hoạt động va

đưa ra bài tốn quản lý dao tạo trong các trường Cao đăng Cộng đồng hiện nay. Đưa ra các chiến lược thiết kế, phân tán, phân mảnh, kiểm sốt đữ liệu, đồng bộ hóa CSDL phân tán.

<small>Chương 3 - Xây dựng cơ sở dữ liệu phân tán quản lý đào tạo tín chỉ trong trường</small>

Cao đẳng Cộng đồng Hà Tây: Nội dung chương này trình bày về hiện trạng quản lý đào tạo

tín chỉ của trường Cao đăng Cộng đồng Hà Tây hiện nay. Từ đó xây dựng, thiết kế hệ thống

<small>phân tán hỗ trợ quản lý đào tạo tín chỉ cho nhà trường.</small>

Trong q trình làm luận văn không thể tránh khỏi một số các thiếu sót rất mong

<small>nhận được sự đóng góp ý kiên của các thây cô và các bạn học viên.</small>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

CHƯƠNG 1 - TONG QUAN VE CƠ SỞ DU LIEU PHAN TAN

<small>1.1. Cơ sở dữ liệu phan tan</small>

<small>1.1.1. Định nghĩa</small>

Một cơ sở đữ liệu (CSDL) phân tán [I] là một tập hợp dữ liệu, mà về mặt logic tập

hợp này thuộc cùng một hệ thống, nhưng về mặt vật ly dit liệu đó được phân tan trên các vi

<small>trí khác nhau của một mạng máy tính.</small>

Phân tán: Dữ liệu khơng cư trú trên một vị trí mà được phân bố rộng khắp trên nhiều

máy tính đặt tại nhiều vị trí khác nhau, đây là điểm phân biệt một CSDL phân tán với một

<small>CSDL tập trung.</small>

Tương quan logic: Dữ liệu trong hệ phân tán có một số thuộc tính ràng buộc chúng với nhau. Điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp

CSDL tập trung, các file dữ liệu được lưu trữ tại nhiều vị trí khác nhau, điều này thường thấy trong các ứng dụng mà hệ thống sẽ phân quyền truy nhập dữ liệu trong môi trường

1.1.2. Những đặc điểm chính của cơ sở dữ liệu phân tán 1.1.3. Những ưu điểm của hệ phân tán

<small>1.2. Hệ quản trị cơ sở dữ liệu phân tán</small>

<small>Hệ quản trị CSDL phân tán có chức năng hỗ trợ việc tạo và bảo trì CSDL phân tán,</small>

chúng có các thành phần tương tự như một hệ quản trị CSDL tập trung và các thành phần hỗ

trợ trong việc chuyên tải dữ liệu đến các trạm và ngược lại.

<small>1.3. Hệ quản trị CSDL tập trung</small>

<small>Các ứng dụng, hệ quản trị CSDL và CSDL được cài đặt trên cùng một bộ xử lý. Ví dụ:</small>

Trên máy tính cá nhân có thể chạy các chương trình ứng dụng có sử dụng phần mềm CSDL Oracle đề truy nhập tới CSDL trên đĩa cứng của máy tính cá nhân đó.

<small>1.4. So sánh CSDL phân tán và CSDL tập trung</small>

<small>CSDL phân tán không đơn giản là những sự thực hiện phân tán của CSDL tập trung,</small>

bởi vì chúng cho phép thiết kế các đặc trưng khác với CSDL tập trung truyền thống.

1.4.1. Điều khiển tập trung

<small>1.4.2. Độc lập dữ liệu</small>

<small>1.4.3. Giảm dự thừa dit liệu</small>

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

1.6. Các đặc trưng của các loại hình hệ thống phân tán

Việc chuyền các ứng dụng trên máy tính cá nhân cũng như các ứng dụng trên các hệ thống

<small>máy lớn trung tâm sang mơ hình phân tán là một xu hướng phát triển mạnh.</small>

Vấn đề đặt ra là, cần lựa chọn hình thức phân tán thích hợp nào cho mỗi mơ hình được chun đơi.

1.6.1. Đặc trưng của hệ thong File server và kién trúc Client/Server 1.6.2. Các đặc trưng của kiến trúc Client/Server

a. Trình diễn thơng tin phân tan

1.7.2. Phân loại các cơ chế điều khiển đồng thời giao dịch phân tán

1.8. Các loại truy xuất và mức trong suốt của CSDL phân tán

1.8.1. Các loại truy xuất CSDL phân tán

a. Truy xuất từ xa thông qua các tác vụ cơ bản

b. Truy xuất từ xa thông qua chương trình phụ trợ

1.8.2. Các mức trong suốt của CSDL phân tán

Tính trong suốt về vị trí

Tính trong suốt trong việc sử dụng Tinh trong suốt của việc phân chia Tính trong suốt của sự trùng lặp

1.9. Thuật tốn nhiều bản sao và đồng bộ hóa dữ liệu

1.9.1. Giải thuật quản lý nhiều bản sao

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

1.9.2. Dong bộ hóa dữ liệu

Replication trong SQL Server là một tập các giải pháp cho phép sao chép, phân phối dữ liệu và đối tượng CSDL từ một CSDL SQL Server đến SQL Server khác, sau đó đồng bộ

<small>giữa hai CSDL với nhau.</small>

Sử dụng Replication, chúng ta có thé phân phối dé liệu đến nhiều SQL Server khác

<small>nhau hay truy cập từ xa thông qua mạng cụ bộ hay internet. Replication cũng nâng cao tinh</small>

thực hiện hay phân phối CSDL trên nhiều Server với nhau.

Đồng bộ hóa đữ liệu sử dụng Replication cho phép chia sẻ dữ liệu giữa các CSDL tại nhiều điểm khác nhau. Với một dữ liệu gốc, ta có thé tạo nhiều bản sao và sử dụng tại nhiều nơi. Dữ liệu

gốc thay đồi, các dit liệu bản sao cũng sẽ thay đối và ngược lại.

<small>1.10. An tồn dữ liệu phân tan</small>

1.10.1. Kiểm sốt cấp quyền tập trung

Một quyền được cấp được xem là một bộ ba thành phần:

<small>* Người sử dụng.</small>

<small>v Loại thao tác.</small>

Định nghĩa đối tượng.

1.10.2. Kiểm soát cấp quyền phân tán

Các vấn đề kiểm sốt cấp quyền trong mơi trường phân tán bao gồm:

Y Cấp quyên cho người sử dụng ở xa.

Quản lý các quy tắc cấp quyền phân tán và xử lý khung nhìn.

<small>« Nhóm người sử dụng.</small>

1.11. Kết luận chương 1

Chương này đã thảo luận về một số các đặc điểm chính của CSDL phân tán, hệ quản trị CSDL phân tán, rút ra những ưu điểm của CSDL phân tán trong thiết kế CSDL.

Các hình thức t6 chức CSDL phân tán và các đặc trưng của nó được đề cập, dé có lựa

chọn giải pháp phù hợp cho thiết kế dữ liệu tương ứng cho từng hệ thống. Việc quản lý giao dich và điều khiển đồng thời phân tán cũng rất quan trọng trong việc đảm bao dữ liệu phan tán được truy xuất. Giải thuật quản lý nhiều bản sao được đề cập trong chương này nhằm

cho việc đồng bộ hóa gitra các trạm được thuận lợi.

Vấn đề an toàn dữ liệu phân tán được đề cập giúp cho việc kiểm soát quyền truy cập,

quyền phân tán được an toàn hơn. Đặc biệt trong điều kiện của CSDL đảo tạo.

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

TAN QUAN LY DAO TAO TIN CHI TRONG CAC TRUONG CAO DANG CONG DONG

2.1. Mơ hình hoạt động trường Cao dang Cộng đồng

Theo hiệp hội Cao đăng Cộng đồng Việt Nam [9], một trường Cao đăng Cộng đồng

<small>(CDCD) theo đúng mơ hình có những khác biệt rõ rang với các trường đại học. Đặc biệt,</small>

khi giáo dục đại học tại Việt Nam mang tính thống nhất tồn quốc khá cao thì khác biệt lại càng rõ rệt, vì trường CĐCĐ đúng nghĩa mang nhiều tính địa phương hơn. Đối với các trường Cao đăng (CD) va dạy nghề tại Việt Nam, trường CDCD theo đúng mơ hình có nhiều khác biệt bởi những đặc điểm sau đây:

v_ Đáp ứng nhu cầu cộng đồng

Y Cơ cấu tổ chức đảm bảo sự tham gia của cộng đồng

Y Chương trình đào tạo được phát triển và điều chỉnh theo yêu cầu của công việc Y Đa ngành và đa cấp

v_ Đào tạo theo mơ hình học tập suốt đời

2.2. Bài toán quản lý đào tạo tin chỉ trong các trường Cao dang Cộng đồng

Xây dựng hệ thống CSDL phân tán nhằm quản lý học sinh, sinh viên giữa các trường thành viên. Đặc điểm mỗi trường là hệ thong đào tao của mỗi trường có nhiều cấp học khác nhau như: Hệ đào tạo nghề ngắn hạn, đải hạn, hệ trung cấp 3 năm, trung cấp 2 năm, cao

<small>đăng chính quy 3 năm, hệ liên thơng lên cao đăng, đại học chính quy và vừa học vừa làm.</small>

Tuy nhiên áp dụng dao tao tin chỉ thì chỉ có hệ Cao dang chính quy và hệ liên thơng lên cao

đăng, đại học chính quy. Dữ liệu dao tạo sẽ duoc phân tán về các cơ sở đào tạo của các

<small>trường thành viên, mỗi trường sẽ quản lý sinh viên của trường mình và phịng đào tạo quản</small>

lý chung tất cả. Phịng đào tạo điều hành chính sách và quy chế.

Dữ liệu cần quản lý: Thông tin cá nhân của học sinh, điểm q trình học cho từng

<small>mơn, từng chuyên nganh...</small>

Mỗi cơ sở đào tạo tự nhập điểm, thông tin cá nhân sinh viên do cơ sở quản lý và giảng dạy, dữ liệu này sẽ được đưa về đữ liệu điểm của sinh viên tại trường quản lý.

2.3. Thiết kế cơ sở dữ liệu

Hai chiến lược chính [3] đã được xác định trong thiết kế các CSDL phân tán là tiếp

cận từ trên xuống (top-dow) và tiếp cận từ dưới lên (bottom-up). Quá trình thiết kế theo hai

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

cách tiếp cận này rất khác nhau. Nhưng chúng ta biết rất hiếm các ứng dụng đủ đơn giản để có thê sử dụng chỉ một trong hai cách tiếp cận. Vì vậy phần lớn thiết kế CSDL cả hai cách tiếp cận đều được áp dung dé b6 sung cho nhau.

2.3.1. Quá trình thiết kế từ trên xuống 2.3.2. Quá trình thiết kế từ dưới lên

2.3.3. Lựa chọn chiến lược thiết kế cơ sở dữ liệu cho bài toán

Với bài toán được nêu ra trong mục 2.2 mơ hình thiết kế hệ thống CSDL sẽ lựa chọn phương pháp thiết kế từ trên xuống là giải pháp thích hợp nhất bởi vì:

V Hệ thống mới chưa có CSDL gốc cần phải thiết kế lại từ dau.

* Cần phải xây dựng các chức năng chính cho hệ thống, dé từ đó phân rã ra các chức năng con cho phù hợp với yêu cầu.

Y Cac thiết kế CSDL cần phải thiết kế lại cho phù hợp với mục đích của hệ thống.

Tuy nhiên trong bài tốn này, với một số CSDL, quy trình quản lý đào tạo đã hình thành san. Cho nên sẽ có vài chức năng thiết kế theo mơ hình từ đưới lên cho phù hợp.

2.4. Chiến lược phân tán dữ liệu

Có 4 chiến lược phân tan dữ liệu cơ bản:

<small>2.4.1. Tập trung dữ liệu2.4.2. Chia nhỏ dữ liệu</small>

<small>2.4.3. Sao lưu dữ liệu</small>

<small>2.4.4. Phương thức lai</small>

2.4.5. Lựa chọn chiến lược phân tan dữ liệu cho bài toán

Trong bài toán nêu trong mục 2.2 dé phân tán dữ liệu cho phù hợp ta chọn hai chiến

<small>lược phân tán:</small>

Y Chia nhỏ dữ liệu: Dữ liệu đào tạo sẽ được chia nhỏ ra theo yêu cầu của hệ thông,

đảm bảo sự hoạt động của hệ thống có độ tin cậy cao nhất.

Y Sao lặp dit liệu: Dữ liệu của các phần sẽ được phân bố ở nhiều trạm khác nhau. Các

phần này sẽ được đồng bộ với bản chỉnh bằng một ứng dụng hay phần mềm nào đó.

2.5. Phương pháp phân mảnh và cấp phát các mảnh

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

Thiết kế phân mảnh dữ liệu là công việc đầu tiên phải thực hiện. Mục dich của việc phân mảnh dữ liệu là tạo ra các đơn vị cấp phát logic, sao cho chi phí thực hiện truy van thông tin là thấp nhất.

<small>2.5.1. Lý do phân mảnh</small>

<small>Trước tiên khung nhìn của các ứng dụng thường chỉ là một tập con của quan hệ. Vì</small>

thế đơn vị truy xuất khơng phải là tồn bộ quan hệ mà chỉ là các tập con của quan hệ. Vì vậy

đưa tập con của quan hệ ra khung nhìn là tốt nhất cho nên phân mảnh các quan hệ và phân

tán đến nơi sử dụng khung nhìn sẽ là điều thích hợp nhất.

Thứ hai là nếu các ứng dụng có các khung nhìn được định nghĩa trên một quan hệ

cho trước, quan hệ đó lại năm tại các vị trí khác thì có hai cách chọn lựa:

<small>1. Đơn vi phân tán là tồn bộ quan hệ khơng được nhân bản va được lưu ở một vi trí.</small>

2. Quan hệ được nhân bản cho tat cả các vị trí hoặc một số vi trí có chạy ứng dụng.

Lua chọn (1) gây ra một một số lượng lớn các truy xuất không cần thiết đến dit liệu ở xa. Còn ngược lại chọn lựa (2) thực hiện nhân bản không cần thiết, gây ra nhiều van đề khi truy nhập và có thé làm lãng phí nhiều khơng gian lưu trữ.

Cuối cùng, việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như

một don vi, sẽ cho phép thực hiện nhiều giao dịch đồng thời và cho phép thực hiện song

song một câu vấn tin băng cách chia nó thành một tập các câu vấn con hoạt tác trên các mảnh. Vì thế việc phân mảnh sẽ làm tăng mức độ hoạt động đồng thời và như thế làm tăng

lưu lượng hoạt động của hệ thống.

<small>Có hai cách phân mảnh cơ bản là:</small>

<small>vx Phân mảnh ngang.v Phân mảnh doc.</small>

<small>2.5.2. Phương pháp phân mảnh ngang</small>

Phân mảng ngang chính là việc chia quan hệ thành nhiều các nhóm bộ. Kết quả của quá trình phân mảnh ngang là các quan hệ con, số lượng quan hệ con phụ thuộc vào điều

<small>kiện rành buộc của các thuộc tính. Và các bộ trong các quan hệ con là tách biệt nhau. Phân</small>

mảnh ngang thực chat là phép chọn quan hệ thỏa mãn một biéu thức điều kiện cho trước.

<small>a. Phân mảnh ngang nguyên thủy</small>

Phân mảnh ngang nguyên thuỷ được định nghĩa bằng một phép toán chọn trên các quan hệ chủ nhân của một lược đồ của CSDL.

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

b. Phân mảnh ngang dẫn xuất

Phân mảnh ngang dẫn xuất được định nghĩa trên một quan hệ thành viên của đường nối dựa theo phép toán chọn trên quan hệ chủ nhân của đường nối đó.

Chúng ta cần kiểm tra tính đúng đắn của phân mảnh ngang: * Tinh day đủ

Phân mảnh ngang nguyên thuỷ: Với điều kiện các vị từ chọn là đầy đủ, phân mảnh thu cũng được đảm bảo là đầy đủ, bởi vi cơ sở của thuật toán phân mảnh là tập các vi từ cực

tiêu và đầy đủ Pr, nên tính đầy đủ được bảo đảm với điều kiện khơng có sai sót xảy ra.

Phân mảnh ngang dẫn xuất: Có khác chút ít, khó khăn chính ở đây là do vị từ định nghĩa phân mảnh có liên quan đến hai quan hệ. Trước tiên chúng ta hãy định nghĩa qui tắc

đầy đủ một cách hình thức. * Tinh tai thiết được

Tái thiết một quan hệ tồn cục từ các mảnh được thực hiện bằng tốn tử hợp trong cả

phân mảnh ngang nguyên thủy lẫn dẫn xuất, Vì thế một quan hệ R với phân mảnh F,={R;,

<small>Ra,...,R„m} chúng ta có:</small>

<small>RE=UR;, VR¡e Fr</small>

<small>* Tinh tach rời</small>

<small>Với phân mảnh nguyên thuỷ tính tách rời sẽ được bảo đảm miễn là các vị từ hội sơ</small>

cấp xác định phân mảnh có tính loại trừ tương hỗ (mutually exclusive). Với phân mảnh dẫn xuất tính tách rời có thể bảo đảm nếu đồ thị nối thuộc loại đơn giản.

<small>2.5.3. Phương pháp phân mảnh dọc</small>

<small>Một phân mảnh dọc cho một quan hệ R sinh ra các mảnh Rị, Rạ,..,R;, mỗi mảnh chứa</small>

<small>một tập con thuộc tính của R và cả khố của R. Mục đích của phân mảnh dọc là phân hoạch</small>

một quan hệ thành một tập các quan hệ nhỏ hơn để nhiều ứng dụng chỉ cần chạy trên một

mảnh. Một phân mảnh “tối ưu” là phân mảnh sinh ra một lược đồ phân mảnh cho phép giảm tối đa thời gian thực thi các ứng dụng chạy trên mảnh đó.

Dé có được các lời giải tối ưu cho bài tốn phân mảnh dọc rất khơng hiệu quả, phải sử

<small>dụng hai phương pháp Heuristic cho phân mảnh dọc các quan hệ tồn cục.</small>

1. Nhóm thuộc tính: Bắt đầu gán mỗi thuộc tính cho một mảnh và trong mỗi bước, nối

<small>một sô mảnh lại với nhau cho tới khi thỏa mãn điêu kiện.</small>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

2. Tach mảnh: Bắt đầu băng một quan hệ và quyết định cách phân chia dựa trên hành vi

<small>truy nhập của các ứng dụng trên các thuộc tính.</small>

Kỹ thuật tách mảnh thích hợp với phương pháp thiết kế từ trên xuống. Các mảnh không gối chồng lên nhau (khơng phải là khóa chính). Ngược lại, với phương pháp nhóm thuộc tính thường tạo ra các mảnh gối chồng lên nhau.

2.5.4. Bài toán cấp phát các mảnh

Gia sử đã có một tập các mảnh F={F\, Fạ, ...,Fn} và một mang bao gồm các vi trí

<small>S={S¡, So, ....Sm} trên đó có một tập các ứng dụng Q={dq¡, q›, ...,qạ} đang chạy.</small>

Bài tốn cấp phát là tìm một phân phối “tối ưu” của F cho S. Tính tơi ưu có thé được định nghĩa ứng với hai số đo:

Chi phí nhỏ nhất: Hàm chi phí có chỉ lưu mảnh F, vào vị trí S¡, chi phí van tin mảnh

Fj vào vi trí S¡, chi phí cập nhật F; tại tất cả mọi vị trí có chứa nó và chỉ phí truyền đữ liệu.

Vi thé bài tốn cấp phát cố gắng tìm một lược đồ cấp phát với ham chi phí tổ hợp nhỏ nhất.

Hiệu năng: Chiến lược cấp phát được thiết kế nhằm duy trì một hiệu quả lớn đó là hạ thấp thời gian đáp ứng và tăng tối đa lưu lượng hệ thống tại mỗi vị trí.

<small>2.5.5. Lựa chọn phương pháp phân mảnh cho bài tốn</small>

Với bài tốn quản lý đào tạo tín chỉ nêu ra trong mục 2.2, kết hợp với việc trình bày

<small>hai phương pháp phân mảnh, phân mảnh ngang, phân mảnh dọc nêu ra trong mục 2.5.2 và2.5.3. Lựa chọn phương pháp phân mảnh ngang cho việc phân mảnh CSDL cho bài toán làphù hợp bởi lẽ:</small>

vx Kỹ thuật phân mảnh dọc phức tạp hơn so với kỹ thuật phân mảnh ngang, vi số lựa chọn phân hoạch rất lớn.

Y Phương pháp phân mảnh doc thì số mảnh tạo ra lớn do đó làm quá trình truy xuất bị

<small>ảnh hưởng. Kỹ thuật cài đặt phân mảnh dọc phức tạp hơn so với phân mảnh ngang.</small>

Để có được các lời giải tối ưu cho bài tốn phân mảnh dọc rất khơng hiệu quả, phải

<small>sử dụng hai phương pháp Heuristic cho phân mảnh dọc các quan hệ toàn cục.</small>

VY Phương pháp phân mảnh ngang dễ thiết kế và cài đặt hơn, đồng thời làm giảm thời gian truy xuất đữ liệu.

2.6. Kiểm soát dữ liệu ngữ nghĩa

CSDL không chỉ tập trung ở một nơi mà phân tán trên nhiều nơi khác nhau. Khi có

<small>một yêu câu về cập nhật dữ liệu, làm thê nào đê dữ liệu van đảm bảo được tính nhât quán và</small>

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

toàn ven dữ liệu. Dinh nghĩa các quy tắc nhằm kiểm soát các thao tác dữ liệu là một trong những yêu cầu quan trọng của một hệ quản trị CSDL tập trung hay phân tán.

Kiểm soát dữ liệu ngữ nghĩa bao gồm:

<small>Y Quản trị khung nhìn.</small>

Y Kiểm sốt tính an tồn và bảo mật. * Kiểm sốt tính tồn vẹn ngữ nghĩa.

<small>Các chức năng này phải bảo đảm cho những người sử dụng được phép sẽ thực hiện</small>

đúng đắn các thao tác trên CSDL nhằm duy tri tính tồn vẹn dit liệu.

2.7. Đồng bộ hóa CSDL phân tán

2.7.1. Dong bộ hóa CSDL cho bài tốn quản lý đào tạo tin chỉ

Đồng bộ hóa dữ liệu Replication cho phép chia sẻ dữ liệu giữa các CSDL tại nhiều điểm

<small>khác nhau. Với một dữ liệu gơc, ta có thê tạo nhiêu bản sao và sử dụng tại nhiêu nơi. Dữ liệu</small>

Replicate 3

<small>Hình 2.4: Mơ hình phân tán dữ liệu Replicate</small>

</div>

×