Tổ chức khai thác dữ liệu giao thông vận tải
Nguyễn Thị Diễm Hà
Trường Đại học Công nghệ
Luận văn ThS. ngành: Hệ thống thông tin; Mã số: 60 48 05
Người hướng dẫn: PGS.TS. Đỗ Trung Tuấn
Năm bảo vệ: 2012
Abstract. Trình bày thực trạng giao thông Việt Nam và nhu cầu tổ chức dữ liệu các
cung đường trên địa bàn thành phố Hải Phịng. Tìm hiểu về cơ sở dữ liệu phân tán:
so sánh cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung; sự cần thiết của cơ sở dữ
liệu phân tán; kiến trúc cơ bản của CSDL phân tán; hệ quản trị cơ sở dữ liệu phân
tán; thiết kế cơ sở dữ liệu phân tán; Kiểm soát dữ liệu ngữ nghĩa. Thiết kế, xây dựng
hệ thống cơ sở dữ liệu phân tán với Visual Studio 2008, hệ quản trị cơ sở dữ liệu
SQL server.
Keywords. Hệ thống thông tin; Khai thác dữ liệu; Giao thông vận tải; Cơ sở dữ liệu
phân tán
Content
Mở đầu
Hiện nay, cùng với xu hướng phát triển chung, nhu cầu về dữ liệu ngày càng tăng, đối
với mọi ngành kinh tế quốc dân nói chung, và ngành giao thơng vận tải nói riêng. Trong
những năm qua, thành phố Hải Phịng đã có nhiều bước tiến trong tất cả các ngành kinh tế,
đáp ứng nhu cầu của kinh tế thị trường cũng như đảm bảo kinh tế người dân ở các huyện lị
trong thành phố.
Hệ thống đường xá liên tỉnh, liên huyện, liên xã cần được quản lý một cách khoa học.
Việc sử dụng CNTT ngày càng quen thuộc trong ngành GTVT. Theo phương pháp quản lý
trong ngành hiện nay, các đơn vị quản trị giao thơng tại các cung đường thường xun có các
báo cáo về Sở giao thơng Hải Phịng, bao gồm: lưu lượng tham gia giao thông, số vụ tai nạn
xảy ra, chất lượng các cung đường, công tác bảo dưõng duy tu, giám sát cung đường,...
Những dữ liệu đó được tổ chức phân tán tại cơ sở, được ghi lại và xử lý tập trung tại sở giao
thơng thành phố Hải Phịng. Việc ứng dụng các kiến thức về Cơ sở dữ liệu phân tán về giao
thơng là cần thiết và có vai trị quan trọng trong cơng tác quản lý GTVT trên địa bàn thành
phố.
Luận văn đã chọn đề tài “Tổ chức, khai thác dữ liệu giao thông vận tải” với mục đích
tìm hiểu về CSDL phân tán, trên cơ sở đó phân tích, thiết kế CSDL các cung đường nhằm
nâng cao công tác quản lý trong ngành giao thông, đặc biệt là công tác quản lý các cung
đường trên địa bàn thành phố Hải Phòng. Luận văn chia thành các chương:
1. Một số vấn đề liên quan đến ctác quản lý các hoạt động trên các cung đường trên địa
bàn thành phố Hải Phòng;
2. Vai trò của CSDL phân tán và khả năng áp dụng các kiến thức hàn lâm vào bài tốn cụ
thể của ngành giao thơng vận tải;
3. Thiết kế, xây dựng hệ thống CSDL phân tán với Visual Studio 2008, hệ quản trị CSDL
SQL server.
Cuối luận văn là phần kết luận và tài liệu tham khảo.
Chương 1. Nhu cầu sử dụng công nghệ thông tin để giám sát các
hoạt động giao thông
1.1. Hiện trạng giao thông ở Việt Nam và vấn đề quản lý
Việt nam là một đất nước có hệ thống chính trị ổn định trong khu vực và trên thế giới, là một
nước chỉ có duy nhất một Đảng Chính trị lãnh đạo, tình trạng khủng bố hầu như khơng có.
Thế nhưng, tình trạng thiệt mạng do tai nạn giao thơng thì lại q nhiều, bình qn mỗi năm
có 9 ngàn đến 13 ngàn người thiệt mạng do TNGT thiệt hại kinh tế ước tính đến cả tỷ
USD/năm bằng cả trị giá xuất khẩu lúa gạo (Việt nam có sản lượng xuất khẩu lúa gạo đứng
thứ hai trên thế giới). Theo báo cáo của bộ Giao thông vận tải, tai nạn giao thông trong 10
năm qua tăng liên tục, đặc biệt từ năm 2001 tăng đột biến. Năm 2002 tai nạn đã làm chết
10.866 người, bị thương 29.449 người.
Hệ thống đường bộ của chúng ta chưa đạt tiêu chuẩn kỹ thuật: như độ nghiêng, độ bám dính
mặt đường, độ phẳng, tầm nhìn, ... chưa đảm bảo.
Tầm nhìn nhiều chỗ cịn bị hạn chế hoặc những chỗ cua không hợp lý đã tạo nhiều điểm đen
thường xảy ra TNGT.
Hệ thống đèn tín hiệu cảnh báo chỉ dẫn không được thiết kế thi công đồng bộ, nên hầu hết các
tuyến đường khơng có biển báo, đèn báo, đèn chỉ dẫn giao thông… đây cũng là nguyên nhân
làm ùn tắc giao thông ở các chỗ đường giao nhau và gây ra TNGT.
Hầu hết các tuyến đường, cầu cống trên đất nước ta kể cả những tuyến đường được đầu tư
xây dựng từ vốn vay ODA đều chưa đảm bảo tiêu chuẩn kỹ thuật và nhanh xuống cấp đến
mức báo động.
Ý thức của người tham gia giao thông chưa cao. Tình trạng kinh doanh vận chuyển hành
khách trên các tuyến đường một cách tự do và tự phát, khơng có tổ chức chặt chẽ nên thường
xảy ra tình trạng phóng nhanh vượt ẩu để tranh giành khách, nhồi nhét khách…. đã xảy ra
khơng ít tai nạn giao thơng thảm khốc.
1.2. Vai trị của cơng nghệ trong lĩnh vực giao thông vận tải
Việc ứng dụng các công nghệ tiên tiến trong giao thơng đường bộ có thể xem được bắt đầu
vào những năm 1950 của thế kỷ 20 bằng việc thay thế động cơ diesel trong cho các động cơ
hơi nước và sau đó là động cơ đốt trong cùng các động cơ điện. Cho đến năm 1989, do có
nhiều cơng nghệ tiến bộ như hệ thống GPS, Internet, cùng với sự ra đời của các hệ thống máy
tính có khả năng tính tốn lớn, động cơ đốt trong thế hệ mới, hệ thống đệm từ, giao thông
đường bộ có những bước tiến dài trong thiết kế, điều khiển, quản lý và khai thác.
1.3. Kết luận chương
Với tình hình thực tế hiện nay, cơng tác quản lý và khai thác hệ thống đường giao thông
ở Việt Nam cịn rất nhiều bất cập, thiếu tính đồng bộ đòi hỏi cần phải nghiên cứu sâu, rộng.
Một trong những vấn đề đó là cần thiết phải xây dựng một hệ thống cơ sở dữ liệu thống nhất,
đồng bộ về các cung đường. Để phù hợp với yêu cầu trên, cần xây dựng hệ cơ sở dữ liệu theo
mơ hình Hệ thống phân tán. Những năm gần đây, hệ cơ sở dữ liệu phân tán được phát triển
dựa trên cơ sở dữ liệu và mạng máy tính. Vấn đề hồn toàn mới là xây dựng và cài đặt một cơ
sở dữ liệu phân tán.
Chương 2. Về cơ sở dữ liệu phân tán
2.1. So sánh cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung
Cơ sở dữ liệu phân tán được thiết kế khác cơ sở dữ liệu tập trung.
Điều khiển tập trung: Điều khiển tập trung các nguồn thơng tin của cơng việc hay tổ chức.
Có người quản trị đảm bảo an toàn dữ liệu. Trong cơ sở dữ liệu phân tán: không đề cập đến
vấn đề điều khiển tập trung. Người quản trị cơ sở dữ liệu chung phân quyền cho người quản
trị cơ sở dữ liệu địa phương.
Độc lập dữ liệu: Tiện lợi chính của độc lập dữ liệu là các chương trình ứng dụng không bị
ảnh hưởng khi thay đổi cấu trúc vật lý của dữ liệu. Trong cơ sở dữ liệu phân tán, độc lập dữ
liệu có tầm quan trọng cũng như trong cơ sở dữ liệu truyền thống.
Giảm dư thừa dữ liệu: Trong cơ sở dữ liệu tập trung, tính dư thừa hạn chế được càng
nhiều càng tốt.
Cấu trúc vật lý và khả năng truy cập: người sử dụng truy cập đến cơ sở dữ liệu tập trung
phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết lập đường truyền...
Tính tồn vẹn, hồi phục và điều khiển tương tranh: trong cơ sở dữ liệu, tính tồn vẹn, hồi
phục và điều khiển đồng thời liên quan nhiều vấn đề liên quan lẫn nhau. Trong cơ sở dữ liệu
phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải
chuyển đổi các quỹ thời gian cho các giao tác liên tiếp. Như vậy giao tác tự trị là phương tiện
đạt được sự tồn vẹn trong cơ sở dữ liệu
Tính biệt lập và an toàn: trong cơ sở dữ liệu truyền thống, người quản trị hệ thống có
quyền điều khiển tập trung, người sử dụng có chắc chắn được phân quyền mới truy cập vào
được dữ liệu. Trong cách tiếp cận cơ sở dữ liệu tập trung không cần thủ tục điều khiển
chuyên biệt. Trong cơ sở dữ liệu phân tán, những người quản trị địa phương cũng phải giải
quyết vấn đề tương tự như người quản trị cơ sở dữ liệu truyền thống.
2.2. Ưu điểm và hạn chế của cơ sở dữ liệu phân tán
2.2.1. Ưu điểm
- Lợi điểm về tổ chức và tính kinh tế.
- Tận dụng những cơ sở dữ liệu sẵn có.
- Thuận lợi cho nhu cầu phát triển.
- Giảm chi phí truyền thơng.
- Tăng số cơng việc thực hiện.
- Tính dễ hiểu và sẵn sàng.
2.2.2. Hạn chế
- Phần mềm phức tạp và kinh phí tốn kém;
- Phải xử lý các thay đổi thông báo trong mọi địa điểm;
- Khó kiểm sốt tính tồn vẹn dữ liệu với nhiều bản sao dữ liệu được phân bố khắp mọi
nơi;
- Đáp ứng chậm nhu cầu của các trạm trong trường hợp các phần mềm ứng dụng không
được phân bố phù hợp với việc sử dụng chung.
Nói chung, kỹ thuật thiết kế cơ sở dữ liệu phân tán phức tạp nhưng hệ cơ sở dữ liệu phân tán
cũng cần thiết cho xu hướng phát triển kinh tế hiện nay.
2.3. Kiến trúc cơ bản của CSDL phân tán
Đây không là kiến trúc tường minh cho tất cả các CSDL phân tán, tuy vậy kiến trúc này thể
hiện tổ chức của bất kỳ một CSDL phân tán nào.
Sơ đồ tổng thể
Sơ đồ phân đoạn
Sơ đồ định vị
Sơ đồ ánh xạ địa phương 1
DBMS của vị trí 1
CSDL địa phương tại vị trí 1
Sơ đồ ánh xạ địa
phương 2
Các vị trí khác…
DBMS của vị trí 2
CSDL địa phương tại vị trí 2
Hình 2.1. Kiến trúc cơ bản của CSDL phân tán
2.4. Hệ quản trị cơ sở dữ liệu phân tán
Hệ quản trị cơ sở dữ liệu phân tán cung cấp công cụ như tạo lập và quản lý cơ sở dữ liệu phân
tán. Gồm:
- Phần quản lý cơ sở dữ liệu (DB)
- Phần truyền thông dữ liệu (DC)
- Từ điển dữ liệu(DD) được mở rộng để thể hiện thông tin về phân tán dữ liệu trong mạng
máy tính
- Phần cơ sở dữ liệu phân tán (DDB)
2.4.1. Phân loại hệ quản trị CSDL phân tán
(1) Hệ quản trị CSDL phân tán thuần nhất:
CSDLPT có được bằng cách chia một CSDL thành một tập các CSDL cục bộ và được quản
lý bởi cùng một hệ QTCSDL.
(2) Hệ quản trị CSDL phân tán không thuần nhất:
CSDLPT không thuần nhất được tích hợp bởi một tập các CSDL cục bộ được quản lý bởi các
hệ QTCSDL khác nhau. Hệ QTCSDLPT không thuần nhất thêm việc chuyển đổi các mơ hình
dữ liệu của các hệ QTCSDL khác nhau để thống nhất việc quản lý.
2.4.2. Mơ hình kiến trúc hệ quản trị CSDL phân tán
- Các hệ Client/Server;
- Hệ ngang hàng (Peer to Peer)
2.5. Thiết kế cơ sở dữ liệu phân tán
Các chiến lược thiết kế:
- Quá trình thiết kế từ trên xuống (top-down)
- Quá trình thiết kế từ dưới lên (Bottom-up)
Thiết kế CSDL phân tán gồm có các cơng việc sau:
- Thiết kế quan niệm;
- Thiết kế phân đoạn;
- Thiết kế cấp phát đoạn dữ liệu;
2.5.1. Thiết kế quan niệm
Thiết kế CSDL mức quan niệm: biến đổi đầu vào thành một cấu trúc CSDL quan niệm chất lượng
hơn, dựa trên một số tiêu chuẩn thiết kế.
Các mục tiêu thiết kế quan niệm:
Hai tiêu chuẩn quan trọng cần đạt được trong quá trình thiết kế cơ sở dữ liệu mức quan niệm:
- Cấu trúc CSDL kết quả (đầu ra của giai đoạn thiết kế quan niệm) cần đạt dạng chuẩn cao nhất;
- Cấu trúc CSDL kết quả phải tương đương với cấu trúc ban đầu;
Tiêu chuẩn về dạng chuẩn:
- Giảm tối đa sự trùng lặp thông tin, từ đó tránh được một số bất tiện khi cập nhật CSDL;
- Các phụ thuộc dữ liệu được kiểm tra dễ dàng nhất, đơn giản và tương đối ít tốn kém nhất;
Tiêu chuẩn tương đương: đảm bảo các thông tin trong quan hệ phổ quát sẽ được tìm thấy đầy
đủ trong CSDL của cấu trúc kết quả.
2.5.2. Phân đoạn dữ liệu
- Việc chia một quan hệ thành nhiều quan hệ nhỏ hơn được gọi là phân đoạn quan hệ.
- Quá trình phân mảnh phải được gắn liền với vấn đề cấp phát dữ liệu và bài toán cụ thể
như thế nào.
(1) Phân đoạn ngang:
Phân đoạn ngang 1 quan hệ tổng thể n-bộ R là tách R thành các quan hệ con n-bộ R1,R2,
…., Rk sao cho quan hệ R có thể được khôi phục lại từ các quan hệ con này bằng phép hợp: R
= R1 υ R2, υ …. υ Rk
Có 2 loại phân đoạn ngang:
Phân đoạn ngang nguyên thủy: phân đoạn ngang nguyên thủy của một quan hệ được thực
hiện dựa trên các vị từ được định nghĩa trên quan hệ đó.
Phân đoạn ngang dẫn xuất: phân đoạn ngang dẫn xuất của một quan hệ được thực hiện dựa
trên các vị từ được định nghĩa trên quan hệ khác.
-> Trong phân đoạn ngang, tập các vị từ đóng 1 vai trò quan trọng.
(2) Phân đoạn dọc:
Phân đoạn dọc 1 quan hệ tổng thể n-bộ R là tách R thành các quan hệ con R1,R2, …., Rk sao
cho quan hệ R có thể được khơi phục lại từ các quan hệ con này bằng phép nối:
R = R1
R2
….
Rk
(3) Phân đoạn hỗn hợp:
Phân đoạn một quan hệ thành các tập con và các bộ con:
- Các bộ con được xác định bởi phân đoạn dọc;
- Các tập con xác định bởi phân đoạn ngang;
Cho phép tối ưu hoá các câu hỏi chọn_chiếu hay kết nối_chiếu
Việc lựa chọn phân đoạn phụ thuộc vào nhu cầu truy nhập của các ứng dụng.
Các yêu cầu của việc phân đoạn:
- Tính đầy đủ: Nếu một quan hệ R được phân rã thành các đoạn R1, R2, …, Rk thì mỗi mục
dữ liệu trong R phải có trong ít nhất một đoạn Ri nào đó.
- Tính tái thiết được:
• Nếu 1 quan hệ R được phân rã thành các đoạn R1, R2, …, Rk thì phải tồn tại một tốn tử
sao cho R= (Ri) i.
• Tốn tử thay đổi tùy theo từng loại phân đoạn.
• Trong thực tế khi các đoạn được phân đoạn ngang thì là phép hợp, phân đoạn dọc thì
là phép nối và phân mảnh hỗn hợp thì là phép nối nửa.
- Tính tách biệt:
• Nếu 1 quan hệ R được phân mảnh ngang thành đoạn R1, R2, …, Rk và mục dữ liệu ti
nằm trong mảnh Ri thì nó sẽ khơng nằm trong một mảnh Rk, k ≠ i.
• Tiêu chuẩn này đảm bảo các mảnh ngang phải được tách rời nhau.
• Nếu quan hệ được phân mảnh dọc thì thuộc tính chung phải được lặp lại trong mỗi
mảnh. Do đó, trong trường hợp phân mảnh dọc tính tách biệt chỉ được định nghĩa trên
các trường không phải là thuộc tính chung của quan hệ.
2.5.3. Cấp phát dữ liệu
Giả sử có 1 tập các mảnh F={F1,F2,…,Fk} và một mạng máy tính bao gồm các vị trí
S={S1,S2,…,Sm} trên đó có 1 tập các ứng dụng Q= {Q1,Q2,…,Qq} đang thực thi.
Hãy tìm một phân phối tối ưu các mảnh F cho các vị trí S.
Một phân phối được gọi là tối ưu nếu thỏa mãn 2 yếu tố:
Chi phí nhỏ nhất: hàm chi phí bao gồm chi phí lưu mỗi mảnh dữ liệu Fi tại vị trí Sj, chi phí
vấn tin Fi tại vị trí Sj, chi phí cập nhật Fi tại tất cả các vị trí có chứa nó, và chi phí truyền dữ
liệu. Vì thế bài tốn cấp phát sẽ tìm một lược đồ cấp phát với hàm chi phí là cực tiểu.
Hiệu quả: chiến lược cấp phát được thiết kế nhằm cực tiểu hóa thời gian thực hiện và tăng
tối đa lưu lượng hệ thống tại mỗi vị trí.
Thơng tin cấp phát:
Thơng tin về cơ sở dữ liệu : độ tuyển của 1 mảnh Fj ứng với câu vấn tin qi – số lượng các
bộ của Fj cần được truy xuất để xử lý qi
Thông tin về ứng dụng: (i)truy xuất đọc do câu vấn tin qi thực hiện trên mảnh Fj trong mỗi
lần chạy của nó; (ii) các truy xuất cập nhật.
Thơng tin về vị trí : khả năng lưu trữ và xử lý của mỗi trạm.
Thơng tin về mạng: gij : chi phí truyền mỗi bó tin giữa 2 vị trí Si và Sj , dùng fsize(byte)
làm kích thước mỗi bó dữ liệu để tính số lượng thông báo.
Chương 3. Thiết kế, xây dựng cơ sở dữ liệu phân tán nhằm quản lý các cung
đường trên địa bàn Hải Phòng
3.1. Đảm bảo dữ liệu cho bài toán
Những người sử dụng ngân hàng dữ liệu các cung đường:
- Người quản lý: Các nhà quản lý thường quyết định phải làm gì, làm như thế nào và đánh giá
kết quả đạt được có đúng với kế hoạch ban đầu hay khơng. Các cơng việc đó phải trên cơ sở
thơng tin có giá trị và kịp thời. Phần lớn những quyết định này dựa trên số liệu thông tin và
sự phân tích các số liệu này. Do đó ban lãnh đạo là một trong những thành phần sử dụng
thông tin cụ thể nhất và nhiêm vụ của cấp cơ sở là cung cấp cho ban lãnh đạo thông tin cần
thiết và hữu ích.
- Các nhà đầu tư, các cơ quan lập quỹ: Những cơ quan, tổ chức đang dự tính đầu tư vào việc
nâng cấp, phát triển GTVT đều quan tâm đến kết quả thu được cả trong quá khứ. Sau khi đầu
tư các nhà đầu tư phải luôn ln theo dõi các thơng tin này.
- Người dân: có thể xem thông tin về hiện trạng các cung đường.
Dữ liệu đầu vào: Căn cứ vào phạm vi, quy mô và đối tượng, các yêu cầu số liệu đầu vào tại
mỗi trạm như sau:
1. Tên đường
2. Chiều dài
km
3. Loại mặt đường:
BT nhựa:
BTXM:
Cấp phối:
Đất:
4. Kiểu đường:
Liên quận:
Nội quận:
5. Loại đường (1÷5)
6. Hệ thống chiếu sáng:
Có:
Khơng:
7. Loại giao cắt:
Có kiểm sốt:
Khơng có kiểm sốt:
8. Giao cắt với đường sắt:
Có:
Khơng:
9. Tổ chức giao thơng:
Đường 1 chiều:
Đường 2 chiều có giải phân cách cứng:
Đường 2 chiều khơng có giải phân cách:
10. Mức độ hư hỏng(1÷7)
11. Hệ thống tín hiệu:
Có:
Khơng:
12. Mật độ lưu thơng:
Hình 3.1. Khuôn dạng dữ liệu đầu vào
3.2. Hạ tầng công nghệ thơng tin sử dụng trong bài tốn
3.2.1. Hệ quản trị Cơ sở dữ liệu SQL Server
Ưu điểm của Hệ quản trị CSDL:
- Quản lý được dữ liệu dư thừa;
- Đảm báo tính nhất quán cho dữ liệu;
- Tạo khả năng chia sẻ dữ liệu nhiều hơn;
- Cải tiến tính tồn vẹn cho dữ liệu.
Microsoft SQL Server là một hệ quản trị cơ sở dữ liệu quan hệ do Microsoft phát triển. SQL
Server hoạt động theo mơ hình Khách - Chủ cho phép đồng thời cùng lúc có nhiều người
dùng truy xuất đến dữ liệu, quản lý việc truy nhập hợp lệ và các quyền hạn của từng người
dùng trên mạng. Ngôn ngữ truy vấn quan trọng của Microsoft SQL server là Transact-SQL.
Transact-SQL là ngôn ngữ SQL mở rộng dựa trên SQL chuẩn của ISO và ANSI được sử
dụng trong SQL Server.
3.2.2. Visual Studio và Ngơn ngữ lập trình C sharp
Theo http:// www.microsoft.com/visualstudio [09]:
3.2.2.1. Visual Studio
a) Giới thiệu chung : Microsoft Visual Studio là mơi trường phát triển tích hợp chính
(Integrated Development Environment - IDE) được phát triển từ Microsoft. Đây là một loại
phần mềm máy tính có cơng dụng giúp đỡ các lập trình viên trong việc phát triển phần mềm.
Các mơi trường phát triển hợp nhất thường bao gồm:
- Một trình soạn thảo mã (source code editor): dùng để viết mã.
- Trình biên dịch (compiler) và/hoặc trình thơng dịch (interpreter).
- Cơng cụ xây dựng tự động: khi sử dụng sẽ biên dịch (hoặc thơng dịch) mã nguồn, thực
hiện liên kết, và có thể chạy chương trình một cách tự động.
- Trình gỡ lỗi: hỗ trợ dị tìm lỗi.
- Ngồi ra, cịn có thể bao gồm hệ thống quản lý phiên bản và các cơng cụ nhằm đơn giản
hóa cơng việc xây dựng giao diện người dùng đồ họa (GUI).
- Nhiều môi trường phát triển hợp nhất hiện đại cịn tích hợp trình duyệt lớp, trình quản
lý đối tượng, lược đồ phân cấp lớp,… để sử dụng trong việc phát triển phần mềm theo hướng
đối tượng.
Visual Studio hỗ trợ rất nhiều ngôn ngữ lập trình, có thể kể tên như sau: C/C++ ( Visual
C++), VB.NET (Visual Basic .NET), va C# (Visual C#)… cũng như hỗ trợ các ngôn ngữ
khác như F#, Python, và Ruby; ngồi ra cịn hỗ trợ cả XML/XSLT, HTML/XHTML,
JavaScript và CSS…
Những chức năng của Mirosoft Visual Studio: Microsoft Visual Studio có những chức năng
cơ bản sau: soạn thảo mã (code editor); Trình gỡ lỗi (debugger); và Thiết kế (Designer).
Trong đó chức năng Thiết kế được xem là một trong những điểm nhấn của Microsft Visual
Studio.
b) Visual Studio 2008 : Tốc độ: Với mỗi phiên bản, Microsoft luôn cố gắng cải thiện Visual
Studio để sao cho đạt được hiệu suất làm việc ngày càng cao hơn.
Tổng quan, Visual Studio 2008 được xây dựng dựa trên bộ ba trụ cột chính:
- Cải thiện hiệu năng sản phẩm;
- Hỗ trợ quản lý vòng đời ứng dụng;
- Sử dụng công nghệ mới;
Visual Studio 2008 đem tới cho nhà phát triển, nhóm phát triển những hỗ trợ chuyên biệt
như:
- Hỗ trợ phát triển cho thiết bị thông minh;
- Xây dựng các ứng dụng dựa trên nền Microsoft Office;
- Xây dựng ứng dụng tương thích Windows Vista;
- Nâng cao hiệu suất xử lý dữ liệu;
- Đem đến những trải nghiệm mới về web;
- Nâng cao hỗ trợ cho nhà phát triển;
- Hỗ trợ quản lý vịng đời ứng dụng chi tiết.
3.2.2.2. Ngơn ngữ lập trình C sharp
C# được coi như ngơn ngữ mang tính cách mạng của Microsoft. Ngơn ngữ C# là một ngôn
ngữ được dẫn xuất từ C và C++, nhưng nó được tạo từ nền tảng phát triển hơn. Microsoft bắt
đầu với công việc trong C và C++ và thêm vào những đặc tính mới để làm cho ngơn ngữ này
dễ sử dụng hơn. Nhiều trong số những đặc tính này khá giống với những đặc tính có trong
ngơn ngữ Java. Khơng dừng lại ở đó, Microsoft đưa ra một số mục đích khi xây dựng ngơn
ngữ này. Những mục đích này được được tóm tắt như sau:
- C# là ngôn ngữ đơn giản;
- C# là ngôn ngữ hiện đại;
- C# là ngôn ngữ hướng đối tượng;
- C# là ngôn ngữ mạnh mẽ và mềm dẻo;
- C# là ngôn ngữ có ít từ khóa;
- C# là ngơn ngữ hướng module;
- C# sẽ trở nên phổ biến;
Lựa chọn phiên bản để xây dựng ứng dụng thử nghiệm: Visual Studio 2008. Phiên bản này có
tích hợp sẵn SQL server 2005, ngơn ngữ lập trình: Visual C# .
3.2.3. Kết nối Visual Studio 2008 với CSDL SQL Server 2005
- Cài đặt bộ SQL Server Management Studio Express
- Mở VS 2008, Vào Tool → Connect to Server
- Kích chọn biểu tượng Connect to Database và điền các thông tin: server name, attach a
database file, …
- Nhấn Test Connection → OK
3.3. Phân tích, thiết kế cơ sở dữ liệu cung đường
Mục tiêu:
- Tìm kiếm, in ra các thông tin cần thiết.
- Báo cáo, tổng hợp kịp thời.
- Chương trình phải tổ chức cơ sở dữ liệu theo cơ chế phân quyền truy nhập tới từng cơ
sở dữ liệu để đảm bảo tính bảo mật.
- Chương trình phải có khả năng phân tán dữ liệu: sử dụng loại Hệ quản trị cơ sở dữ
liệu phân tán thuần nhất, kiến trúc ngang hàng, CSDL được thiết thế theo kiểu phân mảnh
ngang.
- Hệ thống phải có tính mở.
Lý do sử dụng CSDL phân tán:
Các tổ chức có cấu trúc phân tán: Đối với cơ cấu tổ chức quản lý trong ngành Giao thông
vận tải hiện nay, cấp cao nhất là Bộ, sau đó là các Sở, rồi tới các Phòng tại các quận huyện.
Như vậy, với cách tổ chức này, các cơ quan quản lý được phân tán ở các địa phương khác
nhau, trong khi đó, dữ liệu quản lý ngày càng lớn và phục vụ cho đa người dùng nằm phân
tán, vì vậy tổ chức CSDL theo kiểu phân tán là con đường thích hợp với cấu trúc tổ chức
quản lý.
Cần kết nối các CSDL có sẵn: CSDL phân tán là giải pháp tự nhiên khi có các CSDL đang ở
các trạm (các quận) và sự cần thiết xây dựng một ứng dụng toàn cục. Trong trường hợp này
CSDL phân tán được tạo theo tiến trình từ dưới lên dựa trên nền tảng CSDL đang tồn tại.
Tiến trình này đòi hỏi phải tái cấu trúc các CSDL cục bộ ở một mức nhất định.
3.3.1. Lược đồ quan niệm của CSDL
Trong quá trình tìm hiểu về cách tổ chức dữ liệu các cung đường, cần tổ chức các thực thể và
tiến hành chuẩn hoá chúng về dạng chuẩn 3 được các thực thể sau:
1. Quan: dùng để lưu trữ các thông tin về các quận trong thành phố, bao gồm các
thuộc tính sau:
- MaQuan: trường khố của thực thể Quan;
- TenQuan: tên các quận trong thành phố.
- PathServer: địa chỉ máy trạm
Hình 3.2. Bảng Quan
2. Duong
Mơ tả chi tiết các thông tin cần thiết về các cung đường, bao gồm các thuộc tính sau:
- MaDuong: trường khố của thực thể Duong
- MaQuan: lưu mã quận
- TenDuong: lưu tên đường
- ChieuDai: chiều dài đường
- MaLoaiMatDuong: Thuộc tính khóa của thực thể LoaiMatDuong
- MaKieuDuong: Thuộc tính khóa của thực thể KieuDuong
- HeThongChieuSang: Thuộc tính xác định đường có hệ thống chiếu sáng hay khơng
(True or False);
- MaLoaiGiaoCat: Thuộc tính khóa của thực thể LoaiGiaoCat
- GiaoCatVoiDuongSat: thuộc tính xác định đường có giao cắt với đường sắt hay khơng.
- MaToChucGiaoThong: Thuộc tính khóa của thực thể ToChucGiaoThong;
- MaMucDoHuHong: Thuộc tính khóa của thực thể MucDoHuHong;
- HeThongTinHieu: thuộc tính xác định đường có hệ thống tín hiệu đèn giao thơng hay
khơng.
- MatDoLuuThong: thuộc tính xác định mật độ xe lưu thơng.
Hình 3.3. Bảng Duong
3. LoaiMatDuong
Phân loại mặt đường(có các loại mặt đường sau: Bê tông nhựa, Bê tông xi măng(BTXM),
Cấp phối, Đất). Các thuộc tính:
MaLoaiMatDuong: trường khóa của thực thể LoaiMatDuong
TenLoaiMatDuong: thuộc tính xác định tên loại mặt đường
Hình 3.4. Bảng LoaiMatDuong
4. KieuDuong
Phân loại kiểu đường, gồm: Đường liên quận, Đường nội quận. Các thuộc tính:
MaKieuDuong: trường khóa của thực thể KieuDuong
TenKieuDuong: thuộc tính xác định tên kiểu đường.
Hình 3.5. Bảng KieuDuong
5. LoaiGiaoCat
Xác định Loại giao cắt (Có kiểm sốt, khơng có kiểm sốt). Các thuộc tính:
MaLoaiGiaoCat : Trường khóa của thực thể LoaiGiaoCat
TenLoaiGiaoCat: thuộc tính xác định loại giao cắt.
Hình 3.6. Bảng LoaiGiaoCat
6. ToChucGiaoThong
Xác định cách tổ chức đường giao thơng(đường 1 chiều, đường 2 chiều có giải phân cách
cứng, đường 2 chiều khơng có giải phân cách). Các thuộc tính:
MaToChucGiaoThong: Trường khóa của thực thể ToChucGiaoThong
TenToChucGiaoThong: thuộc tính xác định cách tổ chức giao thơng của đường.
Hình 3.7. Bảng ToChucGiaoThong
7. MucDoHuHong
Xác định mức độ hư hỏng của đường:
- Xếp loại 1 và 2: ít hoặc khơng có vết nứt hay biến dạng, tình trạng mặt đường tốt,
khơng cần sửa chữa hoặc cơng tác sửa chữa có thể trì hỗn được.
- Xếp loại 3 và 4: nứt nhưng khơng có hoặc ít biến dạng; tình trạng mặt đường không
tốt cần tiến hành sữa chữa không cần nghiên cứu gì thêm.
- Xếp loại 5, 6, 7: nứt và biến dạng trên diện rộng; tình trạng lớp mặt đường rất xấu và
tồi tệ cần sửa chữa lớn hoặc tiến hành trải thảm.
Các thuộc tính:
MaMucDoHuHong: trường khóa của thực thể MucDoHuHong
TenMucDo: thuộc tính xác định mức độ hư hỏng
MoTa: thuộc tính xác mơ tả mức độ hư hỏng.
Hình 3.8. Bảng MucDoHuHong
3.3.2. Phân đoạn dữ liệu
Tiêu chuẩn phân đoạn: theo quận, theo tên đường, mức độ hư hỏng, cách thức tổ chức, …
- Theo quận: Phân đoạn ngang quan hệ Quan và phân đoạn dọc các quan hệ còn lại để
truy xuất các thuộc tính có giá trị theo MaQuan: MaDuong, TenDuong, ChieuDai,
HeThongChieuSang, GiaoCatVoiDuongSat, HeThongTinHieu, MatDoLuuThong …
- Theo tên đường: phân đoạn dọc quan hệ Duong
- Theo mức độ hư hỏng: phân đoạn theo quan hệ MucDoHuHong
- Theo cách thức tổ chức: phân đoạn theo quan hệ ToChucGiaoThong
3.3.3. Định vị dữ liệu
Các dữ liệu liên quan đến một quận sẽ được đặt tại trạm của quận đó.
Các trạm khác(quận khác) có thể truy cập tới để tra cứu, thống kê thông tin.
3.4. Các chức năng chính
3.4.1. Tìm kiếm
- Tìm kiếm theo Quận;
- TÌm kiếm theo tên đường;
- Tìm kiếm theo mức độ hư hỏng của đường;
- Tìm kiếm theo cách thức tổ chức giao thơng;
Hình 3.9. Chức năng Tìm kiếm
3.4.2. Quản lý người dùng
Hình 3.10. Đăng nhập hệ thống
Hình 3.11. Quản lý người dùng
3.4.3.Quản lý dữ liệu đường
Hình 3.12. Quản lý đường
3.5. Kết luận chương
Trong chương thử nghiệm, luận văn đã thực hiện:
- Chương trình cài đặt thử nghiệm trên mạng LAN.
- CSDL ở các máy trạm tương đương nhau, các có thể truy cập tới CSDL ở các trạm khác.
Dữ liệu được cập nhật thường xuyên tại các trạm (quận) và được sao lưu để lưu trữ tại kho
cơ sở dữ liệu của thành phố (Sở giao thông).
- Hệ thống hoạt động theo kiểu CSDLPT ngang hàng (Peer – to- Peer).
Việc tổ chức, xử lí dữ liệu về giao thông mới đạt được một số kết quả thử nghiệm đơn giản,
có tính minh họa cho những tìm hiểu về lí thuyết cơ sở dữ liệu.
Kết luận
Kết quả đạt được
Luận văn có ý nghĩa đối với cá nhân học viên. Trong thời gian học tập sau đại học, được
sự động viên khuyến khích của cơ quan cơng tác, tơi muốn thực hiện tìm hiểu, nghiên cứu về
cách tổ chức những cơ sở dữ liệu về giao thông vận tải. Một trong số đó là vấn đề quản lý các
cung đường trên địa bàn Hải Phòng.
Việc ứng dụng CSDL phân tán để quản lý dữ liệu về các cung đường hiện nay là vấn đề
quan trọng và cần thiết cho những người làm công tác quản lý giao thông vận tải có cái nhìn
chính xác, và đưa ra quyết định kịp thời. Đồng thời, góp phần xây dựng ngân hàng dữ liệu
cho HDM-4.
Trong phạm vi thực hiện đề tài, qua quá trình tìm hiểu, tơi nhận thấy có thể áp dụng lý
thuyết về Cơ sở dữ liệu phân tán để thực hiện tổ chức dữ liệu giao thơng vận tải. Qua đó đã
thử nghiệm, thiết kế Cơ sở dữ liệu phân tán về các cung đường bộ trên địa bàn thành phố Hải
Phịng nhằm mục đích phục vụ trực tiếp cơng tác đào tạo trong trường.
Mặc dù đã rất cố gắng nhưng do thời gian và kiến thức có hạn, nên kết quả đạt được mới
chỉ là bước đầu.
Hướng nghiên cứu tiếp
Bên cạnh những vấn đề đạt được của luận văn, còn có một số vấn đề cần phát triển thêm như
hồn thiện và phát triển chương trình, quy mơ của bài toán ứng dụng.
References
[01]. Đỗ Trung Tuấn (1997), Cơ sở Dữ liệu, Nhà xuất bản Giáo dục.
[02]. Phạm Thế Quế (2009), Cơ sở dữ liệu phân tán, Nhà xuất bản Thông tin
Truyền thơng.
[03]. Giáo trình Cơ sở dữ liệu phân tán, Đại học KHTN- ĐHQGHN.
[04]. Giáo trình Cơ sở dữ liệu 2, Đại học Thái Nguyên.
[05]. Đồng Thị Bích Thủy, Bài giảng Cơ sở dữ liệu nâng cao, ĐHKHTN Hồ Chí
Minh.
[06]. M.Tamer Ozsu và Patricle Valduriez (1999), Principles of Distributed
Database Systems.
[07].
[08].
[09]. />