Tải bản đầy đủ (.pdf) (77 trang)

Nghiên cứu xây dựng bản đồ số hóa công nghiệp Việt Nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.61 MB, 77 trang )




Bộ công thơng
viện nghiên cứu điện tử, tự động, tin học hóa






Báo cáo tổng kết đề tài cấp bộ năm 2007

nghiên cứu xây dựng bản đồ số hóa
công nghiệp việt nam


Chủ nhiệm đề tài: Ths . lê văn lợi















6930
04/8/2008

hà nội - 2007

BỘ CÔNG THƯƠNG
VIỆN NGHÊN CỨU ĐIỆN TỬ, TIN HỌC, TỰ ĐỘNG HÓA
bac & dba









BÁO CÁO KẾT QUẢ NGHIÊN CỨU
ĐỀ TÀI CẤP BỘ NĂM 2007




NGHIÊN CỨU XÂY DỰNG
BẢN ĐỒ SỐ HÓA CÔNG NGHIỆP VIỆT NAM











Cơ quan chủ trì: VIỆN NC ĐIỆN TỬ, TIN HỌC, TỰ ĐỘNG HÓA
Chủ nhiệm đề tài: ThS. LÊ VĂN LỢI













HÀ NỘI 11/2007
i
BÁO CÁO TỔNG KẾT ĐỀ TÀI:
“Nghiên cứu xây dựng bản đồ số hóa
Công nghiệp Việt Nam











DANH SÁCH CÁN BỘ THỰC HIỆN ĐỀ TÀI

Chủ nhiệm đề tài: ThS. Lê Văn Lợi

TT Họ và tên Học vị Cơ quan
1 Lê Văn Lợi Thạc sỹ Viện NC Điện tử, Tin học, Tự động hoá
2 Nguyễn Đình Lượng Cử nhân Viện NC Điện tử, Tin học, Tự động hoá
3 Lê Đình Hanh Thạc sỹ Viện NC Điện tử, Tin học, Tự động hoá
4 Phạm Đình Thế Kỹ sư Viện NC Điện tử, Tin học, Tự động hoá
5 Nguyễn Kim Anh Kỹ sư Viện NC Điện tử, Tin học, Tự động hoá






“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:

2
MỤC LỤC
1 TỔNG QUAN 5
1.1 CƠ SỞ PHÁP LÝ/XUẤT XỨ CỦA ĐỀ TÀI 5
1.2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI 5
1.3 MỤC TIÊU NGHIÊN CỨU 5
1.4 ĐỐI TƯỢNG, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 6
1.4.1 Đối tượng nghiên cứu 6
1.4.2 Nội dung nghiên cứu 7
1.4.3 Phương pháp nghiên cứu 9
1.5 TÌNH HÌNH NGHIÊN CỨU NGOÀI NƯỚC 9
1.6 TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC 13
2 PHƯƠNG PHÁP TIẾN HÀNH NGHIÊN CỨU 13
2.1 PHÂN TÍCH ĐẶC ĐIỂM DỮ LIỆU CÔNG NGHIỆP 14
2.2 PHÂN TÍCH ĐẶC ĐIỂM CỦA CHUẨN O
PEN
GIS 16
2.2.1 Phương án tiếp cận 16
2.2.2 Cấu trúc phân cấp của các lớp đối tượng 17
2.2.3 Một số đặc điểm 18
2.2.4 Nhập dữ liệu 18
2.2.5 Phân tích dữ liệu Geometry 19
2.3 CẤU TRÚC DỮ LIỆU MAPINFO 19
2.4 SO SÁNH OPENGIS VÀ MAPINFO 20
2.5 LỰA CHỌN HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU 20
2.6 PHÂN TÍCH ĐẶC ĐIỂM THÔNG TIN ĐỊA LÝ 21
2.6.1 Longitude (kinh độ) và Latitude (vĩ độ) 21
2.6.2 Nền bản đồ và phương pháp zoom (phóng to, thu nhỏ), pan (dịch chuyển) 22
2.6.3 Thiết kế phần CSDL 24
2.6.4 Thiết lập CSDL ban đầu 29

2.6.5 Đọc dữ liệu từ các file .MIF và .MID 29
3 THIẾT KẾ HỆ THỐNG TỔNG QUAN 31
3.1 KIẾN TRÚC HỆ THỐNG QUẢN TRỊ NỘI DUNG 33
3.2 KIẾN TRÚC NHÂN VÀ GIAO TIẾP TRÌNH ỨNG DỤNG 35
4 KIẾN TRÚC VÀ GIẢI THUẬT MƠ TƠ TÌM KIẾM BÁN NGỮ NGHĨA 36
4.1 K
HÁI QUÁT
36
4.2 KIẾN TRÚC VÀ GIẢI THUẬT TÌM KIẾM 37
5 THIẾT KẾ PHẦN HIỂN THỊ BẢN ĐỒ 39
5.1 ĐẦU VÀO VÀ ĐẦU RA 39
5.2 TƯƠNG TÁC NGƯỜI DÙNG VÀ MODULE HIỂN THỊ 40
6 THIẾT KẾ GIAO DIỆN VÀ TƯƠNG TÁC TRANG CHỦ 42
6.1 THIẾT KẾ GIAO DIỆN 42
6.2 THIẾT KẾ TƯƠNG TÁC 43
QUẢN TRỊ NỘI DUNG VÀ CẬP NHẬT BẢN ĐỒ 49
6.3 SƠ ĐỒ LOGIC NGƯỜI DÙNG – CƠ SỞ DỮ LIỆU 49
6.4 QUI TRÌNH ĐĂNG NHẬP, ĐĂNG XUẤT 49
6.5 CƠ CHẾ SAO LƯU DỰ PHÒNG 50
6.6 CƠ CHẾ BẢO MẬT THÔNG TIN VÀ CẤP QUYỀN TRUY XUẤT 51
7 PHÂN MẢNH BẢN ĐỒ 54
7.1 LÝ DO PHÂN MẢNH 54
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:

3
7.2 CẤU TRÚC THƯ MỤC PHÂN MẢNH 54
7.3 QUI TRÌNH PHÂN MẢNH 55
7.4 QUAN HỆ GIỮA BẢN ĐỒ VEC-TƠ VÀ PHÂN MẢNH 55
7.5 TẠO DỰNG BẢN ĐỒ TỪ PHÂN MẢNH 56
8 ĐỊNH VỊ ĐỐI TƯỢNG TRÊN BẢN ĐỒ 56
8.1 KHÁI NIỆM VỀ ĐỊNH VỊ VÀ ĐỐI TƯỢNG TRÊN BẢN ĐỒ 56
8.2 BIỂU DIỄN THÔNG TIN ĐỊNH VỊ 57
9 CÁC CÔNG CỤ BẢN ĐỒ 59
9.1 CHÚ GIẢI 60
9.2 ĐO KHOẢNG CÁCH 61
9.3 TÍNH DIỆN TÍCH 61
10 KẾT LUẬN VÀ KIẾN NGHỊ 62
10.1 KẾT LUẬN ERROR! BOOKMARK NOT DEFINED.
11 TÀI LIỆU THAM KHẢO VÀ SỬ DỤNG 63

“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
4
DANH MỤC CÁC HÌNH VẼ
Hình 1: Khái niệm kinh độ, vĩ độ 21
Hình 2: Ảnh raster toàn bộ bề mặt trái đất 22
Hình 3: Nền bản đồ thế giới 22
Hình 4: Tọa độ màn hình của nền bản đồ thế giới 22

Hình 5: Mối quan hệ giữa cửa sổ hiển thị với bản đồ thật của thế giới 23
Hình 6: Bản đồ Việt nam với scale=5400, của sổ 500x400 23
Hình 7: Mối quan hệ giữa 2 mảng thông tin chính 24
Hình 8: Các mức zoom khi nhìn xuống bản đồ thế giới 27
Hình 9: Liên kết Lớp thông tin - geometry 28
Hình 10: Mô hình ứng dụng của IMAP 32
Hình 11: Luồng thông tin dưới góc độ kỹ thuật 33
Hình 12: Kiến trúc nhân và giao tiếp trình ứng dụng (API) 35
Hình 13: Mô hình cơ sở dữ liệu tri thức trong Semantic Search 37
Hình 14: Tiến trình tìm kiếm 38
Hình 15: Đầu vào và đầu ra của module hiển thị 40
Hình 16: Cơ chế hiển thị bản đồ từ CSDL 40
Hình 17: Giao diện bản đồ (bản beta) 42
Hình 18: Khuông nhìn cửa sổ hiển thị bản đồ 44
Hình 19: Thuyết minh vùng điều khiển 45
Hình 20: Giao diện vùng xem bản đồ theo địa chỉ 46
Hình 21: Giao diện vùng bản đồ chỉ dẫn 46
Hình 22: Giao diện danh mục công cụ bản đồ 47
Hình 23:Giao diện phần chú giải 47
Hình 24: Giao diện đo khoảng cách 48
Hình 25: Giao diện đo diện tích 48
Hình 26: Sơ đồ logic người dùng - cơ sở dữ liệu 49
Hình 27: Qui trình đăng nhập, đăng xuất 50
Hình 28: Cơ chế sao lưu dự phòng 51
Hình 29: Quá trình kiểm tra chức năng người dùng 53
Hình 30: Sơ đồ chức năng quản trị bảo mật thông tin 53
Hình 31: Sơ đồ ERD của bảo mật thông tin 54
Hình 32: Ghép bản đồ và khuông nhìn 56
Hình 33: Biểu diễn điểm khu công nghiệp 57
Hình 34: Biểu diễn điểm công ty công nghiệp 58

Hình 35: Biểu diễn thông tin tỉnh/thành phố 58
Hình 36: Biểu diễn thông tin quận/ huyện 59
Hình 37: Biểu diễn thông tin phường/xã 59
Hình 38: Biểu trưng trên chú giải và trên bản đồ 60
Hình 39: Tương tác giữa công cụ đo khoảng cách và phần di chuyển bản đồ 61
Hình 40: Tương tác giữa công cụ đo diện tích và phần di chuyển bản đồ 61

“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
5
1 TỔNG QUAN
1.1 CƠ SỞ PHÁP LÝ/XUẤT XỨ CỦA ĐỀ TÀI
Đề tài "Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam" được thực
hiện theo:
Hợp đồng Nghiên cứu khoa học và Phát triển công nghệ số 06-11RD/BCN-KHCN giữa Bộ
Công nghiệp (bên A) và Viện Nghiên cứu Điện tử, Tin học, Tự động hóa (bên B) ký ngày
26 tháng 01 năm 2006 – thực hiện năm 2006

Hợp đồng Nghiên cứu khoa học và Phát triển công nghệ số 140.07RD/HĐ-KHCN giữa Bộ
Công nghiệp – nay là Bộ Công Thương (bên A) và Viện Nghiên cứu Điện tử, Tin học, Tự
động hóa (bên B) ký ngày 06 tháng 02 năm 2007 – thực hiện năm 2007

1.2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI
- Việt Nam đang hội nhập với khu vực và toàn thế giới về tất cả các lĩnh vực công nghệ và

các ngành công nghiệp. Việc tổ chức, thu thập và giới thiệu các đặc điểm của các ngành
công nghiệp Việt Nam một cách hệ thống là rất cần thiết để xây dựng một hình ảnh rõ
nét hơn về các lợi thế của công nghiệp Việt Nam.

- Giới thiệu theo phương thức điện tử có nhiều ưu thế hơn hẳn so với giới thiệu bằng các
phương thức khác như xuất bản bằng giấy, phát thanh, truyền hình: thời gian cập nhật
nhanh, lưu trữ có hệ thống, xuất bản tức thời, thông tin thường trực 24/24, 7/7.

- Trong phương thức điện tử, bản đồ số hóa theo công nghệ GIS có ưu thế vượt trội vì
tính thân thiện và dễ tiếp cận với người dùng. Năm 2006, tập đoàn Gartner, chuyên
nghiên cứu các xu hướng phát triển của công nghệ đã có nhận định: “location-aware
applications will hit mainstream adoption in the next two to five years” – các ứng dụng
nhận biết vị trí sẽ trở thành xu thế chủ đạo trong vòng 2 đến 5 năm tới. Để có thể sẵn
sàng đón nhận xu thế này, chúng tôi thấy cần phải xây dựng ngay một lõi bản đồ mà trên
đó có thể biểu diễn dữ liệu công nghiệp theo phương thức nhận biết vị trí. Để xây dựng
được lõi công nghệ GIS, đòi hỏi nhóm thực hiện đề tài phải khảo sát kỹ các công nghệ
hiện có và đặc biệt là các xu thế mà các tập đoàn lớn làm về GIS đang theo đuổi.

1.3 MỤC TIÊU NGHIÊN CỨU
Ngay từ cuối năm 2005, khi xin xét duyệt đề cương thực hiện các đề tài, chúng tôi đã lập kế
hoạch cho từng năm nghiên cứu như các điểm trình bày dưới đây.

Năm 2006, đề tài đặt ra các mục tiêu cụ thể như sau:

- Nghiên cứu, thiết kế khung cơ sở dữ liệu cho việc lưu các tham số của các ngành công
nghiệp Việt Nam. Thiết kế này sẽ có tính mở để có thể xây dựng cơ sở dữ liệu theo lớp.
Như vậy khi các ngành, vùng, đặc điểm công nghiệp tăng lên thì khung sẽ tự thay đổi
một cách mềm dẻo để đáp ứng với dữ liệu thu thập được.

- Xây dựng các tính năng cơ bản của kỹ thuật bản đồ như pan, zoom, tìm kiếm, hiển thị

kết quả bằng đồ họa. Đặc biệt trong tìm kiếm thông tin, đề tài sẽ tìm kiếm theo tiếng Việt
với nhiều tùy chọn và tiêu chí khác nhau tùy theo nhu cầu của người dùng.
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
6

- Xây dựng bộ công cụ cho phép nhập dữ liệu từ các nguồn đã có theo các chuẩn đã
được thừa nhận hiện nay trên thế giới hoặc nhập dữ liệu trực tiếp.

- Tổ chức nhập dữ liệu theo bản đồ hành chính làm bản đồ nền. Trên cơ sở này nhập dữ
liệu của từng ngành được lựa chọn theo một thứ tự ưu tiên nhất định.

- Từng bước xây dựng mô tơ tìm kiếm theo văn bản và theo ngữ nghĩa.

-
Xây dựng Website nội bộ và tiến tới xây dựng website trực tuyến về công nghiệp Việt
Nam.

Năm 2007, đề tài đặt ra các mục tiêu cụ thể như sau:

-
Hoàn thiện thiết kế khung cơ sở dữ liệu cho việc lưu các tham số của các ngành công
nghiệp Việt Nam.


- Hoàn thiện các tính năng giao tiếp cơ bản của kỹ thuật bản đồ như pan, zoom, tìm kiếm,
hiển thị kết quả bằng đồ họa.

- Nghiên cứu thiết kế và xây dựng mô tơ tìm kiếm thông tin trên nền GIS, kết hợp phương
thức tìm kiếm toàn văn và tìm kiếm theo ngữ nghĩa sử dụng từ điển ngữ nghĩa đa ngữ.

- Nghiên cứu thiết kế xây dựng bộ công cụ cho phép soạn thảo trực tiếp bản đồ dựa trên
một nền có trước.

- Nghiên cứu thiết kế xây dựng module thống kê công nghiệp trên nền GIS.

- Xây dựng Website bản đồ công nghiệp trực tuyến trên Internet với các chức năng tham
chiếu, xem bản đồ trực tuyến, kết xuất dữ liệu bản đồ và tích hợp mô tơ tìm kiếm.

1.4 ĐỐI TƯỢNG, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
1.4.1 Đối tượng nghiên cứu
1. Khái niệm
Các bản đồ số hóa có tên chung là Hệ thống Thông tin Địa lý (GIS: Geographical Infromation
System). GIS là hệ thống thông tin cho phép người dùng có thể thu thập số liệu, quản trị và
phân tích số liệu đã thu thập được bằng giao diện bản đồ. Các thuộc tính của dữ liệu đều gắn
trực tiếp hoặc gián tiếp với các tham số địa lý. Mục tiêu của hệ thống GIS là tích hợp và biểu
diễn dữ liệu trên nền thông tin địa lý.

2. Phần mềm GIS
GIS được rất nhiều công ty phần mềm quan tâm và phát triển thành các thương phẩm
(MapInfo, ArcView, Google Maps, Google Earth, ). Các gói phần mềm này có ba dạng:
a - Dạng cài đặt trên Desktop, phân phối dưới dạng đóng gói;
b - Dạng sử dụng qua Web (không cần cài đặt, nhưng các bộ duyệt phải ở mức cao);
c - Dạng kết hợp – nghĩa là có cài đặt trên Desktop nhưng vẫn phải kết nối với Internet để
lấy dữ liệu từ máy chủ trung tâm về.


3. Đặc điểm
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
7
- Các gói phần mềm thuộc dạng a- có ưu thế là tốc độ cao vì cơ sở dữ liệu GIS được lưu
ngay trên máy. Bất lợi của phần mềm dạng này là tính phổ biến không cao vì nó chỉ chạy trên
một máy hoặc một số máy và các thay đổi, cập nhật của cơ sở dữ liệu chỉ mang ý nghĩa cục
bộ.
- Các gói phần mềm thuộc dạng b- có ưu thế là tính phổ biến rất cao, người nào cũng có thể
truy nhập được, chỉ cần kết nối máy vào Internet. Tuy nhiên, tốc độ xử lý chậm vì các giao
dịch đều phải trao đổi giữa Client (máy trạm) và Chủ (máy Server trên Internet). Google Maps
sử dụng phương án này.
- Các gói phần mềm dạng c- sử dụng khung dữ liệu sẵn có trên Desktop còn cơ sở dữ liệu để
trên máy chủ. Đặc điểm này cho phép phần mềm tải dữ liệu từ máy chủ về một lần trên
Desktop và sau đó sử dụng lại (cache dữ liệu). Google Earth sử dụng kỹ thuật này.

1.4.2 Nội dung nghiên cứu

Căn cứ trên mục tiêu cuối cùng là xây dựng được website GIS với đầy đủ tính năng của
một phần mềm hệ thống thông tin địa lý giới thiệu các vấn đề liên quan đến Công nghiệp
Việt Nam và do đề tài kéo dài trong 2 năm, nên chúng tôi lập kế hoạch theo từng năm như
sau:


Các nội dung nghiên cứu trong năm 2006:

06-1. Thiết kế CSDL bản đồ số hóa và nhập dữ liệu từ bản đồ hành chính: Lược đồ CSDL
về bản đồ chuẩn hóa theo ERD

06-2. Thiết kế và xây dựng phần nhập dữ liệu cho bản đồ: điểm, đường, vùng: Thiết kế
chức năng và phần coding cho việc nhập dữ liệu bản đồ để vẽ bản đồ nền: thiết kế
hướng đối tượng và giao diện thân thiện

06-3. Thiết kế và xây dựng phần nhập dữ liệu cho các lớp thông tin khác nhau trên bản đồ:
Thiết kế chức năng và phần mềm nhập dữ liệu bản đồ cho các lớp thông tin: thiết kế
hướng đối tượng và giao diện thân thiện

06-4. Thiết kế và xây dựng giao diện bản đồ với các chức năng ở mức đơn giản

06-5. Lập Website nội bộ và chạy thử nghiệm về bản đồ số hóa ngành công nghiệp Việt
Nam: Website nội bộ với các thông tin thử nghiệm ở mức đơn giản.

Các nội dung nghiên cứu trong năm 2007:

07-1. Hoàn thiện thiết kế khung cơ sở dữ liệu cho việc lưu các tham số của các ngành
công nghiệp Việt Nam.

07-2. Hoàn thiện các tính năng giao tiếp cơ bản của kỹ thuật bản đồ như pan, zoom, tìm
kiếm, hiển thị kết quả bằng đồ họa.

07-3. Nghiên cứu thiết kế và xây dựng mô tơ tìm kiếm thông tin trên nền GIS, kết hợp
phương thức tìm kiếm toàn văn và tìm kiếm theo ngữ nghĩa sử dụng từ điển ngữ
nghĩa đa ngữ.


“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
8
07-4. Nghiên cứu thiết kế xây dựng bộ công cụ cho phép soạn thảo trực tiếp bản đồ dựa
trên một nền có trước.

07-5. Nghiên cứu thiết kế xây dựng module thống kê công nghiệp trên nền GIS.

07-6. Xây dựng Website bản đồ công nghiệp trực tuyến trên Internet với các chức năng
tham chiếu, xem bản đồ trực tuyến, kết xuất dữ liệu bản đồ và tích hợp mô tơ tìm
kiếm.

Các nội dung điều chỉnh:

Do kế hoạch tổng thể của đề tài được lập vào cuối năm 2005, do tính chất phát triển không
ngừng của công nghệ và khảo sát thực tế các vấn đề liên quan đến công nghệ và công nghiệp,
trên cơ sở cân nhắc kỹ lưỡng, chúng tôi đã có các điều chỉnh như sau:

Điều chỉnh No. 1

Ngoài nội dung phát triển bản đồ trên nền Web, chúng tôi điều chỉnh nhân bản đồ để phát triển
bản đồ cho cả 3 hướng:

- trên nền Web: đã xây dựng website, phiên bản Beta tại địa chỉ:

- trên nền Desktop: phát triển trên Java, xem bản báo cáo chi tiết
- trên các thiết bị di động PDA, phát triển trên Java, xem bản báo cáo chi tiết

Điều chỉnh No. 2

Sau khi cân nhắc kỹ lưỡng, xét các đặc điểm trên cả ba nền Web, Desktop và PDA, chúng tôi
điều chỉnh nội dung 07-3 như sau:

Nội dung 07-3 cũ: “Nghiên cứu thiết kế và xây dựng mô tơ tìm kiếm thông tin trên nền GIS,
kết hợp phương thức tìm kiếm toàn văn và tìm kiếm theo ngữ nghĩa sử dụng từ điển ngữ
nghĩa đa ngữ” điều chỉnh thành:

Nội dung 07-3 mới: “Nghiên cứu thiết kế và xây dựng mô tơ tìm kiếm, sử dụng phương thức
tìm kiếm toàn văn làm lõi, kết hợp tìm kiếm theo ngữ nghĩa sử dụng từ điển ngữ nghĩa đa
ngữ - lấy việc biểu diễn thông tin chuẩn xác trên nền Web làm chủ đạo, sử dụng các
phương thức: tìm kiếm theo hành chính, tìm kiếm theo phân lớp”.

Điều chỉnh No. 3

Sau khi xem xét kỹ các công cụ trên các bộ phần mềm bản đồ của các hãng khác, và do đặc
điểm phát triển trên cả 3 nền Web, Desktop và PDA, chúng tôi điều chỉnh nội dung 07-4 thành 2
nội dung mới:

Nội dung 07-4 cũ: “Nghiên cứu thiết kế xây dựng bộ công cụ cho phép soạn thảo trực tiếp
bản đồ dựa trên một nền có trước”

Nội dung 07-4.a mới: “Nghiên cứu thiết kế xây dựng bộ công cụ cho phép soạn thảo trực
tiếp và gián tiếp dựa trên một nền có sẵn hoặc các bộ dữ liệu được chuyển đổi tư các phần
mềm khác”
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”


Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
9

Nội dung 07-4.b mới: “Nghiên cứu thiết kế xây dựng qui trình phân mảnh bản đồ dựa trên
bản đồ véc tơ thành cấu trúc phân mảnh đa cấp để có thể truy xuất, hiển thị trên Web,
Desktop và trên các thiết bị cầm tay PDA một cách thống nhất”

Điều chỉnh No. 4

Căn cứ vào thực tế sử dụng của bản đồ và xét thấy các nhu cầu tự nhiên của người dùng,
chúng tôi thêm nội dung hoàn toàn mới, tạm thời đánh số là 07-7:

Nội dung 07-7 (mới): “Nghiên cứu thiết kế và xây dựng bộ các bộ công cụ trực tuyến trên bản
đồ: công cụ chú giải tự động, công cụ đo khoảng cách trên bản đồ và công cụ đo diện tích trên
bản đồ”.

Điều chỉnh No. 5

Sau khi khảo sát thực tế và tham vấn ý kiến của Trung tâm Thông tin và Dự báo Kinh tế - Xã hội
quốc gia (thuộc Bộ Kế hoạch và Đầu tư), chúng tôi chỉnh nội dung của mục 07-5 thành như sau:

Nội dung 07-7 cũ: “Nghiên cứu thiết kế xây dựng module thống kê công nghiệp trên nền
GIS”


Nội dung 07-7 mới: “Nghiên cứu thiết kế cấu trúc thông tin ngành công nghiệp phục vụ việc cập
nhật và biểu diễn thông tin trên nên GIS”
1.4.3 Phương pháp nghiên cứu
- Sử dụng các qui trình, qui chuẩn hiện đại về xây dựng phần mềm đã được các công ty
hàng đầu thế giới áp dụng, đúc rút kinh nghiệm

- Đầu tư thích hợp các cấu thành phần cứng, các bước nghiên cứu cơ bản, tìm hiểu đầy
đủ về các chuẩn dữ liệu số, tham khảo chi tiết các đánh giá của các tổ chức thứ ba về
loại phần mềm tương tự đã được sản xuất thương mại hoặc sản xuất thử.

- Đào tạo, tập huấn và sử dụng các công cụ thiết kế phần mềm, công cụ phát triển phần
mềm, công cụ kiểm tra phần mềm, đánh giá mức hiệu dụng

- Lập thiết kế và phản biện thiết kế

- Lập nhóm quản lý chất lượng và test theo qui trình Alpha, Beta, Release Candidate

- Lập nhóm kiểm tra chéo sử dụng người dùng cuối đóng vai trò thẩm định

1.5 TÌNH HÌNH NGHIÊN CỨU NGOÀI NƯỚC
1. Khái niệm

Các bản đồ số hóa có tên chung là Hệ thống Thông tin Địa lý (GIS: Geographical Infromation
System). GIS là hệ thống thông tin cho phép người dùng có thể thu thập số liệu, quản trị và
phân tích số liệu đã thu thập được bằng giao diện bản đồ. Các thuộc tính của dữ liệu đều gắn
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa

TT Công nghệ Thông tin

Trang số:
10
trực tiếp hoặc gián tiếp với các tham số địa lý. Mục tiêu của hệ thống GIS là tích hợp và biểu
diễn dữ liệu trên nền thông tin địa lý. Nói một cách khác, GIS là một công cụ cho phép người
dùng có thể truy vấn thông tin địa lý, phân tích dữ liệu và soạn thảo chúng theo mục tiêu của họ.

2. Phần mềm GIS
GIS được rất nhiều công ty phần mềm quan tâm và phát triển thành các thương phẩm (MapInfo,
ArcGIS, Google Maps, Google Earth, ). Các gói phần mềm này có ba dạng:
- Dạng cài đặt trên Desktop, phân phối dưới dạng đóng gói;
- Dạng sử dụng qua Web (không cần cài đặt, nhưng các bộ duyệt phải ở mức cao);
-
Dạng kết hợp – nghĩa là có cài đặt trên Desktop nhưng vẫn phải kết nối với Internet để lấy
dữ liệu từ máy chủ trung tâm về.

3. Đặc điểm

- Các gói phần mềm thuộc dạng a- có ưu thế là tốc độ cao vì cơ sở dữ liệu GIS được lưu ngay
trên máy. Bất lợi của phần mềm dạng này là tính phổ biến không cao vì nó chỉ chạy trên một
máy hoặc một số máy và các thay đổi, cập nhật của cơ sở dữ liệu chỉ mang ý nghĩa cục bộ.
- Các gói phần mềm thuộc dạng b- có ưu thế là tính phổ biến rất cao, người nào cũng có thể
truy nhập được, chỉ cần kết nối máy vào Internet. Tuy nhiên, tốc độ xử lý chậm vì các giao dịch
đều phải trao đổi giữa Client (máy trạm) và Chủ (máy Server trên Internet). Google Maps sử
dụng phương án này.
- Các gói phần mềm dạng c- sử dụng khung dữ liệu sẵn có trên Desktop còn cơ sở dữ liệu để
trên máy chủ. Đặc điểm này cho phép phần mềm tải dữ liệu từ máy chủ về một lần trên Desktop
và sau đó sử dụng lại (cache dữ liệu). Google Earth sử dụng kỹ thuật này.


Phần lớn các phần mềm GIS đều là các phần mềm “công cụ” – nghĩa là người dùng sử dụng
chúng để tạo ra các bản đồ. Có một số website dựng sẵn, nhưng chúng có tính chất chung cho
rất nhiều lĩnh vực. Riêng về bản đồ công nghiệp, đáng chú ý có Industrial Map of India,
Romano-British Industries. Các bản đồ số này có thể tra cứu theo lĩnh vực (như automobiles,
khu khai thác quặng, lò gốm, ) Tuy vậy, các bản đồ này không có các chức năng cơ bản như
pan, zoom và tìm kiếm, hiển thị ngay trên bản đồ.

4. Lĩnh vực ứng dụng của GIS

GIS được ứng dụng trong nghiên cứu khoa học, quản lý tài nguyên, quản lý tài sản, đánh giá
tác động của môi trường, khoa nghiên cứu bản đồ, lập kế hoạch làm đường.
Trong tương lai, rất nhiều lĩnh vực sẽ lấy GIS làm nền. Khi thị trường GIS lớn, giá phần mềm và
phần cứng GIS sẽ giảm và xu thế này sẽ càng ngày được cải thiện, nghĩa là giá phần mềm và
phần cứng sẽ rẻ trong lúc chức năng của chúng vẫn không ngừng được nâng cấp. GIS dự đoán
sẽ được sử dụng nhiều trong các cơ quan chính phủ, trong kinh doanh, trong công nghiệp, với
các ứng dụng cụ thể như là quản lý bất động sản, quản lý các cơ quan chăm sóc sức khỏe, bản
đồ hóa các khu vực an ninh đáng lưu ý, trong quốc phòng, phát triển bền vững, quản lý các
nguồn lợi quốc gia, trong giao thông và logistics.
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
11
Hiện nay có xu thế sử dụng GIS cho các dịch vụ dựa trên địa điểm (Location-Based Service -
LBS). Dịch vụ LBS cho phép các thiết bị di động có gắn GPS (ô tô, điện thoại di động, PDA) biết
các dịch vụ gần nhất đang ở đâu (khách sạn, nhà hàng, ga tầu, ) và biết các đối tượng di động

khác đang ở đâu (bạn bè, các cháu nhỏ, xe công an). Các dịch vụ này đang ngày càng được
các nhà sản xuất tích hợp sẵn trong các thiết bị có gắn GPS.

5. Kỹ thuật sử dụng cho GIS

Công nghệ sử dụng cho GIS hiện đại đều số hóa. Một số kỹ thuật thường dùng là số hóa một
bản đồ có sẵn hoặc xây dựng dựa trên các tham chiếu địa lý.
5.1 – Liên kết thông tin từ nhiều nguồn khác nhau
Một trong những kỹ thuật thông thường nhất của GIS là liên kết các nguồn thông tin khác nhau
thành một nguồn thông tin chung dựa vào nền thông tin vị trí. Thông tin vị trí gồm các tọa độ x,
y, z trong không gian. Thông thường x và y là kinh độ và vĩ độ, còn z là cao độ (so với mặt nước
biển). Tuy nhiên, các dạng thông tin khác cũng có thể làm nền miễn là chúng biểu diễn cho giá
trị vị trí hoặc gián tiếp tham chiếu đến giá trị vị trí. GIS có thể được chuyển đổi từ các thông tin
số hóa có sẵn. Ví dụ, các ảnh chụp trái đất từ vệ tinh được đưa vào các CSDL GIS dưới dạng
ảnh quét.
5.2 – Biểu diễn dữ liệu
Dữ liệu GIS là dữ liệu của thế giới thực (đường phố, đồng bằng, rừng núi, khu dân cư, khu công
nghiệp, ) được mã hóa dưới dạng số. Các đối tượng này được chia làm hai loại chính: đối
tượng rời rạc (nhà, điểm đỗ xe) và các đối tượng liên tục (các cánh đồng, các dòng sông). Có 2
phương pháp lưu dữ liệu chủ yếu là Raster và Vector.
Raster: Ma trận các ô, mỗi ô chứa 1 giá trị. Dạng thông thường của raster là ảnh số. Mỗi ô, bên
cạnh giá trị màu của ô đó, còn có thể có 1 giá trị khác.
Vector: Dữ liệu dạng hình học như điểm, đường, đa giác. Dữ liệu dạng vector độc lập với
khuông nhìn (view).
Raster thường chiếm nhiều dung lượng lưu nhưng cho ảnh thực và các phép toán phủ nhiều
lớp dễ thực hiện hơn.
Dữ liệu dạng vector có thể thực hiện một cách dễ dàng phép toán phóng to, thu nhỏ. Ngược lại,
do dữ liệu dạng raster là ảnh nên khó thực hiện hơn. Một số thuộc tính của raster lại tỷ lệ theo
ảnh. Do đó, việc phóng to thu nhỏ lại càng khó thực hiện.
Dữ liệu dạng phi địa lý (dữ liệu không có thuộc tính địa lý như mã tỉnh thành phố, giá trị xuất

khẩu của một ngành công nghiệp, ). Dữ liệu dạng này sẽ được gắn với thuộc tính của vector.
6. Thu thập dữ liệu
Quá trình thu thập dữ liệu (nhập dữ liệu vào GIS) tiêu tốn nhiều thời gian và công sức. Có nhiều
phương thức:
6.1 - Các bản đồ có sẵn dưới dạng phim được quét thành raster và sử dụng các công cụ
chuyển sang dạng vector dựa vào các phương pháp nhận dạng điểm, đường và đa giác từ ảnh.
6.2 – Đo đạc địa hình: ghi dữ liệu và nhập hoặc chuyển trực tiếp từ các công cụ đo. Các bộ đo
sử dụng GPS cũng nằm trong loại thu thập dữ liệu theo phương pháp đo địa hình.
6.3 – Đo theo cảm biến từ xa (Remote sensed): dùng máy ảnh chụp, các máy quét hình, các
máy LIDAR. Các thiết bị này được đặt trên các máy bay thăm dò hoặc trên các vệ tinh.
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
12
Các ảnh số hóa hiện nay phần lớn được thực hiện chụp ảnh không gian (ảnh chụp từ máy bay,
khinh khí cầu, hoặc từ vệ tinh). Việc số hóa được thực hiện từ các trạm chụp – các trạm này
lấy ảnh gốc từ các ảnh stereo (ảnh giả không gian 3 chiều). Các hệ thống này cho phép xác
định được độ cao và kinh độ, vĩ độ từ ảnh (dựa trên nguyên lý của photogrammetry). Hiện nay,
các ảnh chụp là ảnh tương tự, sau đó được số hóa. Trong tương lai, các máy ảnh số sẽ cho ra
ảnh trực tiếp, không cần qua bước số hóa.
Ảnh từ vệ tinh lấy được dựa trên nguyên lý dùng một rada phát sóng và đo tín hiệu phổ điện từ
phản lại từ mặt đất.
Một số phần mềm GIS có công cụ chuyển đổi raster sang vector.
7 - Hình chiếu, hệ tọa độ và mốc tính toán
Khi vẽ bản đồ, người ta phải tìm cách thể hiện nó trên giấy hoặc trên màn hình máy tính. Hình

thức thể hiện này có tên gọi là phép chiếu (projection). Bên cạnh đó, dữ liệu được lưu bao giờ
cũng phải theo một hệ tọa độ nhất định. Giữa các phần mềm GIS cần có một chuẩn chung,
nghĩa là dữ liệu phải tương thích, mới có khả năng chuyển đổi dữ liệu từ GIS này sang GIS
khác. Các hệ thống GIS hiện nay đều sử dụng hệ thống kinh độ, vĩ độ và độ cao. Mô hình ở
mức đơn giản giả thiết quả đất tròn. Các mô hình chính xác hơn sử dụng các datum.
8 - Sử dụng GIS để phân tích dữ liệu
Một trong những ứng dụng đầu tiên là sử dụng GIS để phân tích các đặc điểm khí hậu của các
vùng trong một quốc gia: lượng mưa theo mùa, các loại hình đất,
Một loại ứng dụng cổ điển nữa là lập bản đồ các nguồn khoáng sản, nước ngầm, theo vùng
địa lý.
GIS còn dùng để phân tích các dịch vụ quanh một điểm (vùng) nào đó dựa vào vị trí địa lý của
điểm (vùng đó) và bản đồ các dịch vụ quanh đó – đo theo một khoảng cách nhất định. Đặc điểm
phân tích này cho phép truy vấn các loại dữ liệu (thuộc các lớp khác nhau) khi chọn một điểm
trên bản đồ.
Geostatistics là một môn khoa học dự báo dựa trên dữ liệu của GIS từ việc dự báo các mỏ
quặng đến vấn đề kiểm soát môi trường, Trong geostatistics người ta sử dụng một số công
cụ tính toán như Lý thuyết đồ thị (graph theory), đại số ma trận, và các phép toán nội suy. Dữ
liệu cho các phép tính này được lấy ra từ dữ liệu của GIS.
9 - Phần mềm GIS
Mã nguồn mở:
GRASS (Geographic Resources Analysis Support System) GIS:
MapServer:
PostGIS:
Phần mềm thương mại:
Autodesk:
ERDAS IMAGINE:
ESRI:
IDRISI:
Intergraph:
MapInfo:

“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
13
Phần mềm GIS là công cụ cho phép người dùng truy cập dữ liệu GIS, phân tích, xử lý, kết xuất
và hiển thị kết quả. Có rất nhiều phần mềm GIS dạng thương mại (trên đây liệt kê một số ít các
phần mềm nổi tiếng), dạng mã nguồn mở (chủ yếu mới phát triển gần đây) và mã nguồn chia
sẻ. Phần mềm thương mại được sử dụng nhiều nhất là của ESRI (ArcView, ArcGIS, ArcSDE,
ArcIMS và ArcWeb). Các cơ quan chính phủ, quân sự thường sử dụng theo thiết kế may đo,
trong đó có sử dụng mã nguồn mở và có lẽ là GRASS được dùng nhiều.
Xu thế chuyển đổi dần từ phần mềm đóng gói sang các phần mềm Client/Server trên mạng nội
bộ, sang sử dụng trên Internet và xây dựng các API.
1.6 TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC
Trong nước đã có một số công ty quan tâm phát triển phần mềm GIS, nhưng chủ yếu cung cấp
công cụ để vẽ bản đồ ở mức độ tổng quát, chứ không chuyên sâu về một lĩnh vực nhất định. Có
một số website cung cấp thông tin dưới dạng bản đồ nhưng tập trung vào một số dịch vụ như
đường phố, nhà hàng, khách sạn. Hiện tại, chưa có cơ quan nào cung cấp dịch vụ giới thiệu
ngành công nghiệp Việt Nam theo công nghệ GIS một cách chuyên nghiệp.

Sự cần thiết phải phát triển một bản đồ số hóa giới thiệu ngành Công nghiệp Việt Nam:
• Việt Nam đang hội nhập với khu vực và toàn thế giới về tất cả các lĩnh vực công nghệ và
các ngành công nghiệp. Việc tổ chức, thu thập và giới thiệu các đặc điểm của các ngành công
nghiệp Việt Nam là rất cần thiết để xây dựng một hình ảnh rõ nét hơn về các lợi thế của công
nghiệp Việt Nam.
• Giới thiệu theo phương thức điện tử có nhiều ưu thế hơn hẳn so với giới thiệu bằng các

phương thức khác như xuất bản bằng giấy, phát thanh, truyền hình: thời gian cập nhật nhanh,
lưu trữ có hệ thống, xuất bản tức thời, thông tin thường trực 24/24, 7/7.
• Trong phương thức điện tử, bản đồ số hóa theo công nghệ GIS có ưu thế vượt trội vì
tính thân thiện và dễ tiếp cận với người dùng. Mặt khác, các ngành công nghiệp thường phân
bố trên nền địa lý nên giới thiệu theo bản đồ là hợp logic.
Một số ngành, đơn vị có các website giới thiệu về lĩnh vực, ngành nghề của họ. Tuy nhiên, hầu
hết chỉ là các trang văn bản và nội dung giới thiệu thông thường chỉ gói gọn trong các hoạt động
của đơn vị đó. Việc xây dựng bản đồ số hóa dựa trên nền một cơ sở dữ liệu thống nhất sẽ làm
cho việc cập nhật, lưu trữ, giới thiệu và tìm kiếm thông tin có bài bản, toàn diện.
2 PHƯƠNG PHÁP TIẾN HÀNH NGHIÊN CỨU
Các bản đồ số hóa có tên chung là Hệ thống Thông tin Địa lý (GIS: Geographical Infromation
System). GIS là hệ thống thông tin cho phép người dùng có thể thu thập số liệu, quản trị và
phân tích số liệu đã thu thập được bằng giao diện bản đồ. Các thuộc tính của dữ liệu đều gắn
trực tiếp hoặc gián tiếp với các tham số địa lý. Mục tiêu của hệ thống GIS là tích hợp và biểu
diễn dữ liệu trên nền thông tin địa lý.
Để xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam, chúng ta cần đi theo một mô hình về
GIS. Sau khi khảo sát, xem xét các khía cạnh liên quan (cơ sở dữ liệu và đồ họa), mô hình
được chọn là OpenGIS ().

Trên cơ sở về mô hình, chúng tôi cần nghiên cứu kỹ các đặc điểm của mô hình này và đi đến
lựa chọn Hệ quản trị cơ sở dữ liệu, phương pháp và ngôn ngữ thể hiện các giao tiếp với cơ sở
dữ liệu, ngôn ngữ thể hiện đồ họa, ngôn ngữ phục vụ điều hành đồ họa.



“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa

TT Công nghệ Thông tin

Trang số:
14
2.1 PHÂN TÍCH ĐẶC ĐIỂM DỮ LIỆU CÔNG NGHIỆP

Cho đến tận thời điểm cuối năm 2005 và đầu năm 2006, sau khi khảo sát dữ liệu trên Internet
và tham khảo tài liệu các đơn vị quản lý, chúng tôi nhận thấy chưa có một tổ chức nào xuất bản
các thông tin ngành công nghiệp một cách có hệ thống và duy trì xuất bản một cách có định kỳ.

Để xây dựng được cơ sở dữ liệu về công nghiệp, có 2 mảng vấn đề cần được nghiên cứu và
thiết kế.

Vấn đề thứ nhất là nguồn dữ liệu. Dữ liệu về công nghiệp là loại dữ liệu sống – có nghĩa là thay
đổi theo thời gian. Do tính chất này, để có dữ liệu cập nhật, bắt buộc phải có một tổ chức chính
thống cung cấp hoặc/và phải có một cơ chế cập nhật thông tin.

Do đó, nguồn dữ liệu đòi hỏi nguồn lực về tài chính, kỹ thuật và nhân sự. Chúng tôi đã liên hệ
với Trung tâm Thông tin và Dự báo kinh tế - Xã hội Quốc gia, thuộc Bộ Kế hoạch và Đầu tư.
Vào thời điểm giữa năm 2007, Trung tâm chỉ có dữ liệu ở phạm vi kinh tế nói chung, chưa phân
định giữa công nghiệp và các ngành khác.

Ngay cả đối với Trung tâm, để có được dữ liệu, chúng tôi vẫn phải cần thực hiện các điểm sau:
- Có kinh phí để mua dữ liệu
- Có module chuyển đổi dữ liệu của Trung tâm thành dữ liệu trên bản đồ
- Có người nhập và chỉnh sửa dữ liệu định kỳ.

Vấn đề thứ hai là phân tích và xác định dữ liệu công nghiệp cần những tiêu chí và thuộc tính
nào.


Để giải quyết vấn đề trên, chúng tôi tìm kiếm thông tin trên Internet và các trang vàng, quảng
cáo, Vấn đề cần được quan tâm hàng đầu là tính chất chính thống của thông tin. Việc cung
cấp thông tin được nhìn dưới rất nhiều góc độ và nhiều khi phụ thuộc vào tính chất quảng bá
thông tin.

Chúng tôi cố gắng lược bỏ các loại thông tin mà ở đó, độ sai lệch rất nhiều hoặc quá phụ thuộc
vào tính chủ quan của người đưa tin.

Sau đây là đề xuất cấu trúc thông tin của chúng tôi:

1-/ Tần suất cập nhật thông tin: 6 tháng / 1 lần

2-/ Dạng thông tin: gồm 2 loại chính

Thông tin mang tính chất thống kê
Dạng thông tin này cần thêm thuộc tính thời gian:
6 tháng đầu năm năm N – đề nghị mã là N-0106. Ví dụ, 6 tháng đầu năm năm 2007 sẽ
là 2007-0106
6 tháng cuối năm năm N – đề nghị mã là N-0712. Ví dụ, 6 tháng cuối năm năm 2007 sẽ
là 2007-0712
Cả năm năm N – đề nghị mã là N-0112. Ví dụ, cả năm năm 2007 sẽ là 2007-0112

Thông tin gắn với đối tượng
Đối tượng ở đây được hiểu là:
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin


Trang số:
15
1. các ngành công nghiệp,
2. các tập đoàn kinh tế công nghiệp,
3. các tổng công ty 90-91,
4. các khu công nghiệp,
5. các trường đào tạo chuyên ngành công nghiệp,
6. các viện nghiên cứu công nghiệp,
7. các báo công nghiệp,
8. các công ty công nghiệp.

Nếu có thể được, chúng tôi đã đề nghị Trung tâm mã hóa tất cả các thông tin nói trên theo thứ
tự ưu tiên từ 1 đến 8. Mặt khác, chúng tôi cũng đề nghị Trung tâm cung cấp danh mục các
thông tin từ 1 đến 8.

Chúng tôi có các yêu cầu cụ thể trước mắt như sau:
Các ngành công nghiệp:
- Bia - rượu - nước giải khát
- Dầu khí
- Dệt may
- Đào tạo
- Điện lực
- Điện tử - Tin học
-
Giấy
- Hoá chất
-
Khoáng sản
- Máy công nghiệp

- Máy nông nghiệp
- Quản lý công nghiệp
- Than
- Thép
- Thiết bị điện
-
Thuốc lá
- Xây dựng công nghiệp

Chúng tôi đề nghị Trung tâm cung cấp thông tin các khu công nghiệp như sau:

1. Mã số khu công nghiệp
2. Vị trí địa lý
Diện tích nhỏ: 1 điểm (kinh độ, vĩ độ)
Diện tích trung bình, hình chữ nhật: góc trái trên của hình chữ nhật (kinh độ, vĩ độ) và góc
phải dưới của hình chữ nhật (kinh độ, vĩ độ)
Diện tích lớn: 1 polygon gồm nhiều điểm tạo thành một đa giác: (kinh độ, vĩ độ, kinh độ, vĩ
độ, kinh độ, vĩ độ, )
3. Tên khu công nghiệp
4. Thuộc địa giới hành chính:
Mã số tỉnh/thành phố
Tên Tỉnh/thành phố
Mã số quận/huyện
Tên quận/huyện
5. Địa chỉ
6. Thông tin liên hệ
Số điện thoại
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN


Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
16
Số fax
E-mail
7. Tổng diện tích đất (m
2
)
8. Thông tin mô tả khu công nghiệp (file đính kèm hoặc địa chỉ website)
9. Thông tin chủ đầu tư
Tên chủ đầu tư
Loại hình chủ đầu tư: Cơ quan Nhà nước, DN nước ngoài, DN trong nước,
Số điện thoại
Số fax
Email
Thông tin mô tả chủ đầu tư (file đính kèm hoặc địa chỉ website)
10. Ngày bắt đầu hoạt động
11. Thời hạn hoạt động: vĩnh viễn hoặc trong bao nhiêu năm
12. Các thông tin về điều kiện tham gia khu công nghiệp (file đính kèm hoặc địa chỉ website)
13. Danh mục các ngành nghề được phép hoạt động trong khu công nghiệp
Mã ngành
Tên ngành
14. Danh mục các công ty hiện đang hoạt động trong khu công nghiệp
Tên công ty
Số điện thoại liên hệ
Số fax
Email

Thông tin mô tả công ty hoặc file đính kèm hoặc địa chỉ Website (nếu có)
15. Ngày tháng năm thông tin trên đây được xuất bản
16. Nguồn thông tin (đơn vị cung cấp thông tin trên)

Tuy nhiên, trên thực tế, chúng tôi đã phải thu thập dữ liệu từ các nguồn khác. Lý do: thời điểm
chúng tôi đàm phán với Trung tâm là thời điểm sau khi các khoản chi phí của đề tài đã được
hoạch định.

2.2 PHÂN TÍCH ĐẶC ĐIỂM CỦA CHUẨN OPENGIS
Các công ty đề xướng chuẩn OpenGIS:
Environmental Systems Research Institute, Inc., IBM, Informix, MapInfo, Oracle

OpenGIS là chuẩn về hệ quản trị (HQT) cơ sở dữ liệu (CSDL). Mục tiêu của chuẩn này là định
nghĩa một lược đồ SQL cho phép trích xuất, truy vấn và cập nhật CSDL đối với các tuyển GIS
thông qua các giao tiếp ODBC. Chuẩn này đưa ra các khái niệm thuộc tính không gian và phi
không gian. Các thuộc tính không gian ở đây là các thuộc tính có gắn đặc điểm địa lý, là các đặc
tính đơn giản nội suy từ không gian hai chiều.
2.2.1 Phương án tiếp cận

Môi trường của OpenGIS là chuẩn SQL92. OpenGIS thêm một số đặc điểm vào SQL92.
Các dữ liệu về không gian được chứa trong các bảng. Các bảng có các cột mang thuộc tính
không gian. Chuẩn mở rộng có tên là SQL92 with Geometry Types.

– Các đối tượng được định nghĩa trong Hệ thống tham chiếu không gian
– Đối tượng có tên là Geometry
– Một Geometry phải thuộc vào một lớp nào đó (mô hình OO – hướng đối tượng)

“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN


Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
17
2.2.2 Cấu trúc phân cấp của các lớp đối tượng

• Geometry (non-instantiable)
• Point (instantiable)
• Curve (non-instantiable)
• LineString (instantiable)
• Line
• LinearRing
• Surface (non-instantiable)
• Polygon (instantiable)
• GeometryCollection (instantiable)
• MultiPoint (instantiable)
• MultiCurve (non-instantiable)
• MultiLineString (instantiable)
• MultiSurface (non-instantiable)
• MultiPolygon (instantiable)

l Lớp Geometry
– Type
– SRID
– Coordinates
– interior, boundary, và exterior
– MBR (Minimum Bounding Rectangle),


simple
/
non-simple

– closed / not closed
– empty / non-empty
– Dimension (0, 1, 2)

l Lớp Point
– Một điểm trong hệ tham chiếu không gian
– Ví dụ: vị trí các công ty công nghiệp, các khu công nghiệp
– Các thuộc tính
• Tọa độ X
• Tọa độ Y
• Dimension: 0
• MBR: chính nó


l Lớp Curve
– Được định nghĩa từ một dãy các điểm
– Là lớp trừu tượng (abstract)
– Các thuộc tính
• Tọa độ các điểm
• Curve là simple nếu nó không đi qua một điểm nào 2 lần.
• Dimension: 1
• MBR: hình chữ nhật bao


l Lớp LineString
– Đường nội suy từ một dãy các điểm


Ví dụ: các tuyến đường bộ, đường sắt, đường trong các thành phố
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
18
– Các thuộc tính
• Các đoạn nối nhau liên tiếp
• Là một đường nếu chỉ có 2 điểm.
• LineString là LinearRing nếu nó simple và closed.
• Dimension: 1
• MBR: hình chữ nhật bao

l Lớp Surface, Polygon
– Đa giác phẳng, chúng có thể bao nhau
– Ví dụ: tỉnh, huyện, xã, …
– Các đặc điểm
• Bao polygon là LinearRing

Các polygon không cắt chéo nhau.
• Polygon có thể có khuyên ở trong.
• Dimension: 2
• MBR: hình chữ nhật bao



l Lớp Multipoint, MultiCurve, MultiLineString, MultiSurface, MultiPolygon
– Chúng là các lớp đặc biệt vì chúng chứa các đối tượng thuộc các lớp con tương
ứng
– Các đặc điểm
• Các thành phần không cắt chéo nhau.
• MBR: hình chữ nhật bao tất cả các thành phần con

2.2.3 Một số đặc điểm
– Đường trong OpenGIS là các đường thẳng, không có đường cung (khác với
MapInfo)
– OpenGIS không có “văn bản” (khác với MapInfo)
– OpenGIS không qui định cấu trúc đối tượng nên cần có cách chuyển đổi giữa các đối
tượng của OpenGIS và các dạng thức thông thường khác

2.2.4 Nhập dữ liệu

Sử dụng chủ yếu 2 dạng thức là văn bản và nhị phân. Phần nhị phân chúng tôi không giới
thiệu ở đây.

– Well-Known Text (WKT) Format
• POINT(15 20)
• LINESTRING(0 0, 10 10, 20 25, 50 60)
• POLYGON((0 0,10 0,10 10,0 10,0 0),(5 5,7 5,7 7,5 7, 5 5))
• MULTILINESTRING((10 10, 20 20), (15 15, 30 15))

MULTIPOLYGON(((0 0,10 0,10 10,0 10,0 0)),((5 5,7 5,7 7,5 7, 5 5)))
• GEOMETRYCOLLECTION(POINT(10 10), POINT(30 30),
LINESTRING(15 15, 20 20))
– Well-Known Binary (WKB) Format


l
Tạo dữ liệu cho các đối tượng (ví dụ lấy từ MySQL)

“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
19
• GeomCollFromText(wkt[,srid]) ,
• GeometryCollectionFromText(wkt[,srid])
• GeomFromText(wkt[,srid]) , GeometryFromText(wkt[,srid])
• LineFromText(wkt[,srid]) , LineStringFromText(wkt[,srid])
• MLineFromText(wkt[,srid]) , MultiLineStringFromText(wkt[,srid])
• MPointFromText(wkt[,srid]) , MultiPointFromText(wkt[,srid])
• MPolyFromText(wkt[,srid]) , MultiPolygonFromText(wkt[,srid])
• PointFromText(wkt[,srid])
• PolyFromText(wkt[,srid]) , PolygonFromText(wkt[,srid])

2.2.5 Phân tích dữ liệu Geometry
• Các hàm chuyển đổi dữ liệu
– AsBinary(g)
– AsText(g)
– GeomFromText(wkt[,srid])
– GeomFromWKB(wkb[,srid])
• Các hàm đặc trưng khác (không liệt kê)
• Hàm đáng chú ý

– Area(mpoly)
– Centroid(mpoly)
– MBRContains(g1,g2)
– MBRDisjoint(g1,g2)
– MBRIntersects(g1,g2)

2.3 CẤU TRÚC DỮ LIỆU MAPINFO

l Vì sao NC cấu trúc dữ liệu MapInfo
– MapInfo rất phổ biến ở VN

Dữ liệu mua được hiện nay đều ở dạng này
l Cấu trúc internal của MapInfo không mở
l Cấu trúc xuất dữ liệu của MapInfo mở
– MIF File Header
– MIF Data Section
– MID File

l MIF File Header
– VERSION n
– Charset ”characterSetName”
– [ DELIMITER ”<c>” ]
– [ UNIQUE n,n ]
– [ INDEX n,n ]
– [ COORDSYS ]
– [ TRANSFORM ]
– COLUMNS n
– <name> <type>
– <name> <type>
– .

– .
– DATA
“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
20

l Cấu trúc COLUMNS – quan hệ giữa MIF và MID
– COLUMNS là cấu trúc bảng của MID
– Có bao nhiêu cột và dữ liệu loại nào
– Mỗi một geometry ở MIF tương ứng với một bản ghi ở MID
– Bản ghi của MID được ghi ở file text, dữ liệu cột này với cột kia cách nhau bởi
dấu phẩy

Dữ liệu hiện nay chỉ ở dạng byte, chưa có dữ liệu dạng Unicode

l Các dạng dữ liệu Geometry của MapInfo
1. NONE
2. point
3. line
4. polyline
5. region
6. arc
7. text
8. rectangle

9. rounded rectangle
10. ellipse
11. multipoint
12. collection

2.4 SO SÁNH OPENGIS VÀ MAPINFO

l OpenGiS có cấu trúc đơn giản hơn
– Hướng đối tượng
– Ngoài cấu trúc, còn định nghĩa các phép toán
l MapInfo có cấu trúc nhiều loại hơn
– Một số cấu trúc có vẻ như “không chuẩn”: arc, text, ellipse

2.5 LỰA CHỌN HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU

Theo truyền thống và kinh nghiệm sử dụng, chúng tôi vẫn thường chọn MySQL. MySQL là hệ
quản trị cơ sở dữ liệu mã nguồn mở cung cấp dưới dạng Dual License: hoặc GNU General
Publicc License (GPL). Chúng tôi sử dụng GPL license.

MySQL là HQT CSDL quan hệ. MySQL tuân thủ các câu lệnh chuẩn của các chuẩn phổ thông
như SQL92, SQL99 và SQL2003. Tuy nhiên, MySQL không yểm trợ một cách đầy đủ các chuẩn
này. Mặt khác MySQL lại có phần mở rộng mang đặc trưng riêng của nó.

Qua thực tế sử dụng, MySQL là một phần mềm rất ổn định, và theo kinh nghiệm của chúng tôi
là dễ sử dụng.

Đối với môi trường Web, hiện tại MySQL là HQT CSDL được sử dụng rộng rãi nhất.

Kể từ phiên bản 4.0, MySQL hỗ trợ mô hình OpenGIS đối với Engine MyISAM. Kể từ phiên bản
5.0, MySQL hỗ trợ OpenGIS ở tất cả các engine.


“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
21
Tuy nhiên, do hiện nay trên các ISP, các gói MySQL vẫn còn các phiên bản thấp (4. là chủ yếu)
nên chúng tôi chỉ sử dụng mô hình mà không sử dụng các thuộc tính đặc trưng.

2.6 PHÂN TÍCH ĐẶC ĐIỂM THÔNG TIN ĐỊA LÝ
2.6.1 Longitude (kinh độ) và Latitude (vĩ độ)
Để tìm đọc kỹ hơn về các khái niệm trên, tham khảo:


Mọi điểm trên trái đất đều được xác định bởi cặp (kinh độ, vĩ độ). Độ: °, Phút: ‘, giây: ”.
1 độ = 60 phút, 1 phút = 60 giây.

Vĩ độ: = 0 ở xích đạo, phía bắc: độ bắc (dương) tăng dần về phía bắc, phía nam độ nam (âm)
giảm dần về phía nam (từ -90 độ đến + 90 độ).
Kinh độ: = 0 ở Greenwich, England, độ đông (dương) tăng dần về hướng đông, độ tây (âm)
giảm dần về hướng tây (từ -180 độ đến + 180 độ).























Hình 1: Khái niệm kinh độ, vĩ độ

Tuy nhiên, khi vẽ bản đồ ta sử dụng số đo theo hệ thập phân, đổi phút và giây thành thập phân
– các phần mềm khác cũng theo cách này.

Ta tưởng tượng bề mặt trái đất trải rộng theo hình chữ nhật – ta được một hình chữ nhật có
chiều rộng gấp đôi chiều dài.

“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN

Viện NC Điện tử, Tin học, Tự động hóa

TT Công nghệ Thông tin

Trang số:
22

Hình 2: Ảnh raster toàn bộ bề mặt trái đất
Tất nhiên, cực bắc và cực nam trên ảnh bị méo mó, không thật. Nhưng đối với các phần khác
có thể coi là phẳng và bản đồ ta xử lý được giả thiết là nằm trên mặt phẳng.

2.6.2 Nền bản đồ và phương pháp zoom (phóng to, thu nhỏ), pan (dịch chuyển)

Nền bản đồ thế giới là một hình chữ nhật có chiều rộng gấp đôi chiều cao. Sở dĩ như vậy vì trục
X tương ứng với kinh độ chạy từ -180 độ đến + 180 độ (360 độ) còn chiều cao chạy từ -90 độ
đến 90 độ (180 độ).











Hình 3: Nền bản đồ thế giới
Zoom: Việc phóng to, thu nhỏ tương đương với tăng và giảm giá trị của scale.

Tuy nhiên, khi vẽ trên màn hình ta phải theo tọa độ màn hình, nghĩa là trục Y tăng dần từ trên
xuống và điểm gốc tọa độ là góc trái trên










Hình 4: Tọa độ màn hình của nền bản đồ thế giới
Chuyển đổi: giả thiết ta có một điểm có kinh độ $long và vĩ độ $lat, vẽ trên một nền hình chữ
nhật có chiều rộng $width và chiều cao $height, thì tọa độ mới trong hình chữ nhật đó sẽ là:


scale




-90
+90

-180
+18
2 x
scale

“Nghiên cứu xây dựng bản đồ số hóa ngành Công nghiệp Việt Nam”

Mã số đề tài: 140.07RD/HĐ-KHCN


Viện NC Điện tử, Tin học, Tự động hóa
TT Công nghệ Thông tin

Trang số:
23
$x = (($long +180) / 360) * $width
$y = ((($lat * -1) + 90) / 180) * $height

Tuy nhiên, ta chỉ “soi” một phần của bản đồ. Do đó, mối quan hệ giữa cửa sổ hiển thị bản đồ so
với bản đồ thật của thế giới được thể hiện như trong hình vẽ sau:











Hình 5: Mối quan hệ giữa cửa sổ hiển thị với bản đồ thật của thế giới

Các giá trị chiều rộng, chiều cao của cửa sổ hiển thị là các hằng số, không biến thiên. Vấn đề
còn lại là xác định giá trị zoom (scale trong hình 5) và điểm góc trái trên của cửa sổ (hoặc điểm
tâm của cửa sổ) để xem một vùng nào đó theo chỉ định của người dùng.

Pan: Dịch chuyển cửa sổ - đồng nghĩa với việc dịch chuyển điểm trái trên hoặc tâm của cửa sổ


Nếu ta chọn tâm là (109 độ kinh đông, 16 độ vĩ bắc), cửa sổ (500 x 450) và zoom là 5400, ta
được hình sau:


Hình 6: Bản đồ Việt nam với scale=5400, của sổ 500x400

Vì chúng ta chỉ xét bản đồ Việt Nam nên việc di chuyển ra khỏi biên giới của Việt Nam là vô
nghĩa (mà thực tế ta cũng không có thông tin ngoài biên giới) nên ta phải giới hạn điểm tâm phải
nằm trong khoảng xác định: từ kinh độ nào đến kinh độ nào và từ vĩ độ nào đến vĩ độ nào. Về

scale

2 x
scale

min_y

min_x

×