Tải bản đầy đủ (.doc) (50 trang)

THUYẾT MINH TIÊU CHUẨN CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D (SỐ HÓA, TẠO LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (441.44 KB, 50 trang )

BỘ THÔNG TIN VÀ TRUYỀN THÔNG

THUYẾT MINH TIÊU CHUẨN
CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ
LIỆU SỐ 2D (SỐ HÓA, TẠO LẬP METADATA CẤU
TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU)

HÀ NỘI - 2017

1


2


Mục lục

1 GIỚI THIỆU.................................................................................................................................................. 2
1 GIỚI THIỆU.................................................................................................................................................. 2
1.1 TÊN GỌI CỦA TIÊU CHUẨN VIỆT NAM
1.2 KÝ HIỆU CỦA TCVN
1.3 MỤC ĐÍCH CHUNG
1.4 MỤC ĐÍCH CỦA VIỆC XÂY DỰNG TIÊU CHUẨN

2
2
2
2

2 TÌNH HÌNH TRONG VÀ NGOÀI NƯỚC........................................................................................................... 4
2 TÌNH HÌNH TRONG VÀ NGOÀI NƯỚC........................................................................................................... 4


3 CƠ SỞ XÂY DỰNG CÁC YÊU CẦU KỸ THUẬT................................................................................................ 22
3 CƠ SỞ XÂY DỰNG CÁC YÊU CẦU KỸ THUẬT................................................................................................ 22
3.1 PHÂN TÍCH CÁC TÀI LIỆU TIÊU CHUẨN
3.2 LỰA CHỌN TÀI LIỆU TIÊU CHUẨN
3.3 HÌNH THỨC XÂY DỰNG TIÊU CHUẨN
3.4 PHƯƠNG PHÁP XÂY DỰNG TIÊU CHUẨN

22
40
42
42

4 NỘI DUNG TIÊU CHUẨN............................................................................................................................. 42
4 NỘI DUNG TIÊU CHUẨN............................................................................................................................. 42
4.1 TÊN GỌI TIÊU CHUẨN
4.2 BỐ CỤC TIÊU CHUẨN
4.3 BẢNG ĐỐI CHIẾU NỘI DỤNG DỰ THẢO VÀ CÁC TÀI LIỆU THAM KHẢO

42
43
44

THƯ MỤC TÀI LIÊU THAM KHAO.................................................................................................................. 47
THƯ MỤC TÀI LIÊU THAM KHAO.................................................................................................................. 47

1


THUYẾT MINH TIÊU CHUẨN
CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D

(SỐ HÓA, TẠO LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ
TẢ DỮ LIỆU)

1 Giới thiệu
1.1 Tên gọi của tiêu chuẩn Việt Nam
CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D (SỐ HÓA, TẠO
LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU)
1.2 Ký hiệu của TCVN
TCVN XXXX:201X
1.3 Mục đích chung
Đáp ứng mục tiêu của dự án “Xây dựng chuẩn thông tin số và chuẩn trao đổi thông tin”
của Bộ Thông tin và Truyền thông: “Bảo đảm sự phát triển ứng dụng công nghệ thông tin
nói chung, công nghiệp phần mềm và công nghiệp nội dung số nói riêng được phát triển
thống nhất, đồng bộ theo một kiến trúc quy hoạch tổng thể Công nghệ thông tin và Truyền
thông Quốc gia với một hạ tầng thông tin hiện đại, tốc độ cao và môi trường pháp lý phù
hợp”;
1.4 Mục đích của việc xây dựng tiêu chuẩn

Các năm gần đây, một trong các biện pháp quản lý tài liệu lưu trữ đã được nhắc đến là
số hóa tài liệu và trong xã hội đã manh nha thị trường các dịch vụ số hóa tài liệu lưu
trữ. Luật lưu trữ do Quốc hội thông qua ngày 11/11/2011 đã quy định về tài liệu lưu
trữ điện tử, không quy định chi tiết đến tài liệu lưu trữ số hóa. Chúng ta có thể hiểu
tóm tắt tài liệu điện tử là một bản ghi được tạo ra, gửi, chuyển giao, nhận được, hoặc
lưu trữ, sử dụng bằng phương tiện điện tử. Tài liệu điện tử được hình thành từ hai
nguồn chính:
-

Một là, bản ghi các thông diệp dữ liệu được khởi tạo từ đầu;

-


Hai là, bản ghi các dữ liệu số từ tài liệu truyền thống.

2


Vậy, tài liệu số hóa có nguồn gốc từ tài liệu điện tử, nhưng không đồng nhất với tài
liệu điện tử. Tài liệu số hóa trở thành tài liệu điện tử qua quá trình số hóa dữ liệu. Đây
là quá trình chuyển các dạng dữ liệu truyền thống như các bản viết tay, bản in trên
giấy, hình ảnh… sang chuẩn dữ liệu trên các phương tiện điện tử và được các phương
tiện đó nhận biết được gọi là số hóa dữ liệu và chúng trở thành dữ liệu số.
Từ đó, về mặt lý thuyết, ta hiểu số hóa dữ liệu là quá trình chuyển các dạng dữ liệu
truyền thống sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết.
Để việc số hóa dữ liệu được hiệu quả và chính xác thì việc áp dụng quy trình số hóa
theo chuẩn là điều cần thiết.
Quy trình số hóa dữ liệu 2D là quá trình chuyển các dạng dữ liệu truyền thống như các
bản viết tay, bản in trên giấy, hình ảnh… sang chuẩn dữ liệu trên các phương tiện điện
tử và được các phương tiện đó nhận biết được gọi là số hóa dữ liệu và chúng trở thành
dữ liệu số.
Từ đó, về mặt lý thuyết, ta hiểu số hóa dữ liệu 2D là quá trình chuyển các dạng dữ liệu
truyền thống sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết. Để việc số
hóa dữ liệu được hiệu quả và chính xác thì việc áp dụng quy trình số hóa theo chuẩn là
điều cần thiết.
Số hóa dữ liệu giúp việc lưu trữ, truy xuất, chia sẻ, tìm kiếm thông tin một cách dễ
dàng, linh hoạt trong việc chuyển đổi sang các loại dữ liệu số khác nhau, giảm chi phí
tối đa cho việc quản lý, không gian lưu trữ và có khả năng chỉnh sửa và tái sử dụng dữ
liệu. Do vậy việc xây dựng nên quy trình số hóa theo tiêu chuẩn quốc tế và có sự điều
chỉnh để phù hợp với Việt Nam là điều cần thiết và cấp bách. Tránh sau này các dữ liệu số
hóa không đồng bộ và không theo quy trình chung. Việc xây dựng tiêu chuẩn quốc gia về
“Quy trình tạo lập dữ liệu số 2D” góp phần phát triển công nghiệp nội dung số Việt Nam

theo Quyết định số 50/2009/QĐ-TTg về Quản lý Chương trình phát triển công nghiệp
phần mềm và Chương trình phát triển công nghiệp nội dung số Việt Nam
Tất cả hình ảnh được số hóa nên được chỉ định dữ liệu đặc tả cho quá trình số hóa dữ liệu
2D và hỗ trợ các quy trình nghiệp vụ đang diễn ra. Các tổ chức, cơ quan có thể đưa ra các
yêu cầu cụ thể và để tối đa hóa sự kế thừa các giá trị dữ liệu từ các hệ thống và thiết bị
hiện có. Trong hoạt động hành chính, dữ liệu 2D chủ yếu tập trung vào ảnh quét hoặc ảnh
chụp mà dữ liệu ảnh chủ yếu lấy từ nguồn số hóa. Việc xây dựng tiêu chuẩn về Quy trình

3


tạo lập metadata mô tả dữ liệu 2D giúp đưa ra được quy trình tạo lập dữ liệu đặc tả, các
bước cần thiết, các yêu cầu bắt buộc cho mỗi bước trong quy trình để đảm bảo cho dữ liệu
đặc tả được tạo ra đúng thời điểm và đúng tiêu chuẩn kỹ thuật.
Nhu cầu thực tế và khả năng áp dụng: Cần có bộ tiêu chuẩn kỹ thuật quốc gia về quy trình
tạo lập dữ liệu đặc tả trong quy trình số hóa để áp dụng tại Việt Nam.

2 Tình hình trong và ngoài nước
2.1 Tình hình trong nước
Lĩnh vực số hóa đang là điểm nóng, số lượng tài liệu cần số hóa ngày 1 nhiều. Theo sự
chỉ đạo của Chính phủ, năm 2013 một số bộ ban ngành, đơn vị đứng đầu đã bắt đầu áp
dụng số hóa cho kho tài liệu lưu trữ của mình. Các doanh nghiệp lớn trong lĩnh vực
kiểm toán, ngân hàng, bảo hiểm cũng đã quan tâm tới việc số hóa tài liệu khi lượng hồ
sơ giấy tờ đó ngày một tăng lên với số lượng lớn. Ngoài ra còn có các đơn vị đặc thù
như Bộ công an, quân đội, trường học cũng đã bắt đầu vào việc tư vấn, lập dự toán cho
một dự án số hóa tổng thể bao gồm cả phần mềm chuyên dụng cho đơn vị mình…
Tại Việt nam hiện tại có khá nhiều đơn vị doanh nghiệp, cơ quan nhà nước đưa ra các
giải pháp quy trình số hóa của riêng họ. Do mục tiêu số hóa tài liệu khác nhau, mà có
thể đặt ra các bước số hóa tài liệu khác nhau phù hợp đối với từng cơ quan, tổ chức.
Cục Văn thư và Lưu trữ Nhà nước đặt ra quy trình số hóa tài liệu lưu trữ gồm 12 bước

theo Quyết định số 176/QĐ-VTLTNN ngày 21/10/2011 với yêu cầu phân loại ảnh và
sao lưu ảnh. Nhưng nếu với yêu cầu phổ thông, quá trình thực hiện số hóa tài liệu lưu
trữ chỉ giản đơn có 5 bước là:
Bước 1. Nhận tài liệu lưu trữ đã được lựa chọn để thực hiện số hóa. Việc lựa chọn này
là cần thiết, vì không có một cơ quan, tổ chức nào lại có thể số hóa một lần cả kho lưu
trữ của mình. Tiêu chuẩn để số hóa tùy thuộc vào mục tiêu của chủ sở hữu tài liệu lưu
trữ. Ví dụ, số hóa để bảo hiểm tài liệu lưu trữ, thì tài liệu được chọn phải là tài liệu
thuộc diện quý, hiếm theo quy định của pháp luật.
Bước 2. Chuẩn bị tài liệu. Công việc bao gồm:
- Lấy ra các bìa cứng, ghim kẹp; làm phẳng các trang tài liệu; Phân loại TL, tách riêng
những TL rách, hư hỏng, nếu việc số hóa áp dụng cho các hồ sơ lưu trữ và dùng kỹ

4


thuật scan từng tờ tài liệu. Nếu việc số hóa các tư liệu lưu trữ dạng đóng quyển, thì có
thể áp dụng công nghệ mới tiến bộ hơn như Bookscan cho việc số hóa tài liệu lưu trữ.
Bước 3. Scan và thiết lập hệ thống ảnh; đặt tên file; đặt định dạng; đóng, ghim lại theo
tổ chức tài liệu ban đầu; tạo siêu siêu dữ liệu (metadata). Đây là bước quyết định nhất
để chuyển đổi tài liệu truyền thống sang tài liệu số hóa. Danh mục tài liệu số hóa được
lập và nhúng (gắn) và tài liệu thông qua một phần mềm ứng dụng và tạo ra metadata.
Đồng thời, tài liệu được đặt định dạng theo sự lựa chọn được định trước.
Bước 4. Kiểm tra chất lượng tài liệu đã được số hóa và làm lại những ảnh không đạt
yêu cầu.
Bước 5. Nghiệm thu, bàn giao tài liệu lưu trữ.
Công việc bao gồm bàn giao tài liệu số hóa và bàn giao tài liệu gốc. Nếu tài liệu số hóa
là tài liệu lưu trữ của một Lưu trữ lich sử thì với những văn bản không đóng quyển
trong một hồ sơ, việc bàn giao phải được kiểm tra chặt chẽ từng trang tài liệu để bảo
đảm đầy đủ như tài liệu ban đầu đã nhận ở bước 1.
Tại các đơn vị khác nhau quy trình số hóa thường gắn liền với thiết bị số hóa mà họ

cung cấp, ví dụ tại ĐHQGHN và 1 số doanh nghiệp khác quy trình hiện đang được sử
dụng cho quy trình số hóa:

Hình 1. Quy trình sử dụng trong thư viện ĐHQGHN và 1 số doanh nghiệp tư
nhân
5


Hoặc bên 1 số trường đại học, thư viện khác

Hình 2. Quy trình số hóa tài 1 số thư viện tài Việt nam

Hiện nay lĩnh vực số hóa trong các bộ ban ngành cũng đang là điểm nóng, theo sự chỉ
đạo của chính phủ Bộ Tài nguyên và Môi trường đã ban hành thông tư số 26/2014/TTBTNMT về Quy trình và định mức kinh tế kỹ thuật xây dựng cơ sở dữ liệu tài nguyên
môi trường. Dưới đây là sơ đồ quy trình xây dựng cơ sở dữ liệu tài nguyên môi
trường:

6


Hình 3 – Quy trình số hóa tài liệu của Bộ Tài nguyên và Môi trường
Việc xây dựng cơ sở dữ liệu tài nguyên môi trường là dựa trên thông tin, dữ liệu từ các
kết quả điều tra cơ bản của các lĩnh vực tài nguyên và môi trường đã được kiểm tra,
nghiệm thu và được lưu trữ tại cơ quan chuyên môn theo một hay nhiều khuôn dạng
khác nhau.
Các nội dung khảo sát, thu thập thông tin dữ liệu được thực hiện theo các qui định hiện
hành.
1. Quy trình chi tiết xây dựng CSDL tài nguyên môi trường
1.1 Rà soát, phân tích nội dung thông tin dữ liệu
7



1.1.1 Rà soát, phân loại các thông tin dữ liệu
- Mục đích
Rà soát, phân loại và đánh giá chi tiết các thông tin dữ liệu phục vụ xây dựng cơ sở dữ
liệu phù hợp với yêu cầu.
- Các bước thực hiện
+ Rà soát, đánh giá và phân loại chi tiết dữ liệu đã được chuẩn hóa và chưa được
chuẩn hóa.
+ Chuẩn bị dữ liệu mẫu.
- Sản phẩm
+ Báo cáo rà soát, phân loại và đánh giá các thông tin dữ liệu
+ Bộ dữ liệu mẫu
1.1.2 Phân tích nội dung thông tin dữ liệu
- Mục đích
Phân tích, xác định chi tiết các thông tin dữ liệu phục vụ thiết kế và lập dự toán xây
dựng cơ sở dữ liệu.
- Các bước thực hiện
+ Xác định danh mục CSDL
+ Xác định chi tiết các thông tin cho từng ĐTQL
+ Xác định chi tiết các quan hệ giữa các ĐTQL
+ Xác định chi tiết các tài liệu quét và các tài liệu dạng giấy cần nhập vào CSDL từ
bàn phím
+ Xác định khung danh mục dữ liệu, dữ liệu đặc tả sử dụng trong cơ sở dữ liệu.
+ Xác định các yếu tố ảnh hưởng đến việc xây dựng CSDL.
+ Qui đổi đối tượng quản lý
- Sản phẩm
+ Danh mục đối tượng quản lý và các thông tin chi tiết
+ Danh mục chi tiết các tài liệu quét và giấy cần nhập vào CSDL
+ Báo cáo qui định khung danh mục dữ liệu, dữ liệu đặc tả

+ Báo cáo qui đổi đối tượng quản lý.
1.2 Thiết kế mô hình cơ sở dữ liệu
8


Trường hợp nhiệm vụ, dự án có cả hai nội dung xây dựng CSDL và xây dựng ứng
dụng phần mềm thì các bước “Thiết kế mô hình cơ sở dữ liệu” và “nhập dữ liệu mẫu
để kiểm tra mô hình cơ sở dữ liệu” chỉ thực hiện một lần ở bước này.
- Mục đích
+ Thiết kế mô hình danh mục dữ liệu, dữ liệu đặc tả theo (chuẩn dữ liệu, khung dữ
liệu) dựa trên kết quả rà soát, phân tích.
+ Thiết kế mô hình cơ sở dữ liệu dựa trên kết quả rà soát, phân tích.
- Các bước thực hiện
+ Thiết kế mô hình danh mục dữ liệu, dữ liệu đặc tả.
+ Thiết kế mô hình cơ sở dữ liệu:
- Thiết kế mô hình cơ sở dữ liệu
- Nhập dữ liệu mẫu để kiểm tra mô hình cơ sở dữ liệu.
- Sản phẩm
+ Mô hình cơ sở dữ liệu, mô hình danh mục dữ liệu, dữ liệu đặc tả dưới dạng XML
+ Báo cáo thuyết minh mô hình danh mục dữ liệu, dữ liệu đặc tả
+ Báo cáo thuyết minh mô hình CSDL
+ Báo cáo kết quả kiểm tra mô hình CSDL trên dữ liệu mẫu
1.3 Tạo lập dữ liệu cho danh mục dữ liệu, dữ liệu đặc tả
- Mục đích
Tạo lập nội dung dữ liệu cho danh mục dữ liệu, dữ liệu đặc tả dựa trên kết quả rà soát,
phân tích và thiết kế
- Các bước thực hiện
+ Tạo lập nội dung cho danh mục dữ liệu
+ Tạo lập nội dung cho dữ liệu đặc tả
- Sản phẩm

+ CSDL danh mục dữ liệu, dữ liệu đặc tả đã nhập đủ nội dung
+ Báo cáo kết quả thực hiện
1.4 Tạo lập dữ liệu cho CSDL
1.4.1 Chuyển đổi dữ liệu
- Mục đích
9


Chuyển đổi dữ liệu dạng số (không gian và phi không gian) đã được chuẩn hóa vào
CSDL.
- Các bước thực hiện
+ Đối với dữ liệu không gian dạng số chưa được chuẩn hóa thì việc chuẩn hóa dữ liệu
được thực hiện theo các qui định của từng chuyên ngành trước khi thực hiện chuyển
đổi vào CSDL (biên tập bản đồ, chuyển đổi tọa độ…).
- Đối với dữ liệu phi không gian dạng số chưa được chuẩn hóa:
+ Chuẩn hóa phông chữ theo tiêu chuẩn TCVN 6909
+ Chuẩn hóa dữ liệu phi không gian theo thiết kế mô hình cơ sở dữ liệu
- Chuyển đổi dữ liệu dạng số đã chuẩn hóa vào cơ sở dữ liệu.
- Sản phẩm
+ Dữ liệu dạng số trước khi chuyển đổi.
+ Dữ liệu phi không gian trước khi chuyển hóa
+ Cơ sở dữ liệu đã được chuyển đổi
+ Báo cáo kết quả thực hiện chuyển đổi dữ liệu
1.4.2 Quét (chụp) tài liệu
- Mục đích
Quét (chụp) các tài liệu để phục vụ đính kèm vào các trường thông tin cho các lớp,
bảng dữ liệu của ĐTQL.
- Các bước thực hiện
+ Quét (chụp) các tài liệu
+ Xử lý và đính kèm tài liệu quét.

- Sản phẩm
Danh mục các tài liệu quét và đã được đính kèm vào các lớp, bảng dữ liệu của các
ĐTQL
1.4.3 Nhập, đối soát dữ liệu
- Mục đích
Nhập, đối soát các dữ liệu từ dạng giấy vào cơ sở dữ liệu đã được thiết kế. Dữ liệu sau
khi nhập vào cơ sở dữ liệu phải được đối chiếu, kiểm soát để đảm bảo tính chính xác
dữ liệu
10


- Các bước thực hiện
+ Đối với các dữ liệu không gian dạng giấy: Số hóa theo qui định chuyên ngành sau đó
thực hiện bước “Chuyển đổi dữ liệu”.
+ Đối với nhập dữ liệu dạng giấy (phi không gian):
-

Nhập dữ liệu có cấu trúc cho đối tượng phi không gian

-

Nhập dữ liệu có cấu trúc cho đối tượng không gian

-

Nhập dữ liệu phi cấu trúc cho đối tượng phi không gian

-

Nhập dữ liệu phi cấu trúc cho đối tượng không gian


+ Đối soát dữ liệu:
-

Dữ liệu có cấu trúc đã nhập cho đối tượng phi không gian

-

Dữ liệu có cấu trúc đã nhập cho đối tượng không gian

-

Dữ liệu phi cấu trúc đã nhập cho đối tượng phi không gian

-

Dữ liệu phi cấu trúc đã nhập cho đối tượng không gian

- Sản phẩm
+ Dữ liệu dạng giấy dùng để nhập dữ liệu
+ Báo cáo đối soát dữ liệu và các vấn đề phát sinh trong quá trình nhập dữ liệu
+ Cơ sở dữ liệu đã được nhập đầy đủ nội dung
+ Danh mục dữ liệu để cung cấp, khai thác, sử dụng phục vụ yêu cầu quản lý nhà
nước.
1.5 Biên tập dữ liệu
- Mục đích
Biên tập CSDL theo qui định
- Các bước thực hiện
+ Đối với dữ liệu không gian
-


Tuyên bố đối tượng

-

Sửa lỗi tương quan của dữ liệu không gian

+ Đối với dữ liệu phi không gian: Hiệu đính nội dung
+ Trình bày hiển thị dữ liệu không gian
- Sản phẩm
+ CSDL đã được biên tập
11


+ Tệp trình bày hiển thị dữ liệu không gian
1.6 Kiểm tra sản phẩm
- Mục đích
Kiểm tra CSDL đã được tạo lập đảm bảo tính đầy đủ, chính xác, phù hợp với nội dung
đã được phê duyệt.
- các bước thực hiện
+ Kiểm tra mô hình CSDL
+ Kiểm tra nội dung CSDL
-

Kiểm tra dữ liệu không gian

-

Kiểm tra dữ liệu phi không gian


+ Kiểm tra danh mục dữ liệu, dữ liệu đặc tả
- Sản phẩm
+ Báo cáo kết quả kiểm tra sản phẩm
+ Báo cáo kết quả sửa chữa
+ Báo cáo kiểm tra, nghiệm thu chất lượng, khối lượng
1.7 Phục vụ nghiệm thu và giao nộp sản phẩm
- Mục đích
Phục vụ nghiệm thu và bàn giao các sản phẩm đã kiểm tra.
- Các bước thực hiện
+ Lập báo cáo tổng kết nhiệm vụ và phục vụ nghiệm thu sản phẩm đã kiểm tra.
+ Đóng gói các sản phẩm dạng giấy và dạng số
+ Giao nộp sản phẩm về đơn vị sử dụng và đơn vị chuyên trách công nghệ thông tin
theo phân cấp/qui định quản lý phục vụ quản lý, lưu trữ và đưa vào hệ thống thông tin
ngành tài nguyên và môi trương.
- Sản phẩm
+ Báo cáo tổng kết nhiệm vụ và hồ sơ nghiệm thu kèm theo
+ Biên bản bàn giao đã được xác nhận
+ Các sản phẩm dạng giấy và số.
Dữ liệu đặc tả được sử dụng để mô tả các đối tượng, các thông tin cần thiết để

12

lưu trữ.


Tất cả hình ảnh được số hóa nên được chỉ định dữ liệu đặc tả cho quá trình số hóa tài liệu
và hỗ trợ các quy trình nghiệp vụ đang diễn ra. Các tổ chức, cơ quan có thể đưa ra các yêu
cầu cụ thể và để tối đa hóa sự kế thừa các giá trị dữ liệu từ các hệ thống và thiết bị hiện
có. Quy trình quản lý dữ liệu đặc tả nên tối đa hóa tự động chụp dữ liệu đặc tả, giảm thiểu
việc xử lý thủ công. Bất kỳ việc sử dụng, áp dụng dữ liệu đặc tả nên được thực hiện có sự

tham khảo tiêu chuẩn ISO 23081-1: 2006.

Dữ liệu đặc tả kết hợp với hình ảnh là một

thành phần thiết yếu trong việc quản lý và truy vấn các hình ảnh.
Dữ liệu đặc tả có thể được nhúng với các nguồn tài nguyên tại thông tin tiêu đề, hoặc có thể
được quản lý trong một hệ thống riêng biệt,hoặc cả hai,nhưng trong cả hai trường hợp đó phải
có một mối quan hệ trực tiếp hoặc liên hệ giữa chúng; tức là khi dữ liệu đặc tả nằm trong một
hệ thống riêng biệt,nó cần phải có liên kết trực tiếp đến các hồ sơ. Dữ liệu đặc tả cũng có thể
được đóng gói trong các định dạng hình ảnh.
Trong quy trình số hóa bao gồm các giai đoạn mà dữ liệu đặc tả phải được áp dụng. Các
giai đoạn này là:
- chụp ảnh (quét);
- hình ảnh chụp lại (tái quét);
- đảm bảo chất lượng;
- truyền tải dữ liệu.
Hình dưới đây mô tả quy trình số hóa văn bản, trong đó các quá trình bắt buộc áp dụng dữ
liệu đặc tả được đánh dấu bằng nét đậm.
Tạo lập dữ liệu 2D

Dạng số

Lên kế
hoạch

Thiết kế mô
hình và thử
nghiệm

Dạng giấy


Khuôn dạng dữ liệu

Chuyển đổi dữ liệu

Đảm bảo
chất lượng

Quét (chụp) tài liệu

Dữ liệu đặc tả

Kiểm tra sản phẩm

Lập chỉ mục – Dữ liệu đặc tả

13

Biên tập dữ liệu


Hiện nay, Các dự thảo TCVN về GIS đã và đang được các Bộ, ngành liên quan triển khai
xây dựng dự thảo QCVN, TCVN và Qui định kỹ thuật, Một số QCVN và TCVN đã được
Bộ Tài nguyên và Mội trường xây dựng như sau:
TT

Tên QCVN/TCVN

Số hiệu


Ghi chú

Ghi nhật ký

A

Hệ thống QCVN

1.

QCVN về xây dựng lưới độ cao

QCVN
11:2008/BTNMT

2.

QCVN về xây dựng lưới tọa độ

QCVN
04:2009/BTNMT

3.

QCVN về Phân định địa giới hành QCVN
chính và lập hồ sơ địa giới hành 12:2008/BTNMT
chính các cấp

4.


QCVN về Chuẩn hóa địa danh phục QCVN
vụ công tác lập bản đồ
37:2011/BTNMT

5.

QCVN về Thông tin địa lý cơ sở

6.

Mô hình số độ cao (DEM)

39/2014/TTBTNMT (Lidar),
chưa có quy định
SP chụp ảnh KT
số

7.

Dữ liệu đồ họa đường nét

96TCN
42-90
Quy phạm thành
lập bản đồ địa
hình tỷ lệ 1:500,
1:1 000, 1:2 000,
1:5 000 , 1:10 000

1:25

000

QCVN
42:2012/BTNMT

14


(phần trong nhà)
8.

Dữ liệu nền địa lý gốc (thành lập
trực tiếp ở mức 1:2000, 1:5000,
1:10.000)

21/2014/TTBTNMT,
55/2014/TTBTNMT

9.

Dữ liệu địa lý
(1:25.000,1:50.000,
1:500.000, 1:1tr)

20/2014/TTBTNMT
(1:50.000)

10.

Bản đồ địa hình gốc dạng số các

loại tỷ lệ cơ bản

70/2000/QĐ-ĐC
(Quy định kỹ
thuật số hóa bản
đồ địa hình tỷ lệ
1:10 000, 1:25
000, 1:50 000 và
1:100 000)

11.

Dữ liệu, bản đồ biên giới địa giới

Xây dựng mới

12.

Dữ liệu, bản đồ địa hình đáy biển

180/1998/QĐĐC, Quy định cơ
sở toán học, độ
chính xác nội
dung và ký hiệu
bản đồ địa hình
đáy biển tỷ lệ
1:10 000

B


Hệ thống QĐKT

13.

Quy phạm thành lập bản đồ địa 24/KHKT
hình tỷ lệ 1:10 000 - 1:25 000 (phần
ngoài trời)

3/26/1977

14.

Ký hiệu bản đồ địa hình tỷ lệ 1:500, 1125/ĐĐBĐ
1:1 000, 1:2 000 và 1:5 000

11/19/1994

15.

Ký hiệu bản đồ địa hình tỉ lệ 1:10 1126/ĐĐBĐ
000 và 1:25 000

11/19/1994

16.

Những yêu cầu cơ bản và qui định 541/QĐ/ĐC
kiểm tra, đánh giá chất lượng phim

9/1/1995


thứ cấp
1:100.000,

15


ảnh chụp từ máy bay phục vụ công
tác đo vẽ và hiện chỉnh bản đồ
17.

Quy định kỹ thuật xây dựng lưới 1284/ĐĐBĐ
cấp 0 Nhà nước CHXHCNVN

9/16/1995

18.

Quy định cơ sở toán học, độ chính 180/1998/QĐ-ĐC
xác nội dung và ký hiệu bản đồ địa
hình đáy biển tỷ lệ 1:10 000

3/31/1998

19.

Quy định tạm thời về quy trình đo 431/2001/QĐ-TCĐC
thủy chuẩn hạng 1, 2 bằng máy
thủy chuẩn điện tử và bộ mia có
dạng mã vạch


11/13/2001

20.

Quy phạm thành lập BĐ ĐH 1:250 09/2006/QĐ-BTNMT
000, 1:500 000 và 1:1 000 000

8/16/2006

21.

Ký hiệu BĐĐH 1:250 000, 1:500 11/2006/QĐ-BTNMT
000 và 1:1 000 000

8/22/2006

22.

Quy định kỹ thuật thành lập bản đồ 03/2007/QĐ-BTNMT
địa hình đáy biển tỷ lệ 1:50 000

2/12/2007

23.

Sử dụng hệ thống tham số tính 05/2007/QĐ-BTNMT
chuyển giữa Hệ tọa độ quốc tế
WGS-84 và Hệ tọa độ quốc gia
VN-2000


2/27/2007

24.

Quy định kỹ thuật và quy trình công 2097/QĐ-BTNMT
nghệ (tạm thời) thành lập mô hình
số độ cao bằng công nghệ Lidar

10/22/2008

25.

Quy định về quy phạm xây dựng 01/2009/TT-BTNMT
lưới trọng lực quốc gia

1/14/2009

26.

Quy định kỹ thuật thành lập bản đồ 34/2011/TT-BTNMT
địa hình đáy biển tỷ lệ 1: 100.000
bằng phương pháp đo vẽ trực tiếp

8/1/2011

27.

Quy định kỹ thuật hiện chỉnh bản 05/2012/TT-BTNMT
đồ địa hình quốc gia tỷ lệ 1:25.000

và 1:50.000 bằng ảnh vệ tinh

5/8/2012

28.

Quy định kỹ thuật về đo trọng lực 08/2012/TT-BTNMT

8/8/2012

16


chi tiết
C

Hệ thống TCVN dự kiến xây dựng

29.

Thông tin địa lý – Mô hình quy
chiếu

Đang dự thảo

30.

Thông tin địa lý – Thuật ngữ.

Đang dự thảo


31.

Thông tin địa lý – Phương pháp
phân loại đối tượng

Đang dự thảo

32.

Thông tin địa lý - Các nguyên tắc
về chất lượng

Đang dự thảo

33.

Thông tin địa lý: - Mô hình tham
chiếu, phần 2 - Ảnh

Đang dự thảo

34.

Thông tin địa lý: Thủ tục đánh giá
chất lượng

Đang dự thảo

35.


Thông tin địa lý - Siêu dữ liệu

Đang dự thảo

Nhận xét : Các tiêu chuẩn và quy chuẩn đều được xây dựng bằng hình thức nghiên cứu
các tài liệu và tiêu chuẩn của ISO hoặc tổ chức OGC. Các QCVN này được Bộ Tài
nguyên và Môi trường ban hành.

2.2 Tình hình trên thế giới
Hiện nay, Tổ chức Tiêu chuẩn hóa Quốc tế đã ban hành các Tiêu chuẩn quốc tế ISO
liên quan đến quy trình số hóa:
- ISO 19115-1:2014 Geographic information -- Metadata -- Part 1: Fundamentals
(Thông tin địa lý – Dữ liệu đặc tả – Phần 1: Nguyên tắc cơ bản)
- ISO 19115-2:2009 Geographic information -- Metadata -- Part 2: Extensions for
imagery and gridded data (Thông tin địa lý – Dữ liệu đặc tả – Phần 2: Mở rộng đổi với
dữ liệu ảnh và dữ liệu lưới)
- ISO/TR 13028:2010 Information and documentation - Implementation guidelines for
digitization of records (Thông tin và tư liệu – Hướng dẫn thực hiện đối với số hóa bản
ghi)

17


Tiêu chuẩn ISO / TR 13028: 2010: thiết lập các hướng dẫn để tạo ra và duy trì các bản
ghi trong định dạng kỹ thuật số duy nhất, nơi mà các bài báo gốc, hoặc hồ sơ nguồn
không kỹ thuật số khác, đã được sao chép bằng cách số hóa; thiết lập các hướng dẫn
thực hành tốt nhất cho việc số hóa để đảm bảo độ tin cậy và độ tin cậy của hồ sơ và
cho phép xem xét xử lý các hồ sơ nguồn không kỹ thuật số; thiết lập các hướng dẫn
thực hành tốt nhất cho sự tin cậy của các hồ sơ số hóa có thể ảnh hưởng đến việc chấp

nhận bằng chứng pháp lý và trọng lượng của các hồ sơ đó; thiết lập các hướng dẫn
thực hành tốt nhất cho việc tiếp cận các hồ sơ số hoá cho đến khi họ được yêu cầu; xác
định chiến lược để hỗ trợ trong việc tạo ra các bản ghi số hóa phù hợp để duy trì lâu
dài; và thiết lập các hướng dẫn thực hành tốt nhất cho việc quản lý các hồ sơ nguồn
không kỹ thuật số sau số hóa.
ISO / TR 13028: 2010 được áp dụng để sử dụng trong việc thiết kế và tiến hành số hóa
trách nhiệm của tất cả các tổ chức thực hiện số hóa, hoặc quá trình kinh doanh số hóa,
dự án số hóa chụp lại cho các mục đích quản lý hồ sơ, như được nêu trong ISO 154891: 2001 và ISO / TR 15801: 2009.
ISO / TR 13028: 2010 không áp dụng cho: nắm bắt và quản lý hồ sơ kỹ thuật số sinh;
thông số kỹ thuật cho chụp kỹ thuật số của hồ sơ; thủ tục để ra quyết định cuối cùng về
bố trí hồ sơ; thông số kỹ thuật cho việc bảo tồn lâu dài của hồ sơ kỹ thuật số; số hóa
hoặc cổ phần lưu trữ hiện có cho các mục đích bảo quản.
AS / NZS ISO 13028: 2012 là một tiêu chuẩn của Úc - New Zealand. Đây là một áp
dụng giống hệt nhau của tiêu chuẩn ISO / TR 13028: 2010.
UNE-ISO/TR 13028:2011 IN Tiêu chuẩn của Tây Ban Nha cũng dựa trên tiêu chuẩn
ISO / TR 13028: 2010.
Chính phủ Alberta cũng đưa ra quy trình số hóa “Digitization standard process num
A000015 xuất bản ngày 23-04-2013” được áp dụng cho tất cả các cơ quan ban ngành,
chỉnh phủ và doanh nghiệp của họ với 10 bước bắt buộc phải sử dụng. Bên cạnh đó đi
kèm theo các yêu cầu kỹ thuật cho tiêu chuẩn này “Digitization Technical
Requirements Standard A000013 xuất bản 14-07-2012”
Hiện nay, các tiêu chuẩn quốc tế thuộc họ tiêu chuẩn ISO 191xx rơi vào một số
nhóm tiêu chuẩn sau đây:
-

Các tiêu chuẩn qui định hạ tầng cho việc tiêu chuẩn hóa về không gian địa lý:

18





ISO 19101 Geographic information — Reference model (Thông tin địa lý –
Mô hình tham chiếu);



ISO/TS 19103 Geographic information — Conceptual schema language
(Thông tin địa lý – Ngôn ngữ lược đồ khái niệm);



ISO/TS 19104 Geographic information — Terminology (Thông tin địa lý –
Thuật ngữ);



ISO 19105 Geographic information — Conformance and testing (Thông tin
địa lý – Kiểm thử và sự phù hợp);


-

ISO 19106 Geographic information — Profiles (Thông tin địa lý – Hồ sơ);
Các tiêu chuẩn mô tả các mô hình dữ liệu đối với thông tin địa lý:



ISO 19109 Geographic information — Rules for application schema (Thông
tin địa lý – Qui tắc cho lược đồ ứng dụng);




ISO 19107 Geographic information — Spatial schema (Thông tin địa lý –
Lược đồ không gian);



ISO 19137 Geographic information — Core profile of the spatial schema
(Thông tin địa lý – Hồ sơ lõi của lược đồ không gian);



ISO 19123 Geographic information — Schema for coverage geometry and
functions (Thông tin địa lý – Lược đồ đối với các chức năng và hình học bao
phủ);



ISO 19108 Geographic information — Temporal schema (Thông tin địa lý –
Lược đồ thời gian);



ISO 19141 Geographic information — Schema for moving features (Thông
tin địa lý – Lược đồ đối với việc dịch chuyển các đối tượng địa lý);



ISO 19111 Geographic information — Spatial referencing by coordinates

(Thông tin địa lý – Tham chiếu không gian bằng tọa độ);



ISO 19112 Geographic information — Spatial referencing by geographic
identifiers (Thông tin địa lý – Tham chiếu không gian bằng các định danh địa
lý);

-

Các tiêu chuẩn cho việc quản lý thông tin địa lý:

19




ISO 19110 Geographic information — Methodology for feature cataloguing
(Thông tin địa lý – Phương pháp luận phân loại đối tượng địa lý);



ISO 19115 Geographic information — Metadata (Thông tin địa lý – Dữ liệu
đặc tả);



ISO 19113 Geographic information — Quality principles (Thông tin địa lý –
Nguyên tắc chất lượng);




ISO 19114 Geographic information — Quality evaluation procedures (Thông
tin địa lý – Thủ tục ước lượng chất lượng);



ISO 19131 Geographic information — Data product specifications (Thông
tin địa lý – Đặc tả sản phẩm dữ liệu);



ISO 19135 Geographic information — Procedures for item registration
(Thông tin địa lý – Thủ tục đăng ký hạng mục);



ISO/TS 19127 Geographic information — Geodetic codes and parameters
(Thông tin địa lý – Tham số và mã trắc địa);



ISO/TS 19138 Geographic information — Data quality measures (Thông tin
địa lý – Đo lường chất lượng dữ liệu);

-

Các tiêu chuẩn đối với các dịch vụ thông tin địa lý:



ISO 19119 Geographic information — Services (Thông tin địa lý – Dịch vụ);



ISO 19116 Geographic information — Positioning services (Thông tin địa lý
– Dịch vụ định vị);



ISO 19117 Geographic information — Portrayal (Thông tin địa lý – Phác
họa);



ISO 19125-1 Geographic information — Simple feature access — Part 1:
Common architecture (Thông tin địa lý – Truy cập đối tượng địa lý đơn giản
– Phần 1: Kiến trúc chung);



ISO 19125-2 Geographic information — Simple feature access — Part 2:
SQL option (Thông tin địa lý – Truy cập đối tượng địa lý đơn giản – Phần 2:
Tùy chọn SQL);



ISO 19128 Geographic information — Web map server interface (Thông tin

20



địa lý – Giao diện máy chủ bản đồ web);


ISO 19132 Geographic information — Location based services — Reference
model (Thông tin địa lý – Dịch vụ dựa trên định vị - Mô hình tham chiếu);



ISO 19133 Geographic information — Location based services — Tracking
and navigation (Thông tin địa lý – Dịch vụ dựa trên định vị - Điều hướng và
truy vết);



ISO 19134 Geographic information — Location base services — Multimodal
routing and navigation (Thông tin địa lý – Dịch vụ dựa trên định vị - Điều
hướng và định tuyến đa phương tiện);

-

Các tiêu chuẩn mã hóa thông tin địa lý:


ISO 19118 Geographic information — Encoding (Thông tin địa lý – Mã
hóa);



ISO 6709 Standard representation of geographic point location by

coordinates (Thể hiện chuẩn vị trí điểm địa lý theo các tọa độ);



ISO 19136 Geographic information — Geography Markup Language (GML)
(Thông tin địa lý – Ngôn ngữ đánh dấu địa lý (GML));



ISO/TS 19139 Geographic information — Metadata — XML schema
implementation (Thông tin địa lý – Siêu dữ liệu – Triển khai lược đồ XML);

-

Các tiêu chuẩn đối với các lĩnh vực chủ đề cụ thể:


ISO/TS 19101-2 Geographic information — Reference model — Part 2:
Imagery (Thông tin địa lý – Mô hình tham chiếu – Phần 2: Ảnh);



ISO 19115-2 Geographic information — Metadata — Part 2: Extensions for
imagery and gridded data (Thông tin địa lý – Dữ liệu đặc tả - Mở rộng đối
với dữ liệu lưới và Ảnh);

2.3 Kết luận
Số hóa đã và đang bùng nổ, thị trường cho lĩnh vực này rất lớn và tiềm năng. Các
doanh nghiệp cũng như các cơ quan nhà nước, thư viện, trường đại học… cũng đã có
những giải pháp dịch vụ, quy trình cho việc số hóa tài liệu. Tuy nhiên để hiệu quả và

21


chuẩn xác thì việc xây dựng tiêu chuẩn quy trình số hóa là việc làm cần thiết. Quy
trình số hóa cần tuân theo các tiêu chuẩn quốc tế đồng thời cũng phải có những điều
chỉnh nhất định để phù hợp với yêu cầu cũng như hoàn cảnh tại Việt Nam.

3 Cơ sở xây dựng các yêu cầu kỹ thuật
3.1 Phân tích các tài liệu tiêu chuẩn

3.1.1 Tiêu chuẩn ISO 13028 : 2010
ISO / TR 13028 do Ủy ban kỹ thuật ISO / TC 46, Thông tin và tài liệu biên soạn
hướng dẫn, Tiểu ban SC 11, Lưu trữ / quản lý hồ sơ.
Báo cáo kỹ thuật này được dựa trên tiêu chuẩn S6 Lưu trữ hồ sơ của Lưu trữ New
Zealand: Tiêu chuẩn số hóa, được công bố vào tháng 01 năm 2006.
Báo cáo kỹ thuật này:
Thiết lập các hướng dẫn để tạo ra và duy trì các bản ghi trong định dạng kỹ thuật số
duy nhất, nơi mà các bài báo gốc, hoặc hồ sơ nguồn không kỹ thuật số khác, đã được
sao chép bằng cách số hóa;
- Thiết lập hướng dẫn thực hành tốt nhất cho việc số hóa để đảm bảo độ tin cậy và độ
tin cậy của hồ sơ và cho phép xem xét xử lý các hồ sơ nguồn không kỹ thuật số;
- Thiết lập hướng dẫn thực hành tốt nhất cho sự tin cậy của các hồ sơ số hóa có thể ảnh
hưởng đến việc chấp nhận bằng chứng pháp lý và trọng lượng của các hồ sơ đó;
- Thiết lập hướng dẫn thực hành tốt nhất cho việc tiếp cận các hồ sơ số hoá cho đếnkhi
họ được yêu cầu;
- Xác định các chiến lược để hỗ trợ trong việc tạo ra các bản ghi số hóa phù hợp để
duy trì lâu dài;
Thiết lập hướng dẫn thực hành tốt nhất cho việc quản lý các hồ sơ nguồn không
kỹ thuật số sau số hóa.
Báo cáo kỹ thuật này được áp dụng để sử dụng trong việc thiết kế và tiến hành số hóa

trách nhiệm của tất cả các tổ chức thực hiện số hóa, hoặc quá trình kinh doanh số hóa,
dự án số hóa chụp lại cho các mục đích quản lý hồ sơ, như được nêu trong ISO 154891: 2001 và ISO / TR 15801: 2009.
22


Báo cáo kỹ thuật này là không áp dụng đối với:
a) khai thác và quản lý hồ sơ sinh-kỹ thuật số;
b) thông số kỹ thuật cho quét hồ sơ kỹ thuật số;
c) các thủ tục để ra quyết định cuối cùng về xác định giá trị hồ sơ;
d) thông số kỹ thuật cho việc bảo tồn lâu dài của hồ sơ kỹ thuật số;
e) số hóa của các tài lưu trữ hiện có cho các mục đích bảo quản.
Nội dung của tiêu chuẩn bao gồm các phần chính sau:
Tài liệu bắt đầu bằng việc phân tích đánh giá các lợi ích cũng như rủi ro của việc số
hóa.
Số hóa cung cấp các lợi ích tiềm năng sau đây cho các tổ chức:
có thể truy cập hình ảnh đồng thời cho nhiều người;
truy cập mạng cho phép truy cập từ nhiều nơi bất cứ lúc nào;
hội nhập sâu hơn với các hệ thống thông tin kinh doanh;
khả năng truyền tải hình ảnh trong một quy trình làm việc có cấu trúc, do đó hỗ trợ xử
lý công việc;
loại bỏ tạp chủng (cả giấy và kỹ thuật số) của hệ thống mà có thể gây nhầm lẫn cho
người dùng khi yêu cầu truy cập xem toàn bộ lịch sử của một sự việc nào đó;
khả năng tái sử dụng nguồn lực hạn chế hiện có của mình bằng cách định dạng của họ,
ví dụ: bản đồ rất lớn hoặc các tài liệu được tổ chức trên vi phim hoặc băng từ; áp dụng
phân loại phù hợp và lập chỉ mục cho các tài liệu đặc biệt cho các tập tin lai;
tích hợp với các tổ chức khắc phục thảm họa và các chế độ sao lưu hiện có;
cung cấp một khả năng bảo mật và bảo đảm khả năng làm giảm không gian lưu trữ vật
lý bị chiếm đóng bởi các hồ sơ bản giấy;
tiềm năng để tăng năng suất của tổ chức.
Có một số rủi ro liên quan đến việc thực hiện một quá trình số hóa:

tiết kiệm chi phí ngắn hạn có thể đến chi phí dài hạn trong việc duy trì khả năng tiếp
cận tới các hình ảnh kỹ thuật số theo thời gian;
23


×