ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN THỊ NGUYỆT
NGHIÊN CỨU XÂY DỰNG KHUNG QUẢN TRỊ DỮ LIỆU CHO VIỆC
QUẢN LÝ DỮ LIỆU CỦA TỔNG CÔNG TY MẠNG LƯỚI VIETTEL
Giáo viên hướng dẫn: PGS. TS. Phan Xuân Hiếu
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội - 2019
1
LỜI CẢM ƠN
Tôi xin trân trọng cảm ơn các thầy cô Đại Học Công Nghệ- Đại Học Quốc
Gia Hà Nội đã tạo điều kiện cho học viên lớp cao học K24CNTT một môi trường
học tập hiệu quả, đồng thời truyền đạt cho các học viên lượng kiến thức và kinh
nghiệm quý báu phục vụ cho quá trình học tập và công tác của tôi trong hiện tại
và tương lai. Cách thức làm việc, học hỏi của các thầy cô đã truyền cảm hứng cho
tôi phát huy tinh thần học hỏi và chủ động tự học để nâng cao kỹ năng, kiến thức
cho bản thân.
Tôi xin trân trọng cảm ơn ban lãnh đạo Tổng công ty Mạng lưới Viettel cùng
các anh chị phòng Kỹ Thuật Nghiệp vụ của Tổng công ty đã đại diện đứng ra tổ
chức lớp học cho các cán bộ nhân viên của trong tổng công ty. Để mọi người có
thể vừa làm việc vừa trao đổi, vận dụng các kiến thức được học vào thực tế được
hiệu quả hơn.
Đặc biệt, tôi cảm ơn sâu sắc đến PGS.TS. Phan Xuân Hiếu đã chỉ bảo cho tôi
trong suốt quá trình học tập và làm luận văn, giúp tôi có thêm quyết tâm để nghiên
cứu và hoàn thiện bản luận văn của mình.
Tôi xin gửi lời cảm ơn đến các bạn trong lớp Cao học Hệ thống Thông tin
K24CNTT đã giúp đỡ, động viên, khích lệ tôi trong suốt thời gian học tập.
Tôi xin được gửi lời cảm ơn tới gia đình đã động viên, giúp đỡ tôi trong quá
trình hoàn thành luận văn.
Với lượng kiến thức và kinh nghiệm còn ít nên luận văn không tránh khỏi
những thiếu sót. Tôi xin trân trọng tiếp thu các ý kiến của các thầy, cô, bạn bè để
luận văn được hoàn thiện.
Trân trọng cám ơn.
2
MỤC LỤC
LỜI CẢM ƠN ...................................................................................................... 1
MỤC LỤC ........................................................................................................... 2
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT .......................................... 4
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ .............................................................. 5
MỞ ĐẦU ............................................................................................................. 6
CHƯƠNG 1. KHUNG QUẢN LÝ DỮ LIỆU ..................................................... 9
1.1. Khái niệm chung về quản lý dữ liệu .......................................................... 9
1.1.1. Định nghĩa thông tin và dữ liệu ........................................................... 9
1.1.2. Quản lý dữ liệu .................................................................................. 10
1.1.3. Quản trị dữ liệu .................................................................................. 11
1.1.4. Phân biệt quản lý và quản trị dữ liệu ................................................. 12
1.1.5. Lợi ích và tầm quan trọng của quản lý dữ liệu .................................. 13
1.1.6. Nguyên tắc quản lý dữ liệu ................................................................ 14
1.1.7. Các lĩnh vực trọng tâm chính cần được đề cập trong quản lý dữ liệu 15
1.1.8. Các bước cơ bản để thực hiện quản lý dữ liệu................................... 16
1.2. Khung quản lý dữ liệu ............................................................................ 18
1.3. Khung quản lý dữ liệu viễn thông cho TCT mạng lưới VIettel............... 22
CHƯƠNG 2. QUẢN LÝ ATTT TRONG DOANH NGHIỆP .......................... 27
2.1. ĐỊNH NGHĨA AN TOÀN THÔNG TIN ................................................ 27
2.2. CÁC PHƯƠNG PHÁP QUẢN LÝ AN TOÀN THÔNG TIN................ 27
2.2.1 Tiêu chuẩn quản lý an toàn thông tin ISO27001:2013 ....................... 27
2.2.2 Phương pháp tiếp cận ......................................................................... 28
2.2.3
Phương pháp quản lý rủi ro.............................................................. 228
2.3. KHUNG QUẢN LÝ AN TOÀN THÔNG TIN ...................................... 32
CHƯƠNG 3. GIẢI PHÁP NÂNG CAO NĂNG LỰC QUẢN LÝ AN TOÀN
THÔNG TIN DỮ LIỆU VIỄN THÔNG ........................................................... 37
3.1 Phương pháp quản lý rủi ro ...................................................................... 37
Nguyên lý quản lý rủi ro cho tổ chức.............................................. 38
Mô hình tổ chức và phương pháp quản lý rủi ro ............................. 39
Quy trình quản lý rủi ro................................................................... 41
3
Thực hiện đánh giá rủi ro cho hệ thống dữ liệu viễn thông và xây
dựng kế hoạch xử lý rủi ro ........................................................................... 43
3.2 Quản lý an toàn vận hành ......................................................................... 46
3.3 Quản lý tính liền mạch, liên tục kinh doanh ............................................. 47
KẾT LUẬN ........................................................................................................ 49
TÀI LIỆU THAM KHẢO ................................................................................. 51
PHỤ LỤC 1. Danh sách các điểm yếu, đe dọa dùng để phân tích rủi ro an toàn
dữ liệu viễn thông .............................................................................................. 53
PHỤ LỤC 2: Checklist khảo sát đánh giá rủi ro cho dữ liệu viễn thông ........... 58
PHỤ LỤC 3. Ma trận đánh giá rủi ro................................................................. 87
PHỤ LỤC 4. Danh sách phân tích rủi ro cho dữ liệu viễn thông ...................... 90
4
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
STT
Ký hiệu/
CFhữ viết tắt
Ý nghĩa
1
ANTT
An toàn thông tin
2
BCP
Kế hoạch đảm bảo tính liên tục kinh doanh – Business
Contuinity Plan
3
CNTT
Công nghệ thông tin
4
DAMA
Hiệp hội quản lý dữ liệu quốc tế
5
DG
Data Governance – Quản trị dữ liệu
6
DGI
Data Governance Institute - Viện quản trị dữ liệu
7
HMRR
Hạng mục rủi ro
8
ISMS
Hệ thống quản lý an toàn thông tin – Information
Security Management System
9
KVRR
Khẩu vị rủi ro
10
QTDL
Quản trị dữ liệu
11
QLDL
Quản lý dữ liệu
12
QTRR
Quản trị rủi ro
13
QLRR
Quản lý rủi ro
5
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
STT Chương
Hình
Tên hình vẽ
1
1
1.1
Hình 1.1
Hình 1. 1 Tháp dữ liệu
2
1
1.2
Hình 1.2
Hình 1.2 Khung quản lý dữ liệu DAMAOK
3
1
1.3
Hình 1.3
Hình 1.3 Khung quản lý dữ liệu viễn thông
4
2
2.1
Hình 2.1
Hình 2.1 Lộ trình triển khai ISO27001:2013
5
2
2.2
Hình 2.2
Hình 2.2 Mô hình PDCA
6
2
2.2
Hình 2.3
Hình 2.3 Mô hình PDCA ISO27001
7
2
2.3
Hình 2.4
Hình 2.4 Các lĩnh vực chính ATTT
3.1
Hình 3.1
Hình 3.1 Tháp quản lý rủi ro của tổ chức
viễn thông
8
9
3
3
3.1
Hình 3.2
Hình 3.2 Mô hình kiểm soát rủi ro dữ liệu
viễn thông 3 lớp
10
3
3.1
Hình 3.3
Hình 3.3 Quy trình quản lý rủi ro
11
3
3.1
Hình 3.4
Hình 3.4 Quy trình đánh giá rủi ro
12
3
3.1
Hình 3.5
Hình 3.5. Quy trình xử lý rủi ro
Hình 3.6
Hình 3.6 Bảng đánh giá rủi ro dữ liệu viễn
thông
Hình 3.7
Hình 3.7 Công cụ quản lý rủi ro dữ liệu viễn
thông
Hình 3.8
Hình 3.8 Khung quy trình vận hành khai
thác hệ thống thông tin viễn thông
Hình 3.9
Hình 3.9 Kế hoạch đảm bảo tính liên tục cho
hệ thống viễn thông
13
14
15
16
Mục
3
3
3
3
3.1
3.1
3.2
3.3
MỞ ĐẦU
Ngày nay dữ liệu được coi là tài sản quan trọng, việc quản lý dữ liệu cũng như
đảm bảo an toàn thông tin cho dữ liệu là nhu cầu sống còn của đơn vị. Kết quả
phân tích dữ liệu đóng vai trò then chốt cho các quyết định của ban lãnh đạo, để
tăng tính tin cậy của kết quả phân tích dữ liệu thì yêu cầu bắt buộc đơn vị phải có
phương pháp quản lý dữ liệu cho đơn vị mình hiệu quả và đảm bảo chất lượng
[3].
Việc thu thập, khai thác và sử dụng dữ liệu một cách hiệu quả là một trong những
yếu tố quan trọng, quyết định sự phát triển của tổ chức. Tổ chức không thể khai
thác được dữ liệu nếu không biết rõ giá trị của dữ liệu mình đang sở hữu: dữ liệu
ở đâu, làm thế nào để sử dụng, dữ liệu được tích hợp với các ứng dụng nào, ở
đâu, thời gian nào, v.v. Chất lượng dữ liệu kém có thể dẫn tới gia tăng rủi ro hoạt
động, chiến lược, ảnh hưởng đến việc hỗ trợ ra quyết định, các hoạt động và kế
hoạch hàng ngày từ lãnh đạo đơn vị do đó sẽ ảnh hưởng tới hoạt động, sự phát
triển bền vững của tổ chức. Chất lượng dữ liệu và khai thác dữ liệu hiệu quả
nhưng cần đi đôi việc đảm bảo An toàn thông tin (ATTT) cho dữ liệu [1] ,[3].
Quản lý dữ liệu là sự kết hợp giữa con người, quy trình và kỹ thuật cho phép một
tổ chức có thể tối ưu hóa, bảo vệ và sử dụng các nguồn dữ liệu (cấu trúc và phi
cấu trúc) một cách hiệu quả như một tài sản của doanh nghiệp.
Khung quản lý dữ liệu gồm có các hợp phần về: Quản trị dữ liệu, cấu trúc dữ liệu,
mô hình và thiết kế dữ liệu, lưu trữ và vận hành dữ liệu, an toàn dữ liệu, tích hợp
dữ liệu, quản lý văn bản và nội dung, công cụ báo cáo quản trị, siêu dữ liệu
(metadata) và chất lượng dữ liệu [3].
Sau khi nhận thấy được tầm quan trọng trong việc quản lý dữ liệu, đánh giá khảo
sát hiện trạng tổ chức gặp phải nhiều vấn đề trong việc quản lý dữ liệu như quản
lý dữ liệu phân tán, không tập trung. Với mỗi dữ án liên quan đến dữ liệu thì thời
gian để thu thập, làm sạch dữ liệu tốn đa số thời gian của dự án.Việc quản lý an
toàn thông tin dữ liệu trong tổ chức chưa được triển khai theo phương pháp tổng
thể. Khi lãnh đạo thấy vấn đề, sự cố phát sinh hay có vấn đề nổi cộm lên thì chỉ
đạo dồn nguồn lực vào xử lý, mà không có biện pháp quản lý tổng thể. Hoạt động
vận hành trong tổ chức ưu tiên vấn đề “chữa cháy” hơn là việc ưu tiên “phòng
cháy”. Nguồn lực nhân sự vận hành trong tổ chức dồn sự tập trung vào việc xử lý
vụ việc, sự cố, vấn đề hơn là ưu tiên việc đưa ra phương pháp quản lý tổng thể,
quản lý rủi ro để dần dần giảm vấn đề sự vụ và cải tiến liên tục hệ thống. Các
7
công việc mang tính bị động, xảy ra thì xử lý. Ngoài ra, tổ chức hoạt động trên
lĩnh vực viễn thông, các hệ thống lõi cần đảm bảo tính sẵn sàng liên tục cao, tuy
nhiên các phương án dự phòng, đảm bảo tính liền mạch, ứng cứu khi xảy ra gián
đoạn chưa có tính chủ động hoặc chưa được thử nghiệm định kỳ các phương án.
Song song với các vấn đề thực tại trên của tổ chức thì trên thế giới, các giải pháp
về quản lý dữ liệu và an ninh dữ liệu luôn được cập nhật các phương pháp giải
pháp mới như ISO27001:2013, ISO31000:2018.
Từ các vấn đề trên, luận văn thực hiện nghiên cứu về:
NGHIÊN CỨU XÂY DỰNG KHUNG QUẢN TRỊ DỮ LIỆU CHO VIỆC
QUẢN LÝ DỮ LIỆU CỦA TỔNG CÔNG TY MẠNG LƯỚI VIETTEL.
Mục đích nghiên cứu: Mục đích luận văn nghiên cứu để đưa ra cách thức và
phương pháp quản lý để giải quyết được các vấn đề bất cập trên của tổ chức.
Xây dựng khung quản lý dữ liệu cho dữ liệu viễn thông. Các hợp phần quan trọng
tổ chức cần thực hiện quản lý khi muốn tăng chất lượng dữ liệu và khả năng tin
cậy dữ liệu bao gồm: quản trị, thu thập/ lưu trữ, chất lượng, truy cập và cung cấp,
phân tích, an ninh dữ liệu.
Tuy nhiên, thời gian nghiên cứu, triển khai còn hạn hẹp, luận văn chưa đủ thời
gian để nghiên cứu triển khai hết tất cả các hợp phần trên. Nên trong phạm vi luận
văn này em xin phép được tập trung nghiên cứu sâu và xây dựng và triển khai các
giải pháp về một trong các hợp phần trong khung quản lý là phần quản lý an toàn
thông tin. Tập trung đề xuất các giải pháp để nâng cao năng lực an toàn thông tin
cho dữ liệu viễn thông.
8
Mục đích của việc triển khai các giải pháp quản lý an toàn thông tin toàn diện cho
dữ liệu viễn thông nhằm đảm bảo cho các hệ thống công nghệ thông tin, viễn
thông trong tổng công ty đạt các yêu cầu về an toàn, bảo mật. Các thông tin sẽ
được quản lý đảm bảo tính bí mật, toàn vẹn, xác thực và sẵn sàng. Đồng thời nâng
cao tính liên tục không bị gián đoạn giúp hệ thống thông tin được vận hành liên
tục, chống lại các sự cố an toàn thông tin, các cuộc tấn công từ nội bộ hoặc từ bên
ngoài. Qua đó sẽ nâng cao mức độ tin cậy đối với các đối tác và khách hàng khi
làm việc tại đơn vị. Bên cạnh việc tăng cường hoạt động, quản lý, phòng ngừa,
phát hiện sớm các điểm rủi ro để có hành động xử lý sớm sẽ giảm khả năng rủi
ro xuất hiện. Qua đó giảm tỷ lệ sự cố phát sinh cần xử lý hàng ngày.
Sau khi nghiên cứu triển khai, áp dụng thực tế các giải pháp đưa ra trong luận văn
vào các hoạt động đơn vị. Giúp đơn vị thấy được khung quản lý dữ liệu đầy đủ,
các hợp phần đơn vị cần thiết cho việc quản lý đặc thù cho dữ liệu viễn thông.
Trong các hợp phần của khung quản lý dữ liệu, luận văn tập trung nghiên cứu sâu
về khung quản lý an toàn thông tin. Nghiên cứu xây dựng các giải pháp an toàn
thông tin phù hợp cho đơn vị sau khi khảo sát nắm được các điểm mạnh, điểm
chưa tốt trong hoạt động quản lý an toàn. Những điểm mạnh tổ chức đã thực hiện
triển khai trước đó sẽ được duy trì. Và luận văn tập trung triển khai vào ba giải
pháp chính mà trước đó đơn vị chưa có hoặc triển khai đưa đầy đủ hiện quả đó
là: hoạt động liên quan tới quản lý rủi ro, quản lý công tác vận hành khai thác và
cac hoạt động nhằm nâng cao tính liên tục các hệ thống công nghệ thông tin và
viễn thông.
Phương pháp nghiên cứu: Nghiên cứu phương pháp về quản lý dữ liệu. Khảo
sát, đánh giá hiện trạng hệ thống và cách thức quản lý hiện tại của đơn vị để đề
xuất khung quản lý dữ liệu cho viễn thông. Sau đó đi vào nghiên cứu sâu các giải
pháp cho mảng quản lý an tòan thông tin dữ liệu. Triển khai các phương pháp
quản lý vào thực tế trong đơn vị để nâng cao năng lực quản lý an toàn thông tin
cho dữ liệu viễn thông.
Phương pháp thực nghiệm: Xây dựng hệ thống văn bản, tài liệu, công cụ quản
lý và đưa vào triển khai áp dụng trong thực tế.
Luận văn sẽ được cấu trúc với ba chương. Chương 1 Khung quản lý dữ liệu đưa
ra khái niệm chung về quản trị, quản lý dữ liệu. Mô tả các thành phần chính trong
khung quản lý dữ liệu chung. Sau khi khảo sát hoạt động đơn vị thì đưa ra khung
quản lý dữ liệu cho dữ liệu viễn thông. Các vấn đề, vướng mắc hay gặp phải trong
việc quản lý dữ liệu. Chương hai bắt đầu đi sâu hơn vào trong một những hợp
9
phần quan trọng nhất trong việc quản lý dữ liệu và quản lý an toàn thông tin. Đưa
ra các khái niệm chính về an toàn thông tin dữ liệu. Đưa ra các phương pháp trong
việc quản lý an toàn thông tin, mô tả chi tiết các hợp phần cần thực hiện khi thiết
lập hệ thống quản lý an toàn thông tin tại đơn vị. Sau khi nghiên cứu phương pháp
và đưa ra các phần chính cần thực hiện khi quản lý an toàn thông tin, dựa vào kết
quả khảo sát tại đơn vị, luận văn tập trung đưa ra các giải pháp chính mà chưa
được xây dựng, triển khai tại đơn vị hoặc việc triển khai tại đơn vị chưa được đầy
đủ, hiệu quả. Các giải pháp chi tiết này sẽ được đưa ra tại chương ba và đánh giá
kết quả triển khai.
CHƯƠNG 1. KHUNG QUẢN LÝ DỮ LIỆU
1.1. KHÁI NIỆM CHUNG VỀ QUẢN LÝ DỮ LIỆU
1.1.1. Định nghĩa thông tin và dữ liệu
Ngày nay, nhiều tổ chức nhận ra rằng dữ liệu là tài sản vô cùng quan trọng của
doanh nghiệp. Dữ liệu và thông tin có thể cung cấp cái nhìn sâu sắc về khách
hàng, sản phẩm và dịch vụ của họ qua đó giúp doanh nghiệp đổi mới và đạt được
mục tiêu chiến lược [1], [3].
Mặc dù thừa nhận là vậy nhưng rất ít tổ chức chủ động quản lý dữ liệu như một
tài sản để khai thác giá trị liên tục từ dữ liệu của mình. Giá trị mang lại từ dữ liệu
không phải một cách ngẫu nhiên mà nó là cả một quá trình xây dựng mục tiêu,
chiến lược, kế hoạch, điều phối và có sự cam kết. Đòi hỏi cả việc quản trị và lãnh
đạo.
Dữ liệu và thông tin không chỉ là tài sản của tổ chức mà tổ chức cần đầu tư vào
việc quản trị dữ liệu, thông tin để có thể thu lợi trong tương lai. Dữ liệu và thông
tin quan trọng thiết yếu đối với các tổ chức trong các hoạt động hàng ngày, được
coi như “dòng máu của cuộc sống”, thậm chí là “dầu mỏ mới” của nền kinh tế
thông tin. Do đó tổ chức phải quản trị nguồn dữ liệu để qua đó tăng khả năng ra
các quyết định đúng căn cứ trên kết quả phân tích dữ liệu [3], [9].
Dữ liệu được hiểu là thông tin được lưu trữ dưới dạng số (mặc dù dữ liệu không
giới hạn thông tin được số hóa hay được quản lý trên giấy hay trong các cơ sở
dữ liệu). Tuy nhiên, do ngày nay chúng ta có thể nắm bắt được rất nhiều thông
tin điện tử, chúng ta gọi nhiều thứ là “dữ liệu”, những thứ mà trước đó không
được coi là dữ liệu như: tên, địa chỉ, ngày sinh, những gì mọi người ăn trong bữa
tối thứ bảy, cuốn sách hay được mua nhiều nhất [3], [9].
10
Những sự kiện về hành vi con người được tổng hợp, phân tích và sử dụng để tạo
ra lợi nhuận, cải thiện sức khỏe hoặc ảnh hưởng đến chính sách công.
Thực tế tốn nhiều giấy mực để định nghĩa mối quan hệ giữa dữ liệu và thông tin.
Dữ liệu được gọi “Nguyên liệu của thông tin – Raw material of information” và
thông tin được gọi là “Dữ liệu trong một bối cảnh – Data in context”.
Hình 1.1 biểu diễn tháp dữ liệu từ đáy tới đỉnh lần lượt sẽ là “Dữ liệu, Thông tin,
Kiến thức và trên cùng là Trí tuệ - Data, Information, Knowledge and Wisdom)1.
Wisdom
Knowledge
Information
Data
Hình 1.1 Tháp dữ liệu
Qua hình tháp ta có thể thấy dưới cùng là dữ liệu, dữ liệu là nền tảng cho thông
tin, kiến thức và trí tuệ của tổ chức. Việc tổ chức có khai thác, sử dụng tối đa tri
quản lý dữ liệu cho tốt.
Tuy nhiên trong việc quản lý dữ liệu cho tổ chức còn tồn tại rất nhiều thách thức
như dữ liệu được giả định đơn giản chỉ là tồn tại. Nhưng dữ liệu không chỉ tồn
tại, dữ liệu được tạo ra.Dữ liệu và thông tin là hai khái niệm đan xen và phụ thuộc
với nhau. Dữ liệu là một dạng của thông tin và thông tin là một dạng của dữ liệu.
Cả dữ liệu và thông tin đều cần phải được quản lý để đảm bảo có được chất lượng
cao nâng cao tính tin cậy trong các kết quả phân tích dữ liệu.
1.1.2. Quản lý dữ liệu
Quản lý dữ liệu là sự phát triển, thực hiện và giám sát các kế hoạch, chính sách,
chương trình và thực hành cung cấp, kiểm soát, bảo vệ và nâng cao giá trị của dữ
liệu và tài sản thông tin trong suốt vòng đời của họ.
Quản lý dữ liệu chuyên nghiệp là bất kỳ người nào làm việc trong bất kỳ khía
cạnh của quản lý dữ liệu (từ quản lý kỹ thuật của dữ liệu trong suốt vòng đời của
nó để đảm bảo rằng dữ liệu được sử dụng đúng cách) để đáp ứng mục tiêu chiến
1
11
lược của tổ chức. Các chuyên gia quản lý dữ liệu đảm nhận nhiều vai trò, từ kỹ
thuật (ví dụ, các quản trị cơ sở dữ liệu, quản trị mạng, lập trình viên) đến kinh
doanh chiến lược (ví dụ, nhà chiến lược dữ liệu, cán bộ quản lý dữ liệu).
Hoạt động quản lý dữ liệu trên phạm vi rộng bao gồm mọi thứ, từ khả năng đưa
ra quyết định phù hợp về cách để có được giá trị chiến lược từ dữ liệu, để việc
triển khai kỹ thuật và hiệu suất của cơ sở dữ liệu. Do đó quản lý dữ liệu đòi hỏi
cả hai kỹ năng kỹ thuật và phi kỹ thuật. Trách nhiệm quản lý dữ liệu phải được
chia sẻ giữa các vai trò các bộ phận nghiệp vụ và bộ phận công nghệ thông tin để
đảm bảo một tổ chức có dữ liệu chất lượng cao đáp ứng nhu cầu chiến lược của
mình.
1.1.3. Quản trị dữ liệu
Quản trị dữ liệu là một khái niệm của quản lý dữ liệu liên quan đến khả năng cho
phép một cơ quan, tổ chức bảo đảm rẳng chất lượng dữ liệu cao tồn tại trong suốt
vòng đời hoàn chỉnh của dữ liệu. Các lĩnh vực trọng tâm của quản trị dữ liệu bao
gồm tính khả dụng, khả năng sử dụng, tính nhất quán, tính toàn vẹn dữ liệu, bảo
mật dữ liệu, thiết lập các quy trình để bảo đảm quản lý dữ liệu hiệu quả trong toàn
bộ cơ quan, tổ chức. Người quản lý dữ liệu đóng vai trò bảo đảm các quy trình
quản trị dữ liệu được tuân thủ, các hướng dẫn được thi hành và khuyến nghị cải
tiến các quy trình quản trị dữ liệu [10].
Quản trị dữ liệu là tập hợp các quy trình, vai trò, chính sách, tiêu chuẩn và số liệu
bảo đảm việc sử dụng thông tin hiệu lực và hiệu quả trong việc cho phép một tổ
chức đạt được mục tiêu của mình. Nó thiết lập các quy trình và trách nhiệm bảo
đảm chất lượng và bảo mật của dữ liệu được sử dụng trên toàn doanh nghiệp hoặc
tổ chức. Quản trị dữ liệu xác định ai có thể thực hiện hành động nào, dựa trên dữ
liệu nào, trong tình huống nào, sử dụng phương pháp nào [10], [11].
Quản trị dữ liệu xác định các quy tắc, ảnh hưởng và quy định cho dữ liệu để thiết
lập xây dựng chính sách. Các quy tắc và chính sách này thiết lập quyền quyết
định cũng như các biện pháp kiểm soát đảm bảo an ninh, trách nhiệm và sự tin
cậy. Quản trị không phải là hoạt động giám sát hàng ngày, mà là nền tảng vững
chắc cho một hệ thống quản lý dữ liệu khả thi2.
Quản trị dữ liệu có thể được định nghĩa là một cách tiếp cận có tổ chức để quản
lý dữ liệu và thông tin được chính thức hóa thành một tập hợp các chính sách và
2
12
quy trình bao gồm toàn bộ vòng đời của dữ liệu, từ thu thập đến sử dụng, xử lý.
Các bước chính để tạo ra một chương trình quản trị dữ liệu mạnh mẽ bao gồm:
Xác định thẩm quyền ra quyết định mang tính tổ chức; xác định các tiêu chuẩn,
chính sách dữ liệu và thủ tục để hướng dẫn các quy trình quản lý dữ liệu khác
nhau, bao gồm an ninh dữ liệu và bảo vệ quyền riêng tư, kiểm soát chất lượng dữ
liệu và các hoạt động phổ biến dữ liệu; thực thi các chính sách và thủ tục sau khi
xây dựng; giám sát việc tuân thủ các tiêu chuẩn, chính sách và thủ tục đã được
thiết lập.
Một chương trình quản trị dữ liệu bao gồm: Bảo vệ dữ liệu nhạy cảm; đánh giá
lỗ hổng và quản lý rủi ro; thực thi các yêu cầu tuân thủ pháp luật, quy định, hợp
đồng; xác định các bên liên quan cùng với các vai trò và trách nhiệm của họ và
quản lý truy cập.
Quản trị dữ liệu (Data Governance- DG) được định nghĩa là việc thực hiện các
quyền và kiểm soát (hoạch định, giám sát và thực thi) trong việc quản lý dữ liệu.
Tất cả các tổ chức đưa ra quyết định dựa trên dữ liệu, bất kể họ có chức năng
quản trị dữ liệu chính thức hay không. Do vậy việc thiết lập mô hình quản lý dữ
liệu trong tổ chức sẽ giúp cho tổ chức khai thác được tốt hơn, làm tăng lợi nhuận
đem lại từ dữ liệu cho tổ chức đó. Mục đích của quản trị dữ liệu là đảm bảo dữ
liệu được quản lý đúng cách, theo các chính sách và thông lệ tốt nhất về quản lý
dữ liệu. Nếu như quá trình quản lý dữ liệu là để đảm bảo tổ chức khai thác được
giá trị từ các nguồn dữ liệu của mình thì việc quản trị dữ liệu tập trung vào làm
thế nào để đưa ra quyết định dựa trên dữ liệu. Quản trị dữ liệu tập trung vào các
phạm vi: Chiến lược; Chính sách; Tiêu chuẩn và chất lượng; Giám sát; Tuân thủ;
Quản lý vấn đề; Các dự án quản lý dữ liệu; Định giá tài sản dữ liệu.3
1.1.4. Phân biệt quản lý và quản trị dữ liệu
Quản trị dữ liệu thường bị nhầm lẫn với các thuật ngữ và khái niệm liên quan
khác, bao gồm quản lý dữ liệu. Quản lý dữ liệu đề cập đến việc quản lý các nhu
cầu vòng đời dữ liệu đầy đủ của một tổ chức. Quản trị dữ liệu là thành phần cốt
lõi của quản lý dữ liệu, liên kết các lĩnh vực khác như chất lượng dữ liệu, quản lý
dữ liệu tham chiếu và dữ liệu gốc, bảo mật dữ liệu, hoạt động cơ sở dữ liệu, quản
lý siêu dữ liệu và lưu trữ dữ liệu [3], [12], [13].
3
13
Từ điển quản lý dữ liệu định nghĩa quản trị dữ liệu là việc thực thi quyền lực,
kiểm soát và ra quyết định chung (lập kế hoạch, giám sát và thi hành) đối với việc
quản lý tài sản dữ liệu. Các sáng kiến quản trị dữ liệu cung cấp nền tảng để phát
triển các giao thức và thủ tục quản lý dữ liệu phù hợp.
Mặt khác, quản lý dữ liệu là quá trình đưa các chính sách quản trị vào hoạt động.
Quản trị cung cấp một khuôn khổ; sau đó, cơ quan, tổ chức có thể xác định các
khu vực để quản lý (như bảo mật, cơ sở dữ liệu và kiểm soát tài liệu) và quản lý
cơ sở hạ tầng hoặc kiến trúc. “Quản trị” thiết lập lý do tại sao và ai cho khả năng
truy cập và kiểm soát dữ liệu, trong khi “Quản lý” thiết lập nơi truy cập và cách
thức truy cập [3], [19].
1.1.5. Lợi ích và tầm quan trọng của quản lý dữ liệu
Quản lý dữ liệu quan trọng bởi vì quản lý dữ liệu chủ động là cần thiết để bảo
đảm tính bảo mật, tính toàn vẹn, khả năng truy cập, tính sẵn có và chất lượng của
dữ liệu. Thiết lập quản lý dữ liệu là một nhiệm vụ quan trọng đối với bất kỳ tổ
chức nào. Nó đòi hỏi xác định tầm nhìn tổ chức, chính sách và thực tiễn; giành
được sự ủng hộ của các bên liên quan; thực hiện chương trình; và theo dõi sự
thành công của nó. Bằng cách phác thảo rõ ràng các chính sách, thủ tục chuẩn,
trách nhiệm và kiểm soát các hoạt động dữ liệu xung quanh, chương trình quản
lý dữ liệu giúp bảo đảm thông tin được thu thập, duy trì, sử dụng và phổ biến theo
cách bảo vệ quyền riêng tư, bảo mật và an ninh của cá nhân, trong khi tạo ra dữ
liệu thống kê kịp thời và chính xác [1], [3].
Quản lý dữ liệu là một yếu tố quan trọng để quản lý thành công các hệ thống dữ
liệu phức tạp. Nó cho phép các tổ chức giải quyết hiệu quả hơn các thách thức
liên quan đến chia sẻ dữ liệu, thay đổi theo thời gian và đáp ứng nhu cầu của các
nhóm bên liên quan khác nhau trong và ngoài cơ quan. Những lợi ích của cách
tiếp cận chủ động đối với quản trị dữ liệu bao gồm: Cải thiện độ chính xác của
dữ liệu, đạt được bằng cách lập lịch kiểm toán chất lượng dữ liệu thường xuyên
và sử dụng các tiêu chuẩn dữ liệu nhất quán trong việc đặt tên biến và phân loại
siêu dữ liệu. Cải thiện khả năng sử dụng dữ liệu, xuất phát từ việc giám sát nội
dung dữ liệu về tính nhất quán với tầm nhìn của tổ chức và nhu cầu của các bên
liên quan. Cải thiện tính kịp thời của dữ liệu, được thực hiện bằng cách tránh
trùng lặp các nỗ lực thu thập dữ liệu không cần thiết và giảm công việc cần thiết
để đối chiếu các lỗi hoặc sai lệch khi hợp nhất hoặc chia sẻ dữ liệu. Tăng cường
an ninh dữ liệu, có được bằng cách thiết kế một kế hoạch an ninh toàn diện và áp
dụng các mức bảo vệ phù hợp cho dữ liệu dựa trên mức độ nhạy cảm của chúng.
14
Chức năng của quản trị dữ liệu bao gồm việc thực thi thẩm quyền, kiểm soát và
ra quyết định chung (lập kế hoạch, giám sát và thực thi) đối với việc quản lý tài
sản dữ liệu. Quản trị dữ liệu đóng vai trò rất quan trọng trong việc đạt được chất
lượng dữ liệu cao. Quản trị dữ liệu tạo ra một cấu trúc có tổ chức nhằm phát triển
và thực thi các chính sách, quy tắc, quy trình và thủ tục để bảo đảm và cải thiện
chất lượng dữ liệu trong một tổ chức [3], [9].
1.1.6. Nguyên tắc quản lý dữ liệu
Mục tiêu của quản lý dữ liệu để cho phép tổ chức quản lý dữ liệu như một tài sản.
Quản lý dữ liệu cung cấp các nguyên tắc, chính sách, quy trình, khung, ma trận
số liệu và giám sát để quản lý dữ liệu như một tài sản và hướng dẫn các hoạt động
quản lý dữ liệu ở tất cả các mức độ. Để đạt được mục tiêu tổng thể này, quản lý
dữ liệu cần phải đạt được tính bền vững tức là quản lý dữ liệu cần phải được ưu
tiên, nó không phải là một dự án có thời gian kết thúc, nó là một quá trình liên
tục, đòi hỏi phải kiên trì thực hiện lâu dài, thường xuyên và liên tục cải tiến trong
tổ chức. Bên cạnh đó, quản lý dữ liệu cần tích hợp vào trong các hoạt động quản
lý của đơn vị. Các hoạt động quản lý dữ liệu cần được đưa vào trong phương pháp
phát triển phần mềm, sử dụng dữ liệu để phân tích, quản lý dữ liệu master và quản
lý rủi ro. Quản lý dữ liệu cần đảm bảo đo lường được. Quản lý dữ liệu làm tốt sẽ
có tác động tốt tới tài chính tổ chức, nhưng chứng minh được tác động này cần
có sự hiểu biết thời gian, điểm bắt đầu và lập kế hoạch để cải thiện [3], [12].
Việc triển khai chương trình quản lý dữ liệu yêu cầu cần có sự cam kết trong toàn
tổ chức từ cấp lãnh đạo cao nhất của đơn vị. Có sự cam kết triển khai từ các cấp
lãnh đạo, từ đó đưa vào các hoạt động chiến lược, định hướng kinh doanh. Và
chia sẻ trách nhiệm, có ma trận phân tách trách nhiệm rõ ràng giữa các đơn vị
trong tổ chức về hoạt động quản lý dữ liệu. Quản lý dữ liệu cần dựa trên khung
và có nguyên tắc quản lý cụ thể.
Nguyên tắc quản lý dữ liệu cần đảm bảo tính toàn vẹn những người tham gia quản
lý dữ liệu sẽ thực hiện toàn vẹn các giao dịch của họ. Tiếp theo là tính minh bạch
quy trình quản lý dữ liệu và quản lý dữ liệu sẽ thể hiện tính minh bạch; cần phải
rõ ràng cho tất cả những người tham gia và kiểm toán viên về cách thức và thời
điểm các quyết định và kiểm soát liên quan đến dữ liệu được đưa vào các quy
trình. Có khả năng đánh giá được các quyết định, quy trình và kiểm soát liên quan
đến quản lý dữ liệu sẽ có thể kiểm toán được; chúng sẽ được kèm theo tài liệu để
hỗ trợ các yêu cầu kiểm toán dựa trên hoạt động và tuân thủ. Quản lý dữ liệu sẽ
xác định trách nhiệm cho các quyết định, quy trình và kiểm soát liên quan đến dữ
15
liệu chức năng chéo. Quản lý dữ liệu sẽ xác định trách nhiệm đối với các hoạt
động quản lý là trách nhiệm của từng người đóng góp, cũng như trách nhiệm đối
với các nhóm quản lý dữ liệu. Quản lý dữ liệu sẽ xác định trách nhiệm theo cách
giới thiệu kiểm tra và cân bằng giữa các nhóm kinh doanh và công nghệ cũng như
giữa những người tạo/thu thập thông tin, những người quản lý nó, những người
sử dụng nó và những người giới thiệu các tiêu chuẩn và yêu cầu tuân thủ. Quản
lý dữ liệu sẽ hỗ trợ tốt chuẩn hóa dữ liệu doanh nghiệp. Cuối cùng, quản lý dữ
liệu sẽ hỗ trợ các hoạt động quản lý thay đổi chủ động và phản ứng cho các giá
trị dữ liệu tham chiếu và cấu trúc/ sử dụng dữ liệu gốc và siêu dữ liệu [10].
1.1.7. Các lĩnh vực trọng tâm chính cần được đề cập trong quản lý dữ liệu
An ninh dữ liệu và quản lý rủi ro: Bảo đảm an ninh cho dữ liệu nhạy cảm (dữ
liệu có nguy cơ bị tổn hại do tiết lộ trái phép hoặc vô ý) và thông tin nhận dạng
cá nhân bằng cách bảo vệ chống lại rủi ro tiết lộ trái phép là ưu tiên hàng đầu đối
với chương trình quản lý dữ liệu hiệu quả. Mục tiêu này đạt được bằng cách thiết
lập một kế hoạch quản lý an ninh dữ liệu toàn diện với hệ thống kiểm tra và kiểm
soát để giảm thiểu rủi ro an ninh dữ liệu. Các chính sách và hướng dẫn phải xác
định các quy tắc cho việc sử dụng cá nhân và sử dụng liên quan đến công việc
đối với tất cả hệ thống máy tính và dữ liệu của tổ chức, bao gồm các thủ tục sử
dụng dữ liệu, đánh giá rủi ro dữ liệu để xác định lỗ hổng và xử lý các vi phạm an
ninh dữ liệu và giải thích cách giám sát việc tuân thủ các chính sách này. Điều
quan trọng là phải tiến hành đào tạo nhân viên và kiểm toán thường xuyên để bảo
đảm tuân thủ các chính sách và thủ tục của tổ chức. Kế hoạch bảo mật và an ninh
dữ liệu nên được xem xét và sửa đổi thường xuyên để cập nhật các mối đe dọa
mới nhất [13].
Kiểm kê dữ liệu và quản lý nội dung dữ liệu: Duy trì kiểm kê cập nhật đầy đủ
tất cả các bản ghi và hệ thống dữ liệu bao gồm cả dữ liệu được sử dụng để lưu trữ
và xử lý dữ liệu, cho phép tổ chức nhắm mục tiêu an ninh dữ liệu và quản lý
quyền riêng tư để bảo vệ dữ liệu nhạy cảm. Bản kiểm kê dữ liệu cần chỉ định
những phần tử dữ liệu nào được thu thập, cung cấp lý do cho việc thu thập chúng
và giải thích các mục đích dự định cho việc sử dụng chúng. Một tổ chức nên
thường xuyên xem xét việc kiểm kê của mình và sửa đổi các chính sách quản lý
dữ liệu để bảo đảm rằng chỉ những dữ liệu cần thiết để đáp ứng bộ chính sách,
hoạt động và nhu cầu nghiên cứu chính đáng mới được thu thập và duy trì. Tất cả
các phần tử dữ liệu nên được phân loại theo mức độ nhạy cảm của chúng (ví dụ:
bằng cách đánh giá rủi ro tiết lộ thông tin nhận dạng cá nhân; khả năng gây ảnh
hưởng xấu cho cá nhân, nếu dữ liệu bị xâm phạm; yêu cầu pháp lý để bảo vệ dữ
16
liệu, v.v.) bảo đảm phù hợp với những nỗ lực an ninh được áp dụng để bảo vệ dữ
liệu [3], [11].
Quản lý hồ sơ dữ liệu và truy cập dữ liệu: Bảo đảm tuân thủ các chính sách an
ninh được thực hiện bằng cách chỉ định rõ ràng tất cả các hoạt động liên quan đến
xử lý dữ liệu của người quản lý dữ liệu cũng như người dùng. Điều này bao gồm
nêu rõ ai có thể truy cập dữ liệu nào, cho mục đích gì, truy cập khi nào và truy
cập như thế nào. Một kế hoạch quản trị cần cung cấp hướng dẫn về các hoạt động
dữ liệu người dùng và người quản lý phù hợp để xử lý các bản ghi trong tất cả
các giai đoạn của vòng đời dữ liệu bao gồm thu thập, duy trì, sử dụng và lưu trữ
hoặc hủy dữ liệu một cách an toàn. Ngoài ra, kế hoạch nên xác định các yêu cầu
và cơ chế cho việc hủy thông tin nhận dạng cá nhân để bảo vệ quyền riêng tư cá
nhân (ví dụ: bằng cách xóa tất cả các định danh trực tiếp và gián tiếp khỏi dữ liệu
liên quan đến thông tin nhận dạng cá nhân) [3], [12].
Chất lượng dữ liệu: Xây dựng các phương pháp để ngăn chặn, phát hiện, sửa lỗi
và lạm dụng dữ liệu là điều cần thiết để duy trì dữ liệu chất lượng cao. Cách tiếp
cận chủ động đối với quản lý dữ liệu đòi hỏi phải thiết lập các tiêu chuẩn chất
lượng dữ liệu và giám sát, cập nhật thường xuyên các chiến lược quản lý dữ liệu
để bảo đảm dữ liệu chính xác, phù hợp, kịp thời và hoàn chỉnh cho các mục đích
mà chúng dự định sẽ được sử dụng. Một kế hoạch quản lý dữ liệu mạnh mẽ nên
phác thảo việc sử dụng dữ liệu có thể chấp nhận để cân bằng giữa quyền riêng tư
và an ninh với nhu cầu dữ liệu chất lượng cao cần thiết cho các phân tích thống
kê. Việc kiểm toán chất lượng định kỳ nên được xây dựng trong tất cả các chu
trình quản lý dữ liệu, bao gồm thu thập, báo cáo và phát hành [3].
Chia sẻ dữ liệu và báo cáo: Bảo đảm các hoạt động phổ biến dữ liệu tuân thủ
luật pháp là trách nhiệm chính của cơ quan, tổ chức. Việc phát hành hoặc chia sẻ
bất kỳ dữ liệu nào mà không có sự đồng ý bằng văn bản (ví dụ: dưới dạng hồ sơ
cá nhân hoặc báo cáo tổng hợp) phải tuân thủ các chính sách và quy định do tổ
chức thiết lập bao gồm các thủ tục bảo vệ thông tin nhận dạng cá nhân khi chia
sẻ với các cơ quan khác và thủ tục tránh tiết lộ để bảo vệ thông tin nhận dạng cá
nhân không bị tiết lộ trong các báo cáo công khai. (Bảo đảm rằng mọi thỏa thuận
chia sẻ dữ liệu đều được cho phép theo luật và quy định về quyền riêng tư). Hơn
nữa, kế hoạch quản lý dữ liệu nên xác định các thủ tục để thông báo cho các bên
liên quan thường xuyên về các quyền của họ theo luật và quy định điều chỉnh
quyền riêng tư của dữ liệu.
1.1.8. Các bước cơ bản để thực hiện quản lý dữ liệu
Thành lập ủy ban quản lý dữ liệu: Trong một hệ thống dữ liệu phức tạp với
nhiều mục đích sử dụng, thiết lập nhiệm vụ, ban hành các chính sách và thủ tục
17
quản lý dữ liệu được giao cho một ủy ban quản lý dữ liệu. Ủy ban này phải có
“chức năng chéo” và bao gồm đại diện bộ phận, tư vấn pháp lý, quản trị viên hệ
thống dữ liệu, nhà cung cấp dữ liệu, quản lý dữ liệu, chuyên gia an ninh và quyền
riêng tư, người dùng dữ liệu từ khắp tổ chức. Các thành viên ủy ban đại diện cho
các văn phòng khác nhau này (ví dụ: các văn phòng liên quan đến việc cung cấp
hoặc sử dụng dữ liệu) nên được bổ nhiệm bởi các khu vực (hoặc một nhóm cá
nhân) khác với cơ quan quản lý điều hành.
Xác định chính sách và thủ tục quản lý dữ liệu: Ủy ban quản lý dữ liệu phát
triển các chính sách, thủ tục và tiêu chuẩn cho một chương trình bảo vệ dữ liệu
và quyền riêng tư. Các chính sách và thủ tục này phải khả thi ở các cấp khác nhau
trong cấu trúc quản lý dữ liệu của tổ chức. Ủy ban quản trị có trách nhiệm chính
thức hóa các chính sách và thủ tục quản lý dữ liệu bằng văn bản sau khi lấy ý kiến
phản hồi của các bên liên quan và bảo đảm sự hỗ trợ từ lãnh đạo điều hành.
Triển khai chương trình quản lý dữ liệu: Các chính sách và quy trình cụ thể
được nêu trong chương trình quản lý dữ liệu được những người quản lý dữ liệu
triển khai thông qua việc quản lý dữ liệu liên tục bao gồm thu thập, xử lý, lưu trữ,
bảo trì và sử dụng. Bất kỳ thay đổi nào đối với chương trình quản trị phải được
sự chấp thuận của các lãnh đạo có thẩm quyền điều hành, người ban đầu chỉ định
các thành viên của Ủy ban quản lý dữ liệu.
Theo dõi và báo cáo tiến độ chương trình: Người quản lý dữ liệu có trách nhiệm
tích cực theo dõi các hoạt động liên quan đến dữ liệu để bảo đảm tuân thủ các
tiêu chuẩn, chính sách và thủ tục đã được thiết lập. Ủy ban quản lý dữ liệu nên
theo dõi tiến độ thực hiện chương trình với các số liệu chính (ví dụ: thống kê chất
lượng dữ liệu) và báo cáo định kỳ về tiến độ cho nhóm lãnh đạo và các bên liên
quan khác.
18
1.2. KHUNG QUẢN LÝ DỮ LIỆU
Khung quản lý dữ liệu đang đặt quản trị dữ liệu ở vị trí trung tâm, vì quản trị là
cần thiết cho sự nhất quán và cân bằng giữa các chứ năng. Tất cả các thành phần
trong khung quản lý dữ liệu đều là cần thiết cho tổ chức trong việc quản lý thông
tin, tuy nhiên chúng có thể sẽ được triển khai tại các thời điểm khác nhau phụ
thuộc vào mức độ ưu tiên và yêu cầu của tổ chức [3].
Quản trị dữ liệu là lập kế hoạch, triển khai, giám sát toàn bộ hoạt động, các quy
trình, chức năng có trong quản lý dữ liệu, kiểm soát hệ thống Quản lý dữ liệu
(Data Management). DAMA đã đặt Quản trị dữ liệu vào trung tâm cửa khung
quản lý dữ liệu, vì quản trị dữ liệu đóng vai trò như “trái tim”, thành phần cốt lõi,
ổn định, cân bằng giữa tất cả các chức năng trong Quản lý dữ liệu [3], [19].
Hình 1.2. Khung quản lý dữ liệu
Theo hiệp hội quản lý dữ liệu quốc tế (Data management Association- DAMA),
khung quản lý dữ liệu bao gồm các lĩnh vực sau [3], [19]:
Quản lý kiến trúc dữ liệu (Data Architechture) là thành phần thứ hai trong
khung quản lý dữ liệu, sau thành phần trung tâm là quản trị dữ liệu đã được giới
thiệu trong nội dung trước.
Quản lý kiến trúc dữ liệu liên quan đến các việc: xác định nhu cầu, tiến hành thiết
kế, duy trì và phát triển hệ thống kiến trúc dữ liệu bao gồm các mô hình, chính
19
sách, quy tắc hoặc tiêu chuẩn tác động đến các cách thức dữ liệu được thu thập,
lưu trữ, sắp xếp, tích hợp và đưa vào phân tích, sử dụng.
Quản lý kiến trúc dữ liệu là quá trình xây dựng các yêu cầu trung về quản lý dữ
liệu cho tổ chức. Giúp cung cấp một tiêu chuẩn chung, các yêu cầu chiến lược về
dữ liệu. Đưa ra được các thiết kế tích hợp mức tổng quan để đáp ứng được các
yêu cầu của tổ chức và phù hợp với chiến lược cũng như kiến trúc của doanh
nghiệp.
Thiết kế và mô hình hóa dữ liệu (Data Modeling & Design) là quá trình khám
phá, nghiên cứu, phân tích dữ liệu. Xác định, tìm hiểu các nhu cầu, mục đích khai
thác dữ liệu, thể hiện những nhu cầu, mục đích đó của tổ chức vào các mô hình
dữ liệu thống nhất, chuẩn tắc và có thể được sử dụng nhiều lần, lặp đi lặp lại trong
tương lai. Mô hình hóa dữ liệu đại diện cho đối tượng dữ liệu, thể hiện mối liên
hệ, sự kết hợp giữa các đối tượng dữ liệu khác nhau và các quy tắc có thể có giữa
các đối tượng dữ liệu đó.
Lưu trữ và vận hành dữ liệu (Data Storage & Operations) các hoạt động bao
gồm việc thiết kế, thực hiện, và hỗ trợ lưu trữ dữ liệu, mục đích để tối đa hóa giá
trị trong suốt vòng đời dữ liệu, từ việc tiếp cận, thu thập, tích hợp đến xử lý. Lưu
trữ và vận hành dữ liệu bao gồm hai hoạt động là cơ sở dữ liệu hỗ trợ tập trung
và cơ sở dữ liệu kỹ thuật hỗ trợ.
Cơ sở dữ liệu hỗ trợ (Database support): tập trung vào các hoạt động liên quan
đến vòng đời dữ liệu, từ việc triển khai xây dựng môi trường cơ sở dữ liệu ban
đầu, đến việc thu thập, lưu trữ hay hủy bỏ dữ liệu, bảo đảm cơ sở dữ liệu được
hoạt động tốt thông qua giám sát và điều chỉnh.
Cơ sở dữ liệu kỹ thuật hỗ trợ (Database technology support): xác định nhu
cầu, yêu cầu của hệ thống lưu trữ dữ liệu, xem xét với khả năng, nguồn lực hiện
tại của tổ chức, xác định các phần mềm kỹ thuật, kết cấu kiến trúc sẽ áp dụng, sau
đó tiến hành xây dựng, cài đặt và quản trị các phần mềm và giải quyết các vấn đề
phát sinh liên quan đến kỹ thuật trong tương lai.
Quản trị cơ sở dữ liệu (DBA) đóng vai trò quan trọng trong cả hai khía cạnh dung
lượng lưu trữ dữ liệu và các hoạt động. Vai trò của DBA là thực hiện quản lý có
uy tín nhất và thông qua hầu hết các dữ liệu rộng rãi vai trò chuyên nghiệp, và cơ
sở dữ liệu có lẽ là trưởng thành hầu hết tất cả các biện pháp quản lý dữ liệu. DBA
cũng đóng vai trò chủ đạo trong hoạt động dữ liệu và bảo mật dữ liệu.
20
Bảo mật dữ liệu (Data security) bao gồm việc lập kế hoạch, phát triển và thực
hiện các chính sách, quy trình bảo mật, cung cấp cách thức xác thực, ủy quyền,
truy cập, kiểm soát, thống kê, báo cáo về dữ liệu và tài sản thông tin. Chi tiết các
yêu cầu về bảo mật cho từng loại dữ liệu là khác nhau giữa các công ty, ngành
nghề, lĩnh vực thậm chí là giữa các quốc gia. Tuy nhiên, mục tiêu của hoạt động
bảo mật dữ liệu là như nhau: bảo vệ tài sản thông tin, dữ liệu, tuân thủ các quy
định về quyền riêng tư, bảo mật, các yêu cầu, thỏa thuận khác trong kinh doanh.
Tích hợp dữ liệu và khả năng tương tác (Data Integration &
Interoperability) mô tả quá trình liên quan đến sự di chuyển và hợp nhất dữ liệu
bên trong và giữa các hệ thống lưu trữ, các ứng dụng và tổ chức. Tích hợp dữ liệu
theo các biểu mẫu cấu trúc nhất quán để dữ liệu giữa nhiều hệ thống có thể giao
tiếp được với nhau. Đây là tính năng rất cơ bản mà hầu hết các doanh nghiệp cần
thực hiện để: chuyển đổi dữ liệu, tích hợp các gói giải pháp của đối tác vào hệ
sinh thái ứng dụng chung của tổ chức; chia sẻ dữ liệu giữa các ứng dụng trong tổ
chức; phân phối dữ liệu giữa các cơ sở lưu trữ dữ liệu và trung tâm dữ liệu; lưu
trữ dữ liệu; quản lý giao diện dữ liệu; tích hợp dữ liệu có cấu trúc và phi cấu trúc.
Quản lý tài liệu, nội dung (Document & content management) liên quan đến
kiểm soát quá trình thu thập, lưu trữ, truy cập và sử dụng các tài liệu, thông tin ở
bên ngoài cơ sở dữ liệu. Mục đích là duy trì tính toàn vẹn và cho phép người dùng
truy cập và sử dụng dữ liệu và thông tin phi cấu trúc hoặc bán cấu trúc. Trong
nhiều tổ chức, dữ liệu phi cấu trúc có môi quan hệ trực tiếp với dữ liệu có cấu
trúc do đó cần thiết lập các kế hoạch hành động cụ thể, triển khai và giám sát.
Ngoài ra, cũng như các loại dữ liệu khác, tài liệu và nội dung phi cấu trúc cần
được kiểm tra về chất lượng và bảo mật.
Dữ liệu chủ và dữ liệu tham chiếu (References and master data): Các phòng
ban, bộ phận, các quy trình, hệ thống trong một tổ chúc đều có nhu cầu về chia
sẻ dữ liệu để sử dụng cho mục đích công việc của đơn vị mình. Mặc dù lợi ích
của việc chia sẻ dữ liệu đem lại là rất nhiều, nhưng luôn luôn tiềm ẩn rất nhiều
rủi ro và có nhiều vấn đề phát sinh như dữ liệu có thể bị trùng lặp, dư thừa, chất
lượng dữ liệu không đảm bảo dẫn dến chi phí liên quan bị gia tăng. Đó là lý do
vì sao tổ chức cần có sự quản lý dữ liệu tham chiếu và dữ liệu gốc (reference and
master data) một cách hiệu quả. Dữ liệu tham chiếu là các bảng mã, mô tả dữ liệu,
phân loại dữ liệu khác bên trong tổ chức hoặc liên quan đến dữ liệu, thông tin
khác ngoài phạm vi tổ chức.
21
Kho dữ liệu tập trung và báo cáo quản trị dữ liệu (Data warehousing and
Business Intelliengence) liên quan đến việc lập kế hoạch, thực hiện và kiểm soát
các quy trình để cung cấp dữ liệu hỗ trợ ra các quyết định và hỗ trợ công tác lập
báo cáo, truy vấn, phân tích dữ liệu để ra quyết định. Data warehousing mô tả các
quá trình trích xuất, làm sạch, chuyển đổi, kiểm soát và truyền tải dữ liệu trong
kho dữ liêu. Business Intelligence (BI) là các quá trình, cách thức sử dụng dữ liệu
để hỗ trợ lãnh đạo của công ty đưa ra các quyết định về kinh doanh một cách
chính xác tại mỗi thời điểm. BI dược coi là thuật ngữ phổ biến để miêu tả các
cách sử dụng dữ liệu phục vụ cho việc dự báo môi trường kinh doanh thông qua
các bước phân tích để nắm bắt, phát hiện ra các vấn đề kinh doanh trong dữ liệu.
Từ đó các nhà lãnh đạo sẽ tiến hành đưa ra các hành động, giải pháp cụ thể.
Quản lý siêu dữ liệu (Metadata) liên quan đến việc lập kế hoạch, triển khai và
kiểm soát các hoạt động truy cập, sử dụng metadata. Metadata – Siêu dữ liệu là
loại dữ liệu dùng để mô tả các dữ liệu khác, như mô tả tính chất, loại biến dữ liệu,
thông tin mà dữ liệu đó cung cấp. Cùng với reference data và master data,
metadata hỗ trợ các quá trình xử lý, tích hợp, bảo mật, kiểm soát, chia sẻ dữ liệu
diễn ra hiệu quả và chính xác hơn. Ngoài ra, metadata còn giúp chúng ta hiểu rõ
hơn về dữ liệu, đánh giá chất lượng dữ liệu, quản lý các cơ sở dữ liệu, các ứng
dụng tốt hơn.
Quản lý chất lượng dữ liệu: Việc lập kế hoạch, thực hiện và kiểm soát các hoạt
động áp dụng những kỹ thuật quản lý chất lượng vào dữ liệu để đảm bảo nó phù
hợp để phân tích và đáp ứng nhu cầu của người dùng. Quản lý chất lượng dữ liệu
(Data Quality Management - DQM) là một quá trình hỗ trợ quan trọng trong quản
lý thay đổi tổ chức. Thay đổi tập trung kinh doanh, chiến lược hội nhập kinh
doanh của công ty, và sáp nhập, mua lại, và đối tác có thể uỷ quyền cho rằng chức
năng CNTT nguồn pha trộn dữ liệu, tạo ra dữ liệu, truy cập dữ liệu, hoặc tích hợp
dữ liệu.
Chất lượng dữ liệu là đồng nghĩa với chất lượng thông tin, nếu chất lượng dữ liệu
kém sẽ tạo ra thông tin không chính xác và hiệu quả kinh doanh kém. Làm sạch
dữ liệu là giải pháp cải tiến ngắn hạn và tốn kém mà không giải quyết các nguyên
nhân gốc rễ của các vấn đề về chất lượng của dữ liệu. Một chương trình quản lý
chất lượng dữ liệu chặt chẽ và tổng thể là cần thiết để cung cấp một giải pháp
kinh tế để cải thiện chất lượng dữ liệu toàn vẹn.
Quản lý chất lượng dữ liệu tập trung vào quản lý vòng đời để tạo dữ liệu, chuyển
đổi, và truyền tải để đảm bảo rằng những thông tin kết quả đáp ứng nhu cầu của
22
tất cả người tiêu dùng dữ liệu trong tổ chức.Thể chế hóa quy trình giám sát chất
lượng dữ liệu, quản lý và cải thiện bản lề vào việc xác định nhu cầu kinh doanh
cho dữ liệu chất lượng và xác định những cách tốt nhất để đo lường, giám sát,
kiểm soát và báo cáo về chất lượng của dữ liệu. Sau khi xác định các vấn đề trong
các dòng xử lý dữ liệu, thông báo cho người quản lý dữ liệu thích hợp để có hành
động khắc phục nhằm giải quyết các vấn đề cấp tính, trong khi đồng thời cho
phép loại bỏ các nguyên nhân gốc rễ của nó.
DQM cũng là một quá trình liên tục để xác định các thông số để xác định mức độ
cho phép chất lượng dữ liệu để đáp ứng nhu cầu kinh doanh, và đảm bảo rằng
chất lượng dữ liệu đáp ứng được yêu cầu của tổ chức. DQM liên quan phân tích
chất lượng của dữ liệu, xác định điểm bất thường dữ liệu, và xác định yêu cầu
kinh doanh và tương ứng với quy tắc kinh doanh cho khẳng định chất lượng dữ
liệu cần thiết. DQM liên quan đến việc khi tiến hành các quy trình kiểm tra, kiểm
soát theo dõi phù hợp với các quy tắc chất lượng dữ liệu được xác định, Cũng
như khi tiến hành phân tích dữ liệu, tiêu chuẩn hóa, làm sạch, và củng cố, khi cần
thiết.
1.3 KHUNG QUẢN LÝ DỮ LIỆU VIỄN THÔNG CHO TCT MẠNG LƯỚI
VIETTEL
Dựa trên các thành phần khung quản lý dữ liệu chung của DAMA và quá trình
khảo sát thực tế hiện trạng quản lý dữ liệu tại đơn vị để đưa ra khung quản lý dữ
liệu, các hợp phần quan trọng bắt buộc tổ chức cần thực hiện quản lý khi muốn
nâng cao công tác quản lý dữ liệu của đơn vị mình. Do mô hình thực tế tại tập
đoàn Công nghiệp viễn thông quân đội cho sự phân công rõ ràng vai trò trách
nhiệm về đơn vị ví dụ, các hoạt động định hướng quản trị thì thuộc các phòng ban
trên tập đoàn, các hoạt động phát sinh, thu thập và lưu trữ dữ liệu thì rải rác trong
tất cả hoạt động của đơn vị thành viên trong tập đoàn. Sau đó việc quản trị, quy
cập, phân quyền nằm tập trung tại Tổng công ty mạng lưới Viettel. Từ đây là cung
cấp dịch vụ cho các công ty thành viên sử dụng và phân tích dữ liệu. Song song
với các hoạt động trên thì công tác quản lý an toàn thông tin được thực hiện bởi
chính giải pháp từ các công ty thành viên và bởi công ty An ninh mạng chuyên
trách.
Từ mô hình tổ chức hiện tại của cả tập đoàn, việc đưa ra mô hình khung quản lý
dữ liệu như hình 1.3. Khung quản lý dữ liệu viễn thông được cho là phù hợp vì
sắp xếp các phân hệ, cấu phần hợp lý cho từng đơn vị, tổng công ty theo đúng
chức năng hiện tại.
23
Hình 1.3 Khung quản lý dữ liệu viễn thông
Như vậy khung quản lý dữ liệu viễn thông sẽ bao gồm: quản trị dữ liệu gồm có:
quản lý dữ liệu, quản lý lưu trữ, quản lý vòng đời, quản lý dữ liệu chủ, quản lý
siêu dữ liệu. Hợp phần này chủ yếu sẽ thuộc trách nhiệm định hướng bởi phòng
ban Tập đoàn, đưa ra chỉ đạo, định hướng, nguyên tắc chung cho các đơn vị trực
thuộc thực hiện.
Hợp phần thứ hai là thu thập/ lưu trữ thông tin gồm quản lý các nguồn tạo dữ liệu,
dữ liệu được nhập vào như thế nào, quản lý về thời gian lưu trữ ra sao và cách tổ
chức và tích hợp thông tin.
Sau đó khi thu thập và lưu trữ, dữ liệu sẽ được quản lý, xử lý để đảm bảo chất
lượng, dữ liệu được chuẩn hoá, đảm bảo chất lượng, đo lường và kiểm thử được.
Việc quản lý truy cập dữ liệu rất cần thiết để đảm bảo dữ liệu được truy cập đúng
theo quyền của các đơn vị. Sau đó là hợp phần quan trọng về việc phân tích dữ
liệu, sử dụng các giải pháp bài toán cho việc phân tích dữ liệu, dự đoán tiềm năng
cho việc phát triển, xây dựng sản phẩm và mô hình kinh doanh trong tương lai
của doanh nghiệp.
Cuối cùng là hợp phần về quản lý an ninh thông tin. Hợp phần này được thực
hiện bởi hai lớp tại chính các đơn vị thành viên trong tập đoàn và bởi công ty an
ninh mạng có trách nhiệm rà soát, giám sát lại việc thực hiện tại đơn vị.
Hợp phần quản trị gồm: Công tác quản lý để lập kế hoạch, thực hiện và giám sát
các chính sách, thông lệ và dự án tạo ra, kiểm soát, bảo vệ và tăng cường giá trị
của tài sản thông tin. Tiếp theo là quản lý kiến trúc: quy trình xác định và duy trì
24
các thông số kỹ thuật cung cấp từ vựng nghiệp vụ phổ biến, thể hiện các yêu cầu
về dữ liệu chiến lược, phác thảo các thiết kế tích hợp cấp cao và phù hợp với
chiến lược doanh nghiệp và kiến trúc kinh doanh.
Quản lý vòng đời: quy trình xác định các giải pháp dữ liệu đầu cuối trong toàn bộ
vòng đời dữ liệu. Bao gồm việc tạo ra dữ liệu thông qua các hoạt động phân tích
cho đến triển khai các giải pháp.
Quản lý dữ liệu chủ: quy trình kiểm soát các hoạt động để đảm bảo các định nghĩa
thống nhất của các đơn vị kinh doanh trên nhiều hệ thống nội bộ và mở rộng cho
các đối tác khi thích hợp.
Quản lý metadata: quy trình đầu cuối để tạo, kiểm soát, tăng cường, xác định và
quản lý dữ liệu để cho phép truy cập thông tin tích hợp chất lượng cao.
Hợp phần thu thập/ lưu trữ gồm: Nguồn phát sinh dữ liệu, xác định và quản lý
dữ liệu để cho phép truy cập kinh doanh trên nhiều hệ thống nội bộ và bên ngoài.
Nhập: khả năng thu thập và sắp xếp thông tin từ tầng tạo dữ liệu cho quá trình xử
lý thông tin.
Thời gian lưu: lưu trữ tài sản thông tin tại một địa điểm đã chọn và xác định loại
cấu trúc. Tổ chức và lưu trữ thông tin lịch sử.
Lưu trữ: các hệ thống lưu trữ các loại dữ liệu khác nhau (cấu trúc, bán cấu trúc
và không có cấu trúc) bao gồm các hoạt động của cơ sở dữ liệu.
Chuyển đổi: giá trị dữ liệu được chuyển đổi từ định dạng dữ liệu của một hệ thống
dữ liệu nguồn sang định dạng dữ liệu của một hệ thống dữ liệu đích.
Tổ chức và tích hợp: quản lý, tập hợp, tích hợp và cung cấp các tài sản dữ liệu
cần thiết cho doanh nghiệp yêu cầu để phân tích và ra quyết định.
Hợp phần chất lượng dữ liệu gồm: Chuẩn hóa: định dạng tài sản thông tin thành
các giá trị theo cấu trúc nhất quán. Đảm bảo chất lượng: các tiêu chuẩn thông tin
được tạo ra và áp dụng cho thông tin (về định dạng, ngữ nghĩa và mức độ chất
lượng), để xác định và thông báo nếu có sự khác biệt so với tiêu chuẩn đó.
Đo lường: quy trình và giám sát để đảm bảo thông tin hoàn chỉnh, chính xác, nhất
quán và cập nhật để đáp ứng nhu cầu của tổ chức.
Kiểm thử: cho phép hiển thị các thay đổi được thực hiện để hiểu và ngăn chặn
các tác động tiêu cực đến thông tin.