ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN THỊ NGUYỆT
NGHIÊN CỨU XÂY DỰNG KHUNG QUẢN TRỊ DỮ LIỆU CHO VIỆC
QUẢN LÝ DỮ LIỆU CỦA TỔNG CÔNG TY MẠNG LƯỚI VIETTEL
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội - 2019
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN THỊ NGUYỆT
NGHIÊN CỨU XÂY DỰNG KHUNG QUẢN TRỊ DỮ LIỆU CHO VIỆC
QUẢN LÝ DỮ LIỆU CỦA TỔNG CÔNG TY MẠNG LƯỚI VIETTEL
Chuyên ngành: Hệ thống thông tin
Mã số: 8480104.01
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Giáo viên hướng dẫn: PGS. TS. Phan Xuân Hiếu
Hà Nội - 2019
i
LỜI CẢM ƠN
Tôi xin trân trọng cảm ơn các thầy cô Đại Học Công Nghệ- Đại Học Quốc
Gia Hà Nội đã tạo điều kiện cho học viên lớp cao học K24CNTT một môi
trường học tập hiệu quả, đồng thời truyền đạt cho các học viên lượng kiến thức
và kinh nghiệm quý báu phục vụ cho quá trình học tập và công tác của tôi trong
hiện tại và tương lai. Cách thức làm việc, học hỏi của các thầy cô đã truyền cảm
hứng cho tôi phát huy tinh thần học hỏi và chủ động tự học để nâng cao kỹ
năng, kiến thức cho bản thân.
Tôi xin trân trọng cảm ơn ban lãnh đạo Tổng công ty Mạng lưới Viettel cùng
các anh chị phịng Kỹ Thuật Nghiệp vụ của Tổng cơng ty đã đại diện đứng ra tổ
chức lớp học cho các cán bộ nhân viên của trong tổng công ty. Để mọi người có
thể vừa làm việc vừa trao đổi, vận dụng các kiến thức được học vào thực tế được
hiệu quả hơn.
Đặc biệt, tôi cảm ơn sâu sắc đến PGS.TS. Phan Xuân Hiếu đã chỉ bảo cho
tôi trong suốt quá trình học tập và làm luận văn, giúp tơi có thêm quyết tâm để
nghiên cứu và hoàn thiện bản luận văn của mình.
Tơi xin gửi lời cảm ơn đến các bạn trong lớp Cao học Hệ thống Thông tin
K24CNTT đã giúp đỡ, động viên, khích lệ tơi trong suốt thời gian học tập.
Tôi xin được gửi lời cảm ơn tới gia đình đã động viên, giúp đỡ tơi trong q
trình hoàn thành luận văn.
Với lượng kiến thức và kinh nghiệm cịn ít nên luận văn khơng tránh khỏi
những thiếu sót. Tôi xin trân trọng tiếp thu các ý kiến của các thầy, cơ, bạn bè để
luận văn được hồn thiện.
Trân trọng cám ơn.
ii
MỤC LỤC
LỜI CẢM ƠN ................................................................................................ i
MỤC LỤC .................................................................................................... ii
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ...................................... iv
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ......................................................... vi
MỞ ĐẦU ...................................................................................................... 1
CHƯƠNG 1. KHUNG QUẢN LÝ DỮ LIỆU ................................................. 4
1.1. Khái niệm chung về quản lý dữ liệu ...................................................... 4
1.1.1. Định nghĩa thông tin và dữ liệu ....................................................... 4
1.1.2. Quản lý dữ liệu ............................................................................... 5
1.1.3. Quản trị dữ liệu............................................................................... 6
1.1.4. Phân biệt quản lý và quản trị dữ liệu ................................................ 7
1.1.5. Lợi ích và tầm quan trọng của quản lý dữ liệu .................................. 8
1.1.6. Nguyên tắc quản lý dữ liệu .............................................................. 9
1.1.7. Các lĩnh vực trọng tâm chính cần được đề cập trong quản lý dữ liệu 10
1.1.8. Các bước cơ bản để thực hiện quản lý dữ liệu ................................ 11
1.2. Khung quản lý dữ liệu ....................................................................... 12
1.3. Khung quản lý dữ liệu viễn thông cho TCT mạng lưới VIettel.............. 17
CHƯƠNG 2. QUẢN LÝ ATTT TRONG DOANH NGHIỆP......................... 22
2.1. ĐỊNH NGHĨA AN TỒN THƠNG TIN............................................. 22
2.2. CÁC PHƯƠNG PHÁP QUẢN LÝ AN TỒN THƠNG TIN............... 22
2.2.1 Tiêu chuẩn quản lý an tồn thông tin ISO27001:2013 ..................... 22
2.2.2 Phương pháp tiếp cận..................................................................... 24
2.2.3 Phương pháp quản lý rủi ro ..........................................................224
2.3. KHUNG QUẢN LÝ AN TỒN THƠNG TIN.................................... 27
3.1.1
CHƯƠNG
3.1.2
3. GIẢI PHÁP NÂNG CAO NĂNG LỰC QUẢN LÝ AN TỒN
THƠNG TIN DỮ LIỆU VIỄN THƠNG ....................................................... 33
3.1.3
3.1 Phương pháp quản lý rủi ro .................................................................. 33
Nguyên lý quản lý rủi ro cho tổ chức........................................... 34
Mơ hình tổ chức và phương pháp quản lý rủi ro ........................... 35
Quy trình quản lý rủi ro .............................................................. 37
iii
Thực hiện đánh giá rủi ro cho hệ thống dữ liệu viễn thông và xây
dựng kế hoạch xử lý rủi ro ...................................................................... 39
3.2 Quản lý an toàn vận hành .................................................................... 41
3.3 Quản lý tính liền mạch, liên tục kinh doanh .......................................... 43
KẾT
3.1.4
LUẬN ................................................................................................. 45
TÀI LIỆU THAM KHẢO ............................................................................ 47
PHỤ LỤC 1. Danh sách các điểm yếu, đe dọa dùng để phân tích rủi ro an tồn
dữ liệu viễn thơng ........................................................................................ 49
PHỤ LỤC 2: Checklist khảo sát đánh giá rủi ro cho dữ liệu viễn thông .......... 54
PHỤ LỤC 3. Ma trận đánh giá rủi ro ............................................................ 82
PHỤ LỤC 4. Danh sách phân tích rủi ro cho dữ liệu viễn thơng ..................... 85
iv
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
STT
Ký hiệu/
Chữ viết tắt
Ý nghĩa
1
ANTT
An tồn thơng tin
2
BCP
Kế hoạch đảm bảo tính liên tục kinh doanh –
Business Contuinity Plan
3
CNTT
Công nghệ thông tin
4
DAMA
Hiệp hội quản lý dữ liệu quốc tế
5
DG
Data Governance – Quản trị dữ liệu
6
DGI
Data Governance Institute - Viện quản trị dữ liệu
7
HMRR
Hạng mục rủi ro
8
ISMS
Hệ thống quản lý an tồn thơng tin – Information
Security Management System
9
KĐRR
Khẩu độ rủi ro
10
QTDL
Quản trị dữ liệu
11
QLDL
Quản lý dữ liệu
12
QTRR
Quản trị rủi ro
13
QLRR
Quản lý rủi ro
v
DANH MỤC CÁC BẢNG BIỂU
STT
1
Bảng
Bảng 3.1
Tên bảng
Bảng 3.1 Bảng đánh giá rủi ro dữ liệu viễn thông
vi
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
STT Chương
Mục
Hình
Tên hình vẽ
1
1
1.1
Hình 1.1
Hình 1. 1 Tháp dữ liệu
2
1
1.2
Hình 1.2
Hình 1.2 Khung quản lý dữ liệu DAMAOK
3
1
1.3
Hình 1.3
Hình 1.3 Khung quản lý dữ liệu viễn thơng
4
2
2.1
Hình 2.1
Hình 2.1 Lộ trình triển khai ISO27001:2013
5
2
2.2
Hình 2.2
Hình 2.2 Mơ hình PDCA
6
2
2.2
Hình 2.3
Hình 2.3 Mơ hình PDCA ISO27001
7
2
2.3
Hình 2.4
Hình 2.4 Các lĩnh vực chính ATTT
3.1
Hình 3.1
Hình 3.1 Tháp quản lý rủi ro của tổ chức
viễn thơng
8
9
10
14
15
16
3
3
3
3
3
3
3.1
3.1
3.1
3.2
3.3
Hình 3.2
Hình 3.2 Mơ hình kiểm sốt rủi ro dữ liệu
viễn thơng 3 lớp
Hình 3.3
Hình 3.3 Quy trình quản lý rủi ro
Hình 3.4
Hình 3.4 Cơng cụ quản lý rủi ro dữ liệu viễn
thơng
Hình 3.5
Hình 3.5 Khung quy trình vận hành khai
thác hệ thống thơng tin viễn thơng
Hình 3.6
Hình 3.6 Kế hoạch đảm bảo tính liên tục
cho hệ thống viễn thơng
1
MỞ ĐẦU
Ngày nay dữ liệu được coi là tài sản quan trọng, việc quản lý dữ liệu cũng như
đảm bảo an tồn thơng tin cho dữ liệu là nhu cầu sống cịn của đơn vị. Kết quả
phân tích dữ liệu đóng vai trị then chốt cho các quyết định của ban lãnh đạo, để
tăng tính tin cậy của kết quả phân tích dữ liệu thì u cầu bắt buộc đơn vị phải
có phương pháp quản lý dữ liệu cho đơn vị mình hiệu quả và đảm bảo chất
lượng [3].
Việc thu thập, khai thác và sử dụng dữ liệu một cách hiệu quả là một trong
những yếu tố quan trọng, quyết định sự phát triển của tổ chức. Tổ chức không
thể khai thác được dữ liệu nếu không biết rõ giá trị của dữ liệu mình đang sở
hữu: dữ liệu ở đâu, làm thế nào để sử dụng, dữ liệu được tích hợp với các ứng
dụng nào, ở đâu, thời gian nào, v.v. Chất lượng dữ liệu kém có thể dẫn tới gia
tăng rủi ro hoạt động, chiến lược, ảnh hưởng đến việc hỗ trợ ra quyết định, các
hoạt động và kế hoạch hàng ngày từ lãnh đạo đơn vị do đó sẽ ảnh hưởng tới
hoạt động, sự phát triển bền vững của tổ chức. Chất lượng dữ liệu và khai thác
dữ liệu hiệu quả nhưng cần đi đôi việc đảm bảo An tồn thơng tin (ATTT) cho
dữ liệu [1][3].
Quản lý dữ liệu là sự kết hợp giữa con người, quy trình và kỹ thuật cho phép
một tổ chức có thể tối ưu hóa, bảo vệ và sử dụng các ng̀n dữ liệu (cấu trúc và
phi cấu trúc) một cách hiệu quả như một tài sản của doanh nghiệp.
Khung quản lý dữ liệu gờm có các hợp phần về: Quản trị dữ liệu, cấu trúc dữ
liệu, mơ hình và thiết kế dữ liệu, lưu trữ và vận hành dữ liệu, an tồn dữ liệu,
tích hợp dữ liệu, quản lý văn bản và nội dung, công cụ báo cáo quản trị, siêu dữ
liệu (metadata) và chất lượng dữ liệu [3].
Sau khi nhận thấy được tầm quan trọng trong việc quản lý dữ liệu, đánh giá
khảo sát hiện trạng tổ chức gặp phải nhiều vấn đề trong việc quản lý dữ liệu như
quản lý dữ liệu phân tán, không tập trung. Với mỗi dữ án liên quan đến dữ liệu
thì thời gian để thu thập, làm sạch dữ liệu tốn đa số thời gian của dự án.Việc
quản lý an tồn thơng tin dữ liệu trong tổ chức chưa được triển khai theo
phương pháp tổng thể. Khi lãnh đạo thấy vấn đề, sự cố phát sinh hay có vấn đề
nổi cộm lên thì chỉ đạo dờn ng̀n lực vào xử lý, mà khơng có biện pháp quản
lý tổng thể. Hoạt động vận hành trong tổ chức ưu tiên vấn đề “chữa cháy” hơn
là việc ưu tiên “phịng cháy”. Ng̀n lực nhân sự vận hành trong tổ chức dồn sự
tập trung vào việc xử lý vụ việc, sự cố, vấn đề hơn là ưu tiên việc đưa ra
2
phương pháp quản lý tổng thể, quản lý rủi ro để dần dần giảm vấn đề sự vụ và
cải tiến liên tục hệ thống. Các cơng việc mang tính bị động, xảy ra thì xử lý.
Ngồi ra, tổ chức hoạt động trên lĩnh vực viễn thông, các hệ thống lõi cần đảm
bảo tính sẵn sàng liên tục cao, tuy nhiên các phương án dự phịng, đảm bảo tính
liền mạch, ứng cứu khi xảy ra gián đoạn chưa có tính chủ động hoặc chưa được
thử nghiệm định kỳ các phương án.
Song song với các vấn đề thực tại trên của tổ chức thì trên thế giới, các giải
pháp về quản lý dữ liệu và an ninh dữ liệu luôn được cập nhật các phương pháp
giải pháp mới như ISO27001:2013, ISO31000:2018.
Từ các vấn đề trên, luận văn thực hiện nghiên cứu về:
NGHIÊN CỨU XÂY DỰNG KHUNG QUẢN TRỊ DỮ LIỆU CHO VIỆC
QUẢN LÝ DỮ LIỆU CỦA TỔNG CÔNG TY MẠNG LƯỚI VIETTEL.
Mục đích nghiên cứu: Mục đích luận văn nghiên cứu để đưa ra cách thức và
phương pháp quản lý để giải quyết được các vấn đề bất cập trên của tổ chức .
Xây dựng khung quản lý dữ liệu cho dữ liệu viễn thông. Các hợp phần quan
trọng tổ chức cần thực hiện quản lý khi muốn tăng chất lượng dữ liệu và khả
năng tin cậy dữ liệu bao gồm: quản trị, thu thập/ lưu trữ, chất lượng, truy cập và
cung cấp, phân tích, an ninh dữ liệu.
Tuy nhiên, thời gian nghiên cứu, triển khai còn hạn hẹp, luận văn chưa đủ thời
gian để nghiên cứu triển khai hết tất cả các hợp phần trên. Nên trong phạm vi
luận văn này em xin phép được tập trung nghiên cứu sâu và xây dựng và triển
khai các giải pháp về một trong các hợp phần trong khung quản lý là phần quản
lý an tồn thơng tin. Tập trung đề xuất các giải pháp để nâng cao năng lực an
tồn thơng tin cho dữ liệu viễn thơng.
Mục đích của việc triển khai các giải pháp quản lý an tồn thơng tin tồn diện
cho dữ liệu viễn thông nhằm đảm bảo cho các hệ thống công nghệ thông tin,
viễn thông trong tổng công ty đạt các yêu cầu về an toàn, bảo mật. Các thơng tin
sẽ được quản lý đảm bảo tính bí mật, tồn vẹn, xác thực và sẵn sàng. Đờng thời
nâng cao tính liên tục khơng bị gián đoạn giúp hệ thống thông tin được vận
hành liên tục, chống lại các sự cố an tồn thơng tin, các cuộc tấn cơng từ nội bộ
hoặc từ bên ngồi. Qua đó sẽ nâng cao mức độ tin cậy đối với các đối tác và
khách hàng khi làm việc tại đơn vị. Bên cạnh việc tăng cường hoạt động, quản
lý, phòng ngừa, phát hiện sớm các điểm rủi ro để có hành động xử lý sớm sẽ
giảm khả năng rủi ro xuất hiện. Qua đó giảm tỷ lệ sự cố phát sinh cần xử lý
3
hàng ngày.
Sau khi nghiên cứu triển khai, áp dụng thực tế các giải pháp đưa ra trong luận
văn vào các hoạt động đơn vị. Giúp đơn vị thấy được khung quản lý dữ liệu đầy
đủ, các hợp phần đơn vị cần thiết cho việc quản lý đặc thù cho dữ liệu viễn
thông. Trong các hợp phần của khung quản lý dữ liệu, luận văn tập trung nghiên
cứu sâu về khung quản lý an tồn thơng tin. Nghiên cứu xây dựng các giải pháp
an tồn thơng tin phù hợp cho đơn vị sau khi khảo sát nắm được các điểm
mạnh, điểm chưa tốt trong hoạt động quản lý an toàn. Những điểm mạnh tổ
chức đã thực hiện triển khai trước đó sẽ được duy trì. Và luận văn tập trung
triển khai vào ba giải pháp chính mà trước đó đơn vị chưa có hoặc triển khai
đưa đầy đủ hiện quả đó là: hoạt động liên quan tới quản lý rủi ro, quản lý công
tác vận hành khai thác và cac hoạt động nhằm nâng cao tính liên tục các hệ
thống cơng nghệ thông tin và viễn thông.
Phương pháp nghiên cứu: Nghiên cứu phương pháp về quản lý dữ liệu. Khảo
sát, đánh giá hiện trạng hệ thống và cách thức quản lý hiện tại của đơn vị để đề
xuất khung quản lý dữ liệu cho viễn thơng. Sau đó đi vào nghiên cứu sâu các
giải pháp cho mảng quản lý an tòan thông tin dữ liệu. Triển khai các phương
pháp quản lý vào thực tế trong đơn vị để nâng cao năng lực quản lý an tồn
thơng tin cho dữ liệu viễn thông.
Phương pháp thực nghiệm: Xây dựng hệ thống văn bản, tài liệu, công cụ quản
lý và đưa vào triển khai áp dụng trong thực tế.
Luận văn sẽ được cấu trúc với ba chương. Chương 1 Khung quản lý dữ liệu đưa
ra khái niệm chung về quản trị, quản lý dữ liệu. Mơ tả các thành phần chính
trong khung quản lý dữ liệu chung. Sau khi khảo sát hoạt động đơn vị thì đưa ra
khung quản lý dữ liệu cho dữ liệu viễn thông. Các vấn đề, vướng mắc hay gặp
phải trong việc quản lý dữ liệu. Chương hai bắt đầu đi sâu hơn vào trong một
những hợp phần quan trọng nhất trong việc quản lý dữ liệu và quản lý an tồn
thơng tin. Đưa ra các khái niệm chính về an tồn thơng tin dữ liệu. Đưa ra các
phương pháp trong việc quản lý an tồn thơng tin, mơ tả chi tiết các hợp phần
cần thực hiện khi thiết lập hệ thống quản lý an tồn thơng tin tại đơn vị. Sau khi
nghiên cứu phương pháp và đưa ra các phần chính cần thực hiện khi quản lý an
tồn thơng tin, dựa vào kết quả khảo sát tại đơn vị, luận văn tập trung đưa ra các
giải pháp chính mà chưa được xây dựng, triển khai tại đơn vị hoặc việc triển
khai tại đơn vị chưa được đầy đủ, hiệu quả. Các giải pháp chi tiết này sẽ được
đưa ra tại chương ba và đánh giá kết quả triển khai.
4
CHƯƠNG 1. KHUNG QUẢN LÝ DỮ LIỆU
1.1. KHÁI NIỆM CHUNG VỀ QUẢN LÝ DỮ LIỆU
1.1.1. Định nghĩa thông tin và dữ liệu
Ngày nay, nhiều tổ chức nhận ra rằng dữ liệu là tài sản vô cùng quan trọng của
doanh nghiệp. Dữ liệu và thơng tin có thể cung cấp cái nhìn sâu sắc về khách
hàng, sản phẩm và dịch vụ của họ qua đó giúp doanh nghiệp đổi mới và đạt
được mục tiêu chiến lược [1][3].
Mặc dù thừa nhận là vậy nhưng rất ít tổ chức chủ động quản lý dữ liệu như một
tài sản để khai thác giá trị liên tục từ dữ liệu của mình. Giá trị mang lại từ dữ
liệu không phải một cách ngẫu nhiên mà nó là cả một q trình xây dựng mục
tiêu, chiến lược, kế hoạch, điều phối và có sự cam kết. Đòi hỏi cả việc quản trị
và lãnh đạo.
Dữ liệu và thông tin không chỉ là tài sản của tổ chức mà tổ chức cần đầu tư vào
việc quản trị dữ liệu, thơng tin để có thể thu lợi trong tương lai. Dữ liệu và
thông tin quan trọng thiết yếu đối với các tổ chức trong các hoạt động hàng
ngày, được coi như “dịng máu của cuộc sống”, thậm chí là “dầu mỏ mới” của
nền kinh tế thơng tin. Do đó tổ chức phải quản trị nguồn dữ liệu để qua đó tăng
khả năng ra các quyết định đúng căn cứ trên kết quả phân tích dữ liệu [3][9].
Dữ liệu được hiểu là thông tin được lưu trữ dưới dạng số (mặc dù dữ liệu
không giới hạn thông tin được số hóa hay được quản lý trên giấy hay trong các
cơ sở dữ liệu). Tuy nhiên, do ngày nay chúng ta có thể nắm bắt được rất nhiều
thơng tin điện tử, chúng ta gọi nhiều thứ là “dữ liệu”, những thứ mà trước đó
khơng được coi là dữ liệu như: tên, địa chỉ, ngày sinh, những gì mọi người ăn
trong bữa tối thứ bảy, cuốn sách hay được mua nhiều nhất [3][9].
Những sự kiện về hành vi con người được tổng hợp, phân tích và sử dụng để
tạo ra lợi nhuận, cải thiện sức khỏe hoặc ảnh hưởng đến chính sách công.
Thực tế tốn nhiều giấy mực để định nghĩa mối quan hệ giữa dữ liệu và thông
tin.
Dữ liệu được gọi “Nguyên liệu của thông tin – Raw material of information”
và thông tin được gọi là “Dữ liệu trong một bối cảnh – Data in context”.
Hình 1.1 biểu diễn tháp dữ liệu từ đáy tới đỉnh lần lượt sẽ là “Dữ liệu, Thơng
tin, Kiến thức và trên cùng là Trí tuệ - Data, Information, Knowledge and
Wisdom)1.
1
/>
5
Wisdom
Knowledge
Information
Data
Hình 1.1 Tháp dữ liệu
Qua hình tháp ta có thể thấy dưới cùng là dữ liệu, dữ liệu là nền tảng cho thơng
tin, kiến thức và trí tuệ của tổ chức. Việc tổ chức có khai thác, sử dụng tối đa tri
quản lý dữ liệu cho tốt.
Tuy nhiên trong việc quản lý dữ liệu cho tổ chức cịn tờn tại rất nhiều thách thức
như dữ liệu được giả định đơn giản chỉ là tồn tại. Nhưng dữ liệu không chỉ tồn
tại, dữ liệu được tạo ra. Dữ liệu và thông tin là hai khái niệm đan xen và phụ
thuộc với nhau. Dữ liệu là một dạng của thông tin và thông tin là một dạng của
dữ liệu.
Cả dữ liệu và thông tin đều cần phải được quản lý để đảm bảo có được chất
lượng cao nâng cao tính tin cậy trong các kết quả phân tích dữ liệu.
1.1.2. Quản lý dữ liệu
Quản lý dữ liệu là sự phát triển, thực hiện và giám sát các kế hoạch, chính sách,
chương trình và thực hành cung cấp, kiểm soát, bảo vệ và nâng cao giá trị của
dữ liệu và tài sản thông tin trong suốt vòng đời của họ.
Quản lý dữ liệu chuyên nghiệp là bất kỳ người nào làm việc trong bất kỳ khía
cạnh của quản lý dữ liệu (từ quản lý kỹ thuật của dữ liệu trong suốt vòng đời
của nó để đảm bảo rằng dữ liệu được sử dụng đúng cách) để đáp ứng mục tiêu
chiến lược của tổ chức. Các chuyên gia quản lý dữ liệu đảm nhận nhiều vai trị,
từ kỹ thuật (ví dụ, các quản trị cơ sở dữ liệu, quản trị mạng, lập trình viên) đến
kinh doanh chiến lược (ví dụ, nhà chiến lược dữ liệu, cán bộ quản lý dữ liệu).
Hoạt động quản lý dữ liệu trên phạm vi rộng bao gồm mọi thứ, từ khả năng đưa
ra quyết định phù hợp về cách để có được giá trị chiến lược từ dữ liệu, để việc
triển khai kỹ thuật và hiệu suất của cơ sở dữ liệu. Do đó quản lý dữ liệu địi hỏi
cả hai kỹ năng kỹ thuật và phi kỹ thuật. Trách nhiệm quản lý dữ liệu phải được
6
chia sẻ giữa các vai trò các bộ phận nghiệp vụ và bộ phận công nghệ thông tin
để đảm bảo một tổ chức có dữ liệu chất lượng cao đáp ứng nhu cầu chiến lược
của mình.
1.1.3. Quản trị dữ liệu
Quản trị dữ liệu là một khái niệm của quản lý dữ liệu liên quan đến khả năng
cho phép một cơ quan, tổ chức bảo đảm rẳng chất lượng dữ liệu cao tờn tại
trong suốt vịng đời hồn chỉnh của dữ liệu. Các lĩnh vực trọng tâm của quản trị
dữ liệu bao gờm tính khả dụng, khả năng sử dụng, tính nhất qn, tính tồn vẹn
dữ liệu, bảo mật dữ liệu, thiết lập các quy trình để bảo đảm quản lý dữ liệu hiệu
quả trong toàn bộ cơ quan, tổ chức. Người quản lý dữ liệu đóng vai trị bảo đảm
các quy trình quản trị dữ liệu được tuân thủ, các hướng dẫn được thi hành và
khuyến nghị cải tiến các quy trình quản trị dữ liệu [10].
Quản trị dữ liệu là tập hợp các quy trình, vai trị, chính sách, tiêu chuẩn và số
liệu bảo đảm việc sử dụng thông tin hiệu lực và hiệu quả trong việc cho phép
một tổ chức đạt được mục tiêu của mình. Nó thiết lập các quy trình và trách
nhiệm bảo đảm chất lượng và bảo mật của dữ liệu được sử dụng trên toàn doanh
nghiệp hoặc tổ chức. Quản trị dữ liệu xác định ai có thể thực hiện hành động
nào, dựa trên dữ liệu nào, trong tình huống nào, sử dụng phương pháp nào
[10][11].
Quản trị dữ liệu xác định các quy tắc, ảnh hưởng và quy định cho dữ liệu để
thiết lập xây dựng chính sách. Các quy tắc và chính sách này thiết lập quyền
quyết định cũng như các biện pháp kiểm soát đảm bảo an ninh, trách nhiệm và
sự tin cậy. Quản trị không phải là hoạt động giám sát hàng ngày, mà là nền tảng
vững chắc cho một hệ thống quản lý dữ liệu khả thi2.
Quản trị dữ liệu có thể được định nghĩa là một cách tiếp cận có tổ chức để quản
lý dữ liệu và thơng tin được chính thức hóa thành một tập hợp các chính sách và
quy trình bao gờm tồn bộ vịng đời của dữ liệu, từ thu thập đến sử dụng, xử lý.
Các bước chính để tạo ra một chương trình quản trị dữ liệu mạnh mẽ bao gồm:
Xác định thẩm quyền ra quyết định mang tính tổ chức; xác định các tiêu chuẩn,
chính sách dữ liệu và thủ tục để hướng dẫn các quy trình quản lý dữ liệu khác
nhau, bao gờm an ninh dữ liệu và bảo vệ quyền riêng tư, kiểm soát chất lượng
dữ liệu và các hoạt động phổ biến dữ liệu; thực thi các chính sách và thủ tục sau
2
/>
7
khi xây dựng; giám sát việc tuân thủ các tiêu chuẩn, chính sách và thủ tục đã
được thiết lập.
Một chương trình quản trị dữ liệu bao gờm: Bảo vệ dữ liệu nhạy cảm; đánh giá
lỗ hổng và quản lý rủi ro; thực thi các yêu cầu tuân thủ pháp luật, quy định, hợp
đồng; xác định các bên liên quan cùng với các vai trò và trách nhiệm của họ và
quản lý truy cập.
Quản trị dữ liệu (Data Governance- DG) được định nghĩa là việc thực hiện các
quyền và kiểm soát (hoạch định, giám sát và thực thi) trong việc quản lý dữ
liệu. Tất cả các tổ chức đưa ra quyết định dựa trên dữ liệu, bất kể họ có chức
năng quản trị dữ liệu chính thức hay khơng. Do vậy việc thiết lập mơ hình quản
lý dữ liệu trong tổ chức sẽ giúp cho tổ chức khai thác được tốt hơn, làm tăng lợi
nhuận đem lại từ dữ liệu cho tổ chức đó. Mục đích của quản trị dữ liệu là đảm
bảo dữ liệu được quản lý đúng cách, theo các chính sách và thơng lệ tốt nhất về
quản lý dữ liệu. Nếu như quá trình quản lý dữ liệu là để đảm bảo tổ chức khai
thác được giá trị từ các ng̀n dữ liệu của mình thì việc quản trị dữ liệu tập
trung vào làm thế nào để đưa ra quyết định dựa trên dữ liệu. Quản trị dữ liệu tập
trung vào các phạm vi: Chiến lược; Chính sách; Tiêu chuẩn và chất lượng;
Giám sát; Tuân thủ; Quản lý vấn đề; Các dự án quản lý dữ liệu; Định giá tài sản
dữ liệu.3
1.1.4. Phân biệt quản lý và quản trị dữ liệu
Quản trị dữ liệu thường bị nhầm lẫn với các thuật ngữ và khái niệm liên quan
khác, bao gồm quản lý dữ liệu. Quản lý dữ liệu đề cập đến việc quản lý các nhu
cầu vòng đời dữ liệu đầy đủ của một tổ chức. Quản trị dữ liệu là thành phần cốt
lõi của quản lý dữ liệu, liên kết các lĩnh vực khác như chất lượng dữ liệu, quản
lý dữ liệu tham chiếu và dữ liệu gốc, bảo mật dữ liệu, hoạt động cơ sở dữ liệu,
quản lý siêu dữ liệu và lưu trữ dữ liệu [3][12][13].
Từ điển quản lý dữ liệu định nghĩa quản trị dữ liệu là việc thực thi quyền lực,
kiểm soát và ra quyết định chung (lập kế hoạch, giám sát và thi hành) đối với
việc quản lý tài sản dữ liệu. Các sáng kiến quản trị dữ liệu cung cấp nền tảng để
phát triển các giao thức và thủ tục quản lý dữ liệu phù hợp.
Mặt khác, quản lý dữ liệu là q trình đưa các chính sách quản trị vào hoạt
động. Quản trị cung cấp một khn khổ; sau đó, cơ quan, tổ chức có thể xác
3
/>
8
định các khu vực để quản lý (như bảo mật, cơ sở dữ liệu và kiểm soát tài liệu)
và quản lý cơ sở hạ tầng hoặc kiến trúc. “Quản trị” thiết lập lý do tại sao và ai
cho khả năng truy cập và kiểm soát dữ liệu, trong khi “Quản lý” thiết lập nơi
truy cập và cách thức truy cập [3][19].
1.1.5. Lợi ích và tầm quan trọng của quản lý dữ liệu
Quản lý dữ liệu quan trọng bởi vì quản lý dữ liệu chủ động là cần thiết để bảo
đảm tính bảo mật, tính tồn vẹn, khả năng truy cập, tính sẵn có và chất lượng
của dữ liệu. Thiết lập quản lý dữ liệu là một nhiệm vụ quan trọng đối với bất kỳ
tổ chức nào. Nó địi hỏi xác định tầm nhìn tổ chức, chính sách và thực tiễn;
giành được sự ủng hộ của các bên liên quan; thực hiện chương trình; và theo dõi
sự thành cơng của nó. Bằng cách phác thảo rõ ràng các chính sách, thủ tục
chuẩn, trách nhiệm và kiểm soát các hoạt động dữ liệu xung quanh, chương
trình quản lý dữ liệu giúp bảo đảm thơng tin được thu thập, duy trì, sử dụng và
phổ biến theo cách bảo vệ quyền riêng tư, bảo mật và an ninh của cá nhân, trong
khi tạo ra dữ liệu thống kê kịp thời và chính xác [1][3].
Quản lý dữ liệu là một yếu tố quan trọng để quản lý thành công các hệ thống dữ
liệu phức tạp. Nó cho phép các tổ chức giải quyết hiệu quả hơn các thách thức
liên quan đến chia sẻ dữ liệu, thay đổi theo thời gian và đáp ứng nhu cầu của
các nhóm bên liên quan khác nhau trong và ngồi cơ quan. Những lợi ích của
cách tiếp cận chủ động đối với quản trị dữ liệu bao gồm: Cải thiện độ chính xác
của dữ liệu, đạt được bằng cách lập lịch kiểm toán chất lượng dữ liệu thường
xuyên và sử dụng các tiêu chuẩn dữ liệu nhất quán trong việc đặt tên biến và
phân loại siêu dữ liệu. Cải thiện khả năng sử dụng dữ liệu, xuất phát từ việc
giám sát nội dung dữ liệu về tính nhất quán với tầm nhìn của tổ chức và nhu cầu
của các bên liên quan. Cải thiện tính kịp thời của dữ liệu, được thực hiện bằng
cách tránh trùng lặp các nỗ lực thu thập dữ liệu không cần thiết và giảm công
việc cần thiết để đối chiếu các lỗi hoặc sai lệch khi hợp nhất hoặc chia sẻ dữ
liệu. Tăng cường an ninh dữ liệu, có được bằng cách thiết kế một kế hoạch an
ninh toàn diện và áp dụng các mức bảo vệ phù hợp cho dữ liệu dựa trên mức độ
nhạy cảm của chúng.
Chức năng của quản trị dữ liệu bao gờm việc thực thi thẩm quyền, kiểm sốt và
ra quyết định chung (lập kế hoạch, giám sát và thực thi) đối với việc quản lý tài
sản dữ liệu. Quản trị dữ liệu đóng vai trị rất quan trọng trong việc đạt được chất
lượng dữ liệu cao. Quản trị dữ liệu tạo ra một cấu trúc có tổ chức nhằm phát
9
triển và thực thi các chính sách, quy tắc, quy trình và thủ tục để bảo đảm và cải
thiện chất lượng dữ liệu trong một tổ chức [3][9].
1.1.6. Nguyên tắc quản lý dữ liệu
Mục tiêu của quản lý dữ liệu để cho phép tổ chức quản lý dữ liệu như một tài
sản. Quản lý dữ liệu cung cấp các nguyên tắc, chính sách, quy trình, khung, ma
trận số liệu và giám sát để quản lý dữ liệu như một tài sản và hướng dẫn các
hoạt động quản lý dữ liệu ở tất cả các mức độ. Để đạt được mục tiêu tổng thể
này, quản lý dữ liệu cần phải đạt được tính bền vững tức là quản lý dữ liệu cần
phải được ưu tiên, nó khơng phải là một dự án có thời gian kết thúc, nó là một
q trình liên tục, địi hỏi phải kiên trì thực hiện lâu dài, thường xuyên và liên
tục cải tiến trong tổ chức. Bên cạnh đó, quản lý dữ liệu cần tích hợp vào trong
các hoạt động quản lý của đơn vị. Các hoạt động quản lý dữ liệu cần được đưa
vào trong phương pháp phát triển phần mềm, sử dụng dữ liệu để phân tích, quản
lý dữ liệu master và quản lý rủi ro. Quản lý dữ liệu cần đảm bảo đo lường được.
Quản lý dữ liệu làm tốt sẽ có tác động tốt tới tài chính tổ chức, nhưng chứng
minh được tác động này cần có sự hiểu biết thời gian, điểm bắt đầu và lập kế
hoạch để cải thiện [3][12].
Việc triển khai chương trình quản lý dữ liệu yêu cầu cần có sự cam kết trong
tồn tổ chức từ cấp lãnh đạo cao nhất của đơn vị. Có sự cam kết triển khai từ
các cấp lãnh đạo, từ đó đưa vào các hoạt động chiến lược, định hướng kinh
doanh. Và chia sẻ trách nhiệm, có ma trận phân tách trách nhiệm rõ ràng giữa
các đơn vị trong tổ chức về hoạt động quản lý dữ liệu. Quản lý dữ liệu cần dựa
trên khung và có nguyên tắc quản lý cụ thể.
Nguyên tắc quản lý dữ liệu cần đảm bảo tính toàn vẹn những người tham gia
quản lý dữ liệu sẽ thực hiện toàn vẹn các giao dịch của họ. Tiếp theo là tính
minh bạch quy trình quản lý dữ liệu và quản lý dữ liệu sẽ thể hiện tính minh
bạch; cần phải rõ ràng cho tất cả những người tham gia và kiểm toán viên về
cách thức và thời điểm các quyết định và kiểm soát liên quan đến dữ liệu được
đưa vào các quy trình. Có khả năng đánh giá được các quyết định, quy trình và
kiểm sốt liên quan đến quản lý dữ liệu sẽ có thể kiểm toán được; chúng sẽ
được kèm theo tài liệu để hỗ trợ các yêu cầu kiểm toán dựa trên hoạt động và
tuân thủ. Quản lý dữ liệu sẽ xác định trách nhiệm cho các quyết định, quy trình
và kiểm sốt liên quan đến dữ liệu chức năng chéo. Quản lý dữ liệu sẽ xác định
trách nhiệm đối với các hoạt động quản lý là trách nhiệm của từng người đóng
góp, cũng như trách nhiệm đối với các nhóm quản lý dữ liệu. Quản lý dữ liệu sẽ
10
xác định trách nhiệm theo cách giới thiệu kiểm tra và cân bằng giữa các nhóm
kinh doanh và cơng nghệ cũng như giữa những người tạo/thu thập thông tin,
những người quản lý nó, những người sử dụng nó và những người giới thiệu các
tiêu chuẩn và yêu cầu tuân thủ. Quản lý dữ liệu sẽ hỗ trợ tốt chuẩn hóa dữ liệu
doanh nghiệp. Cuối cùng, quản lý dữ liệu sẽ hỗ trợ các hoạt động quản lý thay
đổi chủ động và phản ứng cho các giá trị dữ liệu tham chiếu và cấu trúc/ sử
dụng dữ liệu gốc và siêu dữ liệu [10].
1.1.7. Các lĩnh vực trọng tâm chính cần được đề cập trong quản lý dữ liệu
An ninh dữ liệu và quản lý rủi ro: Bảo đảm an ninh cho dữ liệu nhạy cảm (dữ
liệu có nguy cơ bị tổn hại do tiết lộ trái phép hoặc vô ý) và thông tin nhận dạng
cá nhân bằng cách bảo vệ chống lại rủi ro tiết lộ trái phép là ưu tiên hàng đầu
đối với chương trình quản lý dữ liệu hiệu quả. Mục tiêu này đạt được bằng cách
thiết lập một kế hoạch quản lý an ninh dữ liệu toàn diện với hệ thống kiểm tra
và kiểm soát để giảm thiểu rủi ro an ninh dữ liệu. Các chính sách và hướng dẫn
phải xác định các quy tắc cho việc sử dụng cá nhân và sử dụng liên quan đến
công việc đối với tất cả hệ thống máy tính và dữ liệu của tổ chức, bao gồm các
thủ tục sử dụng dữ liệu, đánh giá rủi ro dữ liệu để xác định lỗ hổng và xử lý các
vi phạm an ninh dữ liệu và giải thích cách giám sát việc tuân thủ các chính sách
này. Điều quan trọng là phải tiến hành đào tạo nhân viên và kiểm toán thường
xuyên để bảo đảm tuân thủ các chính sách và thủ tục của tổ chức. Kế hoạch bảo
mật và an ninh dữ liệu nên được xem xét và sửa đổi thường xuyên để cập nhật
các mối đe dọa mới nhất [13].
Kiểm kê dữ liệu và quản lý nội dung dữ liệu: Duy trì kiểm kê cập nhật đầy đủ
tất cả các bản ghi và hệ thống dữ liệu bao gồm cả dữ liệu được sử dụng để lưu
trữ và xử lý dữ liệu, cho phép tổ chức nhắm mục tiêu an ninh dữ liệu và quản lý
quyền riêng tư để bảo vệ dữ liệu nhạy cảm. Bản kiểm kê dữ liệu cần chỉ định
những phần tử dữ liệu nào được thu thập, cung cấp lý do cho việc thu thập
chúng và giải thích các mục đích dự định cho việc sử dụng chúng. Một tổ chức
nên thường xuyên xem xét việc kiểm kê của mình và sửa đổi các chính sách
quản lý dữ liệu để bảo đảm rằng chỉ những dữ liệu cần thiết để đáp ứng bộ
chính sách, hoạt động và nhu cầu nghiên cứu chính đáng mới được thu thập và
duy trì. Tất cả các phần tử dữ liệu nên được phân loại theo mức độ nhạy cảm
của chúng (ví dụ: bằng cách đánh giá rủi ro tiết lộ thông tin nhận dạng cá nhân;
khả năng gây ảnh hưởng xấu cho cá nhân, nếu dữ liệu bị xâm phạm; yêu cầu
pháp lý để bảo vệ dữ liệu, v.v.) bảo đảm phù hợp với những nỗ lực an ninh được
áp dụng để bảo vệ dữ liệu [3][11].
11
Quản lý hồ sơ dữ liệu và truy cập dữ liệu: Bảo đảm tuân thủ các chính sách
an ninh được thực hiện bằng cách chỉ định rõ ràng tất cả các hoạt động liên
quan đến xử lý dữ liệu của người quản lý dữ liệu cũng như người dùng. Điều
này bao gờm nêu rõ ai có thể truy cập dữ liệu nào, cho mục đích gì, truy cập khi
nào và truy cập như thế nào. Một kế hoạch quản trị cần cung cấp hướng dẫn về
các hoạt động dữ liệu người dùng và người quản lý phù hợp để xử lý các bản
ghi trong tất cả các giai đoạn của vịng đời dữ liệu bao gờm thu thập, duy trì, sử
dụng và lưu trữ hoặc hủy dữ liệu một cách an toàn. Ngoài ra, kế hoạch nên xác
định các yêu cầu và cơ chế cho việc hủy thông tin nhận dạng cá nhân để bảo vệ
quyền riêng tư cá nhân (ví dụ: bằng cách xóa tất cả các định danh trực tiếp và
gián tiếp khỏi dữ liệu liên quan đến thông tin nhận dạng cá nhân) [3][12].
Chất lượng dữ liệu: Xây dựng các phương pháp để ngăn chặn, phát hiện, sửa
lỗi và lạm dụng dữ liệu là điều cần thiết để duy trì dữ liệu chất lượng cao. Cách
tiếp cận chủ động đối với quản lý dữ liệu đòi hỏi phải thiết lập các tiêu chuẩn
chất lượng dữ liệu và giám sát, cập nhật thường xuyên các chiến lược quản lý
dữ liệu để bảo đảm dữ liệu chính xác, phù hợp, kịp thời và hồn chỉnh cho các
mục đích mà chúng dự định sẽ được sử dụng. Một kế hoạch quản lý dữ liệu
mạnh mẽ nên phác thảo việc sử dụng dữ liệu có thể chấp nhận để cân bằng giữa
quyền riêng tư và an ninh với nhu cầu dữ liệu chất lượng cao cần thiết cho các
phân tích thống kê. Việc kiểm toán chất lượng định kỳ nên được xây dựng trong
tất cả các chu trình quản lý dữ liệu, bao gồm thu thập, báo cáo và phát hành [3].
Chia sẻ dữ liệu và báo cáo: Bảo đảm các hoạt động phổ biến dữ liệu tuân thủ
luật pháp là trách nhiệm chính của cơ quan, tổ chức. Việc phát hành hoặc chia
sẻ bất kỳ dữ liệu nào mà không có sự đờng ý bằng văn bản (ví dụ: dưới dạng hồ
sơ cá nhân hoặc báo cáo tổng hợp) phải tuân thủ các chính sách và quy định do
tổ chức thiết lập bao gồm các thủ tục bảo vệ thông tin nhận dạng cá nhân khi
chia sẻ với các cơ quan khác và thủ tục tránh tiết lộ để bảo vệ thông tin nhận
dạng cá nhân không bị tiết lộ trong các báo cáo công khai. (Bảo đảm rằng mọi
thỏa thuận chia sẻ dữ liệu đều được cho phép theo luật và quy định về quyền
riêng tư). Hơn nữa, kế hoạch quản lý dữ liệu nên xác định các thủ tục để thông
báo cho các bên liên quan thường xuyên về các quyền của họ theo luật và quy
định điều chỉnh quyền riêng tư của dữ liệu.
1.1.8. Các bước cơ bản để thực hiện quản lý dữ liệu
Thành lập ủy ban quản lý dữ liệu: Trong một hệ thống dữ liệu phức tạp với
nhiều mục đích sử dụng, thiết lập nhiệm vụ, ban hành các chính sách và thủ tục
quản lý dữ liệu được giao cho một ủy ban quản lý dữ liệu. Ủy ban này phải có
“chức năng chéo” và bao gồm đại diện bộ phận, tư vấn pháp lý, quản trị viên hệ
thống dữ liệu, nhà cung cấp dữ liệu, quản lý dữ liệu, chuyên gia an ninh và
12
quyền riêng tư, người dùng dữ liệu từ khắp tổ chức. Các thành viên ủy ban đại
diện cho các văn phịng khác nhau này (ví dụ: các văn phịng liên quan đến việc
cung cấp hoặc sử dụng dữ liệu) nên được bổ nhiệm bởi các khu vực (hoặc một
nhóm cá nhân) khác với cơ quan quản lý điều hành.
Xác định chính sách và thủ tục quản lý dữ liệu: Ủy ban quản lý dữ liệu phát
triển các chính sách, thủ tục và tiêu chuẩn cho một chương trình bảo vệ dữ liệu
và quyền riêng tư. Các chính sách và thủ tục này phải khả thi ở các cấp khác
nhau trong cấu trúc quản lý dữ liệu của tổ chức. Ủy ban quản trị có trách nhiệm
chính thức hóa các chính sách và thủ tục quản lý dữ liệu bằng văn bản sau khi
lấy ý kiến phản hồi của các bên liên quan và bảo đảm sự hỗ trợ từ lãnh đạo điều
hành.
Triển khai chương trình quản lý dữ liệu: Các chính sách và quy trình cụ thể
được nêu trong chương trình quản lý dữ liệu được những người quản lý dữ liệu
triển khai thông qua việc quản lý dữ liệu liên tục bao gồm thu thập, xử lý, lưu
trữ, bảo trì và sử dụng. Bất kỳ thay đổi nào đối với chương trình quản trị phải
được sự chấp thuận của các lãnh đạo có thẩm quyền điều hành, người ban đầu
chỉ định các thành viên của Ủy ban quản lý dữ liệu.
Theo dõi và báo cáo tiến độ chương trình: Người quản lý dữ liệu có trách
nhiệm tích cực theo dõi các hoạt động liên quan đến dữ liệu để bảo đảm tuân
thủ các tiêu chuẩn, chính sách và thủ tục đã được thiết lập. Ủy ban quản lý dữ
liệu nên theo dõi tiến độ thực hiện chương trình với các số liệu chính (ví dụ:
thống kê chất lượng dữ liệu) và báo cáo định kỳ về tiến độ cho nhóm lãnh đạo
và các bên liên quan khác.
1.2. KHUNG QUẢN LÝ DỮ LIỆU
Khung quản lý dữ liệu đang đặt quản trị dữ liệu ở vị trí trung tâm, vì quản trị là
cần thiết cho sự nhất quán và cân bằng giữa các chứ năng. Tất cả các thành phần
trong khung quản lý dữ liệu đều là cần thiết cho tổ chức trong việc quản lý
thơng tin, tuy nhiên chúng có thể sẽ được triển khai tại các thời điểm khác nhau
phụ thuộc vào mức độ ưu tiên và yêu cầu của tổ chức [3].
Quản trị dữ liệu là lập kế hoạch, triển khai, giám sát toàn bộ hoạt động, các quy
trình, chức năng có trong quản lý dữ liệu, kiểm soát hệ thống Quản lý dữ liệu
(Data Management). DAMA đã đặt Quản trị dữ liệu vào trung tâm cửa khung
quản lý dữ liệu, vì quản trị dữ liệu đóng vai trò như “trái tim”, thành phần cốt
lõi, ổn định, cân bằng giữa tất cả các chức năng trong Quản lý dữ liệu [3][19].
13
Hình 1.2. Khung quản lý dữ liệu
Theo hiệp hội quản lý dữ liệu quốc tế (Data management Association- DAMA),
khung quản lý dữ liệu bao gồm các lĩnh vực sau [3][19]:
Quản lý kiến trúc dữ liệu (Data Architechture) là thành phần thứ hai trong
khung quản lý dữ liệu, sau thành phần trung tâm là quản trị dữ liệu đã được giới
thiệu trong nội dung trước.
Quản lý kiến trúc dữ liệu liên quan đến các việc: xác định nhu cầu, tiến hành
thiết kế, duy trì và phát triển hệ thống kiến trúc dữ liệu bao gờm các mơ hình,
chính sách, quy tắc hoặc tiêu chuẩn tác động đến các cách thức dữ liệu được thu
thập, lưu trữ, sắp xếp, tích hợp và đưa vào phân tích, sử dụng.
Quản lý kiến trúc dữ liệu là quá trình xây dựng các yêu cầu trung về quản lý dữ
liệu cho tổ chức. Giúp cung cấp một tiêu chuẩn chung, các yêu cầu chiến lược
về dữ liệu. Đưa ra được các thiết kế tích hợp mức tổng quan để đáp ứng được
các yêu cầu của tổ chức và phù hợp với chiến lược cũng như kiến trúc của
doanh nghiệp.
Thiết kế và mơ hình hóa dữ liệu (Data Modeling & Design) là quá trình
khám phá, nghiên cứu, phân tích dữ liệu. Xác định, tìm hiểu các nhu cầu, mục
đích khai thác dữ liệu, thể hiện những nhu cầu, mục đích đó của tổ chức vào các
mơ hình dữ liệu thống nhất, chuẩn tắc và có thể được sử dụng nhiều lần, lặp đi
lặp lại trong tương lai. Mơ hình hóa dữ liệu đại diện cho đối tượng dữ liệu, thể
14
hiện mối liên hệ, sự kết hợp giữa các đối tượng dữ liệu khác nhau và các quy tắc
có thể có giữa các đối tượng dữ liệu đó.
Lưu trữ và vận hành dữ liệu (Data Storage & Operations) các hoạt động
bao gồm việc thiết kế, thực hiện, và hỗ trợ lưu trữ dữ liệu, mục đích để tối đa
hóa giá trị trong suốt vòng đời dữ liệu, từ việc tiếp cận, thu thập, tích hợp đến
xử lý. Lưu trữ và vận hành dữ liệu bao gồm hai hoạt động là cơ sở dữ liệu hỗ trợ
tập trung và cơ sở dữ liệu kỹ thuật hỗ trợ.
Cơ sở dữ liệu hỗ trợ (Database support): tập trung vào các hoạt động liên
quan đến vòng đời dữ liệu, từ việc triển khai xây dựng môi trường cơ sở dữ liệu
ban đầu, đến việc thu thập, lưu trữ hay hủy bỏ dữ liệu, bảo đảm cơ sở dữ liệu
được hoạt động tốt thông qua giám sát và điều chỉnh.
Cơ sở dữ liệu kỹ thuật hỗ trợ (Database technology support): xác định nhu
cầu, yêu cầu của hệ thống lưu trữ dữ liệu, xem xét với khả năng, nguồn lực hiện
tại của tổ chức, xác định các phần mềm kỹ thuật, kết cấu kiến trúc sẽ áp dụng,
sau đó tiến hành xây dựng, cài đặt và quản trị các phần mềm và giải quyết các
vấn đề phát sinh liên quan đến kỹ thuật trong tương lai.
Quản trị cơ sở dữ liệu (DBA) đóng vai trị quan trọng trong cả hai khía cạnh
dung lượng lưu trữ dữ liệu và các hoạt động. Vai trò của DBA là thực hiện quản
lý có uy tín nhất và thơng qua hầu hết các dữ liệu rộng rãi vai trò chuyên
nghiệp, và cơ sở dữ liệu có lẽ là trưởng thành hầu hết tất cả các biện pháp quản
lý dữ liệu. DBA cũng đóng vai trị chủ đạo trong hoạt động dữ liệu và bảo mật
dữ liệu.
Bảo mật dữ liệu (Data security) bao gồm việc lập kế hoạch, phát triển và thực
hiện các chính sách, quy trình bảo mật, cung cấp cách thức xác thực, ủy quyền,
truy cập, kiểm soát, thống kê, báo cáo về dữ liệu và tài sản thông tin. Chi tiết
các yêu cầu về bảo mật cho từng loại dữ liệu là khác nhau giữa các công ty,
ngành nghề, lĩnh vực thậm chí là giữa các quốc gia. Tuy nhiên, mục tiêu của
hoạt động bảo mật dữ liệu là như nhau: bảo vệ tài sản thông tin, dữ liệu, tuân
thủ các quy định về quyền riêng tư, bảo mật, các yêu cầu, thỏa thuận khác trong
kinh doanh.
Tích hợp dữ liệu và khả năng tương tác (Data Integration &
Interoperability) mơ tả q trình liên quan đến sự di chuyển và hợp nhất dữ
liệu bên trong và giữa các hệ thống lưu trữ, các ứng dụng và tổ chức. Tích hợp
dữ liệu theo các biểu mẫu cấu trúc nhất quán để dữ liệu giữa nhiều hệ thống có
15
thể giao tiếp được với nhau. Đây là tính năng rất cơ bản mà hầu hết các doanh
nghiệp cần thực hiện để: chuyển đổi dữ liệu, tích hợp các gói giải pháp của đối
tác vào hệ sinh thái ứng dụng chung của tổ chức; chia sẻ dữ liệu giữa các ứng
dụng trong tổ chức; phân phối dữ liệu giữa các cơ sở lưu trữ dữ liệu và trung
tâm dữ liệu; lưu trữ dữ liệu; quản lý giao diện dữ liệu; tích hợp dữ liệu có cấu
trúc và phi cấu trúc.
Quản lý tài liệu, nội dung (Document & content management) liên quan đến
kiểm sốt q trình thu thập, lưu trữ, truy cập và sử dụng các tài liệu, thông tin
ở bên ngồi cơ sở dữ liệu. Mục đích là duy trì tính tồn vẹn và cho phép người
dùng truy cập và sử dụng dữ liệu và thông tin phi cấu trúc hoặc bán cấu trúc.
Trong nhiều tổ chức, dữ liệu phi cấu trúc có mơi quan hệ trực tiếp với dữ liệu có
cấu trúc do đó cần thiết lập các kế hoạch hành động cụ thể, triển khai và giám
sát. Ngoài ra, cũng như các loại dữ liệu khác, tài liệu và nội dung phi cấu trúc
cần được kiểm tra về chất lượng và bảo mật.
Dữ liệu chủ và dữ liệu tham chiếu (References and master data): Các phòng
ban, bộ phận, các quy trình, hệ thống trong một tổ chúc đều có nhu cầu về chia
sẻ dữ liệu để sử dụng cho mục đích cơng việc của đơn vị mình. Mặc dù lợi ích
của việc chia sẻ dữ liệu đem lại là rất nhiều, nhưng luôn luôn tiềm ẩn rất nhiều
rủi ro và có nhiều vấn đề phát sinh như dữ liệu có thể bị trùng lặp, dư thừa, chất
lượng dữ liệu khơng đảm bảo dẫn dến chi phí liên quan bị gia tăng. Đó là lý do
vì sao tổ chức cần có sự quản lý dữ liệu tham chiếu và dữ liệu gốc (reference
and master data) một cách hiệu quả. Dữ liệu tham chiếu là các bảng mã, mô tả
dữ liệu, phân loại dữ liệu khác bên trong tổ chức hoặc liên quan đến dữ liệu,
thơng tin khác ngồi phạm vi tổ chức.
Kho dữ liệu tập trung và báo cáo quản trị dữ liệu (Data warehousing and
Business Intelliengence) liên quan đến việc lập kế hoạch, thực hiện và kiểm
soát các quy trình để cung cấp dữ liệu hỗ trợ ra các quyết định và hỗ trợ công
tác lập báo cáo, truy vấn, phân tích dữ liệu để ra quyết định. Data warehousing
mơ tả các q trình trích xuất, làm sạch, chuyển đổi, kiểm soát và truyền tải dữ
liệu trong kho dữ liêu. Business Intelligence (BI) là các quá trình, cách thức sử
dụng dữ liệu để hỗ trợ lãnh đạo của công ty đưa ra các quyết định về kinh doanh
một cách chính xác tại mỗi thời điểm. BI dược coi là thuật ngữ phổ biến để
miêu tả các cách sử dụng dữ liệu phục vụ cho việc dự báo môi trường kinh
doanh thơng qua các bước phân tích để nắm bắt, phát hiện ra các vấn đề kinh
16
doanh trong dữ liệu. Từ đó các nhà lãnh đạo sẽ tiến hành đưa ra các hành động,
giải pháp cụ thể.
Quản lý siêu dữ liệu (Metadata) liên quan đến việc lập kế hoạch, triển khai và
kiểm soát các hoạt động truy cập, sử dụng metadata. Metadata – Siêu dữ liệu là
loại dữ liệu dùng để mô tả các dữ liệu khác, như mơ tả tính chất, loại biến dữ
liệu, thơng tin mà dữ liệu đó cung cấp. Cùng với reference data và master data,
metadata hỗ trợ các quá trình xử lý, tích hợp, bảo mật, kiểm sốt, chia sẻ dữ liệu
diễn ra hiệu quả và chính xác hơn. Ngồi ra, metadata còn giúp chúng ta hiểu rõ
hơn về dữ liệu, đánh giá chất lượng dữ liệu, quản lý các cơ sở dữ liệu, các ứng
dụng tốt hơn.
Quản lý chất lượng dữ liệu: Việc lập kế hoạch, thực hiện và kiểm soát các hoạt
động áp dụng những kỹ thuật quản lý chất lượng vào dữ liệu để đảm bảo nó phù
hợp để phân tích và đáp ứng nhu cầu của người dùng. Quản lý chất lượng dữ
liệu (Data Quality Management - DQM) là một quá trình hỗ trợ quan trọng
trong quản lý thay đổi tổ chức. Thay đổi tập trung kinh doanh, chiến lược hội
nhập kinh doanh của công ty, và sáp nhập, mua lại, và đối tác có thể uỷ quyền
cho rằng chức năng CNTT nguồn pha trộn dữ liệu, tạo ra dữ liệu, truy cập dữ
liệu, hoặc tích hợp dữ liệu.
Chất lượng dữ liệu là đồng nghĩa với chất lượng thông tin, nếu chất lượng dữ
liệu kém sẽ tạo ra thơng tin khơng chính xác và hiệu quả kinh doanh kém. Làm
sạch dữ liệu là giải pháp cải tiến ngắn hạn và tốn kém mà không giải quyết các
nguyên nhân gốc rễ của các vấn đề về chất lượng của dữ liệu. Một chương trình
quản lý chất lượng dữ liệu chặt chẽ và tổng thể là cần thiết để cung cấp một giải
pháp kinh tế để cải thiện chất lượng dữ liệu toàn vẹn.
Quản lý chất lượng dữ liệu tập trung vào quản lý vòng đời để tạo dữ liệu,
chuyển đổi, và truyền tải để đảm bảo rằng những thông tin kết quả đáp ứng nhu
cầu của tất cả người tiêu dùng dữ liệu trong tổ chức.Thể chế hóa quy trình giám
sát chất lượng dữ liệu, quản lý và cải thiện bản lề vào việc xác định nhu cầu
kinh doanh cho dữ liệu chất lượng và xác định những cách tốt nhất để đo lường,
giám sát, kiểm soát và báo cáo về chất lượng của dữ liệu. Sau khi xác định các
vấn đề trong các dòng xử lý dữ liệu, thơng báo cho người quản lý dữ liệu thích
hợp để có hành động khắc phục nhằm giải quyết các vấn đề cấp tính, trong khi
đờng thời cho phép loại bỏ các nguyên nhân gốc rễ của nó.
17
DQM cũng là một quá trình liên tục để xác định các thông số để xác định mức
độ cho phép chất lượng dữ liệu để đáp ứng nhu cầu kinh doanh, và đảm bảo
rằng chất lượng dữ liệu đáp ứng được yêu cầu của tổ chức. DQM liên quan
phân tích chất lượng của dữ liệu, xác định điểm bất thường dữ liệu, và xác định
yêu cầu kinh doanh và tương ứng với quy tắc kinh doanh cho khẳng định chất
lượng dữ liệu cần thiết. DQM liên quan đến việc khi tiến hành các quy trình
kiểm tra, kiểm sốt theo dõi phù hợp với các quy tắc chất lượng dữ liệu được
xác định, Cũng như khi tiến hành phân tích dữ liệu, tiêu chuẩn hóa, làm sạch, và
củng cố, khi cần thiết.
1.3 KHUNG QUẢN LÝ DỮ LIỆU VIỄN THÔNG CHO TCT MẠNG
LƯỚI VIETTEL
Dựa trên các thành phần khung quản lý dữ liệu chung của DAMA và quá trình
khảo sát thực tế hiện trạng quản lý dữ liệu tại đơn vị để đưa ra khung quản lý dữ
liệu, các hợp phần quan trọng bắt buộc tổ chức cần thực hiện quản lý khi muốn
nâng cao công tác quản lý dữ liệu của đơn vị mình. Do mơ hình thực tế tại tập
đồn Công nghiệp viễn thông quân đội cho sự phân công rõ ràng vai trị trách
nhiệm về đơn vị ví dụ, các hoạt động định hướng quản trị thì thuộc các phịng
ban trên tập đồn, các hoạt động phát sinh, thu thập và lưu trữ dữ liệu thì rải rác
trong tất cả hoạt động của đơn vị thành viên trong tập đồn. Sau đó việc quản
trị, quy cập, phân quyền nằm tập trung tại Tổng công ty mạng lưới Viettel. Từ
đây là cung cấp dịch vụ cho các công ty thành viên sử dụng và phân tích dữ
liệu. Song song với các hoạt động trên thì cơng tác quản lý an tồn thơng tin
được thực hiện bởi chính giải pháp từ các công ty thành viên và bởi công ty An
ninh mạng chun trách.
Từ mơ hình tổ chức hiện tại của cả tập đồn, việc đưa ra mơ hình khung quản lý
dữ liệu như hình 1.3. Khung quản lý dữ liệu viễn thơng được cho là phù hợp vì
sắp xếp các phân hệ, cấu phần hợp lý cho từng đơn vị, tổng công ty theo đúng
chức năng hiện tại.