Tải bản đầy đủ (.pdf) (13 trang)

QUẢN TRỊ DỮ LIỆU CHỦ ĐA MIỀN: NÂNG CAO QUẢN TRỊ DỮ LIỆU CHO CÁC TỔ CHỨC DOANH NGHIỆP

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.69 MB, 13 trang )

Quản trị dữ liệu chủ da miền: nâng cao quản trị dữ liệu
cho các tô chức doanh nghiệp

Ngô Thùy Linh - Phan Thanh Đức

Khoa Hệ thống thông tin quàn lý, Học viện Ngân hàng

Ngày nhận: 17/05/2021
Ngày nhận bàn sửa: 26/05/2021
Ngày duyệt đăng: 25/06/2021

Tóm tắt: Dữ liệu ngày nay đã trở thành một trong những tài sản quan trọng của các
tổ chức, doanh nghiệp. Tuy nhiên, thách thức đặt ra với các nhà quản lý là làm thế
nào để có thể khai thác, sử dụng và quản lý dữ liệu một cách hiệu quả và thông minh
khỉ có quả nhiều nguồn dữ liệu bên trong và bên ngoài tố chức. Giải pháp quản lý
dữ liệu chủ đa miền dựa vào việc quản lý tống thê dữ liệu trên đa miền sẽ giúp các
tổ chức có cái nhìn thong nhất và chỉnh xác về các thực thê quan trọng, từ đó cung
cấp các thơng tin tài chính phù hợp, đáng tin cậy. Bài báo này tập trung làm rõ các
khải niệm, tầm quan trọng cùa việc quản lý dữ liệu chủ đa miền và một số cách tiếp
cận khỉ xây dựng quản lý dữ liệu chủ da miên.
Từ khóa: Dữ liệu chủ, Quản trị dữ liệu chủ, Quản lý dữ liệu chủ đa miền

Multi-domain master data management: improving data governance for enterprises

Abstract: Today data has become one of the important assets of organizations and businesses.
However, one challenge faced by managers is how to effectively and intelligently exploit, use and
manage data when the organization is exposed to a large number of both internal and external data
sources. A multi-domain master data management solution based on the overall management of data
across multiple domains will help organizations develop a unified and accurate view of important
entities, thereby providing suitable and reliable financial information. This article attempts to clarify
the concepts and the importance of multi-domain master data management, and propose feasible


approaches when building multi-domain master data management.
Keywords: Master Data, Master Data Management, Multi-Domain Master Data Management

Ngo, Thuy Linh
Email:

Phan, Thanh Duc
Email:

Organization of all: Faculty of Management Information System, Banking Academy of Vietnam

Tạp chí Khoa học & Đào tạo Ngân hàng © Học viện Ngân hàng
ISSN 1859 - 011X
số 229-Tháng 6. 2021 72

NGÔ THÙY LINH - PHAN THANH ĐỨC

1. Đặt vấn đề 2. Dữ liệu chủ và miền dữ liệu

Một khảo sát của Gartner (2019) cho thấy Mồi một miền dữ liệu phản ánh đến một
răng chât lượng dữ liệu kém đã dần đèn chi tập các thực thể quan trọng mà các tổ chức,
phí của các tổ chức tăng lên tới 11,8 triệu
doanh nghiệp thường quan tâm như: tập các
USD. Một trong những nguyên nhân dẫn khách hàng, các sản phẩm, các nhà cung
đến chất lượng dừ liệu kém là chưa tích hợp
được thơng tin từ các nguồn dữ liệu khác câp, các nhân viên, tài chính, chính sách...
nhau trong tổ chức. Nhiều tổ chức hiện (Mark Allen & Dalton Cervo, 2015). Trong
nay đã nhận ra giá trị và tầm quan trọng mồi miền dữ liệu có thể có một hoặc nhiều
của việc quản lý dữ liệu chủ (Master Data thực thể, thực thể có thể là một đối tượng,
Management- MDM) và coi MDM là một cá nhân, đơn vị, địa điểm... phải là duy nhất

giải pháp cho thách thức này. Các tổ chức trong một miền nhất định và thường có
thường bắt đầu triển khai MDM và dừng các thuộc tính kèm theo. Ví dụ, trong miền
ở việc tập trung vào một miền dữ liệu (a Khách hàng, một doanh nghiệp đối tác
data domain), sau đó mới mở rộng đến các hoặc một cá nhân có hợp đồng với doanh
miền khác trong mơ hình quản lý dừ liệu đa nghiệp có thể được coi là một thực thể,
mồi thực thể khách hàng có một số thuộc
mien (a multi- domain model). Trong quá tính như: họ tên, số điện thoại, e-mail, giới
trình thực hiện, hầu hết các tổ chức gặp một tính... Tùy vào từng loại hình, lĩnh vực kinh
số khó khăn trong việc thực hiện đầy đủ doanh của từng tổ chức mà có các miền dữ
và nhất quán các mục tiêu quản trị dữ liệu liệu với các thực thể khác nhau. Chẳng hạn
chủ trên nhiều miền (Mark Allen & Dalton có một số miền dữ liệu tương ứng với từng
Cervo, 2015). Sự khó khăn này bắt nguồn lĩnh vực như sau:
từ việc khơng có cái nhìn tổng thể về các - Lĩnh vực sản xuất: Khách hàng, Sản phẩm,
thành phần, chức năng và cả các dịch vụ để Nhà cung cấp, Nguyên vật liệu, Địa điểm...
có thể quản trị dữ liệu chủ một cách chính
xác và hiệu quả. Một số tổ chức nhìn nhận - Lĩnh vực chăm sóc sức khỏe: Bệnh nhân,
việc quản trị này về bản chất chỉ là việc tích Nhà cung cấp, Sản phẩm, Khiếu nại, Triệu
hợp dừ liệu đơn thuần. Đây sẽ trở thành chứng lâm sàng, Bảo hiểm...
một sai lầm khi các dữ liệu theo thời gian - Lĩnh vực tài chính: Khách hàng, Tài
khoản, Sản phẩm, Địa điểm, Bảo hiểm...
ngày càng trở nên đa dạng và phức tạp, bởi
vì ngồi việc tích họp dữ liệu thì tổ chức - Lĩnh vực giáo dục: Sinh viên, Khoa bộ
còn cần phải đưa ra các trách nhiệm của mơn, Địa điểm, Tài liệu, Khóa học...
bộ phận, phòng ban đối với dữ liệu và cần Trên thực tế, mức độ ưu tiên về dữ liệu của
phải quan tâm đến việc quản lý chất lượng các thực thể là khác nhau, dữ liệu nào có
dữ liệu để có thể tiếp cận thành cơng quản
trị dữ liệu trên nhiều miền. Phần tiếp theo mức độ ưu tiên cao sẽ được lưu trữ trong
của bài báo sẽ trình bày các vấn đề có liên vùng bộ nhớ được truy cập nhanh hơn,
quan đến dữ liệu chủ, miền dữ liệu, quản trong hệ tài nguyên tốt hơn, quan tâm về
lý dừ liệu chủ, dừ liệu chủ đa miền và một chất lượng dừ liệu của thực thể đó hơn, có

số cách tiếp cận xây dựng quản trị đa miền cơ chế kiểm soát chất lượng dừ liệu tốt hơn.
nhằm nâng cao việc quản trị dữ liệu cho các
tô chức, doanh nghiệp. Do đó khái niệm “Dừ liệu chủ” (Master
data) đã ra đời để mô tả, phản ánh đến
những dữ liệu quan trọng cần được quan
tâm nhiều hơn trong tổ chức. Theo John R.

Talburt & Yinle Zhou (2015), dừ liệu chủ

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 73

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

của một tổ chức được định nghĩa là dữ liệu 2015). Hay dữ liệu chủ là dữ liệu mô tả các
được lưu giữ bởi tổ chức đó, mơ tả các thực thực thể lõi của tổ chức với tập các thuộc
thể độc lập và liên quan chính đến các hoạt tính và định danh là nhất quán và chính xác
động của tổ chức. Một định nghĩa khác về
(Keith Gordon, 2013).
dữ liệu chủ là dữ liệu mô tả vê các thực thê Ví dụ sau đây sẽ mơ tả rõ hơn về dữ liệu chủ,
quan trọng đối với các hoạt động và phân dữ liệu về các thực thể khách hàng được lưu
tích của tổ chức, cách dừ liệu này tương tác trữ ở các hệ thống Kinh doanh và Ke toán
và chia sẻ sẽ cung cấp ngữ cảnh cho dữ liệu của công ty X (David Loshin, 2009)
giao dịch (Mark Allen & Dalton Cervo, Các thông tin liên quan đến thực thể khách

Hình 1. Dữ liệu về khách hàng được lưu trữ ở 2 hệ thống khác nhau

Nguồn: David Loshin (2009)

Bảng 1. Dữ liệu chủ miền khách hàng của Hệ thống Kinh doanh


Customer Master Data

ID Cust FirstName MiddleName LastName TelNum Address City
KH002 Ha Noi
An Van Le 090234567 25 Ly Thai To

Nguồn: David Loshin (2009)

Bang 2. Dữ liệu chu miền khách hàng của Hệ thống Kế toán

Customer Master Data

ID First Last Add City Zip Tel
ID0070 0909789456
An Le 12 Chua Boc Ha Noi 100000

Nguồn: David Loshin (2009)

74 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6. 2021

NGÔ THÙY LINH - PHAN THANH ĐỨC

hàng được lưu trữ ở hai hệ thống này bao - Dữ liệu tham chiếu (Reference Data): Dữ
gồm:
Hệ thống “Kinh doanh” lưu trừ các thông liệu thường được mô tả bởi các giá trị được
tin khách hàng bao gồm: Tên (FirstName), sử dụng để phân biệt các dữ liệu khác nhau,
chẳng hạn như phân biệt giữa dừ liệu chủ
Tên đệm (MiddleName), Họ (LastName),
Số điện thoại (TelNum), Địa chỉ (Address). và dừ liệu giao dịch.
Dữ liệu chủ miền khách hàng của hệ thống - Dữ liệu cấu trúc giao dịch (Transaction

Kinh doanh được biểu diễn như ở Bảng 1.
Hệ thống “Kế tốn” lưu trừ các thơng tin structure data) đại diện cho những người
của khách hàng bao gồm: Tên (First), Họ tham gia trực tiếp trong một giao dịch,
(Last), Địa chỉ (Add), Thành phố (City), chẳng hạn như nhà cung cấp, khách hàng
Mã bưu chính (ZIP), số điện thoại (Tel). và sản phẩm. Thông tin về một giao dịch
Dữ liệu chủ miền khách hàng của hệ thống không thể được ghi lại trừ khi thông tin chi
Kế toán được thể hiện ở Bảng 2. tiết của những người tham gia này đã tồn
Các miền dữ liệu cũng như các dữ liệu khác
bên trong tổ chức đều có thể chia thành 2 tại trong cơ sở dữ liệu.
- Dữ liệu cấu trúc doanh nghiệp (Enterprise
loại: dữ liệu hoạt động (operational data) structure data) là dữ liệu mô tả cấu trúc của
và dữ liệu không hoạt động (nonoperational doanh nghiệp, ví dụ dữ liệu mơ tả về cơ cấu
data). “Dừ liệu hoạt động” là tập họp dữ tổ chức hoặc cơ cấu tài chính.
liệu theo thời gian thực để hồ trợ yêu cầu Neu coi dữ liệu chủ được biểu diễn dưới
của tổ chức trong các hoạt động hàng ngày dạng các danh từ của dừ liệu và thông tin
thì dữ liệu giao dịch là các động từ. Chúng
của họ. “Dữ liệu không hoạt động” thường mô tả các hoạt động diễn ra hàng ngày
được thu thập trong kho dữ liệu với tần suất trong tổ chức, doanh nghiệp như việc bán
ít hơn và được sử dụng cho hệ thống kinh hàng, doanh số bán hàng, hay các bệnh
doanh thông minh (Dalton Cervo & Mark nhân được phép xuất viện hay nhập viên tại
Allen, 2011). Dữ liệu chủ về bản chất là các bệnh viện...
dữ liệu “không hoạt động”, cụ thể hon, cấu Bất kể các miền dữ liệu được xác định như
trúc dữ liệu chủ được mơ tả ở Hình 2. thế nào, khái niệm dữ liệu chủ cần được
Cấu trúc dữ liệu chủ gồm 3 lóp: dữ liệu xác định rõ ràng và phân biệt với các loại
tham chiếu, dữ liệu cấu trúc giao dịch, dữ dữ liệu khác. Việc xác định dữ liệu chủ phụ
liệu cấu trúc doanh nghiệp. thuộc quan điểm của từng tổ chức và dựa
vào các thực thể quan trọng trong các miền
dừ liệu của tổ chức đó.

3. Quản lý dữ liệu chủ


Hình 2. Cấu trúc 3 lóp dữ liệu chủ Mặc dù được định nghĩa là dữ liệu chủ
nhưng dừ liệu này vẫn có thể được lưu trữ
Nguồn: Keith Gordon (2013) phân tán ở các hệ thống ứng dụng khác
nhau và do đó có thể dẫn đến các silo thơng
tin (các thông tin biệt lập). Điều này phản
ánh một thực trạng tại nhiều doanh nghiệp
là dữ liệu về một thực thể hay dữ liệu chủ
của một miền dữ liệu được lưu trữ ở nhiều
cơ sở dừ liệu khác nhau trong các hệ thống

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 75

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

khác nhau, nhưng thông tin phản ánh về trữ một cách rời rạc ở các hệ thống thông
chúng lại không đồng nhất. tin được cung cấp bởi các hãng khác nhau
Việc lưu trừ dừ liệu chủ ở các hệ thống khác như mô tả ở hai ví dụ trên (Hình 1, Hình
nhau gây khó khăn trong việc tổng hợp, 3) sẽ dần đến tình trạng: dữ liệu của cùng
một thực thể trong một miền dữ liệu sẽ
phân tích và xử lý thơng tin. Ví dụ được mơ rất khác biệt và khi đó chất lượng dữ liệu
tả ở Hình 1, rõ ràng với dữ liệu chủ miên không được đảm bảo ảnh hưởng đến việc
khách hàng được lưu trữ ở hệ thống “Kinh
doanh” và hệ thống “Kế toán” là khác
nhau. Thực tế là cùng một thực thể khách
hàng Lê Văn An nhưng thông tin về khách
hàng này được biểu diễn khác nhau ở 2 hệ
thống: hệ thống “Kinh doanh” khách hàng
An Van Le với mã khách hàng là KH002,
có số điện thoại 0902345678, địa chỉ 25 Lý

Thái Tổ, Hà Nội khác với khách hàng An
Le (mã ID0070) trong hệ thống “Kế toán”
với địa chỉ tại 12 Chùa Bộc, Hà Nội, có số

điện thoại 0909789456. Mặc dù đây là một
khách hàng duy nhất Lê Văn An, nhưng khi
bộ phận quản lý muốn đưa ra các quyết định
liên quan đến kế hoạch chăm sóc khách
hàng và giới thiệu sản phẩm thì họ khơng
biết được số điện thoại nào khách hàng hay
sử dụng cũng như địa chỉ mà khách hàng
thường xuyên có mặt ở đâu để có thể thực
hiện các chiến dịch quảng cáo, marketing
sản phẩm,... Vậy thông tin nào chính xác
nhất khi mơ tả về dữ liệu chủ miền khách
hàng là vấn đề mà doanh nghiệp cần quan
tâm, cũng như có một cái nhìn thống nhất
về dữ liệu chủ khách hàng tại một nơi duy
nhất, thay vì thơng tin nằm rải rác ở nhiều

hệ thống.
Nhìn rộng hơn, với doanh nghiệp sản xuất
và kinh doanh sản phẩm có nhiều bộ phận
phịng ban thì dữ liệu chủ xuất hiện và được
lưu giữ ở các hệ thống tách biệt nhau như ở
Hình 3 (Keith Gordon, 2013).
Như mơ tả ở Hình 3, dữ liệu chủ các miền
dữ liệu: khách hàng, sản phâm, phịng ban,
nhà cung cẩp xuất hiện ở các quy trình
trong các bộ phận, phòng ban khác nhau

(Bảng 3).
Dữ liệu chủ các miền dữ liệu được lưu

76 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021

NGÔ THÙY LINH - PHAN THANH ĐỨC

Bảng 3. Dữ liệu chủ xuất hiện ờ các chủ (Keith Gordon, 2013).
hệ thống khác nhau Các định nghĩa này nêu rõ hai thành phần
chính của việc quản lý dừ liệu chủ được mô
Dữ liệu chủ Được lưu trữ ở các hệ tả ở Hình 4.
thống trong các phòng ban Hai thành phần của MDM: Thành phần
Chính sách (Policies) bao gồm các chính
Sản phẩm 8 hệ thống sách đại diện cho quản trị dữ liệu của MDM,
thành phần Công nghệ (Technologies) bao
Khách hàng 7 hệ thống gồm các công nghệ hồ trợ MDM. Chính
sách xác định các vai trò và trách nhiệm
Phòng ban 3 hệ thống trong quy trình MDM. Ví dụ: nếu một cơng
ty giới thiệu một sản phẩm mới, các chính
Nhà cung cấp 3 hệ thống sách xác định ai chịu trách nhiệm tạo mục
nhập mới trong sổ đăng ký sản phẩm chính,
Nguồn: Keith Gordon (2013) các tiêu chuẩn cho tạo định danh sản phẩm,
những người hoặc bộ phận nào cần được
ra quyết định của tổ chức, cùng nhiều vấn thông báo và những hệ thống dữ liệu khác
đề khác nữa liên quan đến điều hành, quản cần được cập nhật. Tuân thủ quy định cùng
lý khi chất lượng dữ liệu kém... Chính vì với sự riêng tư và bảo mật thông tin cũng là
vậy, cần phải Quản lý dữ liệu chủ (Master những vấn đề quan trọng (John R. Talburt
Data Management- MDM) để đảm bảo & Yinle Zhou, 2015).
chất lượng thơng tin chính xác nhất cho các Thành phần công nghệ của MDM cần xác
thực thể quan trọng trong tổ chức. định hai việc chính, đó là: Quy trình xác

Định nghĩa về quản lý dữ liệu chủ của định thực thể (Entity Resolution Process)
David Loshin (2009) cho biết: Quản lý dữ và Quản lý thông tin xác thực thực thể
liệu chủ là tập hợp các hoạt động quản lý (Entity Identity Information Management-
“dữ liệu tốt nhất”, mà có thể điều phối các EIIM).
- Quy trình xác định thực thể (ER) sẽ xác
bên liên quan chính, những người tham gia định các thực thể quan trọng trong tổ chức,
và khách hàng doanh nghiệp trong việc quy trình này diễn ra khi hai hệ thống thông
kết hợp với các ứng dụng kinh doanh, các tin đang cùng tham chiếu đến một hoặc
nhiều thực thể trong thế giới thực. Quy trình
phương pháp quản lý thông tin và công cụ
quản lý dữ liệu để thực thi các chính sách, Hình 4. Các thành phần của MDM
thủ tục, dịch vụ và cơ sở hạ tầng hồ trợ cho
việc nắm bắt, tích hợp và sau đó chia sẻ Nguồn: John R. Taỉburt & Yinle Zhou (2015)

việc sử dụng dữ liệu chủ, đảm bảo dữ liệu
này là chính xác, kịp thời, nhất quán. Một
định nghĩa nữa về quản lý dừ liệu chủ “đó là
khn khổ của các quy trình và cơng nghệ
nhằm tạo ra và duy trì một mơi trường có
thẩm quyền, đáng tin cậy, bền vững, chính
xác và an tồn mà có thể mơ tả một phiên
bản duy nhất và tồn diện, chính xác của dữ
liệu chủ và các mối quan hệ của nó. Định

nghĩa được đưa ra bởi Gartner (2013): quản
lý dữ liệu chủ là tập các quy tắc dựa trên
công nghệ cho phép các bộ phận nghiệp
vụ và công nghệ thông tin làm việc cùng
nhau để giúp tổ chức có được một phiên
bản duy nhất và chính xác nhất về dừ liệu


SÔ' 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 77

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

Bảng 4. Dữ liệu chủ miền khách hàng sau khi được quăn lý bôi MDM

Customer Master Data

ID First Middle Last TelNum Address City Zip
ID0010
An Van Le 0902345678 12 Chua Boo Ha Noi 100000

Nguồn: David Loshin (2009)

này sẽ “sắp xếp” chọn lọc thông tin về các mảng khách hàng) của doanh nghiệp X
thực thể, xảy ra khi có nhiều nguồn thơng mong muốn được lấy thông tin về khách
tin cùng tham chiếu đến tập các thực thể, sẽ hàng một cách chính xác và đảm bảo nhất.
chọn ra thơng tin có độ ưu tiên, chính xác Dữ liệu chủ về miền khách hàng sau khi
cao. Ví dụ, một bệnh nhân được đưa vào được quản lý bởi MDM và được biểu diễn
bệnh viện ở các thời điểm khác nhau, mỗi
lần ở các khoa khác nhau là khoa nội trú và như Bảng 4.
ngoại trú. ER sẽ so sánh thông tin nhập viện Miền dữ liệu khách hàng có thực thể khách
ở mồi thời điểm và đưa ra quyết định hồ sơ hàng Lê Văn An (Bảng 4) sau khi được
quản lý bởi MDM có mã định danh ID0010
nhập viện nào cho cùng một bệnh nhân và duy nhất với các thuộc tính: Tên, Đệm,
hồ sơ nào dành cho bệnh nhân khác. Họ, Số điện thoại, Địa chỉ, Thành phố, Mã
- Quân lý thông tin nhận dạng thực thể bưu chính; ngồi thực thể này thì miền dữ
liệu khách hàng cịn có nhiều khách hàng
(EIIM) là bộ sưu tập và quản lý thông tin khác và các đối tác... cũng được quản lý

nhận dạng với mục tiêu duy trì tính tồn
vẹn danh tính chủ thể theo thời gian (Zhou bởi MDM.
& Talburt, 201 la). Tính tồn vẹn danh tính Như vậy quản lý dừ liệu chủ không chi là
thực thể yêu cầu mồi thực thể phải được mô vấn đề về công nghệ, không chỉ là vấn đề
tả trong một hệ thống là duy nhất. Các thực tích hợp dữ liệu mà cịn liên quan đến trách
thể riêng biệt phải được mô tả riêng cho
trong hệ thống (Maydanchik, 2007). Toàn nhiệm quản lý dữ liệu, trách nhiệm của
vẹn danh tính chủ thể là một yêu cầu cơ bản các bộ phận phòng ban liên quan rồi chính
cho các hệ thống MDM. sách, chiến lược của tổ chức... Khi tổ chức,
Quay trở lại ví dụ mơ tả trên Hình 1, sau doanh nghiệp triển khai MDM, thì các
khi xác minh với khách hàng tên Lê Văn
An thì bộ phận chăm sóc khách hàng biết bộ phận nghiệp vụ và bộ phận công nghệ
được rằng: ơng Lê Văn An có địa chỉ 12 thông tin làm việc cùng nhau sẽ đảm bảo
Chùa Bộc là địa chỉ tạm trú và địa chỉ ở được tính đồng nhất, độ chính xác, tính bền
25 Lý Thường Kiệt là nơi đăng ký địa chỉ vững của dữ liệu chủ được chia sẻ trong tổ
thường trú, số điện thoại 0902345678 là chức đó. Do đó tổ chức cũng tránh được
số điện thoại khách hàng thường xuyên sử các cuộc tranh luận vơ tận, tốn thời gian về
dụng. Do đó mọi giao dịch sẽ được thực việc trả lời câu hỏi “dữ liệu của hệ thống
hiện với ông An ở 12 Chùa Bộc, liên hệ trong phòng ban nào là đúng?”, điều này có
qua số điện thoại 0902345678. Một số bộ thể dần đến các quyết định kém hiệu quả...
phận, phòng ban (phụ trách liên quan đến ảnh hưởng tới chiến lược của tổ chức.
Dữ liệu chủ đa miền
Quản lý dữ liệu chủ sẽ cung cấp cơng cụ

78 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021

NGÔ THÙY LINH - PHAN THANH ĐỨC

Bảng 5. Một số nhân tố xác định các miền cần đến MDM


GIÁ TRỊ KINH DOANH Giá trị kinh doanh là một yếu tố quan trọng khi quyết định những miền
nào cần phải có MDM. Một lý do tại sao hầu hết các công ty bắt đầu

với MDM khách hàng là vì khơng ccó gì nghi ngờ giá trị chính xác về
thông tin khách hàng mang lại cho doanh nghiệp. Một phiên bản duy
nhất và chính xác về khách hàng có thể liên quan trực tiếp đến sự
sơng cịn của một tổ chức. Như vậy, mọi miền cần được đánh giá từ
quan điểm giá trị kinh daonh để xác định lợi ích của việc áp dụng MDM
cho tổ chức đó

SỐ LƯỢNG Số lượng liên quan trực tiếp đến việc cần thiết có MDM. Nếu một công
ty chỉ cộ hai hoặc ba đối tác, thì khơng có khả năng hưởng lợi từ MDM
đến miền đối tác. Nhưng với một ví dụ khác, nếu một công ty kinh

doạnh với hàng ngàn đại lý, thì việc thực hiện giải pháp MDM cho các
miền đối tác rất có ý nghĩa

TÍNH THAY ĐỔI Nếu dữ liệu không thay đổi và các tập thuộc tính của dữ liệu liên quan
đến các thực thể khơng biến đổi thì khơng cần thiết phải cần đến MDM

KHẢ NẤNG DỪNG LẠI Càng nhiều miền có trong một tổ chức thì việc sử dụng MDM càng cần
thiêt để có sự nhât qn, tin cậy, chính xác của các luồng thông tin
trong tổ chức đó.

ĐỌ PHỨC TẠP Độ phức tạp của các thuộc tính và dữ liệu liên quan đến một miền là
cơ sở để thực thi giải pháp MDM. Lấy miền sản phẩm làm ví dụ: Các
sản phẩm trong một cơng ty có thể rất phức tạp, với số lượng lớn các

thuộc tính liên quan. Từ thực tế đó việc triển khai MDM cho miền sản
phẩm trong công ty là rất lớn


Nguồn:Mark Allen & Dalton Cervo (2015)

và quy trình quản lý dữ liệu chủ, đảm bảo tin một cách hiệu quả cũng như tăng cao
dữ liệu chủ không chỉ nhất quán mà còn khả năng cạnh tranh cho các tổ chức, doanh
chính xác. Quản lý dữ liệu chủ theo miền nghiệp thì các giải pháp MDM đa miền cần
(Master Data Management domain) phản có sự tham gia và cộng tác hiệu quả của bộ
ánh một miền dữ liệu cụ thể mà tại đó việc phận nghiệp vụ chịu trách nhiệm về chất
xác định và kiểm soát dữ liệu chủ được lượng dữ liệu và bộ phận công nghệ thông
tập trung. Trong tổ chức khơng chỉ có một tin có nhiệm vụ quản trị dữ liệu. MDM đa
miền dữ liệu mà còn nhiều miền dữ liệu miền cần hoạt động như một cầu nối tạo
quan trọng khác nữa, do đó họ khơng chỉ
tập trung quản lý dừ liệu chủ trên một miền động lực cho việc cộng tác cho hai bộ phận
mà còn hướng tới quản lý trên nhiều miền. đó trong tổ chức. Điều này dễ hiểu đối với
Quản lý dữ liệu chủ đa miền có liên quan tình huống tổ chức doanh nghiệp nào cần
đến việc quản lý tổng thể dữ liệu chủ trên chuyển đổi từ cơ sở hạ tầng hệ thống cũ
nhiều miền. Vậy liệu tất cả các miền có cần sang hệ thống mới địi hỏi phải có các yêu
đến MDM, nhân tố nào ảnh hưởng đến việc cầu liên quan đến bảo mật, quyền riêng tư,
xác định miền dữ liệu cần MDM tập trung các quy định, chính sách... Để đối mặt và
quan tâm đến? Bảng 5 mô tả một số nhân tố giải quyết được các thách thức này cần có
chính trong việc định hướng miền dữ liệu sự kết hợp chặt chẽ giữa các phịng ban
cho MDM trong mơ hình đa miền. nghiệp vụ và phịng ban cơng nghệ. Một
Để việc quản lý dừ liệu và cung cấp thông minh họa về giải pháp MDM đa miền được
mơ tả ở Hình 5.

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 79

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

Nguồn:Mark Allen & Dalton Cervo (2015)


Với giải pháp MDM đa miền được mô tả ở liệu chủ. Vì MDM được áp dụng trên nhiều
Hình 5, cần đến 4 bộ phận hồ trợ cho việc
triển khai MDM thành cơng, đó là: sự hồ miền, nên các chức năng, các công cụ và
trợ từ cấp điều hành, từ ban chỉ đạo, bộ quy trình liên quan tới các miền trở nên dề
phận quản lý chưcmg trình, bộ phận quản lý sử dụng hơn. Một số chức năng, chang hạn
các thay đổi và rủi ro. Với mỗi miền dữ liệu như quản lý chất lượng dữ liệu là vô cùng
1, 2,..., n cần phải bảo đảm chất lượng dữ rộng. Bởi vì nếu chất lượng dữ liệu của một
liệu, đồng bộ hóa dữ liệu, chính sách quản miền tốt thực sự thì có thể tái sử dụng dữ
lý dữ liệu, quản lý dữ liệu tham chiếu, xác liệu này trên nhiều miền, nhưng chúng vần
định thực thể, quản lý Đọc- Ghi- Cập nhật- có các yêu cầu cụ thể theo miền cho các
Xóa dữ liệu (CRƯD). Giải pháp MDM thể
hiện trên Hình 5 cho thấy một số chức năng hoạt động như mô tả dữ liệu, làm sạch dữ
được dùng chung và có thể được sử dụng liệu, chuẩn hóa dữ liệu...
bởi nhiều miền dữ liệu. Ví dụ, chương trình Như vậy giải pháp MDM được thiết lập
quản trị dữ liệu có phạm vi và quyền hạn để giải quyết các vấn đề: dừ liệu trùng lặp,
rộng hơn, không chỉ tập trung vào dữ liệu phân mảnh, không nhất quán trên nhiều
chủ. Tương tự, việc bảo mật dừ liệu có thê nguồn. Các hệ thống thông tin thường sẽ
sẽ tập trung vào các chính sách và quản lý hồ trợ một nghiệp vụ cụ thể và khi đó dữ
liên quan đến truy cập dữ liệu và bảo vệ dữ liệu chủ yếu duy trì cho nghiệp vụ này. Có
rất ít sự kết nối dữ liệu giữa các hệ thống
với nhau vì thiếu quy trình tổng thể trong

80 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6. 2021

NGÔ THÙY LINH - PHAN THANH ĐỨC

Hình 6. Các chức năng của MDM đa miền

Nguồn:Mark Allen & Dalton Cervo (2015)


tổ chức. Và hệ quả là dữ liệu có chất lượng tố ảnh hưởng đến việc xác định miền dữ
kém, khơng chính xác bởi vì có nhiều nguồn liệu của một tổ chức có cần đến MDM hay
thơng tin cùng mơ tả, đại diện cho một thực không, riêng một miền dữ liệu cũng đã địi
thể. MDM sẽ đóng vai trò hỗ trợ thiết lập hỏi nhiều công nghệ để vận hành. Hơn nữa
và quản lý các luật để xác định các thành việc triển khai MDM không chỉ đơn thuần
phần dữ liệu chung, được sử dụng để khớp chỉ là thêm một ứng dụng mới mà có thể sẽ
các thực thể từ nhiều nguồn, cũng như đưa ảnh hưởng đến các dữ liệu quan trọng đang
các kỳ thuật để làm sạch và củng cố thông được lưu trữ trong các hệ thống hiện có. Từ
tin từ các nguồn đó. Từ đó tạo ra một phiên góc độ cơng nghệ, hiện nay khơng có giải
bản duy nhất và chính xác nhất về thực thể. pháp duy nhất nào có thể đồng thời thỏa
Hình 6 biếu diễn các chức năng của MDM mãn các yêu cầu của các tổ chức, doanh
đa miền như: quản trị dữ liệu, quản trị chất nghiệp. Do đó, khi đánh giá các sản phẩm
lượng dữ liệu, đồng bộ và tích hợp dữ liệu, MDM đa miền, cần phải hiểu những gì nhà
quản lý dữ liệu tham chiếu, bảo mật dữ cung cấp mang lại cho doanh nghiệp.
liệu, kiến trúc dữ liệu.... MDM đa miền có thể phát triển từ nhiều
tình huống khác nhau có thể xảy ra trong
4. Một số cách tiếp cận xây dựng dữ liệu doanh nghiệp, vì vậy khó có một chiến
chủ đa miền lược hoặc kế hoạch toàn diện nào cho các
tổ chức, doanh nghiệp. Chẳng hạn trong
Khơng có một cách tiếp cận duy nhất nào
có thể phù hợp cho tất cả các yêu cầu của Ngân hàng X bộ phận Telesales sau khi gọi
MDM đa miền ở mọi tổ chức, doanh nghiệp. điện cho khách hàng A tư vấn về sản phẩm
Như đã trình bày ở Bảng 5, có nhiều yếu bảo hiểm thì họ được khách hàng này phản
hồi là đã từng đến giao dịch tại chi nhánh

Sơ' 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 81

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp


Data Governance and Producers and Consumers of Master Data
Quality Stewardship of System n
Daỉhboards
Master Data j?

Batch-mode
Master Data
Synchronization

Multi-domain
MDM hub

Real-time Real-time
Master Data Master Data
Synchronization Synchronization

Enterprise Service Bus (ESB)

Hình 10. MDM đa miền kiểu kết hợp

Nguồn:Mark Allen & Dalton Cervo (2015)

dừ liệu từ trung tâm MDM thay vì dừ liệu ở các phịng ban, và xác định chương trình
được duy trì cục bộ. Hình 9 mơ tả một kiến quản lý nào đang được thực hiện. Không
trúc kiểu bền vững. xem xét đầy đủ các yêu cầu này sẽ dần
Kiểu 3: MDM kiểu kết hợp đến tình trạng: các chương trình hiện có
Cách tiếp cận này kết hợp giữa MDM kiểu ảnh hưởng, tác động qua lại lần nhau và
tích hợp và kiểu bền vững để khắc phục liên quan đến các điều chỉnh ưu tiên. Các
những hạn chế của hai mơ hình đó. Trong phòng ban nghiệp vụ và bộ phận giao dịch
kiểu kết họp, không chỉ các trường thuộc là những nơi tạo lập và sử dụng thường

tính định danh được lưu trữ trong trung tâm xuyên dừ liệu chủ. Khi đó có thể các giao
MDM, mà một bản sao của nhiều thuộc dịch sẽ cần đến dữ liệu chủ từ nhiều miền,
tính liên quan đến một thực thể cũng được chẳng hạn miền kế hoạch thực hiện và đơn
duy trì tại đó sẽ tăng tốc truy vấn đến trung đặt hàng có thể có tác động đáng kê đến các

tâm MDM. Ngồi ra, vì thơng tin là bản sao hoạt động kinh doanh ở bộ phận bán hàng
nên các hệ thống hiện tại có thể tiếp tục sử và marketing. Có thể bước đầu MDM được
dụng phiên bản dừ liệu của riêng mình. Do thực hiện thành cơng sẽ mang lại nhiều
đó với cách tiếp cận này, trung tâm MDM
là một hệ thống tham chiếu, tích họp từ lợi ích cho hoạt động doanh nghiệp và
nhiều nguồn, và áp dụng quy trình xác định các hoạt động phân tích, nhưng cũng kéo
các thực thể và các chức năng đảm bảo chất theo các thay đổi về dữ liệu và quy trình
lượng dữ liệu và cung cấp một phiên bản có thể bị gián đoạn nếu như chúng khơng
chính xác duy nhất về dừ liệu chủ. Hình 10 được quản lý tốt. Báo giá, đơn đặt hàng,
trình bày mơ hình MDM đa miền kết họp. yêu cầu, thanh toán, và cung cấp dịch vụ
Khi tổ chức lên kế hoạch thực hiện giải liên quan đến các quy trình chính có thê dề
pháp MDM đa miền, cần phải có đủ thời bị gián đoạn khi dữ liệu chủ thay đối phụ
gian để tìm hiểu các cách tiếp cận triển khai thuộc vào MDM. Và tất nhiên, nếu không
MDM, cũng như kiểm tra sự ảnh hưởng, tác được xử lý tốt, những thay đổi đó có thể
động qua lại của các nghiệp vụ kinh doanh ảnh hưởng tiêu cực đến sự hài lòng và lòng
trung thành của khách hàng, do đó có thể

84 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6. 2021

NGÔ THÙY LINH - PHAN THANH ĐỨC

ảnh hưởng đến lợi nhuận của công ty và trở phận công nghệ thông tin sẽ thúc đẩy các tổ
thành một vấn đề không mong muốn. Như chức, doanh nghiệp đạt được mục tiêu cũng
vậy, khi tiến hành quản lý tất cả các miền như lợi thế cạnh tranh trên thị trường.
dữ liệu với giải pháp MDM đa miền, điều Đối với các doanh nghiệp quy mô lớn,

quan trọng là phải kiểm kê, đánh giá các
quy trình nghiệp vụ, khu vực tiêu dùng và chăng hạn các ngân hàng thương mại thì
vịng đời của dừ liệu chủ. Giải pháp MDM MDM là một giải pháp không thể thiếu nếu
đa miền cần phải là cầu nối tạo ra sự cộng muốn quản lý được các nguồn dữ liệu lớn,
tác giữa các bộ phận có trách nhiệm liên
quan và các bộ phận đóng vai trị trực tiếp đa dạng và thường xuyên biến động. Các
trong quản lý dữ liệu thơng qua các phịng ngân hàng đã có đến hàng triệu khách hàng
ban nghiệp vụ cũng như phịng ban cơng tiềm năng và có số vốn tài chính lớn. Hoạt
nghệ thơng tin. động tại các ngân hàng có liên quan đến
nhiều doanh nghiệp, quản lý hàng triệu tài
5. Kết luận khoản và vơ số sản phẩm tài chính, xử lý

Dừ liệu là một tài sản của tổ chức, dữ liệu giao dịch với hàng ngàn đại lý và duy trì
chủ là chìa khóa cho hoạt động kinh doanh, mối quan hệ với hàng ngàn nhà cung cấp và
địi hỏi cần phải có sự quản lý thích đáng. các cơng ty khác (ví dụ: nhà đấu giá, cơng
MDM là giải pháp cho việc quản lý dữ ty thẩm định, phá sản, tòa án và ủy thác, và
liệu, tuy nhiên MDM khơng chỉ là vấn đề
cơng nghệ, mà cịn liên quan đến khả năng các cơ quan thu nợ). Các ngân hàng cũng
quản trị và ảnh hưởng đến các quy trình sở hữu hoặc sử dụng dịch vụ của các công
kinh doanh của doanh nghiệp. Phạm vi ty bảo hiểm, giao dịch với hàng ngàn luật
của MDM khá lớn do nó là sự tích hợp của sư đại diện cho họ hoặc khách hàng khi xảy
các thành phần, các chức năng và dịch vụ ra tranh chấp, và thuê hàng ngàn nhân viên.
cần thiết đê tạo, duy trì và quản lý, chia sẻ Với những mơ tả đó thì có thể xác định vơ
các dừ liệu quan trọng. Bên cạnh đó, việc số các miền dữ liệu mà một ngân hàng cần
lập kế hoạch cho một chương trình MDM phải có: triển vọng, khách hàng, phương
đa miền cho tổ chức, doanh nghiệp trên tiện, nhà sản xuất, tài khoản tài chính, sản
thực tế gặp nhiều thách thức. Chiến lược phẩm tài chính, đại lý, liên hệ, nhà cung
và cách tiếp cận phù hợp chỉ ra rằng đó là cấp, luật sư và nhân viên... Rõ ràng là khối
cơ sở thích họp để hoàn thiện đầy đủ, thực lượng thơng tin lớn thì số lượng thuộc tính
hiện thành cơng các chiến lược và mục tiêu và các hệ thống dữ liệu duy trì tất cả thơng

MDM trên tồn doanh nghiệp. Đây là chìa tin sẽ lớn và phức tạp. Các ngân hàng sẽ
khóa để cung cấp dữ liệu đáng tin cậy kịp hưởng lợi ích từ giải pháp MDM đa miền
thời để giúp doanh nghiệp đạt được lợi thế khi loại trừ được các vấn đề về dư thừa
cạnh tranh. dữ liệu và sự không nhất quán trên nhiều
Trong MDM đa miền, điều quan trọng là nguồn dừ liệu. Vì vậy với tổ chức doanh
phải xác định: nên sử dụng cách tiếp cận
MDM nào phù hợp với các thành phần, nghiệp có quy mơ lớn như các ngân hàng
chức năng và dịch vụ trên các miền dữ liệu. rất thích hợp để triển khai MDM.
Hơn thế nữa, sự cộng tác chặt chẽ giữa
các bộ phận kinh doanh, nghiệp vụ và bộ Bài báo đã trình bày khái niệm cơ bản của
dữ liệu chủ, quản lý dừ liệu chủ, dừ liệu chủ
đa miền, và các cách tiếp cận để xây dựng
quản trị dừ liệu chủ đa miền. Từ đó, chỉ
ra vai trò và tầm quan trọng của việc quản
trị dữ liệu chủ đa miền trong các tổ chức,
doanh nghiệp hiện nay. Việc xây dựng và

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 85

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

quản trị dữ liệu chủ đa miền đã góp phần động kinh doanh để kịp thời đưa ra các
quyết định mang tính chiến lược trong bối
nâng cao quản trị rủi ro cho doanh nghiệp,
giúp doanh nghiệp có cái nhìn chính xác cảnh của cách mạng công nghiệp 4.0 đang
nhất về các thực thể quan trọng trong hoạt diễn ra mạnh mẽ như hiện nay. ■

Tài liệu tham khảo

David Loshin, 2009, “Master Data Management", Elsevier Inc.

Dalton Cervo & Mark Allen, “Master data management in practice”, 2011, John Wiley & Sons, Inc.
Gartner, 2019, “How to Get Started With Master Data Management
John R. Talburt, Yinle Zhou, 2015, “Master Data Management and Information Integration", Elsevier Inc.
Keith Gordon, 2013, “Principles ofdata management”, BCS Learning and Development Ltd.
Mark Allen & Dalton Cervo, 2015, “Multi - Domain Master Data Management”, Elsevier Inc.
Maydanchik, A., 2007. “Data Quality Assessment”. Technics Publications.
Zhou, Y„ Talburt, J.R., 2011a. “Entity identity information management”. International Conference on Information

Quality 2011.

86 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021


×