Tải bản đầy đủ (.pdf) (81 trang)

Giải pháp quản lý chất lượng dữ liệu thương mại điện tử của doanh nghiệp việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.08 MB, 81 trang )

Đại Học Quốc Gia Tp. Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA
--------------------

NGUYỄN HỒNG TRANG

GIẢI PHÁP QUẢN LÝ CHẤT LƯỢNG DỮ LIỆU
THƯƠNG MẠI ĐIỆN TỬ CỦA DOANH NGHIỆP
VIỆT NAM
Chuyên ngành: Hệ thống Thơng tin Quản lý

LUẬN VĂN THẠC SĨ

TP. HỒ CHÍ MINH, tháng 7 năm 2009


CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

Cán bộ hướng dẫn khoa học: TS. Nguyễn Thanh Bình

Cán bộ chấm nhận xét 1: TS. Võ Văn Huy

Cán bộ chấm nhận xét 2: TS. Võ Thị Ngọc Châu

Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp. HCM
ngày 12 tháng 9 năm 2009.

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1. TS. Võ Văn Huy


2. TS. Nguyễn Quỳnh Mai
3. PGS. TS. Nguyễn Thống
4. TS. Nguyễn Đức Trí
5. TS. Nguyễn Thanh Bình
6. TS. Võ Thị Ngọc Châu

Xác nhận của Chủ tịch Hội đồng đánh giá LV và Bộ môn quản lý chuyên ngành sau
khi luận văn đã được sửa chữa (nếu có).
Chủ tịch Hội đồng đánh giá LV

Bộ môn quản lý chuyên ngành


TRƯỜNG ĐH BÁCH KHOA TP. HCM

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

PHÒNG ĐÀO TẠO SĐH

Độc lập - Tự do - Hạnh phúc

Tp. HCM, ngày 02 tháng 02 năm 2009

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên:

NGUYỄN HỒNG TRANG

Phái:


Nữ

Ngày, tháng, năm sinh:

09/09/1982

Nơi sinh: Lâm Đồng

Chuyên ngành:

Hệ thống Thông tin Quản lý

MSHV:

03207100

I- TÊN ĐỀ TÀI: Giải pháp Quản lý Chất lượng Dữ liệu Thương mại Điện tử của
Doanh nghiệp Việt Nam
II- NHIỆM VỤ VÀ NỘI DUNG:
 Tìm hiểu các lý thuyết về chất lượng dữ liệu để xác định những yêu cầu về
chất lượng dữ liệu thương mại điện tử của các doanh nghiệp Việt Nam.
 Tìm hiểu và xác định các chiều chất lượng của dữ liệu thương mại điện tử
quan trọng đối với người sử dụng dữ liệu và cần được đo lường và cải tiến.
 Xây dựng các bước của quy trình quản lý và cải tiến chất lượng dữ liệu.
 Thiết kế hệ thống.
III- NGÀY GIAO NHIỆM VỤ: 02/02/2009
IV- NGÀY HOÀN THÀNH NHIỆM VỤ: 03/07/2009
V- CÁN BỘ HƯỚNG DẪN: TS. Nguyễn Thanh Bình
CÁN BỘ HƯỚNG DẪN


CN BỘ MƠN
QL CHUN NGÀNH

TS. Nguyễn Thanh Bình


i

LỜI CẢM ƠN

Trong suốt thời gian thực hiện luận văn, tôi đã nhận được sự giúp đỡ và động viên
của các thầy cơ, gia đình và bạn bè. Tơi xin bày tỏ sự trân trọng và gửi lời cảm ơn
chân thành đối với sự giúp đỡ này.
Tôi xin gửi đến các thầy cô trong khoa Quản lý Công Nghiệp - Trường Đại học
Bách Khoa TP. Hồ Chí Minh lịng biết ơn đối với sự giảng dạy tận tình, giúp đỡ và
hỗ trợ tận tình trong suốt khóa học.
Tơi xin chân thành cảm ơn Tiến sĩ Nguyễn Thanh Bình, khoa Khoa học Máy tính Trường Đại học Bách Khoa TP. Hồ Chí Minh đã tận tình hướng dẫn, chỉ bảo và tạo
mọi điều kiện thuận lợi trong suốt quá trình làm luận văn.
Sau cùng, xin gửi lời cảm ơn đến bạn bè, người thân, những người đã hỗ trợ về mặt
vật chất và tinh thần để tơi có thể hồn thành luận văn tốt nghiệp.

Nguyễn Hồng Trang


ii

TÓM TẮT LUẬN VĂN THẠC SĨ

Hiện nay, thương mại điện tử chiếm một tỉ lệ chưa cao trong các hoạt động kinh tế
nhưng nó đã và đang góp phần đẩy mạnh các q trình thương mại thơng thường,

mang lại những lợi ích khơng chỉ cho các doanh nghiệp mà cịn cho khách hàng và
toàn xã hội. Ở Việt Nam, các website thương mại điện tử đua nhau ra đời, tuy
nhiên, việc quản lý chất lượng dữ liệu – một tài sản chiến lược của các doanh
nghiệp vẫn còn bỏ ngỏ. Đây cũng là một trong những nguyên nhân khiến thương
mại điện tử chưa thật sự phát huy được vai trò và thế mạnh của mình, chưa mang lại
hiệu quả kinh doanh và lợi thế cạnh tranh cho doanh nghiệp.
Do vậy, mục tiêu của đề tài là đưa ra một giải pháp quản lý chất lượng dữ liệu
thương mại điện tử phù hợp với tình hình thực tiễn ở Việt Nam. Đề tài đã đi sâu tìm
hiểu các lý thuyết về chất lượng dữ liệu cũng như thực tiễn quản lý của một số các
doanh nghiệp Việt Nam để xác định được các yêu cầu về chất lượng của dữ liệu
thương mại điện tử. Từ đó, đề xuất một quy trình quản lý chất lượng dữ liệu và thiết
kế hệ thống tin học hỗ trợ cho quy trình này.
Tuy nhiên, vì giới hạn về thời gian việc khảo sát thực tế chỉ được thực hiện ở một số
doanh nghiệp và đề tài chỉ thực hiện bước thiết kế hệ thống ở mức tổng quát. Việc
triển khai thiết kế chi tiết và hiện thực hệ thống sẽ là hướng cho các đề tài tiếp theo
về lĩnh vực này.


iii

ABSTRACT
In recent years, e-commerce has not made up a high rate in economic activities yet;
however, it has been contributing to push up commercial transactions, brought
benefits not only to enterprises but also to customers and society as well. In
Vietnam, many e-commerce websites have appeared recently but managers have not
taken care of managing the quality of data – one of enterprise strategic assets. It is
one of reasons why e-commerce has not brought into play its role and strength,
brought economic effects and competitive advantages for enterprises.
Therefore, the aim of this study were to produce a solution to manage the quality of
e-commerce data suitable to real life in Vietnam. The study goes deeply into

researching existing theories of data quality as well as investigating the current
situation in some of Vietnamese enterprises to identify requirements of e-commerce
data then suggesting a process for data quality management and a conceptual design
for an information system to support this process.
However, because of the limit of time, the investigation was done in some of
enterprises and the information system was designed at conceptual level only.
System detailed design, implementation and deployment will be directions for next
studies in this area.


iv

MỤC LỤC
LỜI CẢM ƠN.........................................................................................................i
TÓM TẮT LUẬN VĂN THẠC SĨ........................................................................ii
ABSTRACT..........................................................................................................iii
MỤC LỤC............................................................................................................. iv
MỤC LỤC HÌNH ................................................................................................ vii
MỤC LỤC BẢNG ..............................................................................................viii
Chương 1. MỞ ĐẦU.............................................................................................. 1
1.1. Cơ sở hình thành đề tài.................................................................................1
1.2. Mục tiêu nghiên cứu.....................................................................................2
1.3. Nội dung nghiên cứu ....................................................................................2
1.4. Phạm vi nghiên cứu ......................................................................................3
1.5. Phương pháp nghiên cứu ..............................................................................3
1.6. Ý nghĩa thực tiễn ..........................................................................................3
1.7. Bố cục đề tài.................................................................................................4
Chương 2. CƠ SỞ LÝ THUYẾT .......................................................................... 5
2.1. Dữ liệu và chất lượng dữ liệu .......................................................................5
2.1.1. Định nghĩa.............................................................................................5

2.1.2. Nguyên nhân và hậu quả của dữ liệu kém chất lượng ............................9
2.1.3. Các hệ thống quản lý chất lượng dữ liệu..............................................11
2.2. Thương mại điện tử ....................................................................................19
2.2.1. Định nghĩa...........................................................................................19


v

2.2.2. Lợi ích.................................................................................................20
2.2.3. Dữ liệu thương mại điện tử..................................................................23
2.2.4. Vai trị của dữ liệu đối với sự thành cơng của thương mại điện tử........23
Chương 3. PHÂN TÍCH HỆ THỐNG................................................................ 25
3.1. Cơ cấu tổ chức của các doanh nghiệp bán lẻ trực tuyến .............................. 25
3.2. Quy trình kinh doanh..................................................................................27
3.2.2. Đặt hàng.............................................................................................. 27
3.2.3. Xử lý đơn hàng....................................................................................29
3.3. Hệ thống thông tin......................................................................................31
3.4. Thực trạng quản lý chất lượng dữ liệu thương mại điện tử..........................33
3.5. Những yêu cầu về chất lượng dữ liệu thương mại điện tử ...........................35
3.5.1. Dữ liệu khách hàng..............................................................................35
3.5.2. Dữ liệu sản phẩm.................................................................................35
3.5.3. Dữ liệu đơn đặt hàng ...........................................................................36
3.6. Giải pháp quản lý chất lượng dữ liệu ..........................................................36
3.6.1. Những người tham gia vào quản lý chất lượng dữ liệu ........................38
3.6.2. Quy trình quản lý chất lượng dữ liệu ...................................................39
3.6.3. Cơng nghệ sử dụng trong hệ thống quản lý chất lượng dữ liệu.............42
Chương 4. THIẾT KẾ HỆ THỐNG................................................................... 43
4.1. Tiêu chuẩn đánh giá hệ thống .....................................................................43
4.2. Mục đích của hệ thống................................................................................43
4.3. Yêu cầu của hệ thống .................................................................................44

4.4. Các bước xây dựng hệ thống ......................................................................45


vi

4.5. Mơ hình hệ thống .......................................................................................46
4.5.2. Kiến trúc chức năng ............................................................................47
4.5.3. Kiến trúc tổ chức.................................................................................53
4.5.4. Kiến trúc tác nghiệp ............................................................................57
Chương 5. KẾT LUẬN & KIẾN NGHỊ ............................................................. 65
5.1. Tóm tắt kết quả...........................................................................................65
5.2. Đánh giá hệ thống.......................................................................................66
5.3. Hướng nghiên cứu ......................................................................................67
TÀI LIỆU THAM KHẢO................................................................................... 68
LÝ LỊCH TRÍCH NGANG................................................................................. 70


vii

MỤC LỤC HÌNH
Hình 2.1 Các thành phần của chu trình TDQM .....................................................13
Hình 2.2 Chu trình Unified dPIQ ..........................................................................14
Hình 2.3 Giải pháp quản lý chất lượng dữ liệu của Gartner,
PricewaterhouseCoopers ...............................................................................16
Hình 3.1 Các bộ phận chức năng chính của các doanh nghiệp............................... 25
Hình 3.2 Quy trình kinh doanh tổng quát .............................................................. 27
Hình 3.3 Quy trình đặt hàng chung trên website....................................................28
Hình 3.4 Quy trình xử lý đơn hàng chung ............................................................. 29
Hình 3.5 Hệ thống thông tin tổng quát của các doanh nghiệp................................ 31
Hình 3.6 Các thành phần của Hệ thống Quản lý Chất lượng Dữ liệu.....................38

Hình 3.7 Các bước của quy trình quản lý chất lượng dữ liệu .................................40
Hình 4.1 Các thành phần của kiến trúc hệ thống ...................................................47
Hình 4.2 Kiến trúc chức năng của Hệ thống Quản lý Chất lượng Dữ liệu..............47
Hình 4.3 Kiến trúc tổ chức của Hệ thống Quản lý Chất lượng Dữ liệu ..................54
Hình 4.4 Kiến trúc tác nghiệp của Hệ thống Quản lý Chất lượng Dữ liệu .............57
Hình 4.5 Kiến trúc tầng ứng dụng – Chức năng Định nghĩa Chất lượng................58
Hình 4.6 Kiến trúc tầng ứng dụng – Chức năng Đo lường Chất lượng ..................59
Hình 4.7 Kiến trúc tầng ứng dụng – Chức năng Phân tích & Báo cáo ...................60
Hình 4.8 Kiến trúc tầng ứng dụng – Chức năng Cải thiện Dữ liệu.........................61
Hình 4.9 Kiến trúc tầng tin học của hệ thống ........................................................61
Hình 4.10 Kiến trúc tầng cơ sở hạ tầng của hệ thống.............................................63
Hình 4.11 Kiến trúc cơ sở hạ tầng sau khi tích hợp ...............................................64


viii

MỤC LỤC BẢNG
Bảng 3.1. Phương thức giao hàng được các doanh nghiệp sử dụng........................30
Bảng 3.2. Phương thức thanh toán được các doanh nghiệp sử dụng ......................30
Bảng 3.3. Tần suất cập nhật thông tin trên website................................................34


1

Chương 1. MỞ ĐẦU
1.1. Cơ sở hình thành đề tài
Hậu quả của dữ liệu kém chất lượng xảy ra khá thường xuyên trong cuộc sống hằng
ngày nhưng người ta lại ít thấy nguyên nhân của nó. Thí dụ, khi thư từ hoặc bưu
phẩm bị sót hoặc phân phát trễ, người ta thường nghĩ ngay là do nhân viên bưu điện
làm việc tắc trách mặc dù nếu nghĩ kỹ hơn sẽ thấy nguyên nhân của nó có liên quan

đến vấn đề dữ liệu, điển hình là có sự sai sót trên địa chỉ người nhận.
Trong thực tiễn kinh doanh, chất lượng dữ liệu là một vấn đề đáng lo ngại đối với
các chuyên gia trong các lĩnh vực từ quản lý kho dữ liệu (Data Warehouse) và hệ hỗ
trợ ra quyết định (Decision Support System) đến quản lý mối quan hệ khách hàng
(Customer Relationship Management) và quản lý chuỗi cung ứng (Supply Chain
Management). Dữ liệu kém chất lượng đưa đến sự suy sụp trong chuỗi cung ứng,
dẫn đến những quyết định kinh doanh thiếu chính xác và sự yếu kém trong quản lý
mối quan hệ khách hàng.
Theo một khảo sát được tiến hành trong 29 tổ chức của New Zealand và Australia
bao gồm các tổ chức chính phủ, ngân hàng, tài chính và dịch vụ vào năm 1998, chỉ
riêng những chi phí có thể nhận thấy được phát sinh do dữ liệu kém chất lượng đã
bằng 10 phần trăm doanh thu hằng năm của những tổ chức này [11]. Các chi phí
này phát sinh từ việc phải thực hiện lại cơng việc, làm sạch dữ liệu, tìm và sửa lỗi,
dữ liệu phải thu thập tăng gấp hai lần vì lịng tin đối với dữ liệu giảm sút, mất khách
hàng vì việc quản lý mối quan hệ khách hàng và dịch vụ khách hàng kém. Ngoài ra,
khảo sát về việc quản lý dữ liệu toàn cầu của PricewaterhouseCoopers vào năm
2001 cho thấy 75 phần trăm các nhà điều hành cấp cao cho biết những vấn đề
nghiêm trọng xảy ra là kết quả của dữ liệu kém chất lượng [8]. Trong một nghiên
cứu của viện Data Warehousing (The Data Warehousing Institute - TDWI) vào năm
2002, các nhà nghiên cứu đã ước lượng những vấn đề phát sinh do chất lượng dữ
liệu kém đã tiêu tốn của nền kinh tế Mỹ trên 600 tỉ USD mỗi năm [6].


2

Trước những hậu quả của dữ liệu kém chất lượng, các tổ chức đã nhận thức được
dữ liệu là một tài sản quan trọng của mỗi tổ chức và cần được quản lý như một tài
sản chiến lược để mang lại lợi nhuận cho tổ chức. Trên thực tế, các công ty trên thế
giới đã bắt đầu thiết lập các bộ phận quản trị dữ liệu với một vai trò duy nhất là chịu
trách nhiệm về chất lượng dữ liệu của công ty.

Tại Việt Nam, những năm gần đây, các website thương mại điện tử đua nhau ra đời
từ các website rao vặt, các siêu thị trực tuyến B2C (Business-To-Customer) cho đến
các sàn giao dịch B2B (Business-To-Business). Tuy nhiên, việc quản lý chất lượng
dữ liệu – một tài sản chiến lược của doanh nghiệp vẫn còn bỏ ngỏ. Điều này đã
không mang lại hiệu quả kinh doanh và lợi thế cạnh tranh cho doanh nghiệp. Do
vậy, cần phải có một giải pháp để khắc phục tình trạng này. Đây chính là lý do
chính dẫn đến đề tài “Giải pháp xây dựng hệ thống quản lý chất lượng dữ liệu
thương mại điện tử của các doanh nghiệp Việt Nam”.

1.2. Mục tiêu nghiên cứu
Mục tiêu của đề tài là phân tích và đưa ra giải pháp xây dựng thành công một hệ
thống quản lý chất lượng dữ liệu thương mại điện tử cho các doanh nghiệp Việt
Nam.

1.3. Nội dung nghiên cứu
 Tìm hiểu các lý thuyết về chất lượng dữ liệu để định nghĩa và đánh giá
những yêu cầu về chất lượng dữ liệu thương mại điện tử của các doanh
nghiệp Việt Nam. Đa số các website thương mại điện tử đều có các loại dữ
liệu về khách hàng, sản phẩm, nhà cung cấp và đơn hàng.
 Tìm hiểu và xác định các chiều chất lượng của dữ liệu thương mại điện tử
quan trọng đối với người sử dụng dữ liệu và cần được đo lường và cải tiến.
 Xây dựng các bước của quy trình quản lý và cải tiến chất lượng dữ liệu.
 Xác định các thành phần của hệ thống quản lý chất lượng dữ liệu.


3

 Thiết kế hệ thống.

1.4. Phạm vi nghiên cứu

Đề tài nghiên cứu dừng lại ở mức độ đưa ra giải pháp xây dựng hệ thống quản lý
chất lượng dữ liệu hoàn chỉnh cho các website thương mại điện tử của các doanh
nghiệp Việt Nam.
Vì thời gian thực hiện luận văn có hạn, đề tài chỉ nghiên cứu loại hình thương mại
điện tử B2C và loại dữ liệu được nghiên cứu là dữ liệu khách hàng, chủ yếu là
những thông tin cá nhân và thông tin liên lạc của khách hàng.

1.5. Phương pháp nghiên cứu
 Khảo sát thực tế một số các doanh nghiệp có website thương mại điện tử ở
Việt Nam
 Tìm kiếm và nghiên cứu các lý thuyết liên quan đến quản lý chất lượng dữ
liệu
 Thu thập các dữ liệu và tìm hiểu những yêu cầu đối với chất lượng dữ liệu
thương mại điện tử
 Phân tích các yêu cầu của doanh nghiệp
 Thiết kế giải pháp xây dựng hệ thống quản lý chất lượng dữ liệu

1.6. Ý nghĩa thực tiễn
Xây dựng được một hệ thống quản lý chất lượng dữ liệu thương mại điện tử sẽ đem
lại những lợi ích sau cho các doanh nghiệp:
 Dịch vụ khách hàng được cải tiến
 Việc quản lý chuỗi cung ứng đơn giản và hiệu quả hơn
 Nâng cao lợi thế cạnh tranh cho doanh nghiệp


4

 Tiết kiệm chi phí để khắc phục những vấn đề do dữ liệu kém chất lượng gây
ra
 Giúp đưa ra những quyết định kinh doanh đúng đắn


1.7. Bố cục đề tài
Đề tài được trình bày trong năm chương với các nội dung chính như sau.
Chương 1 giới thiệu đề tài, mục tiêu, nội dung, phạm vi và ý nghĩa thực tiễn của đề
tài.
Chương 2 trình bày các cơ sở lý thuyết về chất lượng dữ liệu, thương mại điện tử
và các nghiên cứu, các quy trình quản lý chất lượng dữ liệu của một số tổ chức đã
xây dựng và áp dụng.
Chương 3 trình bày tìm hiểu về các doanh nghiệp có website thương mại điện tử
bao gồm cơ cấu tổ chức, quy trình kinh doanh, các hệ thống thông tin và thực trạng
quản lý chất lượng dữ liệu ở các doanh nghiệp này. Từ đó, đề xuất giải pháp quản lý
chất lượng dữ liệu thương mại điện tử cho các doanh nghiệp này.
Chương 4 trình bày thiết kế cho hệ thống tin học phục vụ cho việc quản lý chất
lượng dữ liệu ở các doanh nghiệp. Trước hết, chương này sẽ trình bày các tiêu
chuẩn đánh giá hệ thống, mục đích, yêu cầu của hệ thống và các bước để xây dựng
hệ thống. Cuối cùng, phần quan trọng nhất của chương là thiết kế hệ thống sẽ được
trình bày cụ thể dưới những góc nhìn khác nhau: kiến trúc chức năng, kiến trúc tổ
chức và kiến trúc tác nghiệp.
Chương 5 tổng kết các vấn đề mà đề tài đã giải quyết và kiến nghị cho các nghiên
cứu tiếp theo.


5

Chương 2. CƠ SỞ LÝ THUYẾT
Chương 2 trình bày các cơ sở lý thuyết về chất lượng dữ liệu, thương mại điện tử và
các nghiên cứu, các quy trình quản lý chất lượng dữ liệu của một số tổ chức đã xây
dựng và áp dụng.

2.1. Dữ liệu và chất lượng dữ liệu

2.1.1. Định nghĩa
2.1.1.1. Dữ liệu
Hiện nay có rất nhiều định nghĩa về dữ liệu. Brackett (1994) (trích [7]) định nghĩa
dữ liệu là những sự kiện có ý nghĩa cụ thể tại một thời điểm hoặc trong một khoảng
thời gian. Tương tự, theo Saba & McCormick (2001) (trích [9]) dữ liệu được định
nghĩa là một sự việc, một giá trị được gán cho một biến hay theo Shortliffe &
Barnett (2000)(trích [9]) là một có điểm đơn lẻ có thể quan sát được mô tả đặc điểm
của một mối quan hệ . Trong khi đó Tayi và Ballou (1998) (trích [9]) lại định nghĩa
dữ liệu là nguyên liệu của thời kỳ thơng tin. Cùng với Fuller và Redman
(1994)(trích [9]), các nhà nghiên cứu này đều cho rằng những dữ liệu hỗ trợ công
việc và quản lý là rất quan trọng đối với tất cả các quyết định ở mọi cấp độ trong tổ
chức. Dữ liệu có thể ở dạng văn bản hay số liệu mà cũng có thể là những tài liệu,
hình ảnh, âm thanh hoặc những đoạn video (McFadden, Hoffer, & Prescott, 1999)
(trích [9]).
2.1.1.2. Chất lượng
Trong kinh doanh, kỹ thuật và sản xuất, chất lượng của một vật gì đó được hiểu là
tính hơn hẳn hay tính ưu việt của nó. Chất lượng là một thuộc tính tùy thuộc vào
cảm giác, điều kiện và chủ quan và mỗi người có thể cảm nhận một cách khác nhau.
Cùng một sản phẩm, khách hàng có thể chú ý đến sự khác biệt về tính năng của sản


6

phẩm đó so với sản phẩm của đối thủ cạnh tranh trên thị trường. Cịn nhà sản xuất
có thể coi sản phẩm đó có chất lượng nếu nó được sản xuất đúng yêu cầu thiết kế.
Ngoài ra một số định nghĩa về chất lượng khác được định nghĩa như sau.
 Theo định nghĩa của ISO 9000, chất lượng là mức độ mà những đặc tính vốn
có thỏa mãn được những yêu cầu, điều kiện cần thiết.
 Theo [5], chất lượng của một sản phẩm hay dịch vụ không nằm ở những gì
mà nhà sản xuất đưa vào mà là những gì khách hàng nhận được và họ sẵn

lịng trả tiền cho sản phẩm hay dịch vụ đó.
 Theo Tổ chức Chất lượng của Mỹ (American Society for Quality) [1], chất
lượng là một khái niệm mang tính chủ quan mà mỗi người sẽ có định nghĩa
riêng cho mình. Trong kỹ thuật, chất lượng mang hai ý nghĩa:
o Đặc tính của một sản phẩm hoặc dịch vụ có khả năng làm thỏa mãn
nhu cầu.
o Một sản phẩm hoặc dịch vụ khơng có những thiếu sót, khuyết điểm.
2.1.1.3. Chất lượng dữ liệu
Cũng như dữ liệu, có khá nhiều định nghĩa về chất lượng dữ liệu.
Một số nhà nghiên cứu định nghĩa các dữ liệu có chất lượng cao nếu chúng biểu
diễn chính xác cấu trúc thế giới thực mà nó quy chiếu đến.
Tuy nhiên, một số nhà nghiên cứu như Wang, Strong, & Guarascio (1996), Loshin,
(2001) (trích [9]) hay [13] đứng trên quan điểm quản lý và hướng tới người sử dụng
lại cho rằng dữ liệu có chất lượng tốt là dữ liệu phù hợp với nhu cầu sử dụng. Người
sử dụng ở đây được hiểu là những người hoặc những nhóm người sử dụng dữ liệu
của tổ chức để đưa ra những quyết định kinh doanh. Cũng trên quan điểm này,
Strong, Lee và Wang (1997), Pringle, Wilson và Grol (2002) (trích [9]) cho rằng
chất lượng dữ liệu là phụ thuộc vào ngữ cảnh, người sử dụng sẽ định nghĩa thế nào
là một dữ liệu có chất lượng tốt cho mỗi ngữ cảnh sử dụng dữ liệu cụ thể.


7

Hai quan điểm này thường bất đồng với nhau ngay cả cho cùng một dữ liệu cho
cùng một mục đích. Tuy nhiên, đề tài này sẽ sử dụng thuật ngữ chất lượng dữ liệu
theo quan điểm thứ hai. Cụ thể là theo [13], chất lượng dữ liệu là mức độ mà một
dữ liệu hữu ích đối với một sử dụng cụ thể cho một nhu cầu kinh doanh cụ thể. Và
theo [12], các chiều của chất lượng dữ liệu là tính chính xác (accuracy), tính hiện
hành (currency), tính tồn vẹn (completeness) và tính nhất quán (consistency).
2.1.1.4. Các chiều của chất lượng dữ liệu

Nói tới chất lượng dữ liệu, người ta thường chỉ nghĩ đến tính chính xác. Tuy nhiên,
chất lượng dữ liệu chỉ ra nhiều khía cạnh và phức tạp hơn. Theo Redman [12], chất
lượng dữ liệu có các chiều như sau tính chính xác (accuracy), tính hiện hành
(currency), tính tồn vẹn (completeness) và tính nhất qn (consistency).
Tính chính xác: Mức độ dữ liệu phản ánh đúng đắn sự vật hay sự kiện trong thế
giới thực. Một số ví dụ về tính chính xác của dữ liệu:
 Địa chỉ của khách hàng lưu trong cơ sở dữ liệu khách hàng là địa chỉ thật của
khách hàng.
 Nhiệt độ đo được từ nhiệt kế là nhiệt độ thật của khơng khí.
Tính hiện hành: Sự xác định giá trị của dữ liệu được cập nhật hay chưa. Ví dụ:
 Các cơng ty yêu cầu phát hành kết quả kinh doanh hàng quý trong một
khoảng thời gian nào đó.
 Dịch vụ chăm sóc khách hàng phải cung cấp những thông tin được cập nhật
đến khách hàng.
 Hệ thống tín dụng cập nhật tài khoản của thẻ tín dụng trên mỗi giao dịch
được thực hiện.
Tính hiện hành phụ thuộc vào yêu cầu của người sử dụng dữ liệu. Ví dụ, đối với hệ
thống đặt vé máy bay, thơng tin về số ghế cịn trống luôn phải được cập nhật trực


8

tuyến, tuy nhiên với các trường hợp dưới đây có thể chấp nhận dữ liệu được cập
nhật hoặc cung cấp chậm hơn.
 Trong hệ thống chuyển phát thư, khi một bưu phẩm được phát cho khách
hàng thì khơng nhất thiết phải cập nhật ngay trạng thái của bưu phẩm đó mà
nhân viên chuyển phát có thể cập nhật vào cuối ngày.
 Bản báo cáo tài chính của một cơng ty có thể được phát hành một tháng sau
khi năm tài chính kết thúc.
 Kết quả điều tra dân số có thể được công bố sau khi cuộc điều tra tiến hành

kết thúc hai năm.
Tính tồn vẹn: Mức độ mà các giá trị hiện diện trong trong một tập hợp dữ liệu. Cụ
thể hơn, đó là mức độ các thuộc tính mong đợi của dữ liệu được cung cấp đầy đủ
hay khơng. Ví dụ, dữ liệu của khách hàng được xem là đầy đủ nếu:
 Thông tin cá nhân và tất cả địa chỉ cư trú, địa chỉ liên lạc của mỗi khách hàng
đều sẵn có.
 Có đầy đủ dữ liệu của tất cả các khách hàng
Tính tồn vẹn cũng phụ thuộc vào yêu cầu của người sử dụng. Một dữ liệu có thể
thiếu một thuộc tính nào đó nhưng nó vẫn được xem là tồn vẹn nếu nó thỏa u
cầu của người sử dụng. Ví dụ, đối với một yêu cầu về dữ liệu khách hàng là địa chỉ
cư trú bắt buộc phải có cịn địa chỉ cơng ty khơng bắt buộc, trong trường hợp địa chỉ
công ty không được cung cấp thì dữ liệu vẫn được coi là tồn vẹn nếu các yêu cầu
bắt buộc khác được thỏa mãn.
Tính tồn vẹn khơng bao hàm tính chính xác. Một dữ liệu tồn vẹn nhưng có thể
khơng chính xác. Ví dụ, tất cả địa chỉ của khách hàng trong ví dụ trên được cung
cấp đầy đủ nhưng một trong số đó có thể sai.
Tính nhất qn: Mức độ chồng chéo của các thực thể và các thuộc tính. Cụ thể, dữ
liệu được xem là nhất quán nếu dữ liệu trong toàn bộ hệ thống phải được đồng bộ


9

với nhau. Ví dụ, dữ liệu là thiếu nhất quán nếu một thẻ tín dụng đã bị hủy mà tình
trạng trả tiền của nó là q hạn.
Tính nhất qn cũng độc lập các chiều chất lượng khác như chính xác và tồn vẹn.
Trong trường hợp sau, dữ liệu có thể chính xác nhưng khơng nhất qn. Một chiến
lược khuyến mãi của một hãng hàng không kéo dài đến ngày 31 tháng 1 nhưng lại
có một vé được mua vào ngày 2 tháng 2 nhưng vẫn được hưởng khuyến mãi này.
Những dữ liệu này phản ánh đúng thế giới thực nhưng vẫn không được xem là nhất
quán. Tương tự, dữ liệu có thể tồn vẹn nhưng thiếu nhất qn.

2.1.2. Ngun nhân và hậu quả của dữ liệu kém chất lượng
2.1.2.1. Nguyên nhân gây ra dữ liệu kém chất lượng
Theo Cơ quan Hệ thống Thơng tin Quốc phịng Mỹ [3], những ngun nhân gây ra
dữ liệu kém chất lượng có thể là những vấn đề thuộc các phạm vi sau:
 Quy trình nghiệp vụ
 Hệ thống
 Chính sách và các thủ tục
 Thiết kế dữ liệu
Để có thể hiểu được chất lượng dữ liệu, cần phải có một sự hiểu biết đầy đủ về
những quy trình trong đó dữ liệu được phát sinh, sử dụng và lưu trữ. Những quy
trình nghiệp vụ thường dàn trải trong tổ chức và những người có liên quan đến
những quy trình này nên có trách nhiệm đối với chất lượng của dữ liệu mà họ nhập
vào hoặc sử dụng. Cũng theo kinh nghiệm của cơ quan này, phần lớn những lỗi về
dữ liệu phát sinh từ những vấn đề của quy trình [7]. Vì vậy, những người phân tích
hệ thống thơng tin nên kiểm tra các quy trình hiện có để hỗ trợ việc nhập dữ liệu,
phân công và thực thi trách nhiệm về chất lượng dữ liệu và những phương pháp
dùng để trao đổi dữ liệu.


10

Những vấn đề về chất lượng dữ liệu cũng phát sinh từ những thiếu sót trong hệ
thống như những thay đổi trong hệ thống không được lập tài liệu một cách đầy đủ,
thiếu tài liệu hướng dẫn sử dụng hay đào tạo chưa đầy đủ hoặc hệ thống đã được
mở rộng ra khỏi mục đích ban đầu của nó. Vì vậy, những chuyên gia về hệ thống
thông tin cũng nên kiểm tra lại những thay đổi trên hệ thống, tài liệu hướng dẫn sử
dụng, những yêu cầu thay đổi hệ thống và những báo cáo những vấn đề xảy ra đối
với hệ thống để có thể cải tiến chất lượng dữ liệu. Dữ liệu kém chất lượng cũng có
nguyên nhân từ những chính sách khơng đầy đủ của tổ chức. Do vậy, tổ chức cần
thiết lập trách nhiệm quản lý rõ ràng.

2.1.2.2. Hậu quả của dữ liệu kém chất lượng
Dữ liệu kém chất lượng đưa đến những hậu quả to lớn về tiền của cũng như sự phát
triển của các tổ chức. Đó là sự suy sụp trong chuỗi cung ứng, dẫn đến những quyết
định kinh doanh thiếu chính xác và sự yếu kém trong quản lý mối quan hệ khách
hàng.
Theo báo cáo của viện Data Warehousing năm 2006 (trích [15]), những hậu quả do
dữ liệu kém chất lượng gây ra được thống kê như sau:
 Các báo cáo và thống kê khơng chính xác.
 Những dữ liệu kém chất lượng chống lại những dữ liệu đúng và đáng tin cậy.
Điều này dẫn đến những lộn xộn và mâu thuẫn về các số liệu.
 Kết quả của những dữ liệu khơng chính xác dẫn đến những quyết định sai
lầm.
 Thiếu sự hiểu biết đầy đủ và toàn vẹn về khách hàng, do đó, dịch vụ khách
hàng trở nên yếu kém.
 Bộ phận tiếp thị lãng phí tiền bạc và nỗ lực theo đuổi những hướng không
đúng dẫn đến các chiến lược tiếp thị không hiệu quả.


11

 Cung cấp dữ liệu thiếu chính xác cho bộ phận kinh doanh sẽ làm giảm động
lực và năng suất làm việc của họ. Chi phí này lớn hơn giá của bất kỳ loại dữ
liệu nào.
 Chậm trễ trong việc giới thiệu sản phẩm mới.
Dưới đây là những chi phí do dữ liệu kém chất lượng gây ra cho các tổ chức:
 Theo một khảo sát được tiến hành trong 29 tổ chức của New Zealand và
Australia bao gồm các tổ chức chính phủ, ngân hàng, tài chính và dịch vụ
vào năm 1998, chỉ riêng những chi phí có thể nhận thấy được phát sinh do dữ
liệu kém chất lượng đã bằng 10 phần trăm doanh thu hằng năm của những tổ
chức này [11].

 Ngoài ra, khảo sát về quản lý dữ liệu toàn cầu của tổ chức
PricewaterhouseCoopers vào năm 2001 cho thấy 75 phần trăm các nhà điều
hành cấp cao cho biết những vấn đề nghiêm trọng xảy ra là kết quả của dữ
liệu kém chất lượng [8].
 Trong một nghiên cứu của viện Data Warehousing vào năm 2002, các nhà
nghiên cứu đã ước lượng những vấn đề phát sinh do chất lượng dữ liệu kém
đã tiêu tốn của nền kinh tế Mỹ trên 600 tỉ USD mỗi năm [6].
Nhận thức được những hậu quả của dữ liệu kém chất lượng, các nhà nghiên cứu và
các tổ chức đã thiết lập những quy trình và hệ thống quản lý chất lượng dữ liệu để
giảm thiểu dữ liệu kém chất lượng.
2.1.3. Các hệ thống quản lý chất lượng dữ liệu
Quản lý chất lượng dữ liệu đòi hỏi thiết lập và triển khai các vai trị, trách nhiệm,
chính sách và các quy trình liên quan đến việc thu thập, bảo trì, phát tán và sắp xếp
các dữ liệu. Một yêu cầu thiết yếu để việc quản lý chất lượng dữ liệu thành cơng là
phải có sự hợp tác giữa bộ phận kinh doanh và bộ phận kỹ thuật. Bộ phận kinh
doanh có trách nhiệm thiết lập những nguyên tắc nghiệp vụ để quản trị dữ liệu và
kiểm tra chất lượng của dữ liệu. Bộ phận kỹ thuật chịu trách nhiệm xây dựng và


12

quản lý tổng thể bao gồm kiến trúc, hệ thống và cơ sở dữ liệu để có thể thu thập,
bảo trì, phát tán và sắp xếp tài sản dữ liệu điện tử của doanh nghiệp.
2.1.3.1. Một số phương pháp quản lý chất lượng dữ liệu.
 Phương pháp Thông tin Người dùng (Consumer Information)
Phương pháp này được đưa ra bởi các nhà nghiên cứu A. S. Rosenthal, D. M.
Wood và E. R. Hughes [14], mục đích của phương pháp này là làm cho
những dữ liệu hiện có có thể được sử dụng nhiều hơn bằng cách thêm thông
tin. Một trong những cách thêm thơng tin cho dữ liệu đó là đưa ra những tài
liệu về việc diễn dịch ý nghĩa của các dữ liệu. Phương pháp này đem đến cho

người sử dụng dữ liệu cái nhìn tốt hơn về chất lượng để họ có thể xác định
thế nào là dữ liệu đủ tốt cho một mục đích nào đó.
Theo phương pháp này, có các nhiệm vụ cần thực hiện như sau:
o Cung cấp một cơ sở hạ tầng để có thể định nghĩa, lưu trữ các thuộc
tính chất lượng cho các loại dữ liệu khác nhau.
o Thu được các giá trị cho các thuộc tính chất lượng của những dữ liệu
quan trọng.
o Làm cho các giá trị của các thuộc tính dữ liệu sẵn sàng đối với người
sử dụng.
o Theo dõi ảnh hưởng của việc cung cấp các giá trị chất lượng đối với
các quyết định và người ra quyết định.
 Chương trình Quản lý Chất lượng Dữ liệu Tổng thể (Total Data Quality
Management - TDQM)
Chương trình này được Viện Cơng nghệ Massachusetts (Massachusetts
Institute of Technology - MIT) xây dựng dựa vào các nguyên tắc của Quản
lý Chất lượng Tổng thể (Total Quality Management - TQM) và chu trình
chất lượng của Deming (1982). Chu trình của chương trình TDQM bao gồm


13

các thành phần chính như sau: định nghĩa, đo lường, phân tích và cải tiến
chất lượng dữ liệu.
Trong đó, thành phần Định nghĩa tập trung vào việc định nghĩa những khái
niệm liên quan đến chất lượng dữ liệu. Thành phần Đo lường sẽ tập trung
vào việc đo lường các chỉ số chất lượng trên dữ liệu của hệ thống. Thành
phần Phân tích có trách nhiệm chỉ ra và tính tốn những ảnh hưởng của dữ
liệu kém chất lượng cũng như lợi ích tổ chức nhận được từ dữ liệu có chất
lượng tốt. Cuối cùng, thành phần Cải tiến thực hiện nhiệm vụ tái thiết kế các
quy trình nghiệp vụ và hiện thực các giải pháp công nghệ mới để cải thiện

chất lượng dữ liệu của tổ chức. Các thành phần này được mơ tả cụ thể trong
hình dưới đây (trích [10])

Hình 2.1 Các thành phần của chu trình TDQM
 Chu trình Unified dPIQ
Phương pháp này được đưa ra bởi Viện Data Warehousing (The Data
Warehousing Institute - TDWI) bao gồm những hoạt động liên quan đến xem


14

xét dữ liệu (data Profiling), hợp nhất dữ liệu (data Integration) và chất lượng
dữ liệu (data Quality). Các bước cụ thể trong chu trình sẽ được trình bày cụ
thể trong Hình 2.2 (trích [15]).

Hình 2.2 Chu trình Unified dPIQ
Các hoạt động này sẽ diễn ra theo một chu trình có tính chất lặp đi lặp lại.
Nội dung của các bước trong chu trình sẽ được trình bày cụ thể như sau.
o Phân tích và Báo cáo (Analyze - Report): Việc kiểm tra dữ liệu
được diễn ra trước tiên mỗi khi chu trình bắt đầu hoặc lặp lại. Theo


×