GIÁO DC VÀ ÀO TO
TRNG I HC LC HNG
***
PHM NGC THCH
NG DNG KHO D LIU VÀ
I QUAN H KHÁCH HÀNG
NHM PHÂN TÍCH TÌNH HÌNH KINH DOANH
A DOANH NGHIP
Chuyên ngành : Công ngh thông tin
Mã s : 60.48.02.01
Lun vn thc s Công ngh thông tin
NGI HNG DN KHOA HC
PGS. TS PHÚC
ng Nai, Nm 2013
- i -
I CM N
Trc ht, em xin gi ti toàn th các thy cô Khoa Công ngh thông tin li
chúc sc kho và li cm n sâu sc.
Trong sut thi gian hc tp ti trng i hc Lc Hng vi s tn tình
truyn t kin thc ca thy cô ã giúp cho em có mt s kin thc c bn và các
phng pháp hc tp, nghiên cu khoa hc hiu qu em có s t tin hn trong
công vic và các công tác nghiêu cu khoa hc sau này.
Em xin t lòng bit n sâu sc n thy PGS.TS. Phúc ã tn tình hng
n em trong vic thc hin lun vn này và kính chúc thy cùng gia ình luôn
nh khe, thành công trong công vic và t nhiu thành tu trong các công trình
nghiên cu khoa hc ca mình.
Em xin trân trng cm n !
- ii -
I CAM OAN
Tôi xin cam oan ây là công trình nghiên cu ca tôi di s hng dn ca
PGS. TS Phúc. Các kt qu có c và vic phân tích kt qu là trung thc và
cha tng c công b trong bt k công trình nào khác.
TÁC GI
- iii -
C LC
I CM N i
I CAM OAN ii
C LC iii
DANH MC CÁC T VIT TT iv
DANH MC BNG v
DANH MC HÌNH NH vi
GII THIU 1
CHNG 1: MU 3
1.1 Lý do thc hin tài 3
1.2 Mc tiêu nghiên cu 4
1.3 Phm vi nghiên cu 4
1.4 Phng pháp thc hin 4
1.5 Tóm tt kt qut c 5
CHNG 2: C S LÝ THUYT 6
2.1 Lý thuyt v kho d liu 6
2.1.1 nh ngha và các c m ca kho d liu 6
2.1.2 Mc tiêu ca kho d liu 9
2.1.3 Các thành phn ca mt kho d liu 12
2.1.4 Mô hình d liu và vic thit k kho d liu 16
2.2 Lý thuyt v mi quan h khách hàng 30
2.2.1 Nn tng qun lý quan h khách hàng 30
2.2.2 Qun lý quan h khách hàng và qun tr thông minh 32
2.2.3. Kho d liu khách hàng 34
2.2.4. Qun tr thông minh vi s tha mãn ca khách hàng 35
CHNG 3: THIT K VÀ XÂY DNG KHO D LIU VÀ
I QUAN H KHÁCH HÀNG 37
3.1 Thit k chc nng cho h thng qun lý quan h khách hàng 38
3.2 Thit k CSDL cho kho d liu 39
3.2.1. Thit k khi d liu Product Sales 39
3.2.2. Thit k khi d liu Communication Subscription 45
3.3 Np d liu cho kho d liu 48
3.4 To truy vn phát sinh d liu cho kho d liu 57
CHNG 4: CÀI T VÀ KHAI THÁC KHO D LIU 58
4.1 Vit chng trình to form nhp liu 58
4.2 Xây dng ng dng khai thác d liu t kho d liu 61
4.3 Chy chng trình và phân tích kt qu 64
T LUN VÀ HNG TÌM HIU NÂNG CAO 74
TÀI LIU THAM KHO
PH LC
- iv -
DANH MC CÁC T VIT TT
4GL : Fourth-Generation Languages / Ngôn ng th h th t
ASP : Application Support Provider / Nhà cung cp dch v h trng dng
BI : Business Intelligence / Qun tr thông minh
CET : Current Extraction Time / Thi m trích xut d liu hin thi
CRM : Customer Relationship Management / Qun lý quan h khách hàng
CSDL : C s d liu
DASD : Direct Access Storage Device / Thit b lu tr truy cp trc tip
DBMS : Database Management System / H thng qun tr CSDL
DDS : Dimentional Data Store / Lu tr d liu chiu
DIS : Data Item Set / Mô hình quan h cp trung
DN : Doanh nghip
DSS : Decision Support System / H thng h tr ra quyt nh
DW : Data Warehouse / Kho d liu
ETL : Extract, Transform, Load / Trích xut, chuyn i và np d liu
ER : Entity Relationship / Quan h thc th
ERD : Entity Relationship Level / Mc quan h thc th
ERP : Enterprise Resource Planning / Hoch nh ngun lc DN
IT : Information Technology / Công ngh thông tin (CNTT)
LSET : Last Successful Extraction Time / Thi m trích xut d liu thành công
cui cùng
MIS : Management Information Systems / H thng thông tin qun lý
NF : Normal Form / Chun hóa d liu
ODS : Operational Data Store / Lu tr d liu u hành
OLAP : Online Analytical Processing / X lý phân tích trc tuyn
OLTP : Online Transaction Processing / X lý giao dch trc tuyn
PC : Personal Computer / Máy tính cá nhân
RSS : Really Simple Syndication (RSS 2.0.0) / là nh dng d liu da theo
chun XML dùng trong vic chia s tin tc Web.
SCM : Supply Chain Management / Qun lý chui cung ng
SOA : Service-Oriented Architecture / Kin trúc hng dch v
- v -
DANH MC BNG
ng 2.1 Các khía cnh ch yu ca CRM 31
ng 3.1 Các chc nng ca h thng qun lý quan h khách hàng 38
ng 3.2 Thit k chi tit cho bng s kin Product Sales 41
ng 3.3 Thông tin mô t bng chiu d liu dim_Date 42
ng 3.4 Thit k chi tit cho bng chiu d liu dim_Date 42
ng 3.5 Thit k chi tit cho bng chiu d liu dim_Product 43
ng 3.6 Thit k chi tit cho bng chiu d liu dim_Customer 43
ng 3.7 Thit k chi tit cho bng chiu d liu dim_Store 44
ng 3.8 D liu mu cho bng s kin Communication Subscription 46
ng 3.9 Thit k chi tit cho bng s kin Communication Subscription 46
ng 3.10 Thit k chi tit cho bng chiu d liu dim_Communication 47
ng 3.11 Thit k chi tit cho bng chiu d liu dim_Subscription_Status 47
ng 3.12 Thit k chi tit cho bng chiu d liu dim_Channel 47
- vi -
DANH MC HÌNH NH
Hình 2.1 Các thành phn ca kho d liu 12
Hình 2.2 Bng s kin 15
Hình 2.3 Bng chiu d liu 15
Hình 2.4 Chuyn d liu t h thng u hành sang môi trng kho d liu
không chn thun là vic trích xut d liu 17
Hình 2.5 D liu t các ng dng khác nhau cc k ri rc 18
Hình 2.6 Chuyn i d liu t các h thng hin ti sang môi trng kho d
liu mt cách hp lý thì nó sc tích hp 19
Hình 2.7 Các thc th và các mi quan h 20
Hình 2.8 Mi thc th trong mô hình ERD sc xác nh bng mô hình
DIS 20
Hình 2.9 Các quan h trong ERD sc phn ánh bng các kt ni trong
DIS 21
Hình 2.10 Các u vào ca bng c trình bày bng hai giao tác 21
Hình 2.11 Các yu t thit k liên quan n hiu sut 22
Hình 2.12 Môi trng c ghi d liu 22
Hình 2.13 Mô hình d liu hai chiu n gin - các thc th là ngang hàng 24
Hình 2.14 Mô hình d liu ba chiu cho thy rng các thc th là không ngang
hàng vi nhau 24
Hình 2.15 Mô hình kt ni hình sao n gin vi thc thN HÀNG c
tính toán nhiu nht và các thc th khác kt ni vào 25
Hình 2.16 Trong nhiu trng hp, bng s kin tng hp c tính toán bi
liu dng s và khóa ngoi trong khi bng chiu d liu c
tính toán bng d liu ký t 26
Hình 2.17 Mô hình kt ni hình bông tuyt n gin vi thc th KHÁCH
HÀNG kt ni vi thc th QUC GIA 27
Hình 2.18 Khi OLAP trong mô hình kho d liu 28
Hình 2.19 Cách tip cn ETL vi tng d liu trung gian 29
Hình 2.20 Cách tip cn ETL không có tng d liu trung gian 29
- vii -
Hình 2.21 Cách tip cn ELT cho phép vic chuyn i d liu trên máy ch
kho d liu 30
Hình 2.22 Mô hình qun tr thông minh 34
Hình 3.1 Lu các bc tin hành thit k và khai thác kho d liu 38
Hình 3.2 Bng s kin và chiu d liu cho khi d liu Product Sales 40
Hình 3.3 Lc hình sao y cho khi d liu Product Sales 44
Hình 3.4 Bng s kin và chiu d liu cho khi d liu Communication
Subscription 45
Hình 3.5 Lc hình sao y cho khi d liu Communication
Subscription 48
Hình 3.6 To d án mi cho vic np d liu và to lu d liu 49
Hình 3.7 Ánh x ct d liu gia h thng ngun và kho d liu 49
Hình 3.8 Kt qu thc thi d án cho bng chiu d liu dim_Customer 50
Hình 3.9 Kt qu thc thi d án cho bng chiu d liu dim_Product 51
Hình 3.10 Tác v dòng d liu cho bng chiu d liu dim_Store 52
Hình 3.11 Kt qu thc thi d án cho bng chiu d liu dim_Store 53
Hình 3.12 Lu kim soát và t tham s cho d án cho bng s kin 54
Hình 3.13 Lu dòng d liu và vic ánh x ct d liu cho bng s kin 55
Hình 3.14 Kt qu vic np d liu cho bng s kin 56
Hình 4.1 Màn hình chính ca ng dng nhp liu cho h thng ngun 58
Hình 4.2 Màn hình ng nhp ng dng nhp liu 59
Hình 4.3 Màn hình nhp liu cho danh mc khách hàng 59
Hình 4.4 Màn hình nhp liu cho danh mc sn phm 60
Hình 4.5 Màn hình nhp liu cho danh mc kho 60
Hình 4.6 Khi to d án xây dng khi d liu OLAP 61
Hình 4.7 Kt ni hình sao trong khi d liu OLAP 62
Hình 4.8 Tin trình to khi d liu t bng s kin và bng chiu d liu 63
Hình 4.9 Trin khai thành công khi d liu OLAP 63
Hình 4.10 Khi to d án khai thác kho d liu 64
Hình 4.11 Báo cáo li nhun bán hàng theo khách hàng và thi gian 64
Hình 4.12 Doanh thu bán hàng theo thi gian 65
Hình 4.13 Báo cáo chi phí và s lng mua theo vùng, quc gia 66
- viii -
Hình 4.14 Báo cáo li nhun theo khách hàng và thông tin giao tip vi khách
hàng 66
Hình 4.15 Báo cáo doanh thu theo sn phm, khách hàng và thi gian 67
Hình 4.16 Báo cáo doanh thu theo sn phm, khách hàng và thi gian bng
MS Excel 68
Hình 4.17 Danh sách các trng d liu sc chn cho vic phân tích d
liu 69
Hình 4.18 Biu v ch tiêu li nhun 69
Hình 4.19 Biu v ch tiêu doanh thu 70
Hình 4.20 Báo cáo doanh thu ca tt c khách hàng 70
Hình 4.21 Báo cáo li nhun ca tt c khách hàng nm 2013 71
Hình 4.22 Báo cáo li nhun theo thi gian 72
Hình 4.23 Báo cáo li nhun theo v trí a lý 72
Hình 4.24 Báo cáo doanh thu da trên kênh giao tip 73
- 1 -
GII THIU
Ngày nay, nhu cu m rng và phát trin các gii pháp DW và BI s ngày
càng ln mnh, nht là trong bi cnh kinh t xã hi nh hin ti s buc các
TC/DN phi ti u hóa các hot ng ca mình và a ra quyt nh nhanh chóng,
chính xác. Gii pháp DW và BI thng i chung vi nhau nh là gii pháp tng th
phc v cho quá trình xây dng mt doanh nghip thông minh, thông qua vic tp
p và x lý d liu, a ra các báo cáo, phân tích và doán theo các góc nhìn a
chiu phc v cho các hot ng theo dõi và a ra quyt nh ca doanh nghip.
Trong ó, DW ch n gin là vic hp nht d liu t nhiu ngun, c
chun hóa có th khai thác tt, h tr trong vic a ra các quyt nh mang tính
chin lc và chin thut. Mc ích chính ca DW là luôn cung cp mt hình nh
thng nht và chính xác nht v doanh nghip ti bt k thi m nào. S dng mt
trong các gii pháp qun lý kho d liu, doanh nghip có th khai thác toàn b d
liu ca doanh nghip mình thay vì trc ây thng mt rt nhiu công sc.
BI là gii pháp s dng các k nng, qui trình, công ngh, ng dng h tr
ra quyt nh, các công c BI nâng cao kh nng tr giúp a ra các quyt nh
mang tính chin lc, chin thut và em li hiu qu trong kinh doanh. BI cho
phép doanh nghip hiu bit v quá kh và doán tng lai thông qua ng dng
CNTT có th d dàng kim soát khi lng d liu khng l, khai phá tri thc
n có theo nhiu góc nhìn y ca mt doanh nghip. Mc ích chính ca BI là
tr cho doanh nghip ra quyt nh tt hn.
thng BI cung cp các kh nng tr li nhng câu hi quan trng bng
cách chuyn mt lng ln d liu t các h thng ang hot ng sang mt nh
ng hin hành, có th s dng và d hiu. Chúng cung cp thông tin là sn sàng
ra quyt nh. BI cho phép phân tích xu hng hin ti và tng lai, cnh báo ngay
p tc các c hi và các vn và cung cp thông tin phn hi liên tc v tính hiu
qu ca vic ra quyt nh.
Bên cnh s kt hp gia DW và các ng dng BI, còn có mt yu t có nh
ng không nh ti thành công ca doanh nhip, ó là CRM. CRM cam kt mang
i li nhun áng k cho các t chc trin khai nó c v doanh thu và hiu qu cao
- 2 -
trong hot ng sn xut. Chuyn sang nh hng khách hàng trng tâm có th dn
n hiu qu kinh doanh tng cao và t giá n nh, tng trng doanh thu, gia tng
doanh s bán hàng vi chi phí gim, ci thin t sut li nhun t khách hàng, gia
ng s tha mãn khách hàng và gn kt lâu dài vi khách hàng. Cui cùng, mi t
chc u mun khách hàng trung thành hn, li nhun nhiu hn. Bi vì nó thng
òi hi mt su táng k thu hút khách hàng mi nên chúng ta không th có
kh nng có nhng khon u t này. Do vy, mt trong nhng mc tiêu ca
CRM là chuyn i nhng khách hàng không mang li li nhun thành nhng
khách hàng mang li li nhun [11].
i dung ca lun vn bao gm các phn sau:
u: gii thiu chung v kho d liu, qun tr thông minh và qun lý
quan h khách hàng. Tình hình ng dng kho d liu ca các doanh nghip
i Vit Nam và vai trò ca quan h khách hàng trong kinh doanh.
Chng 1: trình bày v các vn chung ca lun vn nh: lý do thc hin
tài, mc tiêu tài, phng pháp thc hin và kt qut c.
Chng 2: trình bày lý thuyt v kho d liu và mi quan h khách hàng.
Các c m và vic thit k kho d liu; vai tro ca quan h khách hàng
và qun tr thông minh.
Chng 3: trình bày vic thit k mt kho d liu c th vi vic thit các
khi d liu, vic np d liu t h thng ngun vào CSDL kho d liu.
Chng 4: vit ng dng np d liu cho h thng ngun và thit k các d
án khai thác d liu t kho d liu, ng thi tin hành phân tích d liu ã
c khai thác t kho d liu.
t lun và hng phát trin: tóm lc các ni dng ã c trình bày
trong lun vn và xut các hng phát trin thêm.
Tài liu tham kho: danh sách các tài liu dùng cho vic tham kho
hoàn thành bài lun vn.
Ph lc: các n mã lnh c dùng trong quá trình sinh d liu cho kho
liu t h thng ngun.
- 3 -
CHNG 1
U
1.1. Lý do thc hin tài:
Vic ng dng h thng thông tin h tr ra quyt nh mà trong ó DW là mt
thành phn quan trng còn hn ch, ch dng li các doanh nghip ln nh: Ngân
hàng (Sacombank, Vietin Bank), Vin thông (MobiFone), Chng khoán (sàn giao
ch chng khoán hà Ni) (Ngun: Ngân hàng Nhà Nc Vit Nam). Do ó, xây
ng mô hình DW s giúp doanh nghip hiu rõ hn v h thng này và giúp Ban
Giám c a ra nhng quyt nh nhanh chóng, chính xác cho hot ng sn xut
kinh doanh ca doanh nghip mình.
Theo kt qu nghiên cu ca 2 chuyên gia là Paul Gray và Jongbok Byun,
trng Claremont Graduate School, khi trin khai DW và CRM thành công, doanh
nghip sc hng rt nhiu li ích nh:
Có th tit kim chi phí tip cn khách hàng mi (thng cao hn gp 5-10
n) nh duy trì c mi quan h tt vi khách hàng hin ti.
t c s tha mãn và trung thành ca khách hàng. u này rt có li vì
khách hàng trung thành thng có xu hng quay tr li mua và ít quan tâm
i giá c hn khách hàng mi.
ng li nhun: Mt công ty c tng thêm 5% khách hàng trung thành thì
có th tng 25% n hn 100% li nhun tùy theo các ngành ngh kinh
doanh.
ng cng hiu qu hot ng qun lý công ty nh h thng quy trình rõ
ràng trong CRM bt buc các nhân viên (NV) phi tuân th quy nh v báo
cáo tình hình ca tng b phn.
Sau ây là các li ích ca vic trin khai CRM thành công c thu thp và
ng kt t mt cuc kho sát rng rãi ca các nghiên cu CRM gn ây [2]:
i thin kh nng hng mc tiêu khách hàng có li nhun.
Tích hp các dch v qua các kênh.
i thin lc lng bán hàng hiu qu và t nng sut cao.
- 4 -
c thù hóa các thông p marketing.
Tùy bin các sn phm và dch v.
i thin dch v khách hàng hiu qu và t nng sut cao.
i thin v giá c.
i lý do ó, tài này s nghiên cu sâu hn v vic ng dng kho d liu
và mi quan h khách hàng nhm giúp doanh nghip có cái nhìn rõ hn v tình hình
kinh doanh ca doanh nghip mình và có nhng phân tích kt qu kinh doanh thông
qua hot ng mua bán, giao tip vi khách hàng nhm xây dng chin lc khách
hàng trng tâm tng hiu qu sn xut, kinh doanh ca doanh nghip mt khi
doanh nghip phát trin và qui mô sn xut kinh doanh c m rng.
1.2. Mc tiêu nghiên cu:
s lý thuyt v kho d liu và các c m ca nó.
s lý thuyt v mi quan h khách hàng.
Thit k và xây dng CSDL h thng kho d liu và mi quan h khách
hàng.
Phân tích tình hình kinh doanh ca doanh nghip da trên vic khai thác d
liu t kho d liu.
1.3. Phm vi nghiên cu:
Lun vn s s dng b d liu kinh doanh ca công ty TNHH Schaeffler Vit
Nam minh ha cho vic thit k kho d liu và mi quan h khách hàng. ng
thi, lun vn s phân tích tình hình kinh doanh ca Schaeffler Vit Nam trên kho
liu va c xây dng.
1.4. Phng pháp nghiên cu:
Nghiên cu c s lý thuyt:
ng hp và phân tích các ngun d liu khác nhau v kho d liu và
i quan h khách hàng.
Thit k và xây dng CSDL:
- 5 -
ng dng h qun tr CSLD SQL Server 2005 xây dng CSDL kho
liu và mi quan h khách hàng.
Vit mã lnh trên CSLD SQL Server 2005 phát sinh d liu t h
thng ngun vào kho d liu.
ng dng b công c Visual Studio 2005 – Business Intelligence
Development Studio thc hin vic chuyn i, np d liu t h
thng ngun d liu vào kho d liu.
Phân tích tình hình kinh doanh ca doanh nghip:
dng công c OLAP trên b công c Visual Studio 2005 khai
thác d liu trên kho d liu.
dng d án báo cáo ca b công c Visual Studio 2005 phân tích
liu t kho d liu.
1.5. Tóm tt kt qut c:
Lý thuyt:
lý thuyt v kho d liu và mi quan h khách hàng.
n phm:
t CSDL kho d liu v doanh thu ca doanh nghip.
t chng trình khai thác d liu ca kho d liu da trên k thut
OLAP.
t d án báo cáo phân tích tình hình kinh doanh ca doanh nghip.
- 6 -
CHNG 2
S LÝ THUYT
2.1. Lý thuyt kho d liu:
2.1.1. nh ngha và các c m ca kho d liu:
Vic tin hc hoá các quy trình kinh doanh; công ngh tiên tin trong truyn ti
và lu tr d liu; công c qun lý c s d liu mnh mã m ra nhng kh nng
i trong các thao tác và phân tích d liu. Các nhà qun lý doanh nghip ang háo
c khám phá nhng kho d liu hin ti và quá kh xác nh xu hng phát
trin và các hình mu trong vic kinh doanh. H hy vng vic khai thác d liu và
dng chúng a ra quyt nh kinh doanh thông minh s làm cho doanh
nghip s có bc phát trin nhy vt và thành công. Trong bi cnh này, các ngành
công nghip ang ngày càng tp trung vào DW, OLAP, và các công ngh liên quan
khác. Trong phm vi nghiên cu ca lun vn này, hc viên ch tp trung vào DW.
Có hai cách nh ngha khác nhau v kho d liu c Ralph Kimball và Bill
Inmon a ra. Có th nói, hai ông là cha ca khái nim kho d liu. Theo Ralph
Kimball “Kho d liu là mt h thng trích xut, làm sch, tng hp và cung cp
ngun d liu vào mt kho lu tr d liu a chiu và sau ó h tr, thc hin truy
n và phân tích cho các mc ích ca quá trình ra quyt nh.”, còn theo Bill
Inmon thì “Kho d liu là mt tp hp d liu tng i n nh (không hay thay
i), cp nht theo thi gian, c tích hp theo hng ch nhm h tr quá
trình to quyt nh v mt qun lý.” [13]. Tuy nhiên, nh ngha ca Bill Inmon
c chp nhn rng rãi hn. Có th hiu các c m trong nh ngha ca Bill
Inmon nh sau:
ng ch (Subject-Oriented): ngha là d liu s cung cp thông tin
mt ch c th hn là các thông tin v các chc nng hay phòng ban
a mt công ty. Bi vì kho d liu theo hng ch nên nó s cho phép
phân tích thông tin c kt ni vi mt ch c th nào ó, ví d
Marketing hoc Sales. Nói mt cách n gin hng ch là mt qui trình
kinh doanh (business process) ch không phi là mt b phn (department).
- 7 -
Tích hp (Integrated): có ngha là d liu c thu thp trong DW có th
n t nhiu ngun khác nhau, nhng c kt hp thành mt n v hp lý
và có liên quan mt thit vi nhau. Ví d: d liu có th ly t b phn
Marketing và Sales a vào kho d liu thành doanh thu hàng nm.
p nht theo thi gian (Time-Variant): kho d liu lu tr d liu t quá
kh cng nh hin ti nh hng các quyt nh kinh doanh trong
ng lai. D liu quá kh s tr giúp trong vic xác nh các mu d liu
n n mt s quyt nh kinh doanh nào ó. Nó hoàn toàn ph thuc vào
ngi qun tr và nhà qun lý doanh nghip v vic quyt nh cách lu tr
liu trong kho d liu trong bao lâu. Ví d: 1 nm, 3 nm, 5 nm,…
n nh (Non-Volatile): có ngha là s không có vic cp nht d liu c
u tr trong kho d liu mà thay vào ó là các thông tin c t chc
hin th các thay i ca d liu ó. D liu trong kho d liu c s dng
cho vic phân tích nên các thao tác cp nht hay xóa d liu có th làm nh
ng ti vic phân tích này. Vì vy, nói chung là d liu trong DW không
bao gic cp nht hay xóa b. Bt c khi nào mt thuc tính c th
hoc mc d liu c cp nht ti ngun thì phiên bn mi ca nó c
u tr trong DW vô hiu phiên bn d liu c.
Trc tiên, chúng ta s tp trung vào các mc tiêu c bn ca DW. Các mc
tiêu này c phát trin da trên các yêu cu và vic qun lý kinh doanh.
DW phi làm sao d liu ca DN c truy cp mt cách d dàng.
i dung ca DW phi d hiu. D liu phi trc quan và rõ ràng i vi
ngi kinh doanh ch không n thun ch cho các nhà phát trin. D hiu
ng ý là mc dc, ni dung ca DW cn c xác nh là có ý ngha.
Doanh nhân mun tách ra và kt hp li d liu trong kho theo cách kt hp
vô tn, quá trình thng c gi là chiu và chn. Các công c truy cp
vào DW phi n gin và d s dng. Chúng cng phi tr li kt qu truy
n cho ngi s dng vi thi gian chi là ti thiu.
DW phi trình bày thông tin ca DN mt cách nht quán. D liu trong
kho phi áng tin cy. D liu phi c thu thp mt cách cn thn t
nhiu ngun khác nhau ngoài DN, c làm sch, m bo cht lng và
- 8 -
c s dng ch khi nó phù hp vi tiêu chí ca ngi s dng. Thông tin
mt quá trình kinh doanh phi phù hp vi thông tin t ni khác. Nu hai
bin pháp thc hin có cùng tên thì chúng phi có ngha là cùng mt th.
Ngc li, nu hai bin pháp này không ging nhau thì chúng phi c
dán nhãn khác nhau. Thông tin nht quán có ngha là thông tin cht lng
cao. Nó có ngha là tt c các d liu sc trình bày và hoàn chnh. Tính
nht quán cng ng ý rng các nh ngha chung cho ni dung ca DW s
n có cho ngi s dng.
DW phi c thích ng và linh hot vi s thay i. Chúng ta hoàn toàn
không th tránh s thay i. Nhu cu ca ngi s dng, u kin kinh
doanh, d liu và công ngh tt cu là các ch th cho các bin ng ca
thi gian. DW phi c c thit k x lý các thay i không th
tránh khi này. Thay i i vi DW nên nh nhàng, có ngha là nó không
làm mt hiu lc ca d liu hoc các ng dng hin thi. D liu và các
ng dng hin thi s không b thay i hoc phá v khi doanh nghip yêu
u nhng câu hi mi hoc mt s d liu mi c thêm vào DW. Nu
liu mô t trong DW c chnh sa thì chúng ta phi gii lý gii cho
nhng thay i mt cách thích hp.
DW phi là phng tin an toàn bo v thông tin quí báu ca DN.
Thông tin quí báu ca mt DN sc lu tr trong DW. mc ti thiu,
DW có th cha thông tin v nhng gì chúng ta ang bán cho mt ai ó vi
t giá c nào ó – là nhng chi tit nguy hi tim tàng trong tay ca
nhng k xu. DW phi kim soát vic truy cp vào các thông tin bí mt
a DN mt cách hiu qu.
DW phi phc v nh là nn tng cho vic ra quyt nh tt hn. DW
phi có d liu chính xác h tr vic ra quyt nh. Ch có mt u ra
chính xác t DW: quyt nh c a ra sau khi DW trình bày các bng
chng ca nó. Nhng quyt nh này cung cp giá tr và tác ng kinh
doanh mà có th phân b cho kho cha. Danh hiu nguyên thy xy ra
trc DW vn là mô t tt nht v nhng gì chúng ta ang thit k: mt h
thng h tr ra quyt nh.
- 9 -
Vì vy, chúng ta có th nói rng DW không là gì c ngoi tr là ni lu tr
c bit d liu ca doanh nghip, là ni d liu c t chc theo cách mà vic
phân tích tr nên d dàng và trc quan cho ngi qun tr doanh nghip và giúp h
thc hin công vic da trên các quyt nh kinh doanh. Hay nói cách khác, mc
tiêu chính ca DW là cung cp mt kho lu tr d liu hp nht, linh hot, có ý
ngha cho ngi dùng trong vic phân tích, báo cáo và h tr ra quyt nh. Tt c
các mc tiêu khác ca DW u có ngun gc t mc tiêu chính này. Tuy nhiên, v
phía ngi s dng hoc doanh nghip vn có khó khn trong vic phân tích, khai
thác, t chc kho d liu, các khó khn thng gp là:
Không th tìm thy d liu cn thit: D liu ri rác rt nhiu h thng
i các giao din và công c khác nhau, khin tn nhiu thi gian chuyn t
thng này sang h thng khác. Có th có nhiu ngun thông tin áp ng
c òi hi, nhng chúng li có nhng khác bit và khó phát hin thông
tin nào là úng.
Không th ly ra c d liu cn thit: Thng xuyên phi có chuyên gia
tr giúp, dn n công vic b dn ng. Có nhng loi thông tin không
th ly ra c nu không m rng kh nng làm vic ca h thng có
n.
Không th hiu d liu tìm thy: Mô t d liu nghèo nàn và thng xa ri
i các thut ng nghip v quen thuc.
Không th s dng c d liu tìm thy: Kt qu thng không áp ng
bn cht d liu và thi gian tìm kim. D liu phi chuyn i bng tay
vào môi trng làm vic ca ngi s dng [12].
2.1.2. Mc tiêu ca kho d liu:
Trc khi i vào chi tit ca các thành phn kho d liu, chúng ta s tìm hiu
các mc tiêu c bn ca kho d liu. Các ch ny sinh có th xy ra là:
Chúng ta có c núi d liu nhng không th truy cp c.
Chúng ta cn ct và chia nh d liu bng mi cách.
i ngi có th d dàng ly d liu mt cách trc tip.
Cho bit ch nhng thành phn quan trng.
- 10 -
Ngn chn vic trình bày cùng vn mà khác nhau các con s.
Chúng ta mun mi ngi s dng thông tin h tr vic ra quyt nh.
Nh vy, vi các yêu cu v công vic nh trên, chúng ta s chuyn i thành
các yêu cu ca mt kho d liu.
Kho d liu phi làm cho thông tin ca mt TC c truy xut d dàng.
Các ni dung ca kho d liu phi d hiu. Các d liu phi trc quan và rõ ràng
cho ngi dùng làm vic ch không n thun cho các nhà phát trin. D hiu có
ng ý là mc dc; ni dung ca kho d liu cn mang ý ngha. Ngi dùng
doanh nghip mun chia tách và kt hp d liu trong kho d liu mt cách vô hn,
quá trình này thng c gi là chiu và chn. Các công c truy cp vào kho d
liu phi n gin và d s dng. Chúng cng phi tr li kt qu truy vn cho
ngi s dng vi thi gian chi là ti thiu.
Kho d liu phi trình bày thông tin ca TC mt cách nht quán. D liu
trong kho d liu phi áng tin cy. D liu phi c kt ni cn thn t nhiu
ngun xung quanh t chc, c làm sch, phi m bo cht lng và sn sàng ch
khi nó phù hp vi nhu cu ca ngi s dng. Thông tin t mt qui trình kinh
doanh phi phù hp vi thông tin ca qui trình khác. Nu hai phng pháp thc
hin có cùng tên thì chúng phi cùng ngha. Ngc li, nu hai phng pháp không
có ngha tng t thì chúng phi c dán nhãn khác nhau. S nht quán thông tin
có ngha là thông tin có cht lng cao. Có ngha là tt c các d liu ã c tính
toán và hoàn chnh. Tính nht quán cng ng ý rng các nh ngha tng quát ni
dung ca kho d liu là có sn cho ngi dùng.
Kho d liu phi thích nghi và thay i linh hot.n gin vì chúng ta
không th tránh khi s thay i. Nhu cu ca ngi s dng, u kin kinh doanh,
liu và công ngh tt cu tùy thuc vào bin ng ca thi gian. Kho d liu
phi c c thit k x lý các thay i không th tránh khi này. Thay i
i vi kho d liu nên uyn chuyn, u ó có ngha là chúng không làm mt
hiu lc d liu hoc các ng dng hin có. D liu và các ng dng hin có không
nên b thay i hoc b phá v khi cng ng doanh nghip yêu cu câu hi mi
- 11 -
hoc d liu mi c thêm vào kho. Nu d liu mô t trong kho d liu c
thay i thì chúng ta phi gii thích cho nhng thay i mt cách thích hp.
Kho d liu phi là mt phng tin an toàn bo v tài sn thông tin
a DN. Viên ngc thông tin quý giá ca mt t chc c lu tr trong kho d
liu. mc ti thiu, kho d liu ging nh ni cha thông tin v nhng gì
chúng ta ang bán cho ai ó vi mt mc giá nào ó – mt mi nguy hi tim n
trong tay nhng ngi xu. Kho d liu phi kim soát vic truy cp vào thông tin
bí mt ca t chc mt cách hiu qu.
Kho d liu phi phc v nh là nn tng cho s ci thin vic ra quyt
nh. Kho d liu phi có d liu chính xác h tr quá trình ra quyt nh. Ch
có mt s tht u ra duy nht t mt kho d liu: các quyt nh c a ra sau
khi kho d liu ã a ra bng chng ca nó.
ng ng doanh nghip phi chp nhn kho d liu nu nó là c coi
là thành công. Vic chúng ta ã xây dng mt gii pháp p mt s dng các sn
phm và nn tng tt là u không quan trng. Nu cng ng doanh nghip không
chp nhn kho d liu và tip tc s dng nó tích cc 6 tháng sau khi ào to thì
vic nghim thu là tht bi. Không ging nh vic vit li mt h thng, ni ngi
dùng không có s la chn nào khác là phi s dng h thng mi, nhng s
ng h thng mi, vic s dng kho d liu ôi khi là tùy chn. Sn gin hóa
d dàng c ngi s dng chp nhn hn.
- 12 -
2.1.3. Các thành phn ca mt kho d liu:
Có bn thành phn riêng r và phân bit sc trình bày trong môi trng
kho d liu, ó là: h thng ngun d liu, khu vc tng d liu, khu vc trình bày
liu và các công c truy cp d liu.
thng ngun d liu (Operational Source Systems): ây là nhng h
thng các bn ghi d liu ghi li các giao dch trong quá trình hot ng kinh
doanh. Các h thng ngun d liu này nên c dùng bên ngoài kho d liu
i vì chúng ta ít có kim soát ni dung và nh dng d liu trong các h
thng này. u tiên ca chính h thng ngun này là x lý hiu sut và tính sn
sàng. Truy vn trên h thng ngun này b bó hp, các truy vn có kt qu mi
n mt bn ghi b hn ch nghiêm trng cho các nhu cu trên h thng ngun
liu này. Chúng ta ginh rng các h thng ngun d liu không c
truy vn theo cách thông dng và t xut nh kho d liu. Các h thng
ngun d liu duy trì rt ít d liu quá kh và nu có mt kho d liu tt thì
các h thng ngun d liu có thc gim bt trách nhim trình bày hay
u tr quá kh. Mi h thng ngun d liu thng là mt ng dng hình ng
Hình 2.1 Các thành ph
n c
a kho d
li
u
(Ngu
n: [11])
- 13 -
nhiên, có ít u t cho vic chia s d liu chung nh sn phm, khách
hàng, a lý. Nu h thng ngun d liu ang c tái cu trúc li có cái
nhìn nht quán thì s là u tuyt vi. Vic n lc tích hp các ng dng ca
doanh nghip nh th s làm cho vic thit k kho d liu d dàng hn nhiu.
Khu vc tng d liu (Data Staging Area): khu vc tng d liu ca kho d
liu là cp ti c vic lu tr và các qui trình x lí ph bin nh là trích
xut-chuyn i-np d liu. Khu vc tng d liu là tt c mi th gia các
thng ngun d liu và khu vc trình bày d liu. Trong kho d liu, d
liu làm vic thô c chuyn i vào kho d liu chuyn giao cho ngi
dng có yêu cu truy vn và s dng. Do ó, ngi dùng s không c
phép truy cp vào khu vc tng d liu này. Khu vc tng d liu b chi phi
i các hot ng n gin là phân loi và x lý tun t. Trong nhiu trng
p, khu vc tng d liu không da trên công ngh liên quan mà thay vào ó
là bao gm mt h thng các tp tin. Sau khi xác nhn d liu cho phù hp vi
nhng quy tc công vic c nh ngha là mt-mt và mt-nhiu, thì bc
cui cùng trong vic xây dng mt c s d liu vt lý chun 3 y là vô
ngha.
Trình bày d liu (Data Presentation): Khu vc trình bày d liu là ni d
liu c t chc, lu tr và sn có cho các truy vn trc tip ca ngi s
ng, các báo cáo và các ng dng phân tích khác. Vì khu vc tng d liu là
khu vc sân sau nên khu vc trình bày s là kho d liu cho các công vic x
lý liên quan. ó là tt c nhng th mà vic x lý d liu cn quan tâm thông
qua các công c truy cp d liu. Chúng ta thng xem khu vc trình bày nh
là mt lot các khi d liu tích hp li. Theo hình thc n gin nht ca nó,
t data mart trình bày d liu t mt qui trình công vic n gin.
Mô hình chiu là mt tên mi cho mt k thut c làm cho c s d liu n
gin và d hiu. T tng trng này n trng hp khác, bt u t nhng
m 1970, các t chc, công ty t vn, ngi dùng và các nhà cung cp CNTT
ã hng v mt cu trúc chiu n gin làm cho các nhu cu c bn ca
con ngi phù hp vi s gin n.
- 14 -
Công nghip sau này ôi khi cp mô hình 3NF nh các mô hình ER. ER
là t vit tt ca Entity Relationship. ERD là vic v các hp và ng giao
tip các mi quan h gia các bng vi nhau. C hai mô hình 3NF và chiu
có thc trình bày trong ERDs bi vì c hai bao gm các bng quan h có
t ni vi nhau, s khác bit chính gia mô hình 3NF và chiu là mc
chun hóa. Vì c hai loi mô hình có thc trình bày theo dng ERDs, nên
chúng ta s không cp n các mô hình 3NF là mô hình ER; thay vào ó,
chúng ta s gi chúng là các mô hình chun hóa gim thiu s nhm ln.
Mô hình chun hóa là vô cùng hu ích cho vic x lý các công vic u
hành bi vì mt giao dch cp nht hoc chèn ch cn tác ng vào c s d
liu mt ni. Tuy nhiên, các mô hình chun hóa là quá phc tp i vi d
liu kho cho vic thc hin truy vn. Ngi dùng không th hiu, xác nh
hoc ghi nh các mô hình chun hóa tng t nh h thng ng giao
thông. Vic s dng các mô hình chun hóa trong khu vc trình bày d liu
a kho d liu s phá toàn b mc ích ca kho d liu, c th là, truy vn
liu trc quan và hiu sut cao.
Thay vào ó, mô hình chiu gii quyt các vn v lc phc tp trong
khu vc trình bày d liu. Mt mô hình chiu cha các thông tin ging nh
t mô hình chun hóa, nhng gói d liu trong nh dng thit k vi mc
c tiêu là làm cho ngi dùng d hiu, tng hiu sut truy vn và thay i
linh hot.
Trong mô hình chiu, có hai thut ng hay c s dng, ó là: bng s kin
(fact tables) và bng chiu d liu (dimension tables).
ng s kin (fact tables): mt bng s kin là mt bng chính trong mô
hình chiu có chc nng lu tr các d liu tng hp cho quá trình hot
ng. Ngi dùng c gng lu tr d liu tng hp t kt qu ca mt
quá trình công vic trong mt data mart n l. Bi vì d liu tng hp a
phn là ln nht trong bt k data mart nào nên cn tránh vic lp li nhiu
i khác.
- 15 -
Vic s dng thut ng kin là trình bày ln ca d liu. Chúng ta
có th tng tng là t mt th trng bit c sn phm ang c bán ra
i s lng bao nhiêu và doanh s mi ngày cho mi sn phm trong mi
a hàng nh th nào. ln d liu c thc hin ti các giao m ca
t c các chiu (ngày, sn phm và ca hàng). Danh sách các chiu s xác
nh c tính ca bng s kin tng hp và cho ta bit phm vi ca công vic
là gì.
ng chiu d liu (dimension tables):
ng chiu d liu là ngi ng hành không th tách ri vi bng s kin.
ng chiu d liu cha các mô t vn bn ca công vic. Trong mt mô
hình chiu, bng chiu d liu s có có nhiu ct hay nhiu thuc tính.
Nhng thuc tính này mô t các hàng trong bng chiu d liu. Trong bng
liu chiu, càng nhiu mô t vn bng càng tt. Vic bng d liu chiu
có khong 50 n 100 thuc tính trong nó là không ph bin. Kích thc
ng chiu d liu thng ít v s hàng (ít hn 1 triu hàng rt nhiu), nhng
có nhiu ct thuc tính. Mi chiu c xác nh bi khóa chính duy nht
a nó, c ký hiu là PK và là khóa ngoi cho bng s kin tng hp nào
t ni vi nó.
Hình 2.2 B
ng s
ki
n
(Ngu
n: tác gi
)
Hình 2.3 B
ng chi
u d
li
u
(Ngun: tác gi)
- 16 -
Thuc tính ca bng chiu d liu óng vai trò quan trng trong kho d liu.
i vì chúng là ngun gc ca hu ht tt c các ràng buc và d liu báo
cáo, nên chúng là chìa khóa làm cho kho d liu d hiu và d s dng. Sc
nh ca kho d liu là t l thun vi cht lng và chiu sâu ca các thuc
tính ca bng chiu d liu. Thi gian dành cho vic cung cp các thuc tính
i mô t k thut rõ ràng càng nhiu thì kho d liu càng tt. Thi gian
dành cho vic tính toán giá tr trong mt ct thuc tính càng nhiu thì kho d
liu càng tt. Thi gian dành cho vic m bo cht lng giá tr trong mt
t thuc tính càng nhiu thì kho d liu càng tt.
Công c truy cp d liu (Data Access Tools): thành phn chính cui cùng
trong môi trng kho d liu là các công c truy cp d liu. Vic s dng
thut ng công c là cp n sa dng v kh nng có thc cung
p cho ngi dùng tác ng lên khu vc trình bày d liu cho quá trình
phân tích ra quyt nh. Theo nh ngha, tt c các công c truy cp d liu
truy vn d liu t khu vc trình bày ca kho d liu. Rõ ràng, vic truy vn là
toàn b vn trong vic s dng kho d liu.
t công c truy cp d liu có thn gin nh mt công c truy vn c
bit hoc phc tp nh mt mô hình khai thác d liu hoc mô hình ng dng.
Các công c truy vn c bit có thc hiu và s dng có hiu qu ch vi
t nh t l ngi dùng nh hp trong kho d liu tim nng. Phn ln
ngi dùng mong mun truy cp d liu thông qua các ng dng tham s có
n. Mt s các công c truy cp d liu phc tp hn, nh các công c d
báo hoc mô hình, thc s có th np kt qu ca chúng tr li vào khu vc
ngun d liu h thng hoc các khu vc tng d liu/ trình bày d liu ca
kho d liu.
2.1.4. Mô hình d liu và vic thit k kho d liu:
Có 2 yu t chính trong vic xây dng mt kho d liu: thit k giao din t
các h thng u hành và thit k bn thân kho d liu. Kho d liu c xây dng
theo phong cách ci tin, ngha là mt giai n phát trin mi ph thuc hoàn toàn
vào kt qut c t các giai n trc ó. u tiên, mt phn d liu c xác