Tải bản đầy đủ (.pdf) (45 trang)

Báo cáo thực tập tốt nghiệp đề tài quản trị dữ liệu kinh doanh bằng hệ quản trị cơ sở dữ liệu oracle

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.94 MB, 45 trang )

HỌC VIỆN CHÍNH SÁCH VÀ PHÁT TRIỂN
KHOA KINH TẾ SỐ
----------

BÁO CÁO THỰC TẬP TỐT NGHIỆP
Đề Tài:

“ Quản Trị Dữ Liệu Kinh Doanh bằng
Hệ Quản Trị Cơ sở dữ liệu Oracle”

Đơn vị: Cơng ty TNHH Giải Pháp Phân Tích Dữ Liệu
Insight Data
Giảng viên hướng dẫn: Ths. Đỗ Thế Dương
Họ và tên sinh viên: Lê Trí Thành
Mã sinh viên: 7103101343
Lớp: KTDL10


LỜI CẢM ƠN
Sau thời gian học tập tại trường, sinh viên được hệ thống lại toàn bộ lý
thuyết chuyên ngành và được tham gia kiến tập một số khâu nghiệp vụ cơ bản
của các kiến thức lý thuyết đã được học. Được sự cho phép của Khoa Kinh Tế
Số và sự tiếp nhận của Công ty TNHH Giải Pháp Phân Tích Dữ Liệu Insight
Data; được sự quan tâm, chỉ đạo của quý thầy cô trong khoa Kinh Tế Số; em
bắt đầu q trình thực tập của mình tại Cơng ty TNHH Giải Pháp Phân Tích
Dữ Liệu Insight Data. Khoảng thời gian thực tập tuy ngắn ngủi nhưng em đã
được học hỏi, được trải nghiệm những công việc thực tế. Thời gian này đã cho
em những bài học kinh nghiệm quý báu, những kỹ năng cần thiết về ngành Dữ
Liệu Lớn mà trong thời gian học tập tại trường em chưa có, để em tự tin bước
vào mơi trường làm việc sau này.
Vì bài thực tập được thực hiện trong phạm vi thời gian hạn hẹp và hạn


chế về mặt kiến thức chun mơn, do đó bài báo cáo của em khơng thể tránh
khỏi những sai sót nhất định. Đồng thời bản thân báo cáo là kết quả của một
quá trình tổng kết, thu thập kết quả từ việc khảo sát thực tế, những bài học đúc
rút từ trong quá trình thực tập và làm việc của em. Em rất mong có được những
ý kiến đóng góp của thầy, cơ để bài báo cáo và bản thân em hoàn thiện hơn.
Qua bài báo cáo này, em xin cảm ơn thầy Đỗ Thế Dương- giảng viên
khoa Kinh Tế Số, Học Viện Chính Sách và Phát Triển. Trong thời gian thực tập
tại cơ quan, em đã được anh Nguyễn Văn Trưởng là một trong những lãnh đạo
của công ty cùng các anh/chị trong cơ quan giúp đỡ và chỉ dẫn tận tình, tạo điều
kiện để em hồn thành báo cáo của mình.
Em xin chân thành cảm ơn.
Sinh viên

Lê Trí Thành
1


MỤC LỤC
1.1 Giới thiệu về cơ sở thực tập................................................................... 3
1.2 Cơ cấu Tổ chức bộ máy ......................................................................... 3
1.2.1 Giới thiệu ban điều hành .................................................................. 4
1.2.2 Đội ngũ nhân sự chủ chốt ................................................................ 1
1.3.Chức năng các phịng ban ..................................................................... 1
1.4 Chính sách nhân sự ................................................................................ 2
1.6 Tầm nhìn, sứ mệnh và giá trị cốt lõi..................................................... 4
CHƯƠNG II. TÌM HIỂU NGHIỆP VỤ TẠI ĐƠN VỊ THỰC TẬP........... 6
2.1 Quản trị dữ liệu trong ngân hàng và doanh nghiệp ........................... 6
2.1.1 Quản trị dữ liệu trong doanh nghiệp ............................................... 6
2.1.2 Quản trị dữ liệu trong các ngân hàng ............................................. 7
2.2.1 Data Warehouse là gì? .................................................................... 12

2.2.2 Các thành phần hoặc các khối xây dựng của Data warehouse ... 12
2.2.3 Ưu điểm và nhược điểm của Data Warehouse – Kho Dữ liệu...... 17
2.2.4 Công cụ xây dựng kho dữ liệu ....................................................... 18
2.3. Ngôn ngữ PL/SQL ............................................................................... 19
2.3.1. Giới thiệu ngôn ngữ PL/SQL ........................................................ 19
2.3.2 Cấu trúc của PL/SQL ..................................................................... 21
2.3 Thực hành truy xuất dữ liệu bằng ngôn ngữ PL/SQL ..................... 29
2.3.1 Cài đặt và cấu hình SQL Developer ............................................... 29
2.3.2 Mơ tả dữ liệu ................................................................................... 30
2.3.3 Thiết kế Data Model........................................................................ 32
2.3.4 Xử lý yêu cầu truy xuất dữ liệu bằng PL/SQL .............................. 33
3.1 Kết quả tích cực đạt được ................................................................... 36
3.1.1 Về Kiến thức .................................................................................... 36
3.1.2 Về Kỹ Năng...................................................................................... 36
3.2 Bài học kinh nghiệm ............................................................................ 36
3.2.1 Bài học kinh nghiệm về cách thực hiện ........................................ 36
3.2.2 Bài học kinh nghiệm về kỹ năng .................................................... 36
3.2.3 Bài học kinh nghiệm về thái độ...................................................... 36

2


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

CHƯƠNG I. GIỚI THIỆU TỔNG QUAN VỀ CƠ SỞ THỰC TẬP
1.1 Giới thiệu về cơ sở thực tập
Đơn vị: Công Ty TNHH Giải Pháp Phân Tích Dữ Liệu Insight Data
Tên viết tắt: INDA
Năm thành lập: 2019
Trụ sở chính: Tầng 5, Tòa nhà NO2 Gold Season, 47 phố Nguyễn Tuân, Thanh

Xuân, Hà Nội
Hotline: 0986.882.818
Mã số thuế: 0109131988
Thành lập năm 2019, Công ty TNHH Giải Pháp Phân Tích Dữ Liệu
Insight Data hiện nay có hơn 100 nhân sự hoạt động tại Hà Nội và TP.Hồ Chí
Minh.
1.2 Cơ cấu Tổ chức bộ máy

Hình 1.1 Sơ đồ tổ chức bộ máy công ty

3

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

1.2.1 Giới thiệu ban điều hành

Hà Vũ Phượng
Giám đốc công ty
12 năm kinh nghiệm triển khai Dự án Data Warehouse / BI cho ngân
hàng, tập đoàn trong nhiều lĩnh vực khác nhau như: TechcomBank, VPBank,
SeaBank, Chuyên gia cao cấp về tư vấn chiến lược quản trị dữ liệu (Data
Governance). Đồng thời là giảng viên đào tạo công nghệ của hãng Oracle,
Microsoft, Giám Đốc Công Ty Google tại Việt Nam.

14 năm kinh nghiệm về CNTT trong

9 năm kinh nghiệm triển khai kho


lĩnh vực tài chính ngân hàng. Từng

dữ liệu trong nhiều lĩnh vực:

đảm nhiệm nhiều vị trí quan trọng

- Ngân hàng: Xây dựng Kho dữ liệu

như: Phó giám đốc dữ liệu, Tư vấn

cho Ngân hàng VPbank, chuyển đổi

cao cấp về giải pháp & quản trị dữ

báo cáo từ IBM Cognos cho

liệu, Kiến trúc sư trưởng, giám đốc

BIDV,...

các dự án về dữ liệu, triển khai các

- Bán lẻ: Xây dựng báo cáo Quản

dự án AI/ML cho ngân hàng tại

Trị Doanh nghiệp với Power BI, tích

indonesia và Singapore.


hợp dữ liệu kế tốn Misa,...Vin
Commerce trên nền tảng Google
Bigquery và Microsoft Power Bi.
4

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

Nguyễn Văn Trưởng
Giám đốc Học viện
7 năm kinh nghiệm triển khai về DWH/BI.
3 năm kinh nghiệm về tư vấn chiến lược và quản lý kinh doanh trong ngành
Dữ liệu đồng thời là chuyên gia về mảng đào tạo, nhân sự.
1.2.2 Đội ngũ nhân sự chủ chốt
Phạm Việt Hưng - Business Intelligence Expert
Nguyễn Việt Tân - Senior Data Analyst Leader
Bùi Văn Lực - Data Engineer Expert
Lương Đình Sơn - Data Analyst Expert
Tạ Văn Hưng - Data Architect Leader
1.3.Chức năng các phòng ban
Giám đốc công ty: Xác định phương hướng phát triển và đường lối kinh
doanh, tổ chức điều hành các hoạt động kinh doanh, mở rộng đối tác, mở rộng khách
hàng và quyết định đầu tư.

1

Recommandé pour toi


Suite du document ci-dessous

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

9

MKT101 Marketing Report
Marketing

2

100% (1)

BIZ102 Emotional Intelligence
Marketing

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99

100% (1)


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99



37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

Phịng Đào tạo: Có chức năng tham mưu cho Ban giám đốc về công tác xây
dựng và phát triển nguồn nhân lực.
Phịng Data Analyst: quản lý, thu thập, phân tích và xử lý dữ liệu, chọn lọc
thông tin để phân tích kinh doanh đưa ra báo cáo hoặc đánh giá về vấn đề nào đó
cho doanh nghiệp.
Phịng Google: Quản lý dữ liệu để phân tích số liệu thống kê, xây dựng quản
lý Website, xây dựng phát triển các ứng dụng trên chính hệ thống mà Google đang
sử dụng, Hỗ trợ doanh nghiệp từ quá trình lên kế hoạch, xây dựng, phát triển ứng
dụng đến tối ưu hóa và quản lý hệ thống.
Phòng Quản lý dự án: tham mưu, tư vấn cho Ban giám đốc công ty về các
vấn đề liên quan đến việc quản lý quá trình thực hiện dự án.
Phịng Kinh doanh, Marketing: Xây dựng và phát triển hình ảnh thương
hiệu, Thiết lập mối quan hệ với truyền thông, tham mưu cho Ban Giám đốc về chiến
lược marketing, sản phẩm và khách hàng.
Phịng Kế tốn, Hành chính, Nhân sự: lập sổ sách kế toán - các hoạt động
về tài chính, quản trị hành chính - nhân sự, tham mưu và hỗ trợ cho Ban giám đốc
về các vẫn đề liên quan đến nhân sự, nghiệp vụ, …
1.4 Chính sách nhân sự
Công ty luôn coi nguồn nhân lực là yếu tố cốt lõi và là tài sản quý giá. Đặt
mối quan hệ giữa Công ty và nhân viên là trung tâm, với mục tiêu cao nhất là sự phát
triển của Công ty luôn đồng hành với sự thỏa mãn về cơng việc và lợi ích của nhân
viên.
Tạo mọi điều kiện giúp mỗi cá nhân phát triển nghề nghiệp đồng thời xây
dựng một lực lượng nhân viên chuyên nghiệp, chuyên môn cao thơng qua các khóa

2

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99



37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

đào tạo theo quy trình của cơng ty. Cơng ty khuyến khích nhân viên chủ động trong
học tập và phát triển nghề nghiệp của bản thân.
Công ty luôn đa dạng hóa phương thức đào tạo nhằm tạo cho nhân viên nhiều
cơ hội học tập và phát triển.
1.5 Lĩnh vực hoạt động
1. Tư vấn và triển khai giải pháp dữ liệu: Khảo sát, đánh giá hệ thống dữ liệu
hiện tại của các cơng ty; cung cấp các giải pháp phân tích dữ liệu lớn, vận hành, bảo
trì hệ thống dữ liệu. cung cấp dịch vụ về cho các ngân hàng, doanh nghiệp:
- Triển khai kho dữ liệu & báo cáo BI (Data Warehouse/BI)
- Triển khai hồ dữ liệu (Data Lake)
- Triển khai Data LakeHouse
- Triển khai quản trị dữ liệu (Data Governance)
2. Cho thuê nhân sự - Data Outsourcing : Insight Data cung cấp dịch vụ thuê
ngoài chuyên gia tại các vị trí sau:
- Chuyên gia thiết kế DWH/ Data Model (Data Architect)
- Chuyên gia tổng hợp, xử lý, làm sạch dữ liệu (Data Engineer)
- Chuyên gia Phân tích dữ liệu (Data Analyst)
- Chuyên gia kiểm thử dữ liệu (Database Tester)
- Chuyên gia báo cáo thông minh (Business Intelligence)
- Đội ngũ tư vấn (Presale) để thực hiện POC (proof of concept) cho các dự án
về kho dữ liệu (Data Warehouse), báo cáo quản trị thông minh (BI)

3

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99



37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

3. Đào tạo: Cơng ty TNHH Giải Pháp Phân Tích Dữ Liệu Insight Data cung cấp
các khóa đào tạo từ cơ bản đến nâng cao và thành lập riêng một học viện đào tại có
tên Học viện đào tạo INDA.
4. Bản quyền phần mềm: Insight Data cung cấp các giải pháp CNTT, phần
mềm bản quyền (License) cho doanh nghiệp giúp vận hành và tối ưu chi phí.
- Giải pháp Google Workspace, Google Cloud
- Giải pháp Microsoft 365
- Giải pháp Oracle
1.6 Tầm nhìn, sứ mệnh và giá trị cốt lõi
Tầm nhìn
Cơng ty TNHH Giải Pháp Phân Tích Dữ Liệu Insight Data mục tiêu:
- Trở thành một trong những công ty đi đầu trong lĩnh vực Phân tích dữ
liệu phục vụ chiến lược kinh doanh.
- Là điểm đến đáng tin cậy với những dịch vụ chất lượng tốt nhất, định
hướng phát triển nghiêm túc hướng đến phục vụ các đối tác trong nước và
ngồi nước
Sứ mệnh
Cơng ty TNHH Giải Pháp Phân Tích Dữ Liệu Insight Data cung cấp các giải
pháp khai thác dữ liệu tối ưu, đảm bảo đáp ứng đúng nhu cầu cho các doanh nghiệp.
Giá trị cốt lõi
- “Chuyên nghiệp – Hợp tác – Sáng tạo – Linh hoạt ” - Chuyên nghiệp, sáng
tạo, linh hoạt trong làm việc, thúc đẩy sự hợp tác đôi bên cùng phát triển.

4

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99



37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

- Đội ngũ tư vấn trình độ chun mơn cao, giàu kinh nghiệm.
- Phương châm: Tận tâm, nhiệt huyết với khách hàng.
- Khát vọng phát triển và không ngừng thay đổi.
- Sự minh bạch trong hoạt động kinh doanh.

5

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

CHƯƠNG II. TÌM HIỂU NGHIỆP VỤ TẠI ĐƠN VỊ THỰC TẬP
2.1 Quản trị dữ liệu trong ngân hàng và doanh nghiệp
2.1.1 Quản trị dữ liệu trong doanh nghiệp
1. Mơ hình quản trị dữ liệu DAMA
Theo Hiệp hội Quản lý dữ liệu (Data Management Association – DAMA,
www.dama.org), QTDL bao gồm các lĩnh vực sau :
– Quản lý kiến trúc dữ liệu (Data Architecture Management):
– Phát triển dữ liệu (Data Development)
– Quản lý thao tác dữ liệu (Data Operation Management)
– Quản lý bảo mật dữ liệu (Data Security Management)
– Quản lý dữ liệu chủ (Reference & Master Data Management)
– Kho dữ liệu DN (Data warehousing and BI)
– Quản lý tài liệu và nội dung (Document and Content Management)
– Quản lý Metadata (Metadata management)
– Quản lý chất lượng dữ liệu (Data Quality Management)

2. Mơ hình quản trị dữ liệu DGI
Theo Viện Quản trị dữ liệu (Data Governance Institute – DGI), để triển khai
chương trình QTDL, sẽ gồm 3 nhóm:
– Kỹ thuật:
– Con người
– Quy trình: Theo mơ hình DGO

6

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

Hình 2.1 Mơ hình DGO

Đặc biệt lưu ý trong mơ hình DGI là: Doanh nghiệp khơng thể thực hiện thành
cơng chương trình QTDL nếu khơng có sự phối hợp chặt chẽ giữa nghiệp vụ, IT và
các đơn vị kinh doanh.
2.1.2 Quản trị dữ liệu trong các ngân hàng
Quản trị dữ liệu trong các doanh nghiệp nói chung và ngân hàng nói riêng đều
có 2 mục tiêu chính, bao gồm:
- Hài hịa dữ liệu trong tồn hệ thống thơng qua quy trình phối hợp và
chia sẻ giữa các bộ phận;
- Đảm bảo dữ liệu được sử dụng đúng cách bằng việc tránh đưa lỗi dữ
liệu vào hệ thống và hạn chế khả năng lạm dụng dữ liệu cá nhân về khách hàng và
thông tin nhạy cảm.

7


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

1. Hệ Thống hạ tầng dữ liệu

Hình 3.1 Mơ hình dữ liệu thực tế tại một ngân hàng với nhiều kho dữ liệu khác nhau.

Các ngân hàng hiện tại đang chưa thực sự quản trị dữ liệu do:
- Chiến lược dữ liệu nhằm phục vụ các mục tiêu kinh doanh của ngân hàng;
- Mơ hình kiến trúc tổng thể được quy hoạch dài hạn và quản lý bởi đơn vị
chuyên trách;
- Hệ thống các chính sách, quy định về dữ liệu để hướng dẫn các đơn vị trong
ngân hàng tuân thủ;
- Hệ thống siêu dữ liệu là nơi ghi nhận quá trình phát triển, luồng dữ liệu, ý
nghĩa của các phân hệ, bảng, trường dữ liệu;
- Chưa phân loại được dữ liệu, chưa có hệ thống Quản lý dữ liệu chủ.

Hình 4.1 Mơ hình dữ liệu thực tế tại một ngân hàng, tồn tại nhiều kho dữ liệu khác nhau

8

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

Hình 5.1 Mức đầu tư cho một khách hàng tại Việt Nam và các khu vực


2. Mơ hình tổ chức quản trị dữ liệu
Về nhận thức giá trị của dữ liệu đối với tổ chức, năm 2018 Phó chủ tịch Hiệp
hội Quản lý dữ liệu quốc tế (DAMA) Việt Nam thực hiện một khảo sát chuyên gia
trong phạm vi nhỏ về Mức độ trưởng thành của Quản trị dữ liệu trong ngân hàng.
Kết quả là nhận thức về giá trị của dữ liệu trong ngân hàng vẫn đang còn rất hạn chế,
mới đạt mức 1 - Chưa triển khai trong 6 mức trưởng thành của Quản trị dữ liệu.Các
ngân hàng còn đang rất lúng túng trong việc hiểu đúng giá trị của dữ liệu và cách
thức triển khai Quản trị dữ liệu.
Với mỗi khách hàng, các ngân hàng tại Việt Nam đầu tư trung bình khoảng
0.5$, trong khi đó các ngân hàng tại khu vực Châu Á Thái Bình Dương và khu vực
Châu Phi đầu tư 3.84$ và 3.53$, khu vực Trung Đông và Châu Âu mức đầu tư cao
hơn rất nhiều. Về mơ hình tổ chức, hiện tại phần lớn các ngân hàng đang chưa có
một đơn vị độc lập, chuyên trách quản trị và khai thác dữ liệu.
Các ngân hàng hiện đang phân bổ các đơn vị quản trị và khai thác dữ liệu
thành các đơn vị trực thuộc Khối và chưa tập trung.

9

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

3. Thực trạng Quản trị dữ liệu trong các Ngân hàng thương mại tại Việt
Nam
Thực trạng Quản trị dữ liệu trong các ngân hàng thương mại Việt Nam Quản
trị dữ liệu xuất hiện từ những năm 1990 - 2010, khi mà các tổ chức bắt đầu xây dựng
kho dữ liệu (Data Warehouse) để lưu trữ và quản lý dữ liệu dựa trên các mơ hình dữ
liệu (data model). Tuy nhiên, ở giai đoạn /này, Quản trị dữ liệu chỉ xoay quanh từng
hệ thống đơn lẻ, chưa có sự gắn kết trên toàn bộ hệ thống. Phải đến năm 2010 khi

dữ liệu ngày càng tăng cao thì khái niệm Quản trị dữ liệu tồn diện mới thực sự hình
thành với 3 trụ cột chính: Con người - mơ hình tổ chức, Chính sách - quy định, và
Cơng nghệ dữ liệu.
Tại Việt Nam, khái niệm Quản trị dữ liệu cũng được đưa vào khá sớm, năm
2014, ngân hàng TMCP Việt Nam Thịnh Vượng đã triển khai dự án Khung Quản trị
Dữ liệu và bắt đầu áp dụng Quản trị dữ liệu ở quy mô nhỏ, Quản trị chất lượng dữ
liệu vào năm 2015. Từ năm 2014 đến nay, các ngân hàng đã manh nha việc triển
khai Quản trị dữ liệu toàn diện. Tuy nhiên kết quả vẫn còn rất hạn chế, khi hiện tại
các ngân hàng triển khai Quản trị dữ liệu vẫn chỉ đếm trên đầu ngón tay, nếu đánh
giá một cách thực sự cơng tâm, thì mức độ triển khai của các ngân hàng này vẫn chỉ
ở mức bắt đầu, sơ khởi.
Thực tế cho thấy, trong nhiều năm phần lớn các ngân hàng sử dụng dữ liệu rải
rác từ khắp các bộ phận trong hệ thống. Các bộ phận riêng biệt triển khai các hệ
thống xử lý giao dịch chuyên biệt mà khơng có sự phối hợp tập trung với dữ liệu
tồn ngân hàng. Chính vì vậy, quản trị dữ liệu được hình thành nhằm tập hợp và
thống nhất dữ liệu trong toàn hệ thống ngân hàng.

10

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

4. Giải pháp dành cho các ngân hàng tại Việt Nam
Từ thực tiễn nêu trên, NHNN cần có những hướng dẫn cụ thể về quản lý dữ
liệu nhằm khuyến khích các ngân hàng khai thác những đóng góp tích cực của quản
lý dữ liệu, đồng thời ban hành những quy định về tính tuân thủ cao dành cho các
ngân hàng nhằm bảo vệ quyền riêng tư của khách hàng, cũng như quyền riêng tư dữ
liệu. Ngoài ra, ngân hàng cũng nên thể hiện tính chủ động và tiên phong trong quản

trị dữ liệu, tập trung vào 2 nội dung chính, bao gồm thiết lập tầm nhìn và chiến lược
cho hoạt động quản trị dữ liệu và quá trình hiện thực hố các chính sách đã đề ra. Cụ
thể:
Một là, do tính chất phức tạp của quản trị dữ liệu, vốn cần có sự phối hợp giữa
đơn vị nghiệp vụ và công nghệ thông tin nên việc triển khai quản trị dữ liệu cần phải
bắt đầu từ các lãnh đạo cấp cao, cụ thể ở đây là Chủ tịch Hội đồng Quản trị hoặc
Tổng Giám đốc. Khi những lãnh đạo cấp cao này nhìn thấy giá trị của dữ liệu, thì
mới có thể bắt đầu chương trình quản trị dữ liệu hiệu quả trong ngân hàng.
Hai là, các ngân hàng nên bổ sung chức danh vị trí Giám đốc điều hành dữ
liệu (CDO). Các ngân hàng Việt Nam có thể cân nhắc bổ sung vị trí CDO trong ngân
hàng, đồng thời cần làm rõ chức năng nhiệm vụ của CDO cũng như các yêu cầu cụ
thể về năng lực.
Ba là, ngân hàng cần thành lập đơn vị chuyên trách quản trị dữ liệu để liên kết
các đơn vị trong ngân hàng cùng tham gia vào hoạt động quản trị dữ liệu do CDO
đứng đầu.
Bốn là, chuẩn bị cơ sở hạ tầng tốt cho công tác quản trị dữ liệu. Cơ sở hạ tầng
ở đây bao gồm cơ sở hạ tầng về con người và công nghệ.
2.2 Kiến thức cơ bản về kho dữ liệu – Data Warehouse

11

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

2.2.1 Data Warehouse là gì?
Data Warehouse (DW) là một hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS)
được xây dựng để đáp ứng yêu cầu của hệ thống xử lý giao dịch. Data Warehouse
hỗ trợ kiến trúc và công cụ cho các nhà quản trị doanh nghiệp để tổ chức, hiểu và sử

dụng thông tin của họ một cách có hệ thống để đưa ra các quyết định chiến lược.
DW có thể được xem như một hệ thống dữ liệu với các thuộc tính sau:
- Là một cơ sở dữ liệu được thiết kế cho các nhiệm vụ điều tra, sử dụng
dữ liệu từ các ứng dụng khác nhau.
- Hỗ trợ một số lượng tương đối nhỏ khách hàng với các tương tác
tương đối dài.
- Bao gồm dữ liệu hiện tại và lịch sử để cung cấp một quan điểm lịch
sử của thơng tin.
- Việc sử dụng nó là đọc chuyên sâu.
- Chứa một vài bảng lớn.
Môi trường Data Warehouse chứa giải pháp khai thác, vận chuyển và tải
(ETL), cơng cụ xử lý phân tích trực tuyến (OLAP), các cơng cụ phân tích khách
hàng và các ứng dụng khác xử lý q trình thu thập thơng tin và cung cấp cho người
dùng doanh nghiệp.
2.2.2 Các thành phần hoặc các khối xây dựng của Data warehouse
Kiến trúc là sự sắp xếp hợp lý của các yếu tố. Data warehouse được xây dựng
với các thành phần phần mềm và phần cứng. Có những cách xây dựng Data
Warehouse khác nhau và tùy thuộc hoàn cảnh.

12

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

Hình 6.1 Kiến trúc Data Warehouse

Thành phần Dữ liệu nguồn hiển thị ở bên trái. Phần tử dàn dữ liệu đóng vai
trị là khối xây dựng tiếp theo.

Ở giữa, chúng ta thấy thành phần Data Storage xử lý dữ liệu của các Data
warehouse. Yếu tố này không chỉ lưu trữ và quản lý dữ liệu; nó cũng theo dõi dữ
liệu bằng cách sử dụng kho siêu dữ liệu.
Thành phần Cung cấp thông tin hiển thị ở bên phải bao gồm tất cả các cách
khác nhau để cung cấp thông tin từ Data warehouse cho người dùng.
1. Thành phần dữ liệu nguồn
Dữ liệu nguồn đi vào Data warehouse có thể được nhóm thành bốn loại lớn:
Production Data: Loại dữ liệu này đến từ các hệ điều hành khác nhau của
doanh nghiệp. Dựa trên các yêu cầu về dữ liệu trong Data Warehouse mà phải chọn
các phân đoạn dữ liệu từ các chế độ hoạt động khác nhau.
Internal Data: Trong mỗi tổ chức, khách hàng lưu giữ các bảng tính, báo cáo,
hồ sơ khách hàng và đơi khi thậm chí cả cơ sở dữ liệu bộ phận “riêng tư” của họ.
Đây là dữ liệu nội bộ, một phần có thể hữu ích trong Data warehouse.

13

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

Archived Data: Các hệ thống hoạt động chủ yếu nhằm mục đích điều hành
cơng việc kinh doanh hiện tại.
External Data: Hầu hết các giám đốc điều hành phụ thuộc vào thơng tin từ
các nguồn bên ngồi cho một tỷ lệ lớn thông tin họ sử dụng
2. Thành phần cấu trúc dữ liệu

Hình 7.1 ETL dữ liệu trong Data Warehouse

Trích xuất dữ liệu: Phương pháp này phải xử lý nhiều nguồn dữ liệu. Ta phải

sử dụng các kỹ thuật thích hợp cho từng nguồn dữ liệu.
Chuyển đổi dữ liệu: Làm sạch, chuẩn hóa dữ liệu
Khi chức năng chuyển đổi dữ liệu kết thúc, chúng ta có một tập hợp dữ liệu
tích hợp được làm sạch, chuẩn hóa và tóm tắt.
Tải dữ liệu: Hai loại nhiệm vụ riêng biệt tạo thành các chức năng tải dữ liệu.
Khi đã hoàn thành cấu trúc và xây dựng Data warehouse và đi vào hoạt động lần đầu
tiên, phải thực hiện tải thông tin ban đầu vào kho lưu trữ dữ liệu. Tải ban đầu di
chuyển khối lượng lớn dữ liệu sử dụng một lượng thời gian đáng kể.
3. Thành phần lưu trữ dữ liệu
Lưu trữ dữ liệu cho Data warehouse là một kho lưu trữ chia nhỏ. Data
warehouse cho các hệ thống hoạt động thường chỉ bao gồm dữ liệu hiện tại. Ngoài

14

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

ra, các Data warehouse này bao gồm dữ liệu có cấu trúc được chuẩn hóa cao để xử
lý nhanh chóng và hiệu quả.
4. Thành phần cung cấp thông tin
Phần tử cung cấp thông tin được sử dụng để cho phép q trình đăng ký tệp
Data warehouse và chuyển nó đến một hoặc nhiều điểm đến theo một số thuật toán
lập lịch do khách hàng chỉ định.
5. Thành phần siêu dữ liệu
Siêu dữ liệu trong Data warehouse giống như từ điển dữ liệu hoặc danh mục
dữ liệu trong hệ quản trị cơ sở dữ liệu. Trong từ điển dữ liệu, ghi dữ liệu về cấu trúc
dữ liệu logic, dữ liệu về bản ghi và địa chỉ, thông tin về chỉ mục, v.v.
Nó bao gồm một tập hợp con dữ liệu tồn cơng ty có giá trị đối với một nhóm

người dùng cụ thể. Dữ liệu trong Data warehouse phải khác hiện tại. Các Data
Warehouse thấp hơn các Data warehouse và thường chứa tổ chức. Xu hướng hiện tại
trong Data warehouse là phát triển một Data warehouse với một số Data warehouse
liên quan nhỏ hơn cho các loại truy vấn và báo cáo cụ thể.
6. Thành phần quản lý và kiểm soát
Các yếu tố quản lý và kiểm soát điều phối các dịch vụ và chức năng trong
Data warehouse. Các thành phần này kiểm soát việc chuyển đổi dữ liệu và chuyển
dữ liệu vào Data warehouse lưu trữ. Nó giám sát sự di chuyển của thông tin vào
phương thức dàn dựng và từ đó vào chính các Data warehouse lưu trữ.

15

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

2.2.3 Quy trình triển khai kho dữ liệu
Quy trình thực hiện

Hình 8.1 Thực hiện xây kho dữ liệu - DW

Xây dựng tăng dần: Data Warehouse phải được xây dựng tăng dần. Triển
khai Data Mart rồi sau đó đến Data Warehouse.
Cần một nhà vô địch: Một dự án Data Warehouse phải có một người tích cực
để thực hiện các tương tác với mọi người trong doanh nghiệp; có thể thuyết phục
đồng nghiệp và nghiên cứu đáng kể về giá cả và lợi ích dự kiến của dự án.
Hỗ trợ quản lý cấp cao: Một dự án Data Warehouse phải được hỗ trợ đầy đủ
bởi quản lý cấp cao. Một dự án kho cần một cam kết bền vững từ quản lý cấp cao.
Đảm bảo chất lượng: Hồ sơ duy nhất đã được làm sạch và có chất lượng

được các tổ chức ngầm định nên được tải vào Data Warehouse.
Chiến lược công ty: Một dự án Data Warehouse phải phù hợp với chiến lược
và mục tiêu kinh doanh của công ty. Mục đích của dự án phải được xác định trước
khi bắt đầu các dự án.
Kế hoạch kinh doanh: Chi phí tài chính (phần cứng, phần mềm và phần mềm
con người), lợi thế dự kiến và kế hoạch dự án cho một dự án Data Warehouse phải
16

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

được vạch ra rõ ràng và được tất cả các bên liên quan hiểu rõ. Nếu khơng có sự hiểu
biết như vậy, những tin đồn về chi tiêu và lợi ích có thể trở thành nguồn dữ liệu duy
nhất, lật đổ các dự án.
Đào tạo: Các dự án Data Warehouse không được bỏ qua các yêu cầu đào tạo
về Data Warehouse. Để một dự án Data Warehouse thành công, khách hàng phải
được đào tạo để sử dụng các kho và hiểu rõ khả năng của nó.
Khả năng thích ứng: Dự án nên xây dựng tính linh hoạt để có thể thực hiện
các thay đổi đối với Data Warehouse nếu và khi được yêu cầu. Giống như bất kỳ hệ
thống nào, Data Warehouse sẽ yêu cầu thay đổi khi nhu cầu của doanh nghiệp thay
đổi.
Quản lý chung: Dự án phải được xử lý bởi cả các chuyên gia CNTT và kinh
doanh trong doanh nghiệp. Để đảm bảo giao tiếp thích hợp với các bên liên quan và
dự án là mục tiêu hỗ trợ hoạt động kinh doanh của doanh nghiệp, chuyên gia kinh
doanh phải tham gia vào dự án cùng với các chuyên gia kỹ thuật.
2.2.3 Ưu điểm và nhược điểm của Data Warehouse – Kho Dữ liệu
1. Ưu điểm của kho dữ liệu
Kho dữ liệu cung cấp thông tin phù hợp về các hoạt động đa chức năng khác

nhau. Nó cũng hỗ trợ báo cáo và truy vấn đặc biệt.
Giúp tích hợp nhiều nguồn dữ liệu để giảm căng thẳng cho hệ thống sản xuất.
Giúp giảm tổng thời gian quay vịng để phân tích và báo cáo. Tái cấu trúc và
tích hợp giúp người dùng dễ sử dụng hơn để báo cáo và phân tích.
Cho phép người dùng truy cập dữ liệu quan trọng từ số lượng nguồn ở một
nơi duy nhất. Do đó, nó giúp tiết kiệm thời gian lấy dữ liệu của người dùng từ nhiều
nguồn.

17

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66

Lưu trữ một lượng lớn dữ liệu lịch sử. Điều này giúp người dùng phân tích
các khoảng thời gian và xu hướng khác nhau để đưa ra dự đoán trong tương lai.
2. Nhược điểm của kho dữ liệu
- Không phải là một lựa chọn lý tưởng cho dữ liệu phi cấu trúc.
- Có thể bị lỗi thời tương đối nhanh Khó thực hiện thay đổi về kiểu và phạm
vi dữ liệu, lược đồ nguồn dữ liệu, chỉ mục và truy vấn.
- Có vẻ dễ dàng, nhưng thực sự, nó quá phức tạp đối với người dùng trung
bình. Tương lai của kho dữ liệu Thay đổi các ràng buộc quy định có thể hạn chế khả
năng kết hợp nguồn dữ liệu khác nhau.
- Khi kích thước của cơ sở dữ liệu tăng lên, các ước tính về những gì tạo nên
một cơ sở dữ liệu rất lớn tiếp tục phát triển. Việc xây dựng và chạy các hệ thống kho
dữ liệu ln tăng kích thước là rất phức tạp.
- Các tài ngun phần cứng và phần mềm có sẵn ngày hơm nay không cho
phép giữ một lượng lớn dữ liệu trực tuyến. Dữ liệu đa phương tiện không thể dễ
dàng thao tác dưới dạng dữ liệu văn bản, trong khi thông tin văn bản có thể được

truy xuất bằng phần mềm quan hệ hiện có. Đây có thể là một chủ đề nghiên cứu.
2.2.4 Cơng cụ xây dựng kho dữ liệu
Có rất nhiều cơng cụ có sẵn trên thị trường. Đây là một số nổi bật nhất:
Google BigQuery

Hình 9.1 Google BigQuery

18

37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99


×