Tải bản đầy đủ (.pdf) (88 trang)

XÂY DỰNG HỆ HỖ TRỢ RA QUYẾT ĐỊNH CHO CÔNG TY CREAIN VIETNAM COMPANY LIMITED

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.2 MB, 88 trang )

HỌC VIỆN NGÂN HÀNG
KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ

-----🙞🙜🕮🙞🙜-----

BÁO CÁO KIỂM TRA 1 MÔN HỆ HỖ TRỢ RA QUYẾT ĐỊNH
VÀ KINH DOANH THÔNG MINH
ĐỀ TÀI:
XÂY DỰNG HỆ HỖ TRỢ RA QUYẾT ĐỊNH CHO CƠNG TY
CREA-IN VIETNAM COMPANY LIMITED
Nhóm thực hiện: Nhóm 11
Giảng viên hướng dẫn: Cơ Nguyễn Thùy Linh

Hà nội, tháng 12 năm 2021


NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
………………………………………………………………………………………………
…....…………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………


………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
……………………………………
Kết luận:………………………………………………………………………………
Hà Nội, ngày… tháng… năm 2021.
Giảng viên hướng dẫn
(Ký tên)

2


Nhóm 11 bao gồm các thành viên:
Tên

Mã sinh viên

Tỉ lệ đóng góp (%)

Cao Hữu Phước (nhóm trưởng)

21A4040088

25%

Vũ Văn Thắng


21A4040104

25%

Nguyễn Bá Hiếu

21A4040033

25%

Phạm Hồng Minh

21A4040074

25%

3


Mục Lục
Câu 1:

5

1.1. Những điểm khác nhau của kho dữ liệu và cơ sở dữ liệu

5

1.2. Phân loại kho dữ liệu


6

1.3. Có mấy cách tiếp cận xây dựng Kho dữ liệu? Sự khác nhau giữa cách tiếp cận
này?
6
Câu 2:

7

2.1. Tại sao cần phải tích hợp dữ liệu từ nhiều nguồn?

7

2.2. Một số vấn đề liên quan tới tích hợp dữ liệu

8

Câu 3:

11

3.1. Quản lý chất lượng dữ liệu là gì?

11

3.2. Cần quản lý chất lượng dữ liệu vì:

11


Câu 4:

13

4.1.

Giới thiệu cơng ty

13

4.2.

Quy trình phân tích

13

Câu 5: Giới thiệu hệ thống nguồn

15

5.1.

Hệ thống Nguồn 1 (SQL Source)

16

5.2.

Hệ thống Nguồn 2 (Oracle Source)


21

5.3.

Hệ thống nguồn 3 (Excel)

21

5.4.

Hệ thống Nguồn 4 (CRM)

22

Câu 6:

24

6.1. Thiết kế bảng Dim, fact

24

6.2. Mô tả trường dữ liệu bảng Dim, Fact

24

6.3. Sơ đồ hình bơng tuyết

43


6.4.

44

Cập nhật dữ liệu vào kho dữ liệu

4


Câu 1:
1.1. Những điểm khác nhau của kho dữ liệu và cơ sở dữ liệu
Tham số
Cơ sở dữ liệu
Mục đích

Chức năng

Phương pháp xử lý

Để ghi và truy vấn dữ liệu

Để xử lý và phân tích dữ liệu

Hỗ trợ các hoạt động hàng

Hỗ trợ quyết định mang tính

ngày

chiến lược


Xử lý giao dịch trực

Xử lý phân tích trực

tuyến(OLTP)

tuyến(OLAP)

Có độ phức tạp cao vì chúng
Các bảng và ghép nối

được chuẩn hóa (cho RDMS)
để giảm dữ liệu thừa, tối ưu
hóa dung lượng lưu trữ

Tính chất dữ liệu

Kho dữ liệu

Chi tiết, được cập nhật thường
xuyên

Bảng và phép nối rất dễ dàng
trong kho dữ liệu vì chúng
khơng được chuẩn hóa.
Có tính lịch sử và thống kê,
được thêm mới chứ không cập
nhật


Phương pháp tiếp cận quan hệ Phương pháp tiếp cận đa chiều
Lưu trữ dữ liệu

phẳng, nhiều dữ liệu khác

và chuẩn hóa, nhiều nguồn dữ

nhau được tích hợp vào một

liệu khác nhau được tích hợp

nguồn

và định dạng lại

Sử dụng

Thường xuyên

Đơn vị công việc

Giao dịch đơn giản, ngắn

5

Trong những trường hợp đặc
biệt
Các câu truy vấn phức tạp



Thơng lượng giao dịch, có thể
Độ đo

thực hiện nhiều giao dịch cùng
một lúc

Thông lượng truy vấn và trả
lời

Sự định hướng

Định hướng ứng dụng

Định hướng chủ đề

Mơ hình sử dụng

Mơ hình quan hệ – thực thể

Mơ hình dữ liệu đa chiều

Loại truy vấn

Những truy vấn giao dịch đơn
giản được sử dụng.

Hiệu suất truy vấn phân tích

Thấp


Những truy vấn phức tạp được
áp dụng cho mục đích phân
tích.
Cao

1.2. Phân loại kho dữ liệu
- Kho dữ liệu doanh nghiệp (Enterprise Data Warehouse): Là một kho tập trung cung
cấp các dịch vụ hỗ trợ ra quyết định trong toàn doanh nghiệp. EDW thường là một tập
hợp các cơ sở dữ liệu cung cấp một cách tiếp cận thống nhất để tổ chức dữ liệu và
phân loại dữ liệu theo chủ đề.
-

Kho dữ liệu hoạt động (Operational Data Store): Là cơ sở dữ liệu trung tâm được sử
dụng để báo cáo hoạt động như một nguồn dữ liệu cho kho dữ liệu doanh nghiệp được
mô tả ở trên. ODS là một yếu tố bổ sung cho EDW và được sử dụng để báo cáo hoạt
động, kiểm soát và ra quyết định. ODS được làm mới theo thời gian thực, khiến nó
thích hợp hơn cho các hoạt động thường ngày như lưu trữ hồ sơ nhân viên. Mặt khác,
EDW được sử dụng để hỗ trợ các quyết định chiến thuật và chiến lược

-

Data Mart: được coi là một tập hợp con của một kho dữ liệu và thường được định
hướng cho một nhóm cụ thể hoặc kinh doanh đường, chẳng hạn như tài chính hoặc
doanh thu. Nó hướng tới chủ đề, làm cho dữ liệu cụ thể có sẵn cho một nhóm người
dùng xác định nhanh hơn, cung cấp cho họ thông tin chi tiết quan trọng.

6


1.3. Có mấy cách tiếp cận xây dựng Kho dữ liệu? Sự khác nhau giữa cách tiếp cận

này?
Có 2 cách tiếp cận xây dựng kho dữ liệu: Top-down và Bottom-up
a.Top-down: Cách tiếp cận này khá đơn giản và dễ hiểu. Đầu tiên, ta xây dựng data
warehouse trước, sau đó data mart được xây dựng trên data warehouse bằng cách chọn ra
các dữ liệu cần thiết với đôi tượng kinh doanh hoặc phòng ban cụ thể.
-

Ưu điểm

● Dễ phát triển một data mart mới, thích nghi nhanh với sự thay đổi trong mơi trường
kinh doanh
● Chi phí ban đầu có thể cao, nhưng chi phát triển sau đó thấp
● Cung cấp góc nhìn dữ liệu theo chiều nhất qn trên các data mart( vì cùng từ một
nguồn là data warehouse mà ra)
-

Nhược điểm

● Chi phí, thời gian lớn ( vì dự án implement theo cách này thường lớn)
● Team cần có kinh nghiệm và kĩ năng tốt để cài đặt.
b.Bottom-up: Hướng tiệp cận này ngược lại với hướng top-down. Ta xây dựng data-mart
trước, sau khi ta tạo xong data mart rồi, mới xây dựng data warehouse.
-

Ưu điểm

● Các data mart có thể được deliver nhanh chóng
● Có khả năng cung cấp các bản report nhanh
● Mở rộng data warehouse dễ dàng khi có sự thay đối, thêm mới các đơn vị phịng ban
● Tiêu tốn thời gian ít hơn, thiết lập ban đầu cũng nhanh hơn

-

Nhược điểm

● Chi phí ban dầu có thê thấp, nhưng sau đó đắt
● Khó bảo trì

7


Câu 2:
2.1. Tại sao cần phải tích hợp dữ liệu từ nhiều nguồn?
Dữ liệu được lưu trong Kho dữ liệu không được tạo ra trực tiếp từ người dùng mà
được lấy từ các nguồn dữ liệu sẵn có và mục đích là phục vụ tạo ra các báo cáo quản trị
do đó nó phải được tích hợp từ nhiều nguồn. Ví dụ: Tại một bệnh viện, các phịng khác
nhau sẽ thực hiện các xét nghiệm khác nhau, do đó để có được đầy đủ thơng tin phục vụ
chẩn đốn thì cần thu thập được kết quả từ nhiêu nguồn. Điều này hoàn toàn tương tự như
tại doanh nghiệp, dữ liệu cần để phân tích có thể nằm rải rác ở nhiều hệ thống tác nghiệp
khác nhau, và vì vậy cần tích hợp lại.
Q trình tích hợp này sẽ được thực hiện trong quá trình ETL. Việc tổng hợp dữ
liệu từ nhiều nguồn vào một kho dữ liệu cho phép chúng ta có thể xem đồng thời nhiều
chỉ số khác nhau (từ nhiều hệ thống nghiệp vụ khác nhau), ví dụ ta có thể xem chỉ tiêu
doanh thu ở nhiều mảng nghiệp vụ khác nhau để có thể so sánh được sự tương quan giữa
các mảng nghiệp vụ này. Từ đó đưa ra được các thơng tin hữu ích và có chiều sâu hơn
giúp ra quyết định kinh doanh, tăng doanh thu và tạo lợi thế cạnh tranh.
Tích hợp dữ liệu cũng giảm sai sót dữ liệu trên tồn hệ thống. Điều này đặc biệt
tăng trải nghiệm khách hàng và mối quan hệ giữa khách hàng và doanh nghiệp.
2.2. Một số vấn đề liên quan tới tích hợp dữ liệu
2.2.1. Các vấn đề khi tích hợp:
Tích hợp nhiều hệ thống thơng tin thường nhằm mục đích kết hợp các hệ thống

thành một tổng thể thống nhất, đưa cho người dùng trải nghiệm tương tác với một hệ
thống duy nhất. Người dùng được cung cấp một cái nhìn logic đồng nhất về dữ liệu được
phân phối vật lý trên các nguồn dữ liệu khác nhau.
Việc tích hợp dữ liệu địi hỏi việc phải phát hiện và giải quyết các xung đột giữa các
lược đồ (schema) và dữ liệu liên quan đến cấu trúc và ngữ nghĩa. Bởi các hệ thống nguồn
thường không được thiết kế để tích hợp ngay từ đầu. Với mục tiêu là cung cấp một cái
nhìn đồng nhất về dữ liệu từ các nguồn khác nhau, các công việc tích hợp sẽ dựa trên:


Khung kiến trúc của một hệ thống



Nội dung và chức năng của hệ thống thành phần



Loại thông tin được quản lý bởi các hệ thống thành phần (chữ và số, dữ liệu đa
phương tiện, dữ liệu có cấu trúc, bán cấu trúc, phi cấu trúc)
8




Mục đích sử dụng (quyền truy cập chỉ đọc hay có thể chỉnh sửa)



Yêu cầu về hiệu suất




Các nguồn lực sẵn có (con người, thời gian, ngân sách, kiến thức,…)
Ngồi ra, các yếu tố không đồng nhất giữa các hệ thống cần được xem xét:



Phần cứng và hệ điều hành



Phần mềm quản lý dữ liệu



Mơ hình dữ liệu, lược đồ và ngữ nghĩa dữ liệu



Phần mềm trung gian



Giao diện người dùng



Các quy tắc kinh doanh và ràng buộc về tính tồn vẹn

2.2.2. Cách tiếp cận:

Hình dưới đây mơ tả về việc tích hợp dữ liệu giữa hai hệ thống ở các mức:



Manual Integration (Tích hợp thủ cơng): Người dùng tương tác trực tiếp với tất cả hệ
thống liên quan, yêu cầu phải có kiến thức chi tiết về ngơn ngữ truy vấn và vị trí, lược
đồ và ngữ nghĩa dữ liệu của các hệ thống.



Common User Interface (Giao diện người dùng chung): Người dùng được cung cấp
giao diện chung để được cung cấp một giao diện đồng nhất. Dữ liệu được trình bày

9


đầy đủ nhưng riêng biệt và vẫn yêu cầu người dùng phải tích hợp (ví dụ: Tìm
kiếm,…)


Intergration by Applications (Tích hợp theo ứng dụng): Cách tiếp cận này sử dụng các
ứng dụng tích hợp dữ liệu từ các nguồn dữ liệu khác nhau và trả về kết quả tích hợp
cho người dùng. Giải pháp này có thể nhanh và rẻ, tuy nhiên các ứng dụng sẽ ngày
một lớn và cần phát triển bởi sự phát triển của dữ liệu, định dạng dữ liệu trên hệ
thống.



Middleware Integration (Tích hợp dùng phần mềm trung gian): Cung cấp các chức
năng có thể giải quyết các vấn đề của tích hợp. Tuy nhiên các công cụ trung gian khác

nhau cần phải được kết hợp để tích hợp xây dựng hệ thống.



Uniform Data Access (Quyền truy cập dữ liệu thống nhất): Tích hợp dữ liệu vật lý
được thực hiện ở mức truy cập dữ liệu. Việc này cung cấp một cơ sở dữ liệu đồng
nhất tuy nhiên thời gian sẽ rất lâu bởi việc truy cập dữ liệu, đồng nhất và tích hợp
được thực hiện đồng thời.



Common Data Storage: Xây dựng datawarehouse.

2.2.3. Từ tích hợp cấu trúc đến ngữ nghĩa:
Việc tích hợp dữ liệu khơng chỉ là tích hợp về mặt kỹ thuật hay cấu trúc. u cầu cao
hơn của nó là tích hợp dữ liệu được mơ tả bởi các mơ hình dữ liệu khác nhau, có trường
hợp có thể cịn là khơng đồng nhất về ngữ nghĩa. Ngữ nghĩa rõ ràng và chính xác là một
yêu cầu cực kỳ quan trọng, nếu không sẽ gây những tổn thất lớn đến doanh nghiệp, thậm
chí có thể dẫn tới phá sản.
Để giải quyết vấn đề này, bản thể học (ontologies) - những mơ tả chính xác nhất và
rõ ràng về các khái niệm và các mối quan hệ của chúng cùng với các từ vựng được chia sẻ
để khắc phục việc không đồng nhất về ngữ nghĩa.
2.2.4. Tiêu chí ASME khi tích hợp dữ liệu:


Abstraction: Bảo vệ người dùng khỏi sự không đồng nhất ở mức độ thấp của các
nguồn dữ liệu cơ bản




Selection: Cân nhắc các khả năng người dùng lựa chọn nguồn dữ liệu được tích hợp
phục vụ cho việc trả lời câu hỏi nào? Mục đích gì?



Modeling correspond: Mơ hình hóa chính xác tương ứng với nhận thức và mong
muốn của người dùng về miền dữ liệu khi được tích hợp.
10




Explicit semantics: Ngữ nghĩa rõ ràng, trình bày các ngữ nghĩa trong thế giới thực dự
kiến của dữ liệu.
Link tham khảo: P. Ziegler. User-Specific Semantic Integration of Heterogeneous

Data: What Remains to be Done? Technical Report ifi-2004.01, Department of
Informatics, University of Zurich. 2004.html,
2004.
Câu 3:
3.1. Quản lý chất lượng dữ liệu là gì?
Quản lý chất lượng dữ liệu (DQM) là việc sử dụng các quy trình, phương pháp và cơng
nghệ để đảm bảo chất lượng của dữ liệu đáp ứng các yêu cầu kinh doanh cụ thể.
3.2. Cần quản lý chất lượng dữ liệu vì:
Sự gia tăng của dữ liệu trong thời đại kỹ thuật số đã đặt ra một thách thức thực sự đó
là sự khủng hoảng dữ liệu. Cuộc khủng hoảng dữ liệu kéo theo việc dữ liệu chất lượng
thấp trong tổng số lượng của nó, khiến các doanh nghiệp khó trong việc thấu hiểu dữ liệu
và trong một số trường hợp, khơng thể sử dụng được. Do đó, Việc quản lý chất lượng dữ
liệu đã trở thành một quy trình quan trọng được sử dụng để hiểu dữ liệu. Nó nhằm mục
đích giúp các tổ chức chỉ ra, thấy được các lỗi trong dữ liệu của doanh nghiệp họ cần phải

giải quyết. Ngồi ra, nó cũng nhằm mục đích đánh giá xem dữ liệu trong hệ thống của họ
có chính xác để phục vụ mục đích dự kiến của họ trong tương lai ​hay không.
Mô tả lý do tại sao bạn cần Quản lý chất lượng dữ liệu:
·      Hoạt động sản xuất kinh doanh của doanh nghiệp tốt hơn.
Tất cả các hoạt động cơ bản của một doanh nghiệp được quản lý một cách nhanh
chóng và hiệu quả khi dữ liệu đã được quản lý đúng cách theo một quy trình quản lý chất
lượng hiệu quả. Dữ liệu chất lượng cao giúp tăng cường khả năng ra quyết định ở tất cả
các cấp độ hoạt động và quản lý của doanh nghiệp
·      Sử dụng hiệu quả các nguồn lực
Dữ liệu chất lượng thấp trong một tổ chức có nghĩa là các nguồn lực bao gồm cả
nguồn lực tài chính được sử dụng một cách khơng hiệu quả. Khi các doanh nghiệp duy trì
chất lượng dữ liệu thông qua việc Quản lý chất lượng dữ liệu sẽ giúp họ khơng bị lãng phí

11


tài nguyên dẫn đến hoạt động kinh doanh hiệu quả hơn cũng như trong việc ra quyết định
của tổ chức.
·      Lợi thế cạnh tranh
Uy tín là điều quan trọng của mọi doanh nghiệp. Một doanh nghiệp có uy tín tốt sẽ
có được lợi thế cạnh tranh cao hơn so với những doanh nghiệp khác. Dữ liệu chất lượng
cao đảm bảo rằng doanh nghiệp duy trì được uy tín tốt. Dữ liệu chất lượng thấp đã được
chứng minh là gây mất lòng tin từ khách hàng, dẫn đến sự khơng hài lịng của họ đối với
các sản phẩm và dịch vụ của doanh nghiệp.
·      Là tiền đề cho kết quả kinh doanh tốt
Khi doanh nghiệp, tổ chức mở một chiến dịch tiếp thị, bán hàng từ dữ liệu sai sót
trong đó khách hàng mục tiêu khơng tồn tại hoặc định hướng sai khách hàng mục tiêu
điều này thực sự là khơng có hiệu quả gì cho việc kinh doanh cũng như chi phí doanh
nghiệp bỏ ra. Khi khách hàng tiềm năng đến từ nguồn dữ liệu chất lượng kém, thì khơng
có lý do gì để doanh nghiệp nhắm họ vào mục tiêu bằng các chiến dịch tiếp thị của doanh

nghiệp.
·      Tăng chi phí cho doanh nghiệp:
Dữ liệu xấu có thể gây ra hậu quả kinh doanh đáng kể cho các công ty. Dữ liệu
chất lượng kém thường được coi là nguồn gốc của lỗi hoạt động, phân tích khơng chính
xác và các chiến lược kinh doanh sai lầm. Ví dụ về thiệt hại kinh tế mà các vấn đề về chất
lượng dữ liệu có thể gây ra bao gồm chi phí tăng thêm khi sản phẩm được vận chuyển đến
sai địa chỉ của khách hàng, mất cơ hội bán hàng do hồ sơ khách hàng sai hoặc không đầy
đủ và tiền phạt do báo cáo tài chính hoặc tn thủ quy định khơng phù hợp.
Một ước tính được trích dẫn bởi IBM đã tính tốn rằng chi phí hàng năm cho các
vấn đề chất lượng dữ liệu ở Mỹ lên đến 3,1 nghìn tỷ đơ la vào năm 2016. Trong một bài
báo ông viết cho MIT Sloan Management Review vào năm 2017, cố vấn chất lượng dữ
liệu Thomas Redman đã ước tính rằng việc sửa lỗi dữ liệu và việc giải quyết các vấn đề
kinh doanh do dữ liệu xấu gây ra khiến các công ty tiêu tốn trung bình từ 15% đến 25%
doanh thu hàng năm của họ.
·  Ảnh hưởng tới việc ra quyết định.
Ngoài ra, sự thiếu tin tưởng vào dữ liệu của các giám đốc điều hành và giám đốc
kinh doanh của công ty thường được cho là nguyên nhân dẫn đến những trở ngại chính
đối với việc sử dụng các cơng cụ phân tích và thơng minh kinh doanh ( BI ) để cải thiện
việc ra quyết định trong các tổ chức.

12


13


Câu 4:
4.1. Giới thiệu công ty
Tên công ty: CREA-IN VIETNAM COMPANY LIMITED
Lĩnh vực hoạt động: Kinh doanh hàng may mặc, giày dép, hàng da và giả da – Sản xuất

vali, túi xách và các loại hàng tương tự.
Giấy phép kinh doanh: 0109604930
Sơ đồ cơng ty:

Trong nhóm có thành viên Cao Hữu Phước từng làm Nhân viên tối ưu hóa tỷ lệ chuyển
đổi tại công ty, thời gian từ tháng 11/2020 – tháng 11/2021.

4.2.

Quy trình phân tích

4.2.1 Quy trình bán hàng:

14


Đơn hàng tại Crea-in:

2.2. Quy trình quảng cáo:

15


Hóa đơn chạy quảng cáo:

Câu 5: Giới thiệu hệ thống nguồn

16



5.1.

Hệ thống Nguồn 1 (SQL Source)

5.1.1 Tổng quan các bảng trong Database 1 và mối quan hệ giữa các bảng
Hệ thống Nguồn 1 (SQL Source) được xây dựng trên Microsoft SQL Server, quản lý bởi
bộ phận Marketing bao gồm 11 bảng tất cả mối quan hệ giữa các bảng được thể hiện như
sau:

Đây là nơi quản lý chi tiết các thơng tin khách hàng, thơng tin và chi phí quảng cáo nên
được thiết kế đầy đủ.

5.1.2 Mô tả chi tiết các trường trong từng bảng


Bảng KhachHang

17




Bảng SanPham



Bảng NhomSanPham




Bảng HoaDon



Bảng KhuyenMai
18




Bảng ChitietHD

Trigger tự động tính tốn:
create trigger Tinhtoan on ChitietHD for insert, update as
begin
update ChitietHD
set ChitietHD.TongTien = i.SoLuong * s.DonGia
from (inserted i inner join ChiTietHD c on i.MaHD = c.MaHD) inner join SanPham s on
s.MaSP = i.MaSP
update ChitietHD
set ChitietHD.ChietKhau = i.SoLuong * s.DonGia * k.PhanTram*0.01
from ((inserted i inner join ChiTietHD c on i.MaHD = c.MaHD) inner join SanPham s
on s.MaSP = i.MaSP) inner join KhuyenMai k on k.MaKM = i.MaKM
update ChitietHD
set ChitietHD.ThanhTien = i.SoLuong * s.DonGia * (100- k.PhanTram)*0.01
from ((inserted i inner join ChiTietHD c on i.MaHD = c.MaHD) inner join SanPham s
on s.MaSP = i.MaSP) inner join KhuyenMai k on k.MaKM = i.MaKM
end

19





Bảng ChienDich



Bảng NenTang



Bảng target_GioiTinh



Bảng target_Tuoi



Bảng ChiTietQuangCao

20


● Dữ liệu nguồn 1:

21



5.2.

Hệ thống Nguồn 2 (Oracle Source)
Hệ thống Nguồn 2 (Oracle Source) xây dựng trên Oracle được quản lý bởi bộ phận

Kế toán bao gồm 1 bảng duy nhất là bảng khách hàng. Khác với nguồn 1, tại hệ thống 2
trường Họ tên được tách ra thành 2 cột là cột Họ và cột Tên. Các thông tin tại nguồn này
đều được lưu bằng tiếng Anh cho nên Giới tính sẽ được lưu dưới dạng “male” và
“female”.

Tại nguồn 2, dữ
liệu tên đã được chia làm
2 cột riêng biệt là Fname
là Lname, giới tính tại
nguồn này được lưu dưới
dạng khác: “male” và
“female”.

Đồng

thời

chúng ta thấy khách hàng
có mã KH00000 lại xuất
hiện ở đây nhưng với 1
địa chỉ khác.

22



5.3.

Hệ thống nguồn 3 (Excel)
Hệ thống Nguồn 3 (Excel) lưu trữ thông tin các khách hàng cũ đã mua hàng trước

khi công ty triển khai sử dụng cơ sở dữ liệu.

Tại nguồn này Giới
tính được lưu dưới dạng
nhị phân 0 và 1. Trong đó
0 tương ứng với Nam và 1
tương ứng với nữ. Khách

23


hàng mã KH00000 lại
xuất hiện cùng với 1 địa
chỉ mới.
5.4.

Hệ thống Nguồn 4 (CRM)

Hệ thống Nguồn 4 do phòng kinh doanh thực hiện các nghiệp vụ bán hàng quản lý. Hệ
thống này sử dụng nền tảng CRM POSCake của Việt Nam. Các dữ liệu ngồi trên hệ
thống CRM thì cịn được kết nối với một file Google Sheets để sao lưu.
Giao diện của CRM:

File Google Sheets backup:


24


Bảng này khơng cịn khách hàng với mã KH00000.

25


×