Tải bản đầy đủ (.pdf) (109 trang)

(Luận văn) phân tích ảnh hưởng của big data đến quá trình phân tích dữ liệu tại các doanh nghiệp kiểm toán của việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.78 MB, 109 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

t
to

TRƯỜNG ĐẠI HỌC KINH TẾ TP. HỒ CHÍ MINH

ng
hi
ep
do
w
n
lo
ad

VÕ THỊ BÍCH HÀ

ju

y
th
yi
pl
ua

al
n

PHÂN TÍCH ẢNH HƯỞNG CỦA BIG DATA ĐẾN


va

n

Q TRÌNH PHÂN TÍCH DỮ LIỆU TẠI CÁC

fu

ll

DOANH NGHIỆP KIỂM TOÁN CỦA VIỆT NAM

oi

m

at

nh
z
z
k

jm

ht

vb
om


l.c
ai

gm
LUẬN VĂN THẠC SĨ KINH TẾ

an
Lu
n

va

ey

t
re

Tp. Hồ Chí Minh – Năm 2018


BỘ GIÁO DỤC VÀ ĐÀO TẠO

t
to

TRƯỜNG ĐẠI HỌC KINH TẾ TP. HỒ CHÍ MINH

ng
hi
ep

do
w
n
lo
ad

VÕ THỊ BÍCH HÀ

ju

y
th
yi
pl
al

n

ua

PHÂN TÍCH ẢNH HƯỞNG CỦA BIG DATA ĐẾN

va

n

Q TRÌNH PHÂN TÍCH DỮ LIỆU TẠI CÁC

fu


ll

DOANH NGHIỆP KIỂM TỐN CỦA VIỆT NAM

oi

m

at

nh
z

Chun ngành: Kế tốn

z

vb

k

jm

ht

Mã số: 8340301

om

l.c

ai

gm

LUẬN VĂN THẠC SĨ KINH TẾ

an
Lu

NGƯỜI HƯỚNG DẪN KHOA HỌC

n

va

TS. TRẦN KHÁNH LÂM

ey

t
re

Tp. Hồ Chí Minh – Năm 2018


t
to

LỜI CAM ĐOAN


ng

Tơi xin cam đoan luận văn “Phân tích ảnh hưởng của Big Data đến q trình

hi
ep

phân tích dữ liệu tại các doanh nghiệp kiểm toán của Việt Nam” là kết quả nghiên

do

cứu độc lập của tơi, do chính tơi hồn thành.

w
n

lo

Nội dung luận văn có tham khảo và sử dụng tài liệu, thông tin được đăng tải

ad

trên các tác phẩm, tạp chí và các trang web theo danh mục tài liệu tham khảo của

y
th

luận văn.

ju

yi
pl

Thành phố Hồ Chí Minh, tháng 04 năm 2018

n

ua

al
n

va
fu
ll

VÕ THỊ BÍCH HÀ

oi

m
at

nh
z
z
k

jm


ht

vb
om

l.c
ai

gm
an
Lu
n

va

ey

t
re


t
to

MỤC LỤC

ng
hi
ep


TRANG PHỤ BÌA
LỜI CAM ĐOAN .................................................................................................. 3

do

w

MỤC LỤC.............................................................................................................. 4

n

DANH MỤC CÁC TỪ VIẾT TẮT ....................................................................... 1

lo

ad

DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, SƠ ĐỒ .......................................... 1

y
th

DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, SƠ ĐỒ .......................................... 2

ju

yi

PHẦN MỞ ĐẦU .................................................................................................... 1


pl

1. Lý do chọn đề tài ............................................................................................. 1

al

ua

2. Mục tiêu nghiên cứu ....................................................................................... 2

n

3. Câu hỏi nghiên cứu ......................................................................................... 3

va

n

4. Đối tượng nghiên cứu ..................................................................................... 3

fu

ll

5. Phạm vi nghiên cứu ........................................................................................ 3

m

Về nội dung ............................................................................................... 3


5.2.

Về không gian và thời gian....................................................................... 3

oi

5.1.

at

nh

z

6. Phương pháp nghiên cứu ................................................................................ 3

z

vb

7. Những đóng góp khoa học và thực tiễn của luận văn.................................... 4

jm

ht

8. Kết cấu của luận văn....................................................................................... 4

k


CHƯƠNG 1: TỔNG QUAN VỀ BIG DATA VÀ PHÂN TÍCH DỮ LIỆU
TRONG KIỂM TỐN .......................................................................................... 6

l.c
ai

gm

1.1. Big Data ........................................................................................................... 6

om

1.1.1. Tóm lược một số thay đổi trong dữ liệu .................................................. 6

an
Lu

1.1.2. Big Data .................................................................................................... 7
Các vấn đề quan trọng ..................................................................... 7

1.1.2.2.

Những yếu tố tạo nên Big Data ..................................................... 10

1.1.2.3.

Các lĩnh vực thuộc Big Data ......................................................... 12

1.1.2.4.


Phương pháp thu thập và truy xuất kiến thức từ Big Data ........... 13

ey

t
re

1.1.3. Các vấn đề về quản lý và an ninh dữ liệu .............................................. 14

n

va

1.1.2.1.


1.2. Phân tích dữ liệu kiểm toán .......................................................................... 16

t
to

1.2.1. Khái quát về phân tích dữ liệu kiểm toán ............................................. 16

ng

1.2.2. Phân tích dữ liệu gia tăng chất lượng kiểm toán .................................. 18

hi
do
w


n

Những người sử dụng nội bộ ........................................................ 20

1.2.3.2.
ngồi

Chính phủ, ủy ban kiểm toán, các tổ chức - cơ quan quản lý bên
....................................................................................................... 21
Bộ phận công nghệ thông tin ........................................................ 22

lo

1.2.3.1.

ad

ep

1.2.3. Phản ứng của các bên liên quan đến phân tích dữ liệu......................... 20

1.2.3.3.

Những khách hàng có sử dụng phân tích dữ liệu ......................... 22

ju

y
th


1.2.3.4.

yi

1.3. Các nghiên cứu về Big Data và phân tích dữ liệu kiểm toán ...................... 23

pl

ua

al

1.3.1. Các nghiên cứu về Big Data trong kiểm toán ........................................ 23
1.3.2. Các nghiên cứu về phân tích dữ liệu kiểm toán .................................... 26

n

n

va

KẾT LUẬN CHƯƠNG 1 .................................................................................... 30

ll

fu

CHƯƠNG 2: THỰC TRẠNG ẢNH HƯỞNG CỦA BIG DATA ĐẾN Q
TRÌNH PHÂN TÍCH DỮ LIỆU TẠI CÁC DOANH NGHIỆP KIỂM TOÁN

CỦA VIỆT NAM ................................................................................................. 32

oi

m

at

nh

2.1. Sơ lược về đặc điểm hoạt động kiểm tốn độc lập Việt Nam ...................... 32

z

2.1.1. Lịch sử hình thành và phát triển hoạt động kiểm toán độc lập Việt
Nam ................................................................................................................. 32

z

vb

jm

ht

2.1.2. Tình hình hoạt động của KTĐL hiện nay ............................................. 34
Số lượng, cơ cấu và loại hình cơng ty kiểm toán........................... 34

2.1.2.2.


Đội ngũ KTV và nhân viên chuyên nghiệp ................................... 35

2.1.2.3.

Về số lượng, cơ cấu khách hàng và doanh thu dịch vụ cung cấp . 36

k

2.1.2.1.

l.c
ai

gm

om

2.2. Khảo sát ảnh hưởng của Big Data đến quá trình phân tích dữ liệu tại các
doanh nghiệp kiểm toán của Việt Nam............................................................... 37

an
Lu

2.2.1. Mục tiêu của khảo sát............................................................................. 37

2.3.1. Khái niệm về Big Data............................................................................. 39
2.3.2. Những nhận định về Big Data................................................................ 45

ey


2.3. Kết quả khảo sát ........................................................................................... 38

t
re

2.2.3. Phương pháp khảo sát ............................................................................ 38

n

va

2.2.2. Đối tượng khảo sát ................................................................................. 38


Big Data giúp cải thiện việc ra quyết định dựa vào số liệu ........... 45

2.3.2.1.

t
to

2.3.2.2. Trọng tâm chính khi sử dụng Big Data là hướng đến khách hàng
và giảm thiểu rủi ro........................................................................................ 46

ng
hi

2.3.2.3. Big Data quan trọng ở sự đa dạng (variety) chứ không phải ở dung
lượng (volume) ............................................................................................... 48


ep
do
w
n

2.3.2.4. Cơ cấu tổ chức trong môi trường Big Data sẽ ảnh hưởng đến
thành công của doanh nghiệp ....................................................................... 49

lo

ad

2.3.2.5. Thách thức nhất khi sử dụng Big Data không phải đến từ công
nghệ mà xuất phát từ con người .................................................................... 51

y
th

ju

2.3.3. Phân tích dữ liệu kiểm toán từ Big Data ............................................... 53

yi

pl

2.3.4. Nguồn nhân lực trong những vấn đề liên quan đến Big Data và phân
tích dữ liệu kiểm toán....................................................................................... 58

ua


al

Nhà lãnh đạo ................................................................................. 58

2.3.4.2.

Bộ phận công nghệ thông tin ........................................................ 61

n

2.3.4.1.

n

va

ll

fu

2.4. Đánh giá chung về thực trạng ..................................................................... 64

oi

m

2.4.1. Ưu điểm................................................................................................... 64

nh


2.4.2. Hạn chế ................................................................................................... 65

at

2.4.3. Nguyên nhân ........................................................................................... 65

z

Nguyên nhân khách quan ............................................................. 65

2.4.3.2.

Nguyên nhân chủ quan ................................................................. 66

z

2.4.3.1.

ht

vb

jm

KẾT LUẬN CHƯƠNG 2 .................................................................................... 66

k

CHƯƠNG 3: GIẢI PHÁP NÂNG CAO TÍNH HỮU ÍCH CỦA BIG DATA VÀ

PHÂN TÍCH DỮ LIỆU KIỂM TOÁN TẠI CÁC DOANH NGHIỆP KIỂM
TOÁN CỦA VIỆT NAM ..................................................................................... 68

om

l.c
ai

gm

3.1. Quan điểm chung về giải pháp ..................................................................... 68

an
Lu

3.2. Các giải pháp cụ thể ...................................................................................... 69
3.2.2. Đầu tư vào cơ sở vật chất ....................................................................... 70

KẾT LUẬN .......................................................................................................... 72

ey

KẾT LUẬN CHƯƠNG 3 .................................................................................... 71

t
re

3.2.3. Các giải pháp hỗ trợ khác ...................................................................... 71

n


va

3.2.1. Đầu tư vào nguồn nhân lực .................................................................... 69


TÀI LIỆU THAM KHẢO ................................................................................... 88

t
to

PHỤ LỤC ............................................................................................................. 88

ng
hi
ep
do
w
n
lo
ad
ju

y
th
yi
pl
n

ua


al
n

va
ll

fu
oi

m
at

nh
z
z
k

jm

ht

vb
om

l.c
ai

gm
an

Lu
n

va

ey

t
re


t
to

DANH MỤC CÁC TỪ VIẾT TẮT

ng

Tên viết tắt

Tên đầy đủ

hi
ep

Hiệp hội kế tốn viên cơng chứng Hoa Kỳ

ACCA

Hội Kế tốn cơng chứng Anh Quốc


do

AICPA

w

Báo cáo tài chính

n

BCTC

lo

Nhóm 4 cơng ty kiểm toán hàng đầu thế giới

ad

Big4

Chuẩn mực kiểm toán
Doanh nghiệp nhà nước

yi

DNNN

ju


y
th

CMKT

Hội đồng Báo cáo tài chính (Anh Quốc)

IAASB

Ủy ban Quốc tế về Chuẩn mực kiểm toán và Dịch vụ đảm bảo

ISA

Chuẩn mực kiểm toán quốc tế

ISA 240

Chuẩn mực kiểm toán quốc tế số 240

KTĐL

Kiểm toán độc lập

KTV

Kiểm toán viên

PCAOB

Ủy ban giám sát các công ty đại chúng Hoa Kỳ


VACPA

Hội Kiểm toán viên hành nghề Việt Nam

pl

FRC

n

ua

al

n

va

ll

fu
oi

m
at

nh

z


z
k

jm

ht

vb
om

l.c
ai

gm
an
Lu
n

va

ey

t
re


t
to


DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, SƠ ĐỒ

ng
hi
ep

Số lượng tài khoản Facebook trên thế giới vào 06/2017 ................

7

Hình 1.2

Ba thành phần đặc trưng cấu thành Big Data ..................................

8

Hình 1.3
Hình 2.1

Doanh thu dự báo từ Big Data và phân tích kinh doanh tồn thế
giới từ năm 2015 đến 2020 ............................................................
Kích thước dữ liệu được xem là Big data ......................................

10
40

Hình 2.2

Dữ liệu thuộc Big Data .................................................................


41

do

Hình 1.1

w

n
lo

ad

Hình 2.5

Những chức năng trong doanh nghiệp sử dụng Big Data và phân
tích dữ liệu ....................................................................................
Đánh giá tính phù hợp, chính xác và đúng thời điểm của dữ liệu ....

43
43

Hình 2.6

Vai trị của Big Data trong doanh nghiệp .......................................

Hình 2.7

Thang đo đánh giá sự thành cơng khi ứng dụng Big Data ..............


Hình 2.8

Những lợi ích mong muốn Big Data mang lại ................................

Hình 2.9

Những miền dữ liệu tập trung nhiều trong Big Data .......................

47

Hình 2.10

Các lĩnh vực được quan tâm trong Big Data ...................................

48

Hình 2.11

Những thách thức khi sử dụng Big Data.........................................

Hình 2.12

Hình 2.15

Những bộ phận trong doanh nghiệp tham gia nghiên cứu - phát
triển - ứng dụng Big Data...............................................................
Số lượng nhân viên trong đơn vị có năng lực chun mơn về phân
tích, mơ hình hóa, khai thác dữ liệu................................................
Đánh giá việc tìm kiếm nhân sự có kỹ năng về phân tích dữ liệu và
kỹ năng quản lý cơng nghệ thơng tin, Big Data ..............................

Lợi ích Big Data mang lại cho phân tích dữ liệu ............................

Hình 2.16

Đánh giá khả năng phân tích dữ liệu của doanh nghiệp ..................

54

Hình 2.17

Các loại phân tích thường sử dụng Big Data ..................................

55

Hình 2.18

Những chức năng quan trọng khi phân tích Big Data .....................

Hình 2.19

Nguồn gốc các ứng dụng phân tích ................................................

56

Hình 2.20

Cách bố trí và quản lý những phát kiến mới về Big Data và phân
tích dữ liệu .....................................................................................

57


pl

Hình 2.4

yi

42

at

ju

y
th

Những tiêu chuẩn và cấu trúc được quan tâm khi nói về Big Data .

Hình 2.3

n

ua

al

n

va


44

ll

fu

45

oi

m

46

nh

z
50

k

jm

ht

vb

om

l.c

ai

gm

Hình 2.14

z

Hình 2.13

49

52
52
54

an
Lu

va
n

55

ey

t
re



t
to

DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, SƠ ĐỒ

ng

Tư duy chiến lược - mối quan tâm về Big Data được thể hiện từ
cấp lãnh đạo ...................................................................................
Người chỉ đạo những vấn đề liên quan đến Big Data......................

hi

Hình 2.21

ep

do

Hình 2.22

w

Hình 2.23

n

lo

ad


Hình 2.24

pl

Nơi tuyển dụng những nhà khoa học dữ liệu ..................................

59
60
61
62
62

n

ua

al

Hình 2.27

Đánh giá khả năng tìm kiếm nhân sự có kỹ năng phân tích dữ liệu

yi

Hình 2.26

ju

y

th

Hình 2.25

Đánh giá khả năng sử dụng và phân tích dữ liệu để cải thiện hoặc
chuyển đổi doanh nghiệp của nhà điều hành và lãnh đạo................
Đánh giá việc tìm kiếm những nhà quản lý/giám đốc điều hành có
thể nhận dạng và tận dụng các cơ hội kinh doanh từ Big Data ........
Nguồn lực cho bộ phận công nghệ thông tin ..................................

58
58

n

va
ll

fu
oi

m
at

nh
z
z
k

jm


ht

vb
om

l.c
ai

gm
an
Lu
n

va

ey

t
re


1

t
to

PHẦN MỞ ĐẦU

ng


1. Lý do chọn đề tài

hi
ep

Ngày nay, hầu như tất cả công ty điều đã nhận ra tầm quan trọng của việc sử

do

dụng dữ liệu trong quá trình ra quyết định thực hiện những chiến lược nhằm đáp

w

ứng sự thay đổi của môi trường kinh doanh mới. Bên cạnh đó, cuộc cách mạng cơng

n

lo

nghiệp lần thứ tư (4.0), còn được gọi là cuộc cách mạng số, hàm chứa sự thay đổi

ad

y
th

lớn lao, khơng chỉ ở khía cạnh kinh tế mà cịn thay đổi văn hóa, xã hội một cách

ju


tồn diện thơng qua các chiến lược cơng nghệ cao, cơng nghiệp hóa ngành sản xuất

yi

pl

mà khơng cần sự tham gia của con người, sử dụng trí thơng minh nhân tạo, điện

ua

al

tốn đám mây, phân tích dữ liệu… để chuyển hóa tồn bộ thế giới thực thành thế

n

giới số, khi đó những ưu thế, vốn là điểm mạnh của Việt Nam và một số nước khác,

va

n

như lực lượng lao động dồi dào, giá rẻ sẽ khơng cịn là điểm mạnh nữa, thậm chí

ll

fu

cịn bị đe dọa nghiêm trọng. Vì những thay đổi mang tính thời đại trong kinh doanh


oi

m

hiện nay nên mỗi đơn vị, tổ chức không thể không hành động để thích ứng với

at

nh

chúng, nếu doanh nghiệp biết tận dụng những thế mạnh mà công nghệ, cụ thể là dữ
liệu mang lại thì chắc chắn sẽ đạt được mục tiêu chiến lược đề ra, ngược lại việc

z
z

chậm thay đổi sẽ càng khiến doanh nghiệp mất đi khả năng cạnh tranh trên thị

vb

jm

ht

trường ngày càng năng động và phát triển với tốc độ chóng mặt này.

k

Khi nhắc đến cuộc cách mạng cơng nghiệp và phân tích dữ liệu thì khơng thể


l.c
ai

gm

không nhắc đến “nguồn tài nguyên” vô cùng lớn và phong phú là Big Data, được
xem là nền tảng để tạo ra những giá trị ở tầm cao mới cho doanh nghiệp. Với lợi thế

om

dân số trẻ trên 90 triệu người, số người sử dụng internet cao vào khoản 54 triệu

an
Lu

người, chiếm 54%, Việt Nam được xem là khu vực tìm năng về Big Data hàng đầu

Châu Á. Các chuyên gia trong nhiều lĩnh vực đều cho rằng việc phân tích dữ liệu từ

ey

từng người tiêu dùng nhằm tìm kiếm những thơng tin bổ ích về xu thế phát triển và

t
re

từ những thông tin thu thập được như hành vi, sở thích, thói quen, xu hướng của

n


va

Big Data sẽ giúp doanh nghiệp nắm bắt chính xác nhất xu thế vận động của ngành


2

vận động của lĩnh vực đang kinh doanh và cả nền kinh tế, điều này sẽ giúp doanh

t
to

nghiệp ra quyết định chính xác và đúng thời điểm.

ng

Khơng đứng ngồi vịng quay của sự phát triển, những doanh nghiệp kiểm toán

hi
ep

hiện nay cũng đang tìm cách thích ứng với những thay đổi mang lại từ cuộc cách

do

mạng công nghiệp 4.0, mà khởi đầu là việc nghiên cứu những dữ liệu có liên quan

w


n

từ Big Data trong cuộc kiểm toán để xác định những phương pháp kiểm toán cần

lo

ad

thiết và hiệu quả. Trong nhiều năm trở lại đây, các kiểm toán viên (KTV) đã có thể

y
th

dựa vào những cơng cụ phân tích dữ liệu tương đối phát triển nhờ công nghệ thông

ju

tin để đưa ra kết luận, tuy nhiên với sự bùng nổ gần đây về dữ liệu thì các cơng cụ

yi

pl

hiện tại có thể khơng đủ, địi hỏi phải có sự chuyển đổi trong cách xử lý và phân
quan trọng và cần thiết.

n

ua


al

tích thơng tin cũng như những hiểu biết của KTV về nguồn dữ liệu Big Data là rất

va

n

Để theo kịp xu hướng đổi mới và phát triển, các công ty kiểm toán lớn thuộc

fu

ll

Big Four và các hội nghề nghiệp Kế toán – Kiểm toán như ACCA, AICPA… đã có

m

oi

những nghiên cứu liên quan đến vấn đề vận dụng Big Data trong kiểm toán. Tuy

nh

nhiên tại Việt Nam, những vấn đề này hiện nay vẫn còn khá mới mẻ và ít nhận được

at

z


sự quan tâm từ phía các KTV và cơng ty kiểm tốn. Nhận thấy tầm quan trọng, tính

z

vb

thời sự của vấn đề cũng như có mong muốn hiểu rõ những khái niệm liên quan và

jm

ht

tìm hiểu cụ thể những ảnh hưởng mà Big Data và phân tích dữ liệu mang lại trong

k

q trình kiểm tốn, tác giả chọn thực hiện đề tài Luận văn: “Phân tích ảnh hưởng

gm

của Big Data đến quá trình phân tích dữ liệu tại các doanh nghiệp kiểm toán

om

2. Mục tiêu nghiên cứu

l.c
ai

của Việt Nam” để xây dựng và hoàn thiện.


an
Lu

Mục tiêu tổng quát của luận văn là tìm hiểu thực trạng Big Data và phân tích dữ

Thứ nhất, hệ thống hóa lý luận cơ bản về ảnh hưởng của Big Data đến q trình
phân tích dữ liệu kiểm tốn.

ey

nghiên cứu cụ thể sau:

t
re

Để đạt được mục tiêu tổng quát nêu trên, luận văn đưa ra một số mục tiêu

n

va

liệu từ Big Data tại các cơng ty kiểm tốn của Việt Nam.


3

Thứ hai, đánh giá thực trạng ảnh hưởng của Big Data và phân tích dữ liệu kiểm

t

to

tốn đến các doanh nghiệp kiểm toán của Việt Nam.

ng

Thứ ba, đề xuất một số phương hướng và giải pháp góp phần nâng cao khả năng

hi
ep

ứng dụng Big Data và phân tích dữ liệu nhằm tăng cường chất lượng kiểm toán.

do

3. Câu hỏi nghiên cứu

w
n

Để đạt được những mục tiêu đề ra, nghiên cứu cần trả lời những câu hỏi sau:

lo

ad

- Thế nào là Big Data và phân tích dữ liệu kiểm tốn?

ju


y
th

- Các doanh nghiệp kiểm toán của Việt Nam hiện nay đang sử dụng Big Data

yi

và phân tích dữ liệu như thế nào?

pl

- Giải pháp nào được đưa ra để vận dụng tốt nhất Big Data và phân tích dữ liệu

al

ua

trong quá trình kiểm tốn?

n

4. Đối tượng nghiên cứu

va

n

Đối tượng nghiên cứu là những ảnh hưởng của Big Data và phân tích dữ liệu

fu


ll

trong kiểm tốn BCTC tại các cơng ty kiểm toán của Việt Nam.

oi
at

nh

5.1. Về nội dung

m

5. Phạm vi nghiên cứu

z

z

Luận văn chỉ tập trung nghiên cứu ảnh hưởng của Big Data và phân tích dữ liệu

vb

đến hoạt động KTĐL của các doanh nghiệp kiểm tốn, khơng nghiên cứu trong các

ht

l.c
ai


- Về khơng gian: các cơng ty kiểm tốn tại Việt Nam

gm

5.2. Về khơng gian và thời gian

k

jm

loại hình kiểm toán khác như kiểm toán nhà nước hay kiểm toán hoạt động.

6. Phương pháp nghiên cứu

an
Lu

đến tháng 12/2017.

om

- Về thời gian: tác giả tiến hành khảo sát, thu thập dữ liệu từ tháng 06/2017

ey

phương pháp phân tích và tổng hợp.

t
re


dụng chủ yếu phương pháp định tính. Bên cạnh đó, nghiên cứu cũng sử dụng

n

va

Để đạt mục tiêu nghiên cứu của đề tài, trả lời các câu hỏi đặt ra, nghiên cứu sử


4

- Phương pháp phân tích tổng hợp: khái quát lý thuyết về các vấn đề nghiên

t
to

cứu và các nghiên cứu có liên quan.

ng

- Phương pháp định tính: được tiến hành theo hướng tìm hiểu và hệ thống hóa

hi
ep

những thơng tin thu thập được từ những nguồn tin uy tín, những nghiên cứu của các

do


hiệp hội nghề nghiệp và những công ty kiểm toán lớn trên thế giới. Tác giả sử dụng

w

n

đồng thời thống kê mơ tả: bao gồm việc tìm hiểu bằng bảng câu hỏi, sau đó thống

lo

ad

kê, so sánh, phân tích nhằm đánh giá việc áp dụng Big Data và phân tích dữ liệu

ju

y
th

kiểm tốn trong hoạt động KTĐL tại các doanh nghiệp kiểm toán của Việt Nam.

yi

7. Những đóng góp khoa học và thực tiễn của luận văn

pl

- Đóng góp về mặt lý thuyết: tìm hiểu những quan điểm, khái niệm liên quan

al


ua

đến Big Data và phân tích dữ liệu hiện nay, qua đó đánh giá những lợi ích cũng như

n

thách thức khi ứng dụng Big Data và phân tích dữ liệu trong q trình kiểm tốn

va

n

của KTV tại những cơng ty KTĐL.

fu

ll

- Đóng góp về mặt thực tiễn: kết quả nghiên cứu của luận văn với một vấn đề

m

oi

khá thời sự hiện nay sẽ có giá trị tham khảo cho KTV và các công ty KTĐL tại Việt

nh

Nam, giúp họ có cái nhìn rõ ràng và cụ thể hơn về Big Data và phân tích dữ liệu


at

z

cũng như những giải pháp giúp ứng dụng Big Data và phân tích dữ liệu hiệu quả

jm

ht

vb

8. Kết cấu của luận văn

z

hơn để gia tăng chất lượng kiểm tốn.

k

Ngồi phần mở đầu, nghiên cứu được thiết kế gồm 3 chương:

gm

l.c
ai

Chương 1: Tổng quan về Big Data và phân tích dữ liệu trong kiểm tốn.


om

Nội dung chương 1 trình bày tóm tắt những vấn đề liên quan đến Big Data và

an
Lu

phân tích dữ liệu cũng như những nghiên cứu gần đây về hai vấn đề này.

Chương 2: Thực trạng ảnh hưởng của Big Data và phân tích dữ liệu kiểm tốn

n

va

tại các doanh nghiệp kiểm toán của Việt Nam.

ey

Big Data và phân tích dữ liệu của các doanh nghiệp kiểm tốn, từ đó nhận ra những

t
re

Chương 2 cung cấp những số liệu cụ thể về thực trạng nhận thức và ứng dụng


5

ưu điểm và hạn chế cũng như chỉ ra nguyên nhân về những vấn đề liên quan đến


t
to

Big Data và phân tích dữ liệu.

ng

Chương 3: Giải pháp nâng cao tính hữu ích của Big Data và phân tích dữ liệu

hi
ep

kiểm toán tại các doanh nghiệp kiểm toán của Việt Nam.

do

Chương này trước hết trình bày quan điểm chung khi đưa ra những giải pháp,

w

n

sau đó đi sâu vào những giải pháp cụ thể và giải pháp hỗ trợ về những vấn đề liên

lo

ad

quan đến Big Data và phân tích dữ liệu nhằm mục tiêu chính nâng cao chất lượng


ju

y
th

kiểm tốn.

yi

Kết luận

pl
n

ua

al
n

va
ll

fu
oi

m
at

nh

z
z
k

jm

ht

vb
om

l.c
ai

gm
an
Lu
n

va

ey

t
re


6

t

to

CHƯƠNG 1: TỔNG QUAN VỀ BIG DATA VÀ PHÂN TÍCH
DỮ LIỆU TRONG KIỂM TỐN

ng

1.1. Big Data

hi
ep

1.1.1. Tóm lược một số thay đổi trong dữ liệu

do

Big Data và phân tích dữ liệu hiện nay được xem là trung tâm của khoa học và

w

kinh doanh hiện đại, các dữ liệu này được tạo ra từ các giao dịch trực tuyến, email,

n

lo

video, âm thanh, hình ảnh, những cú nhấp chuột, blog, truy vấn tìm kiếm, hồ sơ sức

ad


y
th

khỏe, tương tác trên mạng xã hội, dữ liệu khoa học, cảm biến từ điện thoại di động

ju

và các ứng dụng đi kèm (C.Eaton et al., 2012; RD. Schneider, 2012). Tất cả những

yi

pl

yếu tố trên được lưu trữ trong những nền tảng cơ sở dữ liệu đang phát triển mạnh

ua

al

mẽ và càng trở nên khó nắm bắt, lưu trữ, quản lý, chia sẻ, phân tích và hình dung

n

thơng qua các phần mềm cơ sở dữ liệu truyền thống.

n

va

5 exabytes (1018 bytes) đã được con người tạo ra đến năm 2003, nhưng hiện nay


ll

fu

lượng thông tin này có thể được tạo thành chỉ trong vịng hai ngày. Năm 2012, dữ

oi

m

liệu số của thế giới đã được mở rộng đến 2.72 zettabytes (1021 bytes), và dự báo sẽ

nh

tăng gấp đôi sau mỗi hai năm, đạt khoản 8 zettabytes vào khoản năm 2015. IBM,

at

tập đồn cơng nghệ máy tính đa quốc gia của Mỹ, chỉ ra rằng mỗi ngày có 2.5

z

z

exabytes dữ liệu được tạo ra tương đương với 90% dữ liệu được tạo ra trong vòng

vb

jm


ht

hai năm qua (S. Singh and N. Singh, 2011). Một máy tính cá nhân chứa khoản 500
gigabytes (109 bytes), do đó sẽ cần khoản 20 tỷ máy tính để lưu trữ tất cả dữ liệu

k

gm

của thế giới. Trong quá khứ, quá trình giải mã bộ gen của con người mất khoản 10

l.c
ai

năm, bây giờ thì việc này mất khơng q một tuần. Dữ liệu đa phương tiện được dữ

om

kiến tăng 70% vào năm 2013 (J. Manyika et al., 2011). Chỉ Google mới có hơn một

an
Lu

triệu máy chủ trên toàn thế giới. Hiện đã có hơn 6 tỷ thuê bao điện thoại di động
trên thế giới và mỗi ngày có hơn một tỷ tin nhắn được gửi đi. Đến năm 2020, 50 tỷ

dữ liệu. Theo dự án này, có rất nhiều thống kê đã được đưa ra, chẳng hạn Facebook

ey


cầu, dự án tập trung thu thập thời gian, hình dung và phân tích một khối lượng lớn

t
re

Năm 2012, hình thái dữ liệu của Big Data đã được hồn thành với quy mơ tồn

n

va

thiết bị sẽ được kết nối với mạng và internet (B. Gerhardt et al., 2012).


7

có 955 triệu tài khoản hoạt động hàng tháng bằng 70 ngơn ngữ, 140 tỷ hình ảnh

t
to

được tải lên, 125 tỷ kết nối bạn bè, mỗi ngày có 30 tỷ nội dung và 2.7 tỷ lượt thích

ng

và bình luận được đăng tải, số lượng tài khoản Facebook vào tháng 06/2017 tại các

hi
ep


châu lục được thể hiện ở hình 1.1 (nguồn Internet World Stats). Mỗi phút, có 48 giờ

do

video được tải lên và mỗi ngày có 4 tỷ lượt xem được thực hiện trên Youtube.

w

Google hỗ trợ nhiều dịch vụ như giám sát 7.2 tỷ trang mạng mỗi ngày và xử lý 20

n

lo

petabyte (1015 bytes) dữ liệu dịch sang 66 ngôn ngữ khác nhau. Có khoảng 1 tỷ

ad

y
th

Tweets (những mẫu tin nhỏ dưới dạng blog – theo Wikipedia) sau mỗi 72 giờ từ

ju

hơn 140 triệu người dùng đang hoạt động trên Twitter. 571 trang web mới được tạo

yi


pl

ra mỗi phút trong ngày. Dự báo trong thập kỷ tới, khối lượng thông tin sẽ tăng gấp

ua

al

50 lần, tuy nhiên số lượng các chuyên gia về công nghệ thông tin theo kịp với tiến

n

độ phát triển đó chỉ tăng 1.5 lần (C. Tankard et al., 2012).

n

va
ll

fu
oi

m
at

nh
z
z
k


jm

ht

vb
om

l.c
ai

gm
an
Lu

ey

t
re

1.1.2.1. Các vấn đề quan trọng

n

1.1.2. Big Data

va

Hình 1.1: Số lượng tài khoản Facebook trên thế giới vào 06/2017



8

Big Data là thuật ngữ dùng cho các bộ dữ liệu có cấu trúc đa dạng và phức tạp

t
to

hơn với những khó khăn trong việc lưu trữ, phân tích và hiển thị cho các quá trình

ng

hoặc kết quả tiếp theo. Big Data được đặc trưng bởi các thành phần chính: sự đa

hi
ep

dạng (variety), tốc độ (velocity) và dung lượng (volume) (Intel IT Center, 2012).

do

- Sự đa dạng: làm cho Big Data thật sự là nguồn dữ liệu rất lớn. Big Data

w

thường đến từ nhiều nguồn và thường có ba loại: có cấu trúc, bán cấu trúc và khơng

n

lo


có cấu trúc. Dữ liệu có cấu trúc nằm trong kho dữ liệu đã được gắn thẻ và dễ dàng

ad

y
th

sắp xếp nhưng dữ liệu phi cấu trúc là ngẫu nhiên và khó phân tích. Dữ liệu bán cấu

ju

trúc khơng thích hợp cho các lĩnh vực cố định mà chứa những phần tử dữ liệu riêng

yi
pl

biệt.

ua

al

- Dung lượng: hay kích thước của dữ liệu bây giờ lớn hơn terabytes và

n

petabytes. Quy mô lớn và sự gia tăng của dữ liệu vượt xa các kỹ thuật phân tích và

n


va

lưu trữ truyền thống.

ll

fu

- Tốc độ: nghĩa là vận tốc các dữ liệu được tạo ra và xử lý để đáp ứng các nhu

oi

m

cầu và thách thức trên con đường tăng trưởng và phát triển.

at

nh

Cụ thể từng thành phần được minh họa như sau:

z
z
k

jm

ht


vb
om

l.c
ai

gm
an
Lu
tâm đến bảo mật dữ liệu, thêm vào đó là sau khi tạo ra và xử lý Big Data thì sẽ tạo

ey

minh nguồn dữ liệu, rất khó để kiểm sốt một nguồn dữ liệu lớn nên cần phải quan

t
re

Dưới áp lực của nền thông tin phát triển, một vấn đề khác cần quan tâm là xác

n

va

Hình 1.2: Ba thành phần đặt trưng cấu thành Big Data


9

ra một giá trị tăng thêm cho tổ chức. Có một số vấn đề được rút ra từ nghiên cứu


t
to

của TDWI – Transforming Data with Intelligence (P. Russom, 2011) được yêu cầu

ng

cho các chuyên gia quản lý:

hi
ep

- Sau khi tổ chức áp dụng một số hình thức phân tích Big Data, những lợi ích

do

mang lại gồm: markerting tốt hơn, hiểu biết sâu sắc hơn về kinh doanh, mở rộng

w

nhiều phân khúc khách hàng, có nhiều thay đổi trong doanh thu và trên thị trường.

n

lo

- Trong khi thực hiện phân tích Big Data, sẽ phát sinh nhiều rào cản: sự thiếu

ad


y
th

chuyên mơn, chi phí, khó khăn trong thiết kế hệ thống phân tích, thiếu những phần

ju

mềm cơ sở để phân tích. Big Data khơng chỉ là cơ hội vì sự phân tích tồn diện

yi

pl

trong hiện tại và tương lai mà cịn là rào cản vì rất khó tiếp cận và quản lý.

ua

al

- Big Data hiện nay đang được lưu trữ và sử dụng với những kỹ thuật tiên tiến

n

gồm: có cấu trúc, bán cấu trúc, phức hợp, dữ liệu sự kiện và không cấu trúc.

va

n


- Khi thay đổi nền tảng phân tích, những vấn đề có thể xảy ra: khơng phù hợp

ll

fu

với một dung lượng dữ liệu lớn, không thể hỗ trợ các mơ hình phân tích cần thiết,

oi

m

dữ liệu được tải quả chậm, công nghệ thông tin không thể bắt kịp với nhu cầu.

at

nh

Có thể thấy từ nghiên cứu này rằng phân tích Big Data vẫn cần rất nhiều sự
quan tâm, ngoại trừ tính đa dạng, dung lượng lớn và tốc độ vượt trội thì việc phân

z
z

tích Big Data cịn mang lại tiềm năng mở ra những hiểu biết mới giúp tối ưu hóa

vb

jm


ht

việc ra quyết định. Cần hiểu rằng Big Data không phải là công cụ dành riêng cho
các doanh nghiệp lớn, “big” ở đây không chỉ lớn đo bằng số lượng mà còn chỉ độ

k
gm

sâu của việc phân tích, nghĩa là khơng kể doanh nghiệp thu thập được bao nhiêu số

l.c
ai

liệu, quan trọng là sẽ làm gì với những số liệu đó, phân tích như thế nào để mang lại

om

lợi ích tốt nhất trong hoạt động của chính doanh nghiệp. Hình 1.2 thể hiện thống kê
tồn cầu từ 2015-2020 (tỷ đô la Mỹ) do trang Statistics Portal thực hiện.

an
Lu

dự báo doanh thu cho ngành công nghiệp Big Data và phân tích kinh doanh trên

n

va

ey


t
re


10

t
to
ng
hi
ep
do
w
n
lo
ad
ju

y
th
yi
pl
n

ua

al
n


va
ll

fu
m

oi

Hình 1.3: Doanh thu dự báo từ Big Data và phân tích kinh doanh toàn thế

nh

z

1.1.2.2. Những yếu tố tạo nên Big Data

at

giới từ năm 2015 đến 2020 (tỷ đô la Mỹ)

z

ht

vb

Theo ICAEW (2015), xu hướng của Big Data được thúc đẩy bởi các yếu tố:

jm


năng lực tính tốn, các nguồn dữ liệu mới và cơ sở hạ tầng để tạo ra dữ liệu. Ba yếu

k

tố này tạo ra những tiến bộ đáng kể trong việc hình thành và phát triển Big Data:

gm

- Năng lực tính tốn: năng lực cốt lõi của Big Data là sự tăng trưởng mạnh mẽ

l.c
ai

về năng lực tính tốn và khả năng lưu trữ trong những năm gần đây, giúp thu thập

om

và xử lý toàn bộ bộ dữ liệu, bất kể kích thước và độ phức tạp của chúng, điều này

an
Lu

thường được mô tả như sự tăng trưởng theo cấp số nhân trong năng lực tính tốn.

mây cơng cộng). Bằng việc sử dụng điện tốn đám mây, doanh nghiệp không cần
phải mua tất cả tài nguyên máy tính để sử dụng mà chỉ đơn giản là truy cập vào đám

ey

toàn bộ doanh nghiệp (đám mây riêng) hay giữa một số khách hàng với nhau (đám


t
re

Data, cụ thể điện tốn đám mây dựa trên mơ hình chia sẻ tài ngun máy tính trong

n

va

Mơ hình điện tốn đám mây đang tiếp tục hỗ trợ trong việc sử dụng rộng rãi Big


11

máy đó khi cần thiết. Do đó, mơ hình điện tốn đám mây có khả năng cung cấp cho

t
to

doanh nghiệp quyền truy cập vào các tài nguyên máy tính lớn một cách hiệu quả và

ng

linh hoạt. Những tiến bộ về phần mềm cũng mang lại sự phát triển về khả năng xử

hi
ep

lý và lưu trữ dữ liệu, chẳng hạn các loại phần mềm mới hỗ trợ cho những dữ liệu


do

lớn và khơng có cấu trúc tốt hơn so với các hệ thống quản lý cơ sở dữ liệu truyền

w

thống (ví dụ: phần mềm Apache Hadoop giúp quản lý bộ dữ liệu rất lớn bằng cách

n

lo

chia tách việc xử lý giữa nhiều máy tính với nhau), bên cạnh đó khả năng xử lý dữ

ad

y
th

liệu phi cấu trúc (như video hay văn bản) đã được cải thiện rất nhiều, các công cụ

ju

phục vụ cho việc trình bày dữ liệu cũng đang có những tiến triển đáng kể.

yi

pl


- Nguồn dữ liệu: sự gia tăng sức mạnh tính tốn làm tăng tính khả thi trong

ua

al

việc thu thập và xử lý dữ liệu từ nhiều nguồn mới, chẳng hạn từ internet cung cấp

n

rất nhiều dữ liệu từ những cú nhấp chuột thơng qua các tìm kiếm, các truy cập vào

va

n

các trang web để mua hàng hóa, dịch vụ; truyền thơng xã hội cũng tạo ra nhiều loại

ll

fu

dữ liệu mới bao gồm các trạng thái, bình luận, lượt thích, hình ảnh, video và mạng

oi

m

lưới liên lạc; công nghệ di động đang mang lại nhiều cơ hội để tạo ra truyền thông


at

nh

xã hội và dữ liệu interet cũng như những dữ liệu mới về định vị cá nhân; dữ liệu mở
đề cập đến số lượng lớn dữ liệu chủ yếu từ khu vực công, chẳng hạn như dữ liệu

z
z

không gian địa lý, dữ liệu vận chuyển, dữ liệu tài chính của chính phủ và dữ liệu

vb

jm

ht

dịch vụ cơng; “internet of things” là việc nhúng chíp máy tính và cảm biến vào các
thiết bị vật lý như máy móc, tịa nhà, đồ gia dụng, quần áo… tất cả đều tạo ra dữ

k
gm

liệu. Khi doanh nghiệp ngày càng sử dụng công nghệ số trong các lĩnh vực như bán

l.c
ai

hàng, marketing, quản lý khách hàng, chuỗi cung ứng, truyền thông nội bộ… thì


om

lượng dữ liệu bên trong được tạo ra sẽ tăng lên đáng kể, hơn nữa, những cải tiến

an
Lu

trong quản lý dữ liệu bán cấu trúc, phi cấu trúc cho phép doanh nghiệp tận dụng tốt
hơn nguồn dữ liệu hiện có và mới như email, văn bản, hình ảnh và giọng nói.

“mời gọi rộng rãi”, việc này có thể tiến hành theo hình thức đồng thực hiện (khi

ey

cơng ty hay tổ chức giao việc cho mạng lưới cộng tác viên gia cơng theo hình thức

t
re

mới, được minh chứng thơng qua các xu hướng crowdsourcing - là hình thức một

n

va

- Cơ sở hạ tầng kỹ thuật số cho phép tạo ra các hợp tác và sáng tạo kiến thức


12


cơng việc có tính cộng tác), nhưng cũng có thể thực hiện bởi từng cá nhân riêng lẻ

t
to

(Jeff Howe, 2006) và phần mềm nguồn mở. Việc chia sẻ kiến thức này đã mang lại

ng

cho cộng đồng những hiểu biết sâu sắc hơn về những dữ liệu từ những nơi hạn chế

hi
ep

tiếp cận, từ những chuyên gia trong các lĩnh vực cụ thể… Hiện nay các nghiên cứu

do

ứng dụng đang được nhấn mạnh, chẳng hạn trong dịch thuật ngôn ngữ, người ta cho

w

rằng sẽ không hiệu quả nếu chỉ dịch từng từ sang từ vì trong nhiều trường hợp một

n

lo

từ duy nhất có thể chuyển sang một số từ, kết quả là các nghiên cứu ứng dụng đã


ad

y
th

cho ra đời việc dịch cụm từ sang cụm từ và đây là cách tiếp cận thơng minh hơn rất

ju

nhiều. Do đó, tiến bộ đến từ sự hiểu biết mới về các vấn đề cụ thể chứ không nhất

yi

pl

thiết là những đột phá trong lý thuyết chung.

ua

al

1.1.2.3. Các lĩnh vực thuộc Big Data

n

Học viện McKinsey Global đã xác định tiềm năng của Big Data tồn tại chủ yếu

n


va

trong năm lĩnh vực chính sau:

ll

fu

- Chăm sóc sức khỏe: hệ thống hỗ trợ các quyết định lâm sàn, phân tích bệnh

oi

m

án, phân phối thuốc cho từng bệnh nhân, trả lương dựa trên hiệu quả của nhân viên

at

nh

y tế, phân tích mẫu bệnh, cải thiện sức khỏe cộng đồng.
- Khu vực công: tạo sự minh bạch thông qua các dữ liệu có thể tiếp cận được,

z
z

phát hiện nhu cầu mới, nâng cao hiệu suất công việc, ra quyết định dựa trên các hệ

vb


jm

ht

thống tự động để giảm chi phí, đổi mới các sản phẩm và dịch vụ cung cấp.
- Bán lẻ: phân tích hành vi dự trữ hàng, đa dạng và tối ưu hóa giá, thiết kế lại

k
l.c
ai

sản phẩm và hậu cần, tiếp thị dựa trên công nghệ mới.

gm

việc sắp xếp sản phẩm, cải thiện hiệu suất, tối ưu hóa đầu vào lao động, phân phối

om

- Sản xuất: dự báo nhu cầu cải tiến, quy hoạch chuỗi cung ứng, hỗ trợ bán

an
Lu

hàng, phát triển hoạt động sản xuất, áp dụng tìm kiếm trên các trang web.

- Dữ liệu vị trí cá nhân: hành trình thơng minh, quảng cáo nhắm vào vị trí địa

chiến dịch marketing, xác định hành vi của khách hàng dựa vào các mơ hình mua và


ey

hội từ những người tiêu dùng nhằm mục tiêu quảng cáo sản phẩm, thực hiện các

t
re

Các Website cung cấp nhiều cơ hội cho Big Data, chẳng hạn phân tích mạng xã

n

va

lý hoặc tình huống khẩn cấp, quy hoạch đơ thị, mơ hình kinh doanh mới.


13

phân tích tâm lý, từ những kết luận thu được, các cơng ty sẽ tối ưu hóa nội dung và

t
to

các đề nghị được đưa ra (A.Vailaya, 12/2012, p.24-31). Một số công ty như Google

ng

hay Amazon xuất bản các bài báo liên quan đến công việc của họ, Facebook,

hi

ep

Twitter và Linkedln đang tiến thêm một bước nữa khi xuất bản các dự án mã nguồn

do

mở cho các dữ liệu lớn như Cassandra, Hive, Pig, Voldemort, Storm, IndexTank.

w

Ngồi ra, các phân tích dự đốn về lưu lượng giao thơng hoặc xác định các mối đe

n

lo

dọa từ các nguồn cấp video, âm thanh và dữ liệu khác nhau cũng là lợi thế của Big

ad

y
th

Data (B.Gerhardt et al., 2012).

ju

1.1.2.4. Phương pháp thu thập và truy xuất kiến thức từ Big Data

yi


pl

Hầu hết các doanh nghiệp điều phải đối mặt với nhiều dữ liệu mới, có nhiều

ua

al

hình thức khác nhau và Big Data có tiềm năng cung cấp các thơng tin chi tiết để có

n

thể chuyển đổi mọi doanh nghiệp. Big Data đã tạo ra một ngành công nghiệp mới

va

n

hỗ trợ chẳng hạn như MapReduce - là một khn khổ được lập trình bởi Google sử

ll

fu

dụng phương pháp chia nhỏ và chiếm giữ để giải quyết các vấn đề dữ liệu phức tạp

oi

m


thành các đơn vị làm việc nhỏ và xử lý chúng song song nhau (S. Curry et al.,

at

nh

2013).

Việc truy xuất kiến thức từ Big Data được hiểu là việc thực hiện một số thao tác

z
z

được thiết kế trước để lấy thông tin từ bộ dữ liệu phức tạp (E. Belogi and J. Horey,

vb

jm

ht

2012). Quá trình này được miêu tả trải qua những bước cơ bản như:
- Xác định các miền ứng dụng của thơng tin và mục đích của q trình từ quan

k
l.c
ai

- Tạo điểm dữ liệu con cho việc khám phá tri thức;


gm

điểm của khách hàng;

an
Lu

và tính tốn thơng tin về thời gian và các thay đổi cần thiết;

om

- Loại bỏ nhiễu, xử lý dữ liệu thiếu, thu thập thông tin cần thiết đến mơ hình
- Tìm kiếm các thuộc tính hữu ích để trình bày dữ liệu tùy thuộc vào mục đích

liệu;

ey

- Chọn các thuật tốn khai thác dữ liệu và phương pháp tìm kiếm các mẫu dữ

t
re

- Lập bảng đồ mục tiêu cho từng phương pháp khai thác dữ liệu cụ thể;

n

va


của công việc;


14

- Nghiên cứu các dạng thể hiện của dữ liệu;

t
to

- Quay lại bất kỳ các bước kể trên, có thể lặp lại từng bước một, bao gồm việc

ng

chọn lại hình thức hiển thị hay chọn lại mẫu;

hi
ep

- Sử dụng thông tin trực tiếp, kết hợp với những thông tin từ những hệ thống

do

khác hoặc chỉ đơn giản là đăng ký vào hệ thống và nhận kết quả.

w

1.1.3. Các vấn đề về quản lý và an ninh dữ liệu

n


lo

Vào tháng 05 năm 2012, trung tâm công nghệ thông tin Intel đã khảo sát 200

ad

y
th

nhà quản lý công nghệ thông tin trong các cơng ty lớn để tìm ra cách họ tiếp cận với

ju

việc phân tích Big Data (Intel IT Center, 2012). Các nhà quản lý công nghệ thông

yi

pl

tin khi được hỏi về những tiêu chuẩn mà họ muốn xem xét để phân tích Big Data thì

ua

al

câu trả lời thu được bao gồm những vấn đề như: bảo mật dữ liệu, công nghệ để sở

n


hữu dữ liệu khách hàng, minh bạch dữ liệu, các tiêu chuẩn đo lường hiệu quả, khả

va

n

năng tương tác giữa dữ liệu và hệ thống.

ll

fu

Khi những kẻ tấn cơng mạng phá vỡ những tuyến phịng thủ truyền thống của

oi

m

dữ liệu sẽ đòi hỏi các tổ chức cần áp dụng những mơ hình an ninh theo hướng thơng

at

nh

minh, có nhiều nhận thức về rủi ro hơn, thay đổi nhanh chóng theo ngữ cảnh. Hệ
thống an ninh thơng minh được phát triển từ việc phân tích Big Data, liên quan đến

z
z


cả bề rộng của nguồn dữ liệu và chiều sâu của thơng tin cần thiết để xác định chính

vb

jm

ht

xác rủi ro nhằm chống lại các hoạt động bất hợp pháp và các mối đe dọa trực tuyến
phát triển khác. Một mơ hình bảo mật dữ liệu thường có các đặc điểm sau: (S. Curry

k
gm

et al., 2013)

om

hiệu quả;

l.c
ai

- Các nguồn dữ liệu bên trong và bên ngồi đều có thể tạo giá trị và mang lại

an
Lu

- Các công cụ tự động thu thập nguồn dữ liệu đa dạng và chuẩn hóa chúng;


- Các cơng cụ phân tích xử lý một khối lượng lớn dữ liệu luôn thay đổi nhanh

ey

xem xét chúng dựa trên các mơ hình về hành vi và rủi ro;

t
re

- Hệ thống giám sát liên tục phân tích các nguồn tài nguyên có giá trị cao và

n

va

chóng trong thời gian hạn chế;


15

- Kiểm soát hoạt động như là xác thực người dùng bổ sung, ngăn chặn truyền

t
to

tải dữ liệu hoặc rút gọn việc ra quyết định;

ng

- Các nhà phân tích an ninh có thể truy vấn được những dữ liệu liên quan;


hi
ep

- Chuẩn hóa những tiêu chuẩn về an ninh dưới dạng văn bản hoặc được chia sẻ

do

thông qua những nguồn đáng tin cậy;

w
n

- Mở rộng cơ sở hạ tầng có khả năng xử lý các tìm kiếm lớn và phức tạp;

lo

- Mức độ tích hợp cao của các cơng cụ quản lý rủi ro và bảo mật để phát hiện

ad

y
th

các vấn đề tiềm ẩn.

ju

- Để phát triển cách tiếp cận tồn diện và chắc chắn đối với Big Data thì khi


yi

pl

bắt đầu quản lý dự án, các công ty cần thiết lập và mô tả chi tiết nguồn gốc dữ liệu,

ua

al

tạo và truy cập các ủy quyền cũng như phân loại các phát hiện theo tầm quan trọng

n

của chúng, bên cạnh đó cần đảm bảo các hồ sơ dữ liệu được lưu trữ và bảo vệ theo

va

n

đúng quy định, nên phát triển các chính sách liên quan đến quy trình xử lý dữ liệu,

ll

fu

chẳng hạn như kiểu dữ liệu được lưu trữ, thời gian lưu trữ, kho lưu trữ và các kiểu

oi


m

truy cập vào dữ liệu (C. Tankard, 2012).

at

nh

Một vấn đề khác cũng đáng quan tâm đó là khi lưu trữ dữ liệu tại một địa chỉ
duy nhất sẽ phát sinh nguy cơ dữ liệu bị tấn cơng, do đó địi hỏi kho dữ liệu cần có

z
z

những hoạt động kiểm sốt thích hợp. Để chắc chắn việc truyền thơng an toàn nên

vb

jm

ht

áp dụng mã bảo mật và sử dụng nguyên tắc giảm đặc quyền, đặc biết đối với quyền
truy cập, ngoại trừ quản trị viên có quyền truy cập dữ liệu để xử lý các vấn đề phát

k
gm

sinh theo quy định.


l.c
ai

Để kiểm soát truy cập hiệu quả dữ liệu nên liên tục quan sát và thay đổi vai trò

om

của các tổ chức, nhân viên để hạn chế sự lạm dụng những quyền hạn khơng chính

an
Lu

đáng. Các cơng ty nên đầu tư vào các sản phẩm bảo mật đảm bảo bằng cách sử

dụng những cơng nghệ phân tích nhanh chóng thay vì những thiết bị cố định. Ngồi

ninh vì khi các tổ chức phân loại dữ liệu, họ kiểm soát bằng những quy định đặc

ey

Curry et al., 2013). Tuy nhiên cũng cần nói thêm là Big Data có lợi thế lớn về an

t
re

quy định của luật bảo vệ dữ liệu (C. Tankard, 2012 và M. Smith et al., 2012 và S.

n

va


ra, các tổ chức cần xem xét phân nhánh pháp lý để lưu trữ dữ liệu nhằm tuân thủ


×