ĐỀ TÀI : NGHIÊN CỨU MỨC ĐỘ
TRUYỀN TÀI THÔNG ĐIỆP CỦA TIN
TỨC TRỰC TUYẾN – MỘT HƯỚNG PHÁT
TRIỂN MỚI TRONG XÂY DỰNG MÔ
HINH DỰ BÁO KIỆT QUỆ TÀI CHÍNH VÀ
PHÁT HIỆN GIAN LẬN BCTC
Nguyễn Thị Ngọc My TC10 _K36
Nguyễn Thị Hồng Trân TC10 _K36
LÝ DO CHỌN ĐỀ TÀI
Tính tới cuối năm 2013, tàn dư suy thoái dai dẳng của nền kinh tế
Việt Nam kéo theo sự gia tăng không ngừng số lượng doanh nghiệp
giải thể và phá sản .Tình trạng tài chính yếu kém cộng thêm các
khiếm khuyết trong hệ thống quy chế kiểm toán kế toán vô hình
chung tạo nên một môi trường thuận lợi cho các hành vị gian lận trên
báo cáo tài chính khi hàng loạt công ty phải tiến hành giải trình các
sai lệch trọng yếu trên BCTC được kiểm toán . Cùng với sự gia tăng
vượt trội của số lượng tin tức trực tuyến của doanh nghiệp trên hai
sàn HOSE và HNX nói riêng củng như số lượng thông tin phi cấu
trúc nói chung trong thời điểm hiện nay, việc xây dựng mô hình dự
báo kiệt quệ tài chinh và gian lận không chỉ đơn thuần dựa trên
nguồn dữ liệu cấu trúc truyền thống mà còn mở rộng nghiên cứu trên
nguồn dữ liệu phi cấu trúc của doanh nghiệp.
LÝ DO CHỌN ĐỀ TÀI
Theo hiểu biết tốt nhất của nhóm tác giả , chưa có
bài nghiên cứu tài chính tại Việt Nam tiến hành
nghiên cứu mức độ truyền tải thông điệp có ý
nghĩa của dữ liệu phi cấu trúc của doanh nghiệp
trong nghiên cứu và dự báo tài chính nói chung ,
đặc biệt đối với vấn đề dự báo kiệt quệ tài chính và
phát hiện gian lận Báo cáo tài chính. Đó là những
lý do cấp thiết để nhóm chúng tôi tiến hành bài
nghiên cứu này tại thị trường Việt Nam.
MỤC ĐÍCH NGHIÊN CỨU
Mảng nội dụng
Tình trạng kiệt quệ tài chính của doanh nghiệp tại
Việt Nam chịu ảnh hưởng bởi các nhân tố truyền
thống nào?
Hành vi gian lận BCTC tại Việt Nam có những dấu
hiệu truyền thống nào để phát hiện?
Tình trạng kiệt quệ tài chính có là động lực thúc đầy
các hành vi gian lận BCTC tại Việt Nam hay không?
Mảng thông tin :
Mức độ truyền tài thông điệp của dữ liệu phi cấu trúc
dạng tin tức trực tuyến trong dự báo kiệt quệ tài chính
và phát hiện gian lận BCTC là như thế nào?
Sự kết hợp giữa dữ liệu phi cấu trúc và dữ liệu cấu trúc
có cải thiện được khả năng dự báo kiệt quệ tài chính
và phát hiện gian lận BCTC so với dữ liệu cấu trúc
truyền thống hay không ?
PHƯƠNG PHÁP NGHIÊN CỨU
Đầu tiên, bài nghiên cứu sử dụng quá trình phân tích thông điệp
văn bản và kĩ thuật Khai phá văn bản nhằm chuyển đổi dữ liệu phi
cấu trúc thành các dự liệu dạng số nhằm tích hợp xây dựng biến đại
diện tin tức phi cấu trúc NEWS . Các biến cấu trúc truyền thống
được đề cập dựa trên các nhân tố tác động đến tình trạng kiệt quệ
tài chính và hành vi gian lận BCTC
Xây dựng các mô hình cạnh trạnh bao gồm các biến cấu trúc truyền
thống nhằm xem xét mức độ tác động của từng nhân tố với tình
trạng kiệt quệ tài chính và gian lận ,cũng như mực độ kết hợp giữa
các nhân tố dự báo truyền thống.
Xây dựng mô hình thay thế là các mô hình cạnh tranh có bổ sung
thêm biến tin tức NEWS nhằm xem xét mức độ truyền tài thông
điệp của tin tức trực tuyến trong việc dự báo kiệt quệ tài chính và
gian lận cũng như khả năng kết hợp giữa hai biến cấu trúc truyền
thống và phi cấu trúc .
Xây dựng mô hình tối ưu nhất kết hợp giữa các nhân tố khác nhau
trên các nguồn dữ liệu khác nhau ( nếu có thể ) . Riêng mô hình tối
ưu dự báo kiệt quệ tài chính sẽ được sử dụng để tính xác suất kiệt
quệ để dự báo cho mô hình gian lận
NỘI DUNG NGHIÊN CỨU
Chương 1 : Tổng quan về kiệt quệ tài chính và
gian lận Báo cáo tài chính
Chương 2: Phân tích định tính tình hình kiệt quệ
tài chính và gian lận tại Việt Nam
Chương 3: Dữ liệu cấu trúc, phi cấu trúc và phân
tích dữ liệu văn bản
Chương 4: Xây dựng mô hình dự báo kiệt quệ tài
chính và gian lận BCTC
Chương 5: Mô tà dữ liệu và trình bày kết quả thực
nghiệm
Chương 6: Hạn chế và đề xuất
CHƯƠNG 1 : TỔNG QUAN VỀ KIỆT QUỆ TÀI
CHÍNH VÀ GIAN LẬN BÁO CÁO TÀI CHÍNH
Tiếp cận trên quan điểm lý thuyết
Tiếp cận dựa trên các dấu hiệu trên thị trường
Các nhân tố truyền thống ảnh hưởng đến tình trạng kiệt quệ tài
chính
1.1 Kiệt quệ tài
chính
TIẾP CẬN TRÊN QUAN ĐIỂM LÝ THUYẾT
Kiệt quệ tài chính được tiếp cận dựa trên quan
điểm lý thuyết được đề cập đến điển hình trong các
bài nghiên cứu của các tác giả Andrade và Kaplan
(1998); Baldwin và Mason (1983); Brown, James
và Mooradian (1992). Các nhà nghiên cứu này
tiếp cận vấn đề kiệt quệ tài chính dựa trên các nét
tương đồng với phá sản (Bankruptcy) và vỡ nợ
(Default). Vì không hề có sự phân biệt rõ ràng về
sự khác biệt giữa kiệt quệ tài chính so với vỡ nợ
và phá sản nên về mặt lý thuyết , khái niệm kiệt
quệ tài chính được định nghĩa nhiều khi có sự
tương tự với các khái niệm trên.
TIẾP CẬN DỰA TRÊN CÁC DẤU HIỆU TRÊN THỊ
TRƯƠNG
Cách tiếp cận này chủ yếu dựa trên các quy định
về niêm yết chứng khoán để có thể xác định được
thời điểm tương đối chính xác khi nào một công ty
bắt đầu bước vào tình trạng kiệt quệ tài chúng.
Dựa trên cách tiếp cận này thì sự khác biệt giữa
hai nhóm công ty kiệt quệ và khoẻ mạnh rõ ràng
hơn. Một số bài nghiên cứu về dự báo kiệt quệ tài
chính tại Trung quốc thường sử dụng thông tin từ
các sở giao dịch nhằm nhận dạng các công ty đang
bị phá sản hay công ty bị huỷ niêm yết, đồng thời
kết hợp với các quy định của luật chứng khoán.
Các nhân tố truyền thống ảnh hưởng đến tình
trạng kiệt quệ tài chính
Dòng tiền và các nhân tố
liên quan
Nhân tố quản trị công ty đại
chúng
Nhân tố vĩ mô
GIAN LẬN BÁO CÁO TÀI CHÍNH
Gian lận : Gian lận được định nghĩa ở nhiều từ điển khác
nhau.Từ điển thế giới của WEBSTER định nghĩa gian lận
như là sự lừa dối có chủ đích nhằm làm cho một người nào
đó từ bỏ tài sản hay quyền lợi hợp pháp của họ, bao gồm tất
cả những thủ thuật, trò gian trá (Trick), sự xảo trá
(Cunning), sử giả vờ (Dissembling).Từ điển thừa kế của Mỹ
định nghĩa Fraud là sự lừa dối cố ý được thực hiện để mà bảo
vệ cho các lợi ích mang tính không công bằng hay không
tuân theo luật pháp. Từ điển của Black định nghĩa Fraud là
việc sử dụng một cách có ý định những trò lừa đảo hay
những hành động hay cách thức không thành thật để có thể
giành được các lợi ích không hợp pháp. Ngoài ra còn có một
số định nghĩa khác như: Singleton (2006) định nghĩa Fraud
là sự đối ngược lại với sự thực (Truth), sự công bằng
(Fairness) và tính công bằng (Equity).
GIAN LẬN BCTC
Gian lận báo cáo tài chính là một phân nhóm lớn
về gian lận và đã được quan tâm nhiều trong thời
gian qua trên thế giới.Gian lận báo cáo tài chính
cũng là một trong những chủ đề được các nhà
nghiên cứu rất ưa thích hiện nay. Tuy nhiên, để
hiểu được bản chất của gian lận báo cáo tài chính
là điều không đơn giản. Sau đây là tổng quan tóm
tắt về những vấn đề then chốt nhất có liên quan
đến gian lận báo cáo tài chính.
Theo ACFE (Association of Certified Fraud Examiners)
gian lận báo cáo tài chính là việc có chủ đích, gian dối, nói
không đúng sự thực, hay việc loại trừ các sự thật hữu hình,
hay các dữ liệu kế bị làm sai lệch và khi xem xét tất các các
thông tin được cung cấp sẵn sẽ làm cho người đọc thay đổi
những đánh giá của anh ta hay cô ta hay thay đổi quyết
định. Do đó, khi các nhà quản lý của một công ty cung cấp
thông tin tài chính sai lệch, nó được gọi là gian lận báo cáo
tài chính. Với nền kinh tế đầy khó khăn như hiện nay, nhiều
công ty và tổ chức cần có sự chuẩn bị kỹ lưỡng để đối phó với
các hành vi gian lận. Ngoài ra có thể theo tác giả
(Singleton2006) Gian lận báo cáo tài chính bao gồm sự chủ
đích và sự lừa gạt được thực hiện bởi một đôi ngũ có kỹ
năng, kiến thức (ban chuyên viên cấp cao, các kiểm toán
viên nội bộ) với một hệ thống các chương trình được lập kế
hoạch hoàn hảo và một khả năng làm cho người khác rơi vào
bẫy của mình.
CÁC DẤU HIỆU NHÂN BIẾT GIAN LẬN BCTC
Tỳ số tài chính
Đặc điểm quản trị công ty đại chúng
Tình trạng kiệt quệ tài chính
PHÂN TÍCH ĐỊNH TÍNH TÌNH HÌNH
KIỆT QUỆ TÀI CHÍNH VÀ GIAN LẬN
TẠI VIỆT NAM
0
10000
20000
30000
40000
50000
60000
70000
0
5
10
15
20
25
30
35
40
2007 2008 2009 2010 2011 2012 2013
Hủy niêm yết bắt buôc
Kiểm soát, tạm ngưng giao dịch
Số lượng doanh nghiệp phá sản và giải thể
giai đoạn 2007-2013
TÌNH TRẠNG KIỆT QUỆ TÀI CHÍNH
Xét riêng các công ty niêm yết phi tài chính trên
HSX và HOSE, số lượng công ty bị hủy niêm yết
có sự tăng nhanh trong hai năm gần đâu , từ 4
công ty bị hủy niêm yết năm 2011 tăng lên 18
công ty trong năm 2012 và tiếp tục tăng mạnh
lên mức cao nhất là 37 công ty trong năm 2013,
trong đó có 25 công ty bị hủy niêm yết bắt buộc.
Điều này cho thấy toàn cảnh khu vực doanh
nghiệp tại Việt Nam vẫn đang tiếp tục biến động
xấu và tồn tại các dấu hiệu cho thấy nhiều công ty
đang trong tình trạng kiệt quệ tài chính dẫn đến
vỡ nợ và phá sản . Nguồn nhóm tự tổng hợp theo
thông tin trên hai sàn HOSE và HNX.
GIAN LẬN BCTC
Tính tới thời điểm 20/4/2009, số lượng công ty có
BCTC có sự sai lệch giữa trước và sau khi kiểm
toán là 194 trên tổng 357 công ty niêm yết trên
hai sàn giao dịch, trong đó đa phần các công ty có
sự sai lệch trọng yếu hơn 10% và hơn 45 công ty
có sự sai lệch sau kiểm toán hơn 50%. Trong số
gần 500 doanh nghiệp công bố báo cáo soát xét
sáu tháng đầu năm 2013, gần 300 doanh nghiệp
có sai lệch về số liệu giữa BCTC tự lập và Báo cáo
tài chính sau kiểm toán 6 tháng đầu năm 2013,
trong đó, gần 200 trường hợp phải điều chỉnh giảm
về doanh thu, lợi nhuận, số còn lại phải điều chỉnh
tăng
Nguồn: Thống kê của Stock.vn, 2009.
DỮ LIỆU PHI CẤU TRÚC VÀ PHÂN
TÍCH NỘI DUNG THÔNG ĐIỆP VĂN
BẢN
Phân biệt dữ liệu cấu trúc và phi cấu trúc
Theo quan điểm công nghệ thông tin, dữ liệu có
cấu trúc là “dạng thông tin có khả năng lưu trữ
trong các hệ quản trị cơ sở dữ liệu quan hệ (
relational database), trong đó các thực thể và
thuộc tính đã được định nghĩa sẵn”.
dữ liệu phi cấu trúc được định nghĩa là dạng dữ
liệu không có cấu trúc định nghĩa sãn và không
thể biểu diễn dưới dạng bảng số liệu quan hệ
(relational tables)”.
0
5000
10000
15000
20000
25000
0
2000000
4000000
6000000
8000000
10000000
12000000
2007 2008 2009 2010 2011 2012 2013
Số lượng tin
Số lượng từ
Phân tích văn bản ( Text analysis)
Chính đặc tính phi cấu trúc (không theo quy luật) và tính mờ (
không rõ ràng) của các dữ liệu phi cấu trúc gây khó khăn cho
các phần mềm máy tính truyền thống trong việc nhận dạng ,so
sánh và xử lý so với dữ liệu cấu trúc thông thường. Để khai
thác những tri thức cần thiết hoặc các thông điệp có ý nghĩa mà
thông tin phi cấu trúc truyền tải cần trải qua một quá trình gọi
là phân tích nội dung thông điệp (Content analysis). Riêng đối
với dữ liệu phi cấu trúc dạng chữ (text), quá trình này gọi là
phân tích văn bản (Textual Analysis) , tương ứng với kĩ thuật
khai thác văn bản Text- mining. Nhờ đó, thông tin văn bản
dạng chữ sẽ được chuyển sang dạng số, tạo điều kiện thuận lợi
trong xây dựng các biến đại diện thông tin trong nghiên cứu
tài chính .Các biến đại diện thông tin thường phản ánh ba
khíacạnh của thông điệp truyền tải: lượng thông tin trong
thông điệp (Amount), mức độ rõ ràng của thông điệp
(Transperency) và sắc thái của thông điệp ( Tone). “Tone” ( sắc
thái thông tin) thường được chú trọng hơn cả và các nhà
nghiên cứu thường chia sắc thái thông điệp thành hai dạng
Tích cực hoặc Tiêu cực.
Các kĩ thuật khai phá văn bản
Các bài nghiên cứu tài chính trên thế giới thường
lựa chọn hai phương pháp phổ biến nhất để rút
trích ý nghĩa từ các thông điệp văn bản, bao gồm
phương pháp Khai phá văn bản dạng Thống kê
“Statistical” và phương pháp dạng Tự điển từ
“Dictionary
Tổng quan nghiên cứu sử dụng dữ liệu phi cấu trúc trong dự báo
kiệt quệ tài chính và phát hiện gian lận
Frederik Hogenboom (2010) và cộng sự thiết kế phương pháp
SPEED ( mô hình phân biệt các sự kiện kinh tế dựa trên ngôn
ngữ học) , với mục tiêu dự báo các sự kiện kinh tế tài chính
tiêu biểu của doanh nghiệp như phá sản, gian lận, M&A,
SEOS/IPOs, phát hành trái phiếu, tái cấu trúc doanh nghiệp.
Các từ khóa tài chính được trích xuất từ trang Yahoo Finance!
của 100 doanh nghiệp trên sàn NASDAQ, sau đó ánh xạ chúng
với siêu dữ liệu tạo bởi từ điển Wordnet để giải thích nghĩa, từ
đó phân loại sự kiện một cách kịp thời và nhanh chóng nhất
cho nhà đầu tư. Ali Al-Jaoua (2010), ứng dụng phương pháp tự
điển từ và kĩ thuật phân lớp văn bản, nhằm dự báo các tin tức
ngắn theo các sự kiện tài chính là “ thay đổi nhân sự cao cấp”, “
vi phạm luật lệ ( kế toán)”, “chuyển giá” .(Larcker và
Zakolyukina [2010] tìm được nhiều bằng chứng cho thấy nhiều
mối tương quan giữa bàn tường thuật phát biểu của CEO và
CFO trong các cuộc họp với những sai phạm và gian lận trên
báo cáo tài chính. Rajan Gupta ( 2012) cũng tiến hành rút
trích các từ khóa theo phương pháp “ Một giỏ các từ khóa” (
Bag of words) và thuật toán SVM nhằm phát hiện gian lận xuất
hiện trên các Báo cáo tài chính của các công ty tại Ấn độ.
XÂY DỰNG MÔ HÌNH DỰ BÁO
Xây dựng biến NEWS tổng quát đại diện cho dữ liệu phi cấu
trúc
Đề xuất biến dạng cấu trúc truyền thống
Dự báo KQTC
Ba nhóm biến số dạng cấu trúc được để xuất đại diện
cho ba nhóm dấu hiệu phát hiển hành vi gian lận
BCTC được đề cập ở phần đầu bài nghiên cứu :
Nhóm biến tỷ số tài chính : Bảy biến số được đề cập
đại diện cho Mức độ nợ, thành phần tài sản, các khoản
mục kế toán có tính thanh khoản cao, Hiệu quả hoạt
động của công ty.
Nhóm biến đại diện cho đặc điểm Quản trị đại chúng
của công ty : Các biến số được xây dựng trên hai khía
cạnh Cấu trúc sở hữu và Đặc điểm Ban giám đốc.
Biến đại diện cho tình trạng kiệt quệ của công ty, được
tính bằng xác suất kiệt quệ của công ty theo mô hình
dự báo kiệt quệ tài chính tôi ưu nhất gi
PHAT HIEN GIAN LAN
Ba nhóm biến số dạng cấu trúc được để xuất đại diện
cho ba nhóm dấu hiệu phát hiển hành vi gian lận
BCTC được đề cập ở phần đầu bài nghiên cứu :
Nhóm biến tỷ số tài chính : Bảy biến số được đề cập
đại diện cho Mức độ nợ, thành phần tài sản, các khoản
mục kế toán có tính thanh khoản cao, Hiệu quả hoạt
động của công ty.
Nhóm biến đại diện cho đặc điểm Quản trị đại chúng
của công ty : Các biến số được xây dựng trên hai khía
cạnh Cấu trúc sở hữu và Đặc điểm Ban giám đốc.
Biến đại diện cho tình trạng kiệt quệ của công ty, được
tính bằng xác suất kiệt quệ của công ty theo mô hình
dự báo kiệt quệ tài chính tôi ưu nhất .