Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo

Dữ liệu do con người tạo ra ngày càng nhiều hơn về số lượng, tăng nhanh về khối lượng, phát triển mạnh về quy mô khiến việc phân loại, lựa chọn, khai phá, sử dụng gặp những khó khăn nhất định. Mục tiêu bài viết nhằm tổng quan các ứng dụng của kỹ thuật khai phá dữ liệu trong lĩnh vực kiểm toán. Ứng dụng khai phá dữ liệu trong lĩnh vực kiểm toán liên quan đến dịch vụ đảm bảo và tính tuân thủ (phát hiện gian lận, tình hình tài chính) và kế toán điều tra. Qua đó, giúp hiểu hơn về vai trò của khai phá dữ liệu và rộng hơn là dữ liệu lớn (big data), cũng như cơ hội cho các nghiên cứu ứng dụng trong tương lai

pdf8 trang | Chuyên mục: Kế Toán Thương Mại Dịch Vụ | Chia sẻ: yen2110 | Lượt xem: 243 | Lượt tải: 0download
Tóm tắt nội dung Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
 loại hình gian lận 
có ảnh hưởng xấu đến các bên liên quan thông qua 
các báo cáo tài chính gây hiểu nhầm hoặc gian lận 
(FFS) (Elliott và Willingham, 1980). Do đó, nhiều 
nhà nghiên cứu tập trung vào việc phát hiện FFS với 
sự trợ giúp của việc khai phá dữ liệu ở các cấp khác 
nhau: dựa trên gian lận của nhà quản lý cấp cao 
(Fanning và Cogger, 1998, Pai và cộng sự, 2011), 
phát hiện gian lận dựa trên dự đoán về kết quả hoạt 
động trong tương lại của công ty (Virdhagriswaran 
và Dakin, 2006) và phát hiện gian lận trong các 
báo cáo tài chính (Kirkos và cộng sự, 2007; Perols, 
2011). Các kết luận quan trọng của các tác giả này 
bao gồm: khả năng của các mô hình mạng thần 
kinh phân loại thành viên trong các cơ sở nghiên 
cứu SEC so với các cơ sở không điều tra với độ 
chính xác cao. Một giải thích cho thành công tương 
đối của mạng nơron là khả năng sử dụng các quy 
trình học tập thích ứng để xác định điều gì là quan 
trọng để phân biệt “tín hiệu” thực từ các tín hiệu 
nhiễu. Các nghiên cứu cũng khảo sát hiệu quả của 
việc kết hợp các chỉ số tài chính và quản trị, các 
yếu tố ngoại sinh và nội sinh và lựa chọn tính năng 
để phát hiện các báo cáo tài chính sai lệch. Theo 
dòng nghiên cứu, nghiên cứu của Gaganis (2009) 
liên quan đến việc sử dụng các kỹ thuật phân loại 
khai phá dữ liệu kết hợp cả dữ liệu tài chính và phi 
tài chính cho xác định FFS và kết luận rằng sự phân 
loại chính xác phụ thuộc vào cách dữ liệu được xử 
lý trước, chức năng khách quan, và chiến lược tìm 
kiếm của mô hình. Alden và cộng sự (2012) đã sử 
NGHIEÂN CÖÙU TRAO ÑOÅI
NGHIÊN CỨU KHOA HỌC KIỂM TOÁN36 Số 119 - tháng 9/2017
dụng các thuật toán di truyền để phát hiện các mẫu 
FFS và kết luận rằng ước lượng thuật toán phân 
phối cho thấy khả năng phân loại mô hình gian lận 
tài chính tốt hơn so với mô hình hồi quy xác suất 
truyền thống. Cụ thể hơn, Lin và cộng sự (2003) 
đã phát triển mô hình mạng nơ ron tích hợp để 
đánh giá nguy cơ FFS. Mô hình mạng thần kinh 
mờ của Lin và cộng sự (2003) đã vượt trội hơn hầu 
hết các mô hình thống kê và mạng thần kinh khớp 
thần kinh được báo cáo trong các nghiên cứu trước 
và hiệu quả của nó so với mô hình hồi quy logit. 
Liou (2008) đã khám phá ra sự khác biệt và tương 
đồng giữa phát hiện báo cáo tài chính giả mạo và 
các mô hình dự báo thất bại kinh doanh bằng cách 
sử dụng hồi quy logistic, mạng nơ ron và cây quyết 
định và nhận thấy rằng các yếu tố tài chính được sử 
dụng để phát hiện các báo cáo gian lận là hữu ích 
trong dự báo thất bại kinh doanh. Welch và cộng 
sự (1998) đã phát triển một hệ thống phân loại dựa 
trên khai phá dữ liệu để xây dựng mô hình quyết 
định của kiểm toán viên khi ước tính khả năng 
gian lận bởi các nhà thầu phát triển hồ sơ thầu 
cho các hợp đồng của Chính phủ và báo cáo rằng 
trong các mô hình quyết định phân loại liên quan 
đến chế biến, sản xuất các mô hình cải tiến khi so 
sánh với các phương pháp toán học truyền thống. 
Kochetovakozloski và cộng sự (2011) đã sử dụng 
khai phá dữ liệu để cải thiện xét đoán của kiểm 
toán viên về các sự kiện “quản trị” gian lận.
Hành vi điều chỉnh lợi nhuận
Trong lĩnh vực tiên đoán về quản trị lợi nhuận, 
Tsai và Chiou (2009) đã phát triển mạng lưới thần 
kinh và các mô hình cây quyết định để các nhà đầu 
tư sử dụng để dự đoán mức độ quản trị lợi nhuận 
trước đó và đánh giá mức độ tăng giảm của lợi 
nhuận sau đó. Kết quả của Tsai và Chiou (2009) 
chỉ ra rằng sử dụng các kỹ thuật khai phá dữ liệu đã 
làm tăng đáng kể dự báo về quản trị lợi nhuận và 
các quy tắc ra quyết định giúp xác định việc quản 
trị lợi nhuận. Mặt khác, Ezazi và cộng sự (2013) 
đã kiểm tra tính hữu dụng của các kỹ thuật khai 
phá dữ liệu khác nhau trong dự đoán quản trị lợi 
nhuận và đặt câu hỏi về giả thiết tuyến tính cho 
việc mô hình biến kế toán dồn tích tùy ý và kết luận 
rằng một cách tiếp cận phi tuyến tính để dự đoán 
việc quản trị lợi nhuận hiệu quả hơn phương pháp 
tuyến tính. Tập trung vào việc phát hiện quản trị lợi 
nhuận, Jones (1991) đưa ra mô hình tích lũy bằng 
cách sử dụng một thuật toán di truyền. Kết quả cho 
thấy sự vượt trội của các thuật toán di truyền so 
với các phương pháp phân cụm. Để giải quyết vấn 
đề số liệu sẵn có trong ước tính chuỗi thời gian, 
Hoglund (2013) nhận thấy mô hình Jones dựa trên 
hồi quy tuyến tính mờ tốt hơn mô hình Jones dựa 
trên hồi quy trong việc phát hiện quản trị lợi nhuận 
được mô tả khi các chuỗi thời gian ước lượng ngắn. 
Song và cộng sự (2013) đã kiểm tra mối liên quan 
giữa quản trị lợi nhuận và khai khống tài sản và 
phát hiện ra rằng việc khai khống tài sản có mối 
liên quan đáng kể với biến kế toán dồn tích tùy ý.
Tóm lại, các ứng dụng khai phá dữ liệu trong 
kiểm toán và dịch vụ đảm bảo tập trung chủ yếu 
vào hai chủ đề chính: kiểm toán (bao gồm các giai 
đoạn ký kết, lập kế hoạch, thực hiện và sau kiểm 
toán) và kế toán điều tra (phát hiện gian lận và 
quản trị lợi nhuận). Mục tiêu chính của các ứng 
dụng trong lĩnh vực này là dự đoán và nhiệm vụ 
chính là phân loại. Các kỹ thuật nổi trội là các 
mạng nơ-ron và hồi quy. Các cơ hội nghiên cứu 
trong tương lai bao gồm: tăng các dữ liệu đầu vào 
với các biến số liên quan đến đặc điểm quản trị, thử 
nghiệm các cách tiếp cận khác nhau để kết hợp các 
cách phân loại, kiểm tra các thuật toán học khác 
nhau và các mô hình cấu trúc, khám phá các thời 
gian khác nhau và các phương pháp tiền xử lý dữ 
liệu, mở rộng phạm vi phát triển mô hình tới nhiều 
loại hình kinh doanh và nhiều lựa chọn hơn, tăng 
thời gian dự đoán bao gồm các biến phi tài chính 
và phân tích trực quan hơn, chú ý nhiều hơn đến so 
sánh mô hình, chuẩn hóa dữ liệu và khai phá văn 
bản trong dự báo gian lận tài chính.
4. kết luận
Bài viết tổng quan các nghiên cứu liên quan 
đến ứng dụng khai phá dữ liệu trong lĩnh vực kiểm 
NGHIÊN CỨU KHOA HỌC KIỂM TOÁN 37Số 119 - tháng 9/2017
toán và dịch vụ đảm bảo. Hầu hết, các nghiên cứu 
cho thấy khai phá dữ liệu ngày càng đóng vai trò 
quan trọng và tăng tính hiệu quả cho công việc của 
kiểm toán viên. Tại Việt Nam, nghiên cứu về ứng 
dụng khai phá dữ liệu trong kiểm toán còn chưa 
được chú ý. Nghiên cứu trong tương lai về lĩnh vực 
này sẽ là hướng đi phù hợp và tiềm năng cho các 
nhà nghiên cứu lẫn các nghiên cứu ứng dụng, triển 
khai trong thực tiễn.
TÀI LIỆU THAM KHẢO
1. Anandarajan, M., Anandarajan, A., 
1999. A comparison of machine learning 
techniques with a qualitative response 
model for auditor’s going concern reporting. 
Expert Syst. Appl. 16 (4), 385–392.
2. Argyrou, A., Andreev, A., 2011. A 
semi-supervised tool for clustering 
accounting databases with applications to 
internal controls. Expert Syst. Appl. 38 (9), 
11176–11181.
3. Beynon, M.J., Peel, M.J., Tang, Y.C., 2004. 
The application of fuzzy decision tree 
analysis in an exposition of the antecedents 
of audit fees. Omega 32 (3), 231–244.
4. Bhimani, A., Gulamhussen, M.A., Lopes, 
S., 2009. The effectiveness of the auditor’s 
going-concern evaluation as an external 
governance mechanism: evidence fromloan 
defaults.Int.J.Account.44(3) ,239–255.
5. Blacconiere, W.G., DeFond, M.L., 1997. An 
investigation of independent audit opinions 
and subsequent independent auditor 
litigation of publicly-traded failed savings 
and loans. J. Account. Public Policy 16 (4), 
415–454.
6. Busta, B., Weinberg, R., 1998. Using 
Benford’s law and neural networks as a 
review procedure. Manag. Audit. J. 13 (6), 
356–366.
7. Calderon, T.G., 1999. Neural networks and 
preliminary information risk assessment in 
an auditing environment. Account. Enq. 8, 
245–290.
8. Calderon, T.G., Cheh, J.J., 2002. A roadmap 
for future neural networks research in 
auditing and risk assessment. Int. J. Account. 
Inf. Syst. 3 (4), 203–236.
9. Callen, J.L., Kwan, C.C., Yip, P.C., Yuan, 
Y., 1996. Neural network forecasting of 
quarterly accounting earnings. Int. J. 
Forecast. 12 (4), 475–482.
10. Cerullo, M.J., Cerullo, M.V., 2006. Using 
neural network software as a forensic 
accounting tool. Information Systems 
Control Journal 2, 33.
11. Debreceny, R.S., Gray, G.L., 2010. Data 
mining journal entries for fraud detection: 
an exploratory study. Int. J. Account. Inf. 
Syst. 11 (3), 157–181.
12. Debreceny, R.S., Gray, G.L., 2011. Data 
mining of electronic mail and auditing: a 
research agenda. J. Inf. Syst. 25 (2), 195–226.
13. Evans, J.R., 2013. Business Analytics: 
Methods, Models, and Decisions. 
Prentice-Hall, Boston, MA.
14. Issa, H., Kogan, A., 2014. A predictive 
ordered logistic regression model as a tool for 
quality review of control risk assessments. J. 
Inf. Syst. 28 (2), 209–229.
15. Jans, M., Alles, M., Vasarhelyi, M., 2013. The 
case for process mining in auditing: sources 
of value added and areas of application. Int. 
J. Account. Inf. Syst. 14 (1), 1–20.
16. Jo, H., Han, I., Lee, H., 1997. Bankruptcy 
prediction using case-based reasoning, 
neural networks, and discriminant analysis. 
Expert Syst. Appl. 13 (2), 97–108.
17. Jones, J.J., 1991. Earnings management 
during import relief investigations. J. 
Account. Res. 193–228.
18. Jones, F.L., 1996. The information content 
of the auditor’s going concern evaluation. J. 
Account. Public Policy 15 (1), 1–27.
19. Kirkos, E., 2012. Predicting auditor switches 
by applying data mining. Journal of Applied 
Economic Sciences 3 (21), 246–261.
20. Kirkos, E., Spathis, C., Manolopoulos, 
Y., 2007. Data mining techniques for the 
detection of fraudulent financial statements. 
Expert Syst. Appl. 32 (4), 995–1003.
21. Kirkos, E., Spathis, C., Manolopoulos, Y., 
2008. Support vector machines, decision trees 
and neural networks for auditor selection. 
Journal of Computational Methods in.
22. Science and Engineering 8 (3), 213–224.
23. Tackett, J.A., 2013. Association rules for 
fraud detection. Journal of Corporate 
Accounting and Finance 24 (4), 15–22.
...

File đính kèm:

  • pdfvai_tro_cua_khai_pha_du_lieu_trong_linh_vuc_kiem_toan_va_dic.pdf