Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo
Dữ liệu do con người tạo ra ngày càng nhiều hơn về số lượng, tăng nhanh về khối lượng, phát triển mạnh về quy mô khiến việc phân loại, lựa chọn, khai phá, sử dụng gặp những khó khăn nhất định. Mục tiêu bài viết nhằm tổng quan các ứng dụng của kỹ thuật khai phá dữ liệu trong lĩnh vực kiểm toán. Ứng dụng khai phá dữ liệu trong lĩnh vực kiểm toán liên quan đến dịch vụ đảm bảo và tính tuân thủ (phát hiện gian lận, tình hình tài chính) và kế toán điều tra. Qua đó, giúp hiểu hơn về vai trò của khai phá dữ liệu và rộng hơn là dữ liệu lớn (big data), cũng như cơ hội cho các nghiên cứu ứng dụng trong tương lai
loại hình gian lận có ảnh hưởng xấu đến các bên liên quan thông qua các báo cáo tài chính gây hiểu nhầm hoặc gian lận (FFS) (Elliott và Willingham, 1980). Do đó, nhiều nhà nghiên cứu tập trung vào việc phát hiện FFS với sự trợ giúp của việc khai phá dữ liệu ở các cấp khác nhau: dựa trên gian lận của nhà quản lý cấp cao (Fanning và Cogger, 1998, Pai và cộng sự, 2011), phát hiện gian lận dựa trên dự đoán về kết quả hoạt động trong tương lại của công ty (Virdhagriswaran và Dakin, 2006) và phát hiện gian lận trong các báo cáo tài chính (Kirkos và cộng sự, 2007; Perols, 2011). Các kết luận quan trọng của các tác giả này bao gồm: khả năng của các mô hình mạng thần kinh phân loại thành viên trong các cơ sở nghiên cứu SEC so với các cơ sở không điều tra với độ chính xác cao. Một giải thích cho thành công tương đối của mạng nơron là khả năng sử dụng các quy trình học tập thích ứng để xác định điều gì là quan trọng để phân biệt “tín hiệu” thực từ các tín hiệu nhiễu. Các nghiên cứu cũng khảo sát hiệu quả của việc kết hợp các chỉ số tài chính và quản trị, các yếu tố ngoại sinh và nội sinh và lựa chọn tính năng để phát hiện các báo cáo tài chính sai lệch. Theo dòng nghiên cứu, nghiên cứu của Gaganis (2009) liên quan đến việc sử dụng các kỹ thuật phân loại khai phá dữ liệu kết hợp cả dữ liệu tài chính và phi tài chính cho xác định FFS và kết luận rằng sự phân loại chính xác phụ thuộc vào cách dữ liệu được xử lý trước, chức năng khách quan, và chiến lược tìm kiếm của mô hình. Alden và cộng sự (2012) đã sử NGHIEÂN CÖÙU TRAO ÑOÅI NGHIÊN CỨU KHOA HỌC KIỂM TOÁN36 Số 119 - tháng 9/2017 dụng các thuật toán di truyền để phát hiện các mẫu FFS và kết luận rằng ước lượng thuật toán phân phối cho thấy khả năng phân loại mô hình gian lận tài chính tốt hơn so với mô hình hồi quy xác suất truyền thống. Cụ thể hơn, Lin và cộng sự (2003) đã phát triển mô hình mạng nơ ron tích hợp để đánh giá nguy cơ FFS. Mô hình mạng thần kinh mờ của Lin và cộng sự (2003) đã vượt trội hơn hầu hết các mô hình thống kê và mạng thần kinh khớp thần kinh được báo cáo trong các nghiên cứu trước và hiệu quả của nó so với mô hình hồi quy logit. Liou (2008) đã khám phá ra sự khác biệt và tương đồng giữa phát hiện báo cáo tài chính giả mạo và các mô hình dự báo thất bại kinh doanh bằng cách sử dụng hồi quy logistic, mạng nơ ron và cây quyết định và nhận thấy rằng các yếu tố tài chính được sử dụng để phát hiện các báo cáo gian lận là hữu ích trong dự báo thất bại kinh doanh. Welch và cộng sự (1998) đã phát triển một hệ thống phân loại dựa trên khai phá dữ liệu để xây dựng mô hình quyết định của kiểm toán viên khi ước tính khả năng gian lận bởi các nhà thầu phát triển hồ sơ thầu cho các hợp đồng của Chính phủ và báo cáo rằng trong các mô hình quyết định phân loại liên quan đến chế biến, sản xuất các mô hình cải tiến khi so sánh với các phương pháp toán học truyền thống. Kochetovakozloski và cộng sự (2011) đã sử dụng khai phá dữ liệu để cải thiện xét đoán của kiểm toán viên về các sự kiện “quản trị” gian lận. Hành vi điều chỉnh lợi nhuận Trong lĩnh vực tiên đoán về quản trị lợi nhuận, Tsai và Chiou (2009) đã phát triển mạng lưới thần kinh và các mô hình cây quyết định để các nhà đầu tư sử dụng để dự đoán mức độ quản trị lợi nhuận trước đó và đánh giá mức độ tăng giảm của lợi nhuận sau đó. Kết quả của Tsai và Chiou (2009) chỉ ra rằng sử dụng các kỹ thuật khai phá dữ liệu đã làm tăng đáng kể dự báo về quản trị lợi nhuận và các quy tắc ra quyết định giúp xác định việc quản trị lợi nhuận. Mặt khác, Ezazi và cộng sự (2013) đã kiểm tra tính hữu dụng của các kỹ thuật khai phá dữ liệu khác nhau trong dự đoán quản trị lợi nhuận và đặt câu hỏi về giả thiết tuyến tính cho việc mô hình biến kế toán dồn tích tùy ý và kết luận rằng một cách tiếp cận phi tuyến tính để dự đoán việc quản trị lợi nhuận hiệu quả hơn phương pháp tuyến tính. Tập trung vào việc phát hiện quản trị lợi nhuận, Jones (1991) đưa ra mô hình tích lũy bằng cách sử dụng một thuật toán di truyền. Kết quả cho thấy sự vượt trội của các thuật toán di truyền so với các phương pháp phân cụm. Để giải quyết vấn đề số liệu sẵn có trong ước tính chuỗi thời gian, Hoglund (2013) nhận thấy mô hình Jones dựa trên hồi quy tuyến tính mờ tốt hơn mô hình Jones dựa trên hồi quy trong việc phát hiện quản trị lợi nhuận được mô tả khi các chuỗi thời gian ước lượng ngắn. Song và cộng sự (2013) đã kiểm tra mối liên quan giữa quản trị lợi nhuận và khai khống tài sản và phát hiện ra rằng việc khai khống tài sản có mối liên quan đáng kể với biến kế toán dồn tích tùy ý. Tóm lại, các ứng dụng khai phá dữ liệu trong kiểm toán và dịch vụ đảm bảo tập trung chủ yếu vào hai chủ đề chính: kiểm toán (bao gồm các giai đoạn ký kết, lập kế hoạch, thực hiện và sau kiểm toán) và kế toán điều tra (phát hiện gian lận và quản trị lợi nhuận). Mục tiêu chính của các ứng dụng trong lĩnh vực này là dự đoán và nhiệm vụ chính là phân loại. Các kỹ thuật nổi trội là các mạng nơ-ron và hồi quy. Các cơ hội nghiên cứu trong tương lai bao gồm: tăng các dữ liệu đầu vào với các biến số liên quan đến đặc điểm quản trị, thử nghiệm các cách tiếp cận khác nhau để kết hợp các cách phân loại, kiểm tra các thuật toán học khác nhau và các mô hình cấu trúc, khám phá các thời gian khác nhau và các phương pháp tiền xử lý dữ liệu, mở rộng phạm vi phát triển mô hình tới nhiều loại hình kinh doanh và nhiều lựa chọn hơn, tăng thời gian dự đoán bao gồm các biến phi tài chính và phân tích trực quan hơn, chú ý nhiều hơn đến so sánh mô hình, chuẩn hóa dữ liệu và khai phá văn bản trong dự báo gian lận tài chính. 4. kết luận Bài viết tổng quan các nghiên cứu liên quan đến ứng dụng khai phá dữ liệu trong lĩnh vực kiểm NGHIÊN CỨU KHOA HỌC KIỂM TOÁN 37Số 119 - tháng 9/2017 toán và dịch vụ đảm bảo. Hầu hết, các nghiên cứu cho thấy khai phá dữ liệu ngày càng đóng vai trò quan trọng và tăng tính hiệu quả cho công việc của kiểm toán viên. Tại Việt Nam, nghiên cứu về ứng dụng khai phá dữ liệu trong kiểm toán còn chưa được chú ý. Nghiên cứu trong tương lai về lĩnh vực này sẽ là hướng đi phù hợp và tiềm năng cho các nhà nghiên cứu lẫn các nghiên cứu ứng dụng, triển khai trong thực tiễn. TÀI LIỆU THAM KHẢO 1. Anandarajan, M., Anandarajan, A., 1999. A comparison of machine learning techniques with a qualitative response model for auditor’s going concern reporting. Expert Syst. Appl. 16 (4), 385–392. 2. Argyrou, A., Andreev, A., 2011. A semi-supervised tool for clustering accounting databases with applications to internal controls. Expert Syst. Appl. 38 (9), 11176–11181. 3. Beynon, M.J., Peel, M.J., Tang, Y.C., 2004. The application of fuzzy decision tree analysis in an exposition of the antecedents of audit fees. Omega 32 (3), 231–244. 4. Bhimani, A., Gulamhussen, M.A., Lopes, S., 2009. The effectiveness of the auditor’s going-concern evaluation as an external governance mechanism: evidence fromloan defaults.Int.J.Account.44(3) ,239–255. 5. Blacconiere, W.G., DeFond, M.L., 1997. An investigation of independent audit opinions and subsequent independent auditor litigation of publicly-traded failed savings and loans. J. Account. Public Policy 16 (4), 415–454. 6. Busta, B., Weinberg, R., 1998. Using Benford’s law and neural networks as a review procedure. Manag. Audit. J. 13 (6), 356–366. 7. Calderon, T.G., 1999. Neural networks and preliminary information risk assessment in an auditing environment. Account. Enq. 8, 245–290. 8. Calderon, T.G., Cheh, J.J., 2002. A roadmap for future neural networks research in auditing and risk assessment. Int. J. Account. Inf. Syst. 3 (4), 203–236. 9. Callen, J.L., Kwan, C.C., Yip, P.C., Yuan, Y., 1996. Neural network forecasting of quarterly accounting earnings. Int. J. Forecast. 12 (4), 475–482. 10. Cerullo, M.J., Cerullo, M.V., 2006. Using neural network software as a forensic accounting tool. Information Systems Control Journal 2, 33. 11. Debreceny, R.S., Gray, G.L., 2010. Data mining journal entries for fraud detection: an exploratory study. Int. J. Account. Inf. Syst. 11 (3), 157–181. 12. Debreceny, R.S., Gray, G.L., 2011. Data mining of electronic mail and auditing: a research agenda. J. Inf. Syst. 25 (2), 195–226. 13. Evans, J.R., 2013. Business Analytics: Methods, Models, and Decisions. Prentice-Hall, Boston, MA. 14. Issa, H., Kogan, A., 2014. A predictive ordered logistic regression model as a tool for quality review of control risk assessments. J. Inf. Syst. 28 (2), 209–229. 15. Jans, M., Alles, M., Vasarhelyi, M., 2013. The case for process mining in auditing: sources of value added and areas of application. Int. J. Account. Inf. Syst. 14 (1), 1–20. 16. Jo, H., Han, I., Lee, H., 1997. Bankruptcy prediction using case-based reasoning, neural networks, and discriminant analysis. Expert Syst. Appl. 13 (2), 97–108. 17. Jones, J.J., 1991. Earnings management during import relief investigations. J. Account. Res. 193–228. 18. Jones, F.L., 1996. The information content of the auditor’s going concern evaluation. J. Account. Public Policy 15 (1), 1–27. 19. Kirkos, E., 2012. Predicting auditor switches by applying data mining. Journal of Applied Economic Sciences 3 (21), 246–261. 20. Kirkos, E., Spathis, C., Manolopoulos, Y., 2007. Data mining techniques for the detection of fraudulent financial statements. Expert Syst. Appl. 32 (4), 995–1003. 21. Kirkos, E., Spathis, C., Manolopoulos, Y., 2008. Support vector machines, decision trees and neural networks for auditor selection. Journal of Computational Methods in. 22. Science and Engineering 8 (3), 213–224. 23. Tackett, J.A., 2013. Association rules for fraud detection. Journal of Corporate Accounting and Finance 24 (4), 15–22. ...
File đính kèm:
- vai_tro_cua_khai_pha_du_lieu_trong_linh_vuc_kiem_toan_va_dic.pdf