

Data analytic approach for bankruptcy prediction

Data analytic approach for bankruptcy prediction
저널명Journal name
게재일Date of publication
작성일Date of issue
2020-03-25 11:05


금융분야에서 기업들의 부도율 예측은 중요한 문제이며 기존에 금융지식과 회귀모델을 기업부도율 예측문제에 적용해 왔다. 그러나 모델의 예측 정확도 개선과 현장에서의 모델자동화 필요성에 의해 AI 모델 도입에 대한 요구가 있어왔다. 이 논문에서는 한국 기업 데이터의 skewness 를 해결하고 최신 머신러닝 모델을 도입하며 데이터를 분석하였다. 이를 통해 기업부도율에 관해 기존의 모델대비 AUC 정확도가 평균 17% 향상되는 결과를 얻어내었다. 뿐만 아니라 금융권에서 문제제기가 되어왓던 결과의 해석부분에 있어서도 XGBoost 모델의 feature importance 등을 통해 명확한 부도 결과 해석을 이끌어 내었다. 따라서 한국 기업데이터에 새로운 머신러닝 및 AI 기술을 적용함으로써 높은 예측율과 결과해석을 도출하고 금융산업에서의 적용가능성을 높임으로써 향후 핀테크분야의 핵심기술을 마련하는데 중요한 역할을 하였다. 이 결과는 본 교육연구단이 지향하는 수학기반 미래융합기술의 토대 구축 및 트렌트 세터로서의 역할을 하는 방향과 잘 맞다고 생각한다.



Bankruptcy prediction problem has been intensively studied over the past decades. From traditional statistical models to state of the art machine learning models, various predictive models are developed and applied to various datasets. However, models that use machine learning are not used in the field of business, for two main reasons. First, the prediction accuracy does not far exceed the statistical models and second, the results are not interpretable. In this study, we focused on solving the skewness which is a characteristic of financial data. By solving this problem, we obtained 17% average improvement in AUC over existing models. To address the second shortcoming, we analyze the importance of features identified by the XGBoost model. The interpretation of the model differs among categories of data. Our bankruptcy prediction model has high predictive accuracy with clear explanations and is therefore directly applicable to the industry.

kartal escort maltepe escort