Нейропрогнозы дефолта
Модель, использующая искусственную нейросеть и алгоритмы глубинного обучения, дала более точные прогнозы по дефолту заемщиков, чем стандартный скоринг, которым занимаются кредитные бюро. К такому выводу пришли исследователи из Питтсбургского университета, разработавшие и протестировавшие такую модель на данных заемщиков США.
Это первая модель нейросети, основанная на значительной выборке данных кредитных бюро, то есть на той же информации, с помощью которой осуществляется обычный кредитный скоринг, а также учитывающая все ограничения, налагаемые законодательством США, отмечают авторы.
Прогнозировать дефолт заемщика с помощью стандартного эконометрического подхода затруднительно, поскольку между факторами, влияющими на дефолт, имеются сложные нелинейные взаимосвязи. Ученые сочли, что с прогнозом, учитывающим большой объем многоуровневых данных, лучше справится искусственная нейросеть, нежели логистическая регрессия – метод, использующийся в обычном кредитном скоринге.
Исследователи основывались на квартальных данных одного из крупнейших кредитных бюро США, Experian, за период 2004–2015 гг. В них содержалось более 200 переменных по выборке из 1 млн домохозяйств, в том числе сведения об имеющихся у потребителей займах, кредитных платежах и просрочках по платежам. Во входные данные не были включены демографические характеристики.
Создатели нейросети, как и кредитные бюро, ориентировались на то, что заемщик допустил дефолт, если просрочил платеж по кредиту на 90 дней и более. Заемщики, попадающие в категории от только что взявших кредит до тех, кто просрочил платеж на 60 дней и более (но менее 90 дней), считались «текущими».
Для выработки прогнозов нейросеть тренировалась на квартальных данных с 2004 по 2011 г. и затем применяла полученные навыки на данных за восемь последующих кварталов.
Тестирование показало, что обученная нейросеть делает более точные прогнозы по дефолту заемщиков, чем модель, применяющаяся в обычном кредитном скоринге. Так, точность прогноза традиционного скоринга составляла 98–99,4%, нейросети – не ниже 99,9%; точность ранжирования по группам риска – не ниже 85,4% у нейросети против 79–81,4% у традиционного скоринга. Авторы также протестировали способность нейросети прогнозировать системный риск в случае дефолтов заемщиков, рассчитав агрегированную вероятность дефолта в 2006–2013 гг. и сравнив ее с реальными показателями. Выяснилось, что нейросеть правильно предсказала взлет просрочки по кредитным платежам в 2007–2009 гг., а также сокращение ее уровня после кризиса.
Кроме того, исследователи подсчитали возможную выгоду для потребителей, поведение которых предсказывает нейросеть, а не обычный кредитный скоринг. Совокупная экономия заемщиков из выборки на ставках обслуживания кредитных карт, возникающая благодаря более точному прогнозу нейросети, оценивается в $723,6 млн.