p2p网贷风险防控
摘自杂志文章《基于公开信息的网络借贷平台预警机制研究----利用BP神经网络法》,原文发表于《现代商贸工业》(国内统一序号:CN42-1687/t;ISSN 1672-3198),2019年第1期,第134页。[本文为全文]
一.导言
近年来,P2P行业出现井喷式发展,对我国金融体系的完善、中小企业资金缺口的弥补、个人现金流的补充都具有重要意义。然而,随着行业竞争的激烈,P2P行业的各种风险也在不断显露。2016年以来,我国P2P频现庞氏骗局、跑路等事件,涉案金额巨大,社会影响极其恶劣。目前,我国金融监管从业人员的数量远远少于金融机构,职权不清导致其难以履行真正的职能。基于这一背景,本文试图利用最易获取的公开数据建立一个有效的预警模型,从而帮助监管者完成对海量金融机构的低成本有效筛选。
国务院总理李克强在2014年9月达沃斯论坛上公开发出“大众创业、万众创新”的号召。伴随着“双创”这个词的,还有“互联网金融”。在十二届全国人大三次会议上,李克强总理首次公开提及互联网金融。这是政府部门首次公开提及互联网金融行业。自此,P2P网贷行业在中国进入野蛮生长期。从2012年开始,新增P2P平台数量逐渐增加,2014-2015年达到顶峰,最高月份新增平台数量达到256家。然后,新增平台数量逐渐减少,网贷平台总数从2017年开始逐渐稳定。
巴菲特说过,“退潮了才知道谁在裸泳。”随着互联网金融的退潮,中国经济的主基调将呈L型,热钱将逐渐退出网贷市场,国家相关扶持政策也将收紧,有问题的网贷平台数量将逐渐上升。2015年7月,最糟糕的一年,问题平台多达171家,之后问题平台数量开始逐渐减少。然而,自2017年12月以来,问题平台数量一直呈上升趋势,2018年7月,问题平台多达131家。冰冷的数据背后,是无数因为平台跑路而支离破碎的家庭,以及全国公安经侦部门巨大的破案压力。
本文以网络公开信息为基础,选取13个指标作为P2P网络平台风险预警指标体系,建立了包括输入层、隐含层和输出层的BP神经网络预警模型。利用Python软件对建立的神经网络进行训练。在期望输出值和样本输出值的误差降低到标准范围后,建立预警模型。
第二,建立基于公开信息的风险预警模型的必要性
随着信息技术的快速发展和使用,人们的生活方式发生了巨大的变化。金融就是利用海量信息实现资金的最有效配置。随着互联网信息的使用,金融业本身也必将迎来巨大的变革。在这场革命中,金融不再只是纽约证交所西装革履的经纪人的专利。信息技术打破了金融参与的门槛,现在每个人都可以参与这场资金的盛宴。就像现在大家都已经接受了使用支付宝一样,“骗子”、“赌博”、“薅羊毛”等负面标签也会逐渐从网贷平台上淡出,逐渐成为人们理财的一种选择。面对复杂多变的网贷平台风险,有必要建立有效的网贷平台风险预警模型。
(一)实时监控的必要性
网贷平台的风险不是一成不变的,但是大量网贷平台的人工检测,不仅效率低下,也是对公共资源的极大浪费。只有利用网络预警模型,才能实现对网贷平台的实时监控,以最小的人力物力完成平台风险的前期排查。
(2)个人使用的必要性
(3)需要
随着中国网贷行业市场清理的加速,一些网贷平台倾向于浑水摸鱼。与典型的网贷迅雷公司相比,持续时间长,金额相差极大。在杭州的网贷平台跑路潮中,很明显很多公司上线才几个月。这些公司正是利用了当前经侦部门压力大、精力不足的空档,大有一枪换一枪的趋势。因为金额比较小,增加了被骗投资者维权的难度。因此,利用这种模式可以快速警示没有太多历史记录的新公司,将这种“欺诈游击战”的不良势头扼杀在萌芽状态。
第三,网贷风险预警指标体系的设置
(一)国内外网贷机构的差异
在英美等西方发达国家,P2P平台只是一个纯粹的信息中介,不参与任何借贷交易,也没有任何赔偿投资人损失的责任。因为英美等发达国家有比较完善的个人征信系统,投资者可以根据借款人的信用状况和财产归属自由出价,确定合适的资本收益率。此外,英国等国家有比较完善的监管政策和规范,有专门的部门对P2P进行监管,职责明确。比如美国的证券交易委员会,英国的市场行为管理局和P2P金融协会,规范的政策和完善的监管有效的控制了这些国家P2P的风险。
虽然征信系统在国内逐渐普及,但普遍来说一切都不完善,P2P目前也没有权限与国家征信系统对接,借款人的风险很难得到全面客观的暴露。因此,投资者往往开始寻求“可靠”、“有保障”的P2P平台。这也使得P2P平台不得不宣传自己的“担保”、“国资背景”、“自有保障基金”来增加自己的信用。这使得P2P平台只是另一种银行,形成了一个恶性循环,当一个小企业违约时,P2P公司为了平台本身的声誉,会选择掩盖过去,最终不得不跑路。目前我国资管新规已经明确表示要打破刚信支付,但是借款人在接受投资的时候还需要一段时间才能亏损。
(二)网贷平台风险因素
网贷平台的风险可以
从系统风险和非系统风险两个层面进行分析,结合网贷平台自身特点,筛选出最能代表性的风险因素。
网贷平台的系统性风险主要有政策风险、法律风险和经济周期风险。犹豫政策上的宽松法规的不健全等,导致平台数量疯长并引发恶性竞争,甚至会出现劣币驱逐良币的情况。另外经济周期的影响也是无法忽视的,随着全球经济的转冷反全球化趋势的越发严重,很多大型金融机构都无法支撑何况新兴的网贷平台。但本文目标更多是从微观角度检测企业风险,因此暂不考虑经济周期。
网贷平台的非系统风险有信用风险、品牌风险、技术风险等。为了尽可能争取客户很多平台会有意放宽放款条件,这导致了大批老赖的进入以及部分投机分子的薅羊毛行为。有证据显示,现在很多从平台拿到贷款的人有意在网上制造平台负面信息,以期待平台倒闭后自己也不用还清贷款,这些行为无疑大大增长了平台自身的风险。如果出现了技术性问题导致官网无法打开或资金无法提现等情况很容易触及投资者敏感的神经,造成挤兑现象。
(三)预警模型指标设立
但是值得注意的是,在网贷相关法律法规还并不完善的当下,相关数据的获取难度较高且真实程度也值得怀疑,因此本文利用大数据思维,主要利用在互联网上公开的人人都可以轻松得到的信息作为预警模型的输入指标,通过指标内部的非线性逻辑来反应一家平台的风险程度。一个恶性非法的网络借贷平台必然会尽可能的扩大自身的影响力、同时做好反调查准备,在监管单位有所反应之前圈到足够的钱,这种行为很难不在网络上留下痕迹。因此,社会公开信息指标的引入可以有效弥补官方观数据的不足及真实性问题,增强预警模型的可信度和有效性。
综上所述,网贷平台风险评估体系如表1所示,各指标的原始数据如表2所示。
四、BP神经网络的设计
(一) BP神经网络概述
BP神经网络中BP是back propagation的缩写,译为反向传播,因此BP神经网络又称误差反向传播神经网路,是1986年由Rumelhart和McClelland为首的科学家提出的概念。BP神经网络通过采用误差逆向传播算法,由程序自动学习演算使得误差降至最小值,以得到最接近真实情况的权值。
BP神经网络属于多层感知机,是由多个感知机层全连接组成的前馈神经网络,全连接是指层上任一神经元与临近层上的任意神经元之间都存在连接,该模型拥有出色的处理非线性问题的能力。 BP神经网络具有输入层,隐含层和输出层,理论上已经证明一个隐含层的BP神经网络可以实现任意非线性映射,可以满足绝大部分场合的需要。
(二)BP模型神经节点设置
本文采用的是标准结构的BP神经网络,包括一个输入层、一个隐含层和一个输出层。其中,输入层的节点数为13,由输入指标的数量决定;输出层的节点数为1,其中健康平台的平台值为0,问题平台值为1。
隐含层的节点数选择和输入层神经单元以及输出层神经单元数量有关。但目前还没有很好地确定依据,根据任务来确定隐含层节点的数量是比较困难的。因此,目前还是主要以过往的成功经验为依据,一般参考的经验公式是:L=log2n,n为输入节点数,因此隐含层的节点数为3。
(三)BP模型参数设置
再确认了BP神经网络模型的输出层,隐含层和输出层节点后,还要确定神经网络的传输函数和训练目标等参数。非线性的传递函数主要分为Log-sigmoid和Tan-sigmoid两种。其中Log-sigmoid型输入值可取任意值,输出值范围为(0,1),Tan-sigmoid型输入值可以取任意值,输出值范围为(-1,1);线性传递函数pureline的输出和输出可以取任意值。因为本文输出值都为正数,因此输入层传播函数为Log-sigmoid函数,输出层传播函数选择pureline函数,可接受的误差标准为ε= 0.1,训练次数为100000,学习速率为0.2,动量因子为0.1。
五、面相Python的BP神经网络的训练和检验
本文综合参考网贷之家等多个网贷平台评级网站,综合考虑选择11家优质网络平台作为低风险样本,同时选择6家最近刚刚暴雷的平台作为高风险样本。并从中随机抽取两家低风险两家高风险作为检验样本,其余13家为训练样本。网络的训练和检验都通过Python来完成。通过整理可以得到一个17×13的矩阵,为取消各指标之间的数量级差别,从而最大程度降低预测误差,将原始数据归一化处理。归一化处理后训练模型的输入值如表3所示,检测模型的输入值如表4所示。
对于已经训练完成的BP网络模型,训练输入值对建立的BP网络进行检测,输出结果如表5所示:
根据检测结果,检验输出和期望输出值非常接近,准确率达到了100%,两者数据误差满足误差要求。因此,建立的BP神经网络模型有较好的风险评估能力,可用来对网贷行业进行监测,达到风险预警的目的。
六、研究结果
构建一个科学有效的网贷平台风险预警模型,可以快速对网贷平台进行初步排查,尽早识别和预警高风险网贷平台,已采取风险防范和化解措施。传统的数理模型大多通过数理统计、逻辑回归等方进行预测,这并不适用于网贷平台这一新型金融模式的风险预警上。另外传统模型也过度于依赖于历史官方统计数据,但是网贷平台相关法规的不完善,平台自身可以通过调整统计端口等方法肆意修改数据,从而造成预警模型的失灵。本文大量采用网络公开数据,这是网贷平台无力修改的,虽然不能直观的反应平台风险状况,但是数据本身的真实性反而能够保证预警模型的科学有效。另外,由于公开数据的获得无门槛,从而大大降低了模型使用难度。神经网络的优点就是反应数据之间非直观的复杂联系,因此本文大胆使用公开数据,该模型甚至可以成为普通民众对网贷平台的风险监测工具,若能得到大范围使用,必将倒逼网贷平台主动走向规范化正规化,让网贷平台主动走到监管的笼子里,从而让彻底杜绝大面积平台暴雷,实控人跑路,投资人上访的不良事件。
参考文献:
[1]谢平,邹传伟.互联网金融模式研究[J].金融研究,2012(12).
[2]王峥.我国互联网金融的风险分析及防范措施[J].时代金融,2014,(8).
[3]曹一.论加强P2P网络借贷平台的监管[J].金融监管,2011(4).
[4]陈朝晖,张艳芳.基于BP神经网络的商业银行风险预警模型研究[J].福建商业高等专科学报,2011(2).
[5]Tam K Y. Neural Network Models and the Prediction of Bank Bankruptcy [J]. Omega,1991(5).
[6]杨群华 . 我国互联网金融的特殊风险及防范研究 [J].金融科技时代,2013 (7) .
[7]郭莹莹.国内外金融危机预警模型述评[J].科学决策,2013(10).
[8] 张玉梅. P2P 小额网络贷款模式研究[J]. 生产力研究, 2010 (12).
欢迎进入中国知网~《现代商贸工业》杂志阅读和参考引用原文
官方网址:http://www.xdsmgy.cn/