征信行业
第一门户

大数据风控,现实比理想要骨感

大数据与信用宝

大数据与信用征集

来源:《中国征信》杂志2015年第3期   作者:陈宇       感谢原创

 

没有任何一家机构敢自诩其可以解决风控命题。现在,很多人在谈大数据风控,其实都是一厢情愿的,不现实也不可能。大数据可以优化管理,提高风控效率,降低风控成本;但无法决定风控质量。风控永远是一个一揽子的系统工程。确切说,不同的银行面对同一风险等级的客户,它们的风控并不处于同一个水平,因为不同的银行都有不同的风险承受能力,自然是会形成不同的风险定价水平。
前不久,不少国内人人贷(P2P)公司呼吁征信系统接口向其开放,它们认为,征信系统开放了,其风控就OK了。这是不可能的,即便金融机构面对同一个征信系统,最终的使用效率、定价能力,还是取决于自身。越是公开透明的市场,竞争的难度是越大的。
下面仔细分析下为何大数据在风控方面是相对无效的?理由是多方面的,首要问题其实就是金融更多时候是靠天吃饭的,即单一金融机构其收益是被经济形势决定的,经济形势却完全可以决定金融的走向,且决定形势的因素极为庞大。经济形势低迷的情况下,金融机构,无论怎么折腾都很难玩出特别好的花样。2008年金融危机一来,倾巢之下安有完卵,就是这个道理。系统性的风险是任何一家金融机构都必须面临的现实问题,风控制度在系统性风险之前,毫无意义。
大数据风控模式首先要解决的命题就是其是否能够准确预测经济形势?尽管很多人认为大数据可以解决这个问题,但在我们看来,这既不现实也不可能。正如前文所言,通过过去一系列数据来推演未来经济走向,基本上注定是不现实的。所谓大数据,其核心逻辑前提属于统计学的范畴,由两部分叠加的:一是样本筛选,即通过数据筛选出相同特征的群体会出现某些违约的概率;二是通过做大足够数据量来覆盖统计学里所说的偶发性特征,这两个逻辑统一且不可分割。由于大数据的相关性是建立在的群体普遍性特征上的,所谓的相关性必要前提是拥有足够多的统计覆盖,但足够多是多少?悖论在于没有足够多的基础数量就无法推导足够可靠的相关性,而缺乏足够多的样本就无法确保其相关性。
对于单一金融机构而言,足够多的基础数量已经是个致命的难题了。这里还隐含一个基础性逻辑,正如前文讨论大数据时所谈到的,每个操作的业务群体还要呈现独立非相关。
这里我们做个小讨论:经营贷款和消费性贷款,谁更可能被用来做大数据风控?我们的答案是消费信贷。因为从人群的使用特征来看,消费性需求更稳定,虽然也会受到经济波动的影响,但相对经营性贷款来,还是相对稳定,更容易被量化;从人群覆盖面来看,也更广泛,更有扎实的数据基础。相比而言,经营性需求则很难适用数据模型化。
大数据基于过去决定未来,其实还存在一个问题,往往会出现未来重新定义过去的情形,即一个人往往会因为自身某些特征值的改变而改变系统基于历史数据所形成的特征认定。这种现象其实是个循环函数的概念,带有变量值的东西往往是难以建模的,我们在金融运作中经常发现这样的问题,企业获得资金前后存在不同的基础性特征。
前段时间碰到阿里的人,交流大数据理念,最后我们无法在大数据是否可以建立风控模型上达成一致。假设大数据风控模型能成立,事实上你会面临一个非常致命的问题,你的客户群体,会变得你越来越不认识。为什么会出现这样的情形?所有金融机构的风控都是事前审核,而非事后控制,因为事后控制是不现实的。一旦阿里金融采取大数据的量化放贷,在市场就会出现大量的放贷机构,依附在阿里之上,采取尾随策略,跟踪放贷。在阿里放贷的基础之上,再配置20%左右的贷款,期限比阿里短,阿里之前所设定的所谓模型,全部失去效应。
前文所提到的《银河帝国》,谢顿教授给出了一条重要的假设:所有的进入样本统计的样本主体,自己并不知道自己是被统计的样本,否则就会失去统计意义。
这个也是为什么说银行很难对企业进行事前审核的原因。过去几年,浙江省内大量的股份制银行就是采取如此策略使得大银行的所谓风控审核都沦为形同虚设。在业务面前,其实很多风控都是形同虚设的。
此外,金融业不同于其他行业的一个地方,还在于风险滞后。这意味着基于历史数据所推导的模型,会在过去和未来之间留有一段缝隙,这个缝隙所做发生的任何影响,都会让金融机构无法有效调整风险的认定。银行基于餐饮企业的大量数据建立风控模型,并进行批量放贷。贷款一旦放出,银行基本就没有主动权了,你要回收贷款,企业第一要有钱还你,第二也要配合还你才行。所以,往往是“贷前你老大,贷后你就是孙子”了。这个时候,突然某一天政府发文要求降低三公消费,餐饮企业一片萧条,银行只能干瞪眼。信贷业务的风险滞后性,使得银行即使给出数据模型进行自我修复的时间,但是对于既定的业务而言,这个修复也是不现实也不可能的。
因此,抛开目前大数据仍受限制于数据孤岛等一系列的现实难度(全维度的大数据,成本极高,现实难度极大),就单一大数据风控模型而言,能实现风控的数据模型化,都只是美好的设想,是脱离了社会现实的一种自我意淫的产物。
当然,这里并非否认大数据的现实意义。大数据可以提高管理效率以及提升风控效率,作为金融机构而言,效率的提升,管理的成本下降,最终金融机构对抗风险的能力得以提升。
我们有一个奇怪的设想,大数据能否让计划经济回归?尽管市场经济高效的资源配置的方式广为人知,但其弊端也是非常明显的,高效的背后其实存在巨大经济资源浪费。市场经济通过有效竞争,让资源尽可能的实现合理的配置,但是我们也看到往往一个成功的企业背后倒下的是无数个类似企业。一百多年前,马克思也提出了这样一个问题,就是为什么社会总是生产出那些高于实际需要的产品,牛奶宁愿倒掉也不给予普通民众?市场经济高效率的背后反映的恰是社会的相对低效,在这种情况下,计划经济的推出其实存在一定的合理性。从构思和出发点来看,计划经济力图构建一个体系,让市场需求能被有效计算,然后以需定产,从而最大程度的降低社会成本。然而,理论无限美好,现实却很残酷,现实需求其实是无法计算和统计的。是否大数据匹配云计算是否可以解决和这个问题,从而理论上让计划经济回归或者部分回归?这是一个很有意思的命题。
或许在很多专家眼里,我们对于大数据的理解过于肤浅,但是从金融运行实践来看,我们对这一结论抱有很大信心。大数据即便最终成功,也必然难以成为一个普遍性的成功,而大量的机构还是会集中在对统一数据的有效应用上,不同的机构由于自身的情况不同,必然有不同的应用结果。这才是真正决定了整体竞争的效率和结果。

征信宝(zhengxinbao.com) 微信号 ixinyong ,关于一切信用和信用的一切.

赞(0) 打赏
网站部分资源来自网上,如有侵权请告知删除,我们期待与你长期合作:征信宝 » 大数据风控,现实比理想要骨感
分享到: 更多 (0)
已有 0 条评论

征信宝推荐

大红包万达万e贷