全球电子商务、移动支付、社交网络以及云计算和大数据等互联网技术和商业模式的发展正改变着个人的生活方式与企业的运营方式。 以信息采集、整理、保存、加工,并向信息使用者提供服务的信用业也日益受到信息技术的冲击。大数据征信正在全球掀起征信业的变革。
征信业与信息技术联系密切。信息技术的进步驱动了信用风险管理水平的提高,促进了信用的可获得性。大数据技术出现之前,征信评价技术的发展可以说经历了三个阶段。
第一个阶段( 1950年以前) : 定性信用风险决策。
1950 年之前,审贷过程是根据放贷人的经验和对借贷人的了解,由人工来完成的。这种定性的决策方式,缺乏一个客观统一的标准,是否发放贷款完全依赖于信贷员个人的经验,而且决策效率很低。审贷不具备客观性和科学性。
第二个阶段( 1950—1980 年代) : 局部风险量化分析。
1956年信用评估数据挖掘公司费埃哲( FICO)成立,来自斯坦福的工程师William Fair 和数学家Earl Isaac 进行了数学分析模型和工程实现的整合,推出一个量化评分系统。利用FICO 评分模型,银行等信贷机构可以进行自动化的批量审贷,增加了信贷的可获得性,减少了违约率,引领了消费信贷的第一次革命。
由于仅仅使用内部的数据进行FICO 个人评分建模,因此FICO 模型在解决信贷交易双方信息不对称问题上的作用仍有局限。
第三个阶段( 1980年—2010年) : 全局量化风险分析。
1980年之后,征信机构Experian 收集了不同信贷机构个人消费者的信贷信息,形成了消费者的全局信息。不同的信贷结构之间共享全局信息,可以全面地了解个人消费者的信用状况,更好地解决了信息不对称问题,促成了信用风险管理的又一次革命。由于征信机构不能为缺少信贷信息的少量个人消费者提供全局信用记录,因此这类消费者无法享受信贷机构的正常服务。
目前,数据库技术、互联网技术、云计算与物联网技术的突飞猛进使人类社会进入了大数据时代,更高维度的数据和不同层次的数据都用于信用评分建模,挖掘数据潜在的价值。
各种机器学习的算法和模型广泛地用于企业信用风险评估中,以全样本为对象进行如因素分析、判别分析、分群分析、决策树、类神经网络以及规则归纳等。Ling-Jing Kao, Chih-Chou Chiu, Fon-Yu Chiu 将分类回归树模型应用于个人信用评估,准确率达到 92.9%,结果优于判别分析、Logistic 回归、SVM 等方法。Altman 使用神经网络(ANN)模型对企业信用进行评估,用于预测企业资金的窘迫度,并与 Logistics 回归模型进行了比较分析,结论是 ANN 模型以判别度 92.8%优于其他模型。
以大数据个人征信ZestFinance公司为例,在ZestFinance的大数据模型中,要用到3500个数据项,从中提取70000个变量,利用10个预测分析模型进行集成学习或者多角度学习,进而得到最终的消费者信用评分ZestFinance 的数据源是大数据,可以生成数以万计的风险变量,然后分别输入不同的预测模型中,例如欺诈模型、身份验证模型、预付能力模型、还款能力模型、还款意愿模型以及稳定性模型等。每一个子模型都从不同的角度预测个人消费者的信用状况,克服了传统信用评估中单个模型考虑因素的局限性,使预测更为精准。
基于大数据的新型信用评分模式较传统模式引入更多的变量,大大降低了贷款违约率。据ZestFinance公司网站介绍,目前该公司发放的发薪日贷款由于使用新的评分模型,相关贷款人的违约率降低将近50%。
大数据背景下,征信市场参与主体不断增加,市场竞争日趋激列。传统的征信机构对于大数据征信的态度比较谨慎,以研发为主,逐步推进;而新兴的互联网金额公司则比较激进,基本上直接利用大数据技术替代传统征信技术进行信用风险评估。在传统征信机构方面,全球最大的个人征信机构Experian(益博睿)已开发出跨渠道身份识别引擎,连接客户消费接触点。早在多年前,就投入研发社交关系数据,并探究互联网大数据对征信的影响。全球第二大征信机构Equifax(艾克飞)通过构建自己的数据创新团队和收购中小型IT高科技公司来为大数据产品和服务的研发布局。
与此同时,一些创新型的金融科技企业直接进入大数据征信领域,例如美国信用审批公司ZestFinance利用大数据技术为缺乏征信数据而只能接受高利贷的人群进行信用评估服务,采集了海量跟消费者信用弱相关的数据变量,利用基于机器学习的大数据分析模型进行信用评估,取得不错的实效,将信贷的成本降低了25%。另外一家公司Kabbage则使用商业规模、从业时间、交易量、社交媒体活跃程度以及卖方的信用评分,通过整合多元化的数据利用大数据重构信用评估体系,从而服务于小微企业。
大数据技术使用,增加了信用产品与服务的供给。大数据的应用场景逐渐丰富,国内出现了多种信用服务。
反映电商信用行为的芝麻信用。芝麻信用基于阿里巴巴的电商交易数据和蚂蚁金服的互联网金融数据,并与公安网等公共机构以及合作伙伴建立数据合作,数据涵盖了信用卡还款、网购、转账、理财、水电煤缴费、租房信息、住址搬迁历史、社交关系等等。芝麻信用以芝麻分来直观呈现信用水平,主要包含了用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度,从950~350分划分为5个等级,分数越高代表信用程度越好,违约可能性越低。
反映互联网社交行为的腾讯征信。腾讯征信的数据更多的是社交数据,其征信产品有两大类别:
一是反欺诈产品,包括人脸识别和欺诈评测;
二是信用评级产品,包括信用评分和信用报告。
腾讯征信反欺诈产品的主要服务对象包括银行、证券、保险、消费金融、小贷、P2P等商业机构,它能帮助企业识别用户身份,防范涉黑账户或有组织欺诈,发现恶意或者疑似欺诈客户,避免资金损失。对于之前没有个人征信报告的蓝领工人、学生、个体户、自由职业者等用户,腾讯通过他们使用社交、门户、游戏、支付等服务,通过海量数据挖掘和分析技术来预测其风险表现和信用价值,为其建立个人信用评分。
反映借款人风险的好贷云风控。好贷云风控是好贷网和全球最大的个人信用评分机构FICO(费埃哲)共同打造的大数据风控平台,整合征信公司、司法数据、工商数据、消费数据等重要数据源头,构建了金融贷款机构风控所需全行业各领域的风险数据库,同时包括反欺诈风险名单库、重大风险识别名单库、贷款申请记录名单库的数据,合计已超过7000万条。多达6000多个维度的数据库不仅能有效补足贷款机构本地的数据库,还能协助其大幅提高反欺诈识别和信用风险识别能力,同时结合FICO的信贷决策引擎为信贷机构提供服务。
在大数据技术的支持下,信用服务机构能同时处理多个受评对象,而且能够保证很高的处理效率。同时,现代信息技术能够满足评价结果与信用信息同步,即当受评对象的信用信息发生变化时,系统可以对其信用进行实时计算,保证信用评价的同步性。另外,借助于互联网、物联网等现代信息技术,信用服务机构可以对受评企业进行实时监控,一旦企业出现经营危机与危险行为,便瞬时预警,从而极大提升信用服务的效率。
以大数据为基础的新型信用评分方式更侧重于寻找现有数据间的关联性,摒弃了传统评估模式对历史信贷数据的深度挖掘,决定了新型评估方式将使更多无法享受传统金融服务的人群受益。如ZestFinance 是通过对数以千计的变量及其关联性进行整理,在大数据挖掘的基础上最终形成一个独立的信用分数。这有别于常规信用评估体系通过对一个贷款人最重要的十几个方面或者几十个参数进行一个线性回归,得出一个常规信用分数的做法。
“ZestFinance ”给这些无银行账户或信用记录不完善的借款人创造透明、公正的信用评分。
我国征信业发展时间较短,金融服务覆盖率不高,作为强变量的信贷记录缺失问题严重。央行个人征信系统共收录自然人数8.5亿,其中有信贷记录的自然人约为3.4亿,征信覆盖率仅为25%。据银监会统计,小企业授信户数为398.8万户,约占中小企业总户数的比例仅为9.5%。这导致大量的人群与企业由于缺少金融信用记录而无法获得贷款。可以预见,大数据不仅将促进我国征信业发展,而且开辟了一条利用大数据征信推进普惠金融的新路径。
-
声明:
文中观点仅是相关研究人员根据相关公开资料作出的分析和判断,并不代表公司观点。在任何情况下,鹏元数据及其雇员对任何机构或个人因使用本报告所引发的任何直接或间接损失不承担任何法律责任。
鹏元数据拥有旗下品牌“itSaiD它说”,大数据债券风险预警平台,提供精准及时的大数据金融风控系列产品以及有效的解决方案,为传统金融机构、互联网金融机构、非金融企业、政府、个人等用户提供最具价值的大数据信用风险评价服务。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.