收藏!史上最全的数据化风控模型梳理方法

发表于:2022-9-26 09:26

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:佚名    来源:万联网

  供应链金融风控其实是一个很庞大、很复杂的课题,也没有一个标准答案。按照不同维度来划分的话,供应链金融的种类和做法有很多,不同行业的做法就完全不一样。
  供应链金融分为几块,第一块就是业务场景,一般基于仓储、物流运输等不同的行业会有相关的管理系统,比如WS、TMS和OMS系统等,公司内部可能会有内部管理系统。
  线上业务平台和公司内部的管理系统会产生大量的数据。这种数据是为业务而不是为金融服务的,但这个数据是做供应链金融要考虑的重点。
  第二块会有供应链金融平台和与金融相关的授信还款的整套管理系统。
  整个风控体系在这里是连接供应链金融平台和业务场景平台的。图上这几个绿块是不同的数据来源,这些数据可能来源于业务场景的B2B平台、大数据公司或是行业数据。
  这几个数据归到一起后,再做数据的分析采集,清洗后再基于这个数据来建模,再把模型的结果放到风控引擎里,最后把风控引擎的结果输出到供应链金融平台,这样就完成了整个业务的流程。
  信息化视角下供应链金融风控的实现路径是怎样的呢?
  从第1步到第6步是一个项目的初期过程。而第6步第8步是一个循环、不断迭代的过程。
  第1步到第6步主要是从数据的选择,到的数据的清洗与整理,再到规则、评分和策略的界定,再到模型的实施,这是一次性的。做完后通过一段时间把供应链金融的数字化风控系统上线,往复循环,不断地优化模型。
  供应链金融数据风控如何实现?
  1、数据的几个层面 
  数据是整个供应链金融平台里最开始的原料来源。
  首先是数据的选择和获取,在大数据时代,有很多互联网的数据、内部管理系统的数据以及第三方专业数据公司的数据可以通过接口、程序或爬虫软件等方式来获取,另外也要选取对所在行业和平台做供应链金融有效的数据。
  其次是数据的清洗与整理,通过清洗和整理后把数据变成金融平台能够使用的数据。因为数据的来源很多,包括结构化的数据、非结构化的文本数据、word文档和Excel的数据或是从第三方网页爬过来的数据。这种数据需要通过清洗整理后变成金融可用的数据,这块就会涉及到数据的清洗整理。
  第三块是数据的维护,因为数据是动态,需要不断更新维护。这样就要有一套更新机制,保证数据实时和定期的更新或者自动获取新的数据,用于后面的数字化风控,所以数据的维护和更新是很关键的。
  2、用于供应链金融风控的数据类型 
  能够用于供应链金融风控的数据类型,这里简单归类为六大类:
  第一类是公检法涉诉数据,这种数据可能来自国家政府部门,比如国家工商类网站、商务局网站以及海关网站等。有些数据公司对这些数据做了扒取、分类和整理。可能需要按条付费购买,当然也可以自己爬取,这就可能涉及开发成本。
  第二类是企业关键人的数据,企业管理者可能是企业的法人,也有可能是企业的实际控制人。通过前面的工商数据找出企业背后关键人的数据,包括关键人的基本信息,以及本身的一些行为数据。当然这需要个人的同意,拿到数据后对企业关键人做分析,了解背后的法人和实际控制人的状况。
  第三个是生产和交易数据,这是供应链金融独特的一点。生产和交易的数据是用于供应链金融风控的重要数据来源。基于生产和交易的数据去判断企业的状况,判比如企业是走上坡路还是走下坡路,生产是否正常,生产力是否饱和以及跟他的上下游的交易与付款是否正常等,这些都是非常重要的判断依据。
  第四个是财务数据,财务的数据再加上金融数据也是传统信贷和银行采用的数据。金融数据一方面来自于平台的积累,一方面来自第三方相关的数据。还有就是供应链所在的行业数据,包括行业政策和商品价格的变化。
  数据的来源很多,有的些偏重于生产和交易数据,有些更偏重行业数据,需要根据企业的状况或行业特点来选取,再用数据进行后续的建模和数字化风控的应用。
  3、常用的数据类型
  下面简单列举了常用两大类型数据:
  1)业务数据,来自于生产和交易的数据,包括业务主体的基本信息、历史交易数据和订单数据,还有其他的业务系统数据,包括贷款申请时录入的数据,都是很关键的。数据录入时的验真也作为一个参考点
  2)第三方数据分为企业、个人和行业,包括刚提到的公检法、税务、公积金、水电、征信、动产抵押等数据源,这些数据有些可能需要花钱购买,有些要自己去采集,有的是自己内部的或是合作方的数据。
  供应链金融企业背后的法人代表也是很关键的因素。个人本身的数据,包括黑名单、定位,甚至银行流水的数据。
  最后是行业的数据,比如物流行业的GPS、 ETC数据,外贸的海关贸易数据和第三方交易平台数据。很多行业门户会发布所在行业的价格指数,这也是非常重要的参考来源。
  每个企业和行业的数据来源都不太一样,需要根据企业行业的实际情况选择。
  4、风控数据源的选择标准
  数据怎么来选?这里简单总结一下选择的标准:
  第一个是数据在风控中的价值,因为数据是为后面的建模服务的,所以选数据前要先看模型应该怎么搭建建,要有个初步的架构。行业不同,数据的选择也不一样,公检法数据对于某些行业会比较关键,但对于某些行业又没那么关键。
  第二个数据的真实性,数据是否真实可靠也是非常重要的。
  第三个是数据可量化、指标化,只有可量化的数据才能用于后续的建模。
  第四点数据获取得的成本。数据是通过接口跟别人对接,还是通过爬虫来获取,这里涉及的成本也是不一样的。因此数据的获取成本也很重要,数据不是说越多越好。另外还要考虑在建模过程中如何来使用这些数据。
  5、数据处理过程
  其实数据还有一个处理过程,数据有可能是结构化的,也有可能是很散乱的,这就需要做好数据的质量分析,以及对它的描述性做统计分析。
  我们一般用SAS工具来对它进行分析,然后进行清洗和集成,以及数据的集计。举个例子,可能你得到数据源是单个企业里每个订单的详细数据,但是风控建模可能不需要如此详细,而且需要的是每月和每季度的订单量和交付量的数据,这时就需要提前对这些数据进行清洗再做集计处理,处理完的数据才是真正可用于服务建模用的数据。
  数据化风控是供应链金融风控的一个重要的辅助手段,非常有价值,能够帮助平台完成很多的事情,节省很多人工的成本、降低人为操作风险、提高审批效率,是每个平台都应该去考虑和努力的方向。
  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号