信贷审批模型 (信贷评估框架知识图谱)

做了多年的互联网金融,各种*款贷**业务各有自己的特点和要点。其中信贷的要点非风控模型莫属。任何一款信贷产品的核心就在于它的风控模型,它会直接影响着客户的授信额度、产品定价和还款方式等。那么我们就看看信贷产品的风控是如何利用数据形成自己的模型判断的。

随着机器学习和大数据的发展,使得金融领域的业务效率和准确性都得到了提升。并且当数据运用得到了不断训练和验证后,其稳定性也十分适应金融这个对风险把控严格的领域。目前在风控模型中运用较多的就是评分卡模型。也就是我们有时听到的A卡、B卡、C卡。

信贷评分卡模型

  • A卡(Application Score Card)

A卡用于贷前申请借款时对申请人进行量化评估,为授信、额度、以及客户分级定价提供量化依据。

  • B卡(Behavior Score Card)

B卡用于客户在贷期间,对其未来一定期间内逾期概率的预测。为在*借款贷**提供贷中监控,对客户进行合理的调额和调价提供量化依据。

  • C卡(Collection Score Card)

C卡用于客户已逾期的情况下,对其未来一定期间内是否能够还款的预测。为催收环节的资源分配及策略提供量化依据。

信贷评分卡模型原理,信贷风险量化模型

评分卡分类

下面我们从模型建立的整体流程及关键点上,具体介绍下A卡模型。B卡和C卡可按思路以此类推。

A卡模型特征变量

建立模型的重要环节是确立输入的特征变量,然后不断的优化特征变量的取值和权重。A卡模型的特征变量可以归纳为以下三类:

  • 客户基本信息特征变量

基本信息包括:身份证信息(通常进行实名和人脸识别认证)、手机号(包括通讯录,通话记录等)、性别、年龄、学历、住址、婚姻、工作单位、工资收入、交易流水、资产、公积金、联系人等信息。

  • 客户信用信息特征变量

信用信息包括:征信报告、信贷历史、征信查询次数、历史逾期情况、在贷情况、第三方数据评估机构量化值(如同盾评估分,FICO信用分等)

  • 客户负面信息特征变量

负面信息包括:民事判决、法院强执、行政刑事处罚、第三方数据黑名单等。

模型的术语释义

  • 逾期期数M

是指实际还款日与应还款日之间的逾期天数,并按区间划分的逾期状态。

逾期期数(M)

定义

M0

当前未逾期(或用C表示,取自Current)

M1

逾期1-30日

M2

逾期31-60日

M3

逾期61-90日

M4

逾期91-120日

M5

逾期121-150日

M6

逾期151-180日

M7

逾期180日以上。此时也被称为呆账(Bad Debts)

  • 观察点

在样本集上选取的观察时间点。不同的模型,选取的观察点不同。拿A卡模型来讲,观察点定义为客户申请*款贷**的时间。

  • 观察期

观察点向前获取特征变量的时间段。观察期长度根据数据的多少决定,可以尽量多的获取。对于A卡模型,可以选择观察点前6个月或者12个月作为观察期。

  • 表现期

观察点向后预测客户好坏标签的时间段。这里很重要的点就在于,逾期多长时间判定为坏。这决定了表现期取多长。好坏标签的判定也就是确定逾期多长时间算是坏用户。这里可以用滚动率分析的方法。其基本思想是算出逾期M期的客户,在M+1期仍然逾期的概率。然后选出概率最大的那期作为好坏判定的界限。如果数据不足以支持计算,那么可以采用通常的指标,一般定义逾期超过90天即M4的客户,为坏客户。

信贷评分卡模型原理,信贷风险量化模型

评分卡建模

可选用LightGBM或LR评分卡建模。此处并非专长,具体的建模方法可以参考《机器学习》周志华;《Python金融大数据分析》第2版;或者参考其他网络文章,介绍的也很详细。