想做互联网怎么办 (互联网征信下的评估流程)

编者按:

12月5日,新金融联盟主持了以“关于信用的无线畅想”为主题的沙龙,邀请到来自百度钱包、京东金融、宜信、橙子银行、汇付天下、FICO等互联网金融机构的风控业务负责人,从风险控制的角度讨论如何利用大数据做征信。极客金融(微信号:jikejinrong)作为本次活动的协办方,将沙龙上学习到的干货和大家分享。

2014年下半年,互联网金融对征信的需求变得迫切。征信系统建设的工作此前主要由央行完成,但央行在征信数据上存在短板,仅掌握银行客户的信用卡消费记录和一些房贷、车贷记录,征信报告的实际覆盖面仅为2.9亿人。为了补足短板,央行“喊话”阿里、腾讯加入征信体系建设,也正在向民间征信机构发放牌照。

在企业方面,像BAT、P2P平台这样掌握了大数据的互联网企业,也开始建立自己的征信模型。按照2013年12月央行出台的《征信机构管理办法》,全国将有不到十家企业第一批获得个人征信牌照,包括芝麻信用、腾讯征信、深圳鹏元等。这些企业掌握着诸多数据来源,但目前也面临着如何挑选有用数据的问题。

央行和这些互联网金融机构准备怎么做征信的呢?简单来说有三个步骤:

1、判断从哪些维度去评估用户信用、需要用到哪些数据;

2、能够直接从互联网上获取的数据,考虑怎么把它抓取过来;

3、不能够直接从互联网上获取的数据,考虑通过其他手段去获取。

那么问题又来了,这三个步骤具体怎么操作呢?

一、评估用户个人信用,除了银行信用卡消费数据外,你还需要get到3类信息

央行正在与美国征信机构FICO的决策与分析管理技术团队合作,建立个人消费者征信体系。FICO给个人消费者做评分的方式是:接入各大银行和金融服务机构的数据,开发出一个统一的数据模型,再提供给各家公司。

在美国,几乎每个消费者都有自己的FICO信用评分;在中国,央行、建行、工行、招行、农行等银行,以及宜信、有利网等P2P平台,也与FICO有合作。从美国中小P2P平台的情况来看,如果没有使用FICO的模型,他们每做一个*款贷**要500到1000美元这样的成本,如果用了的话成本能降到100美元以下。

事实上,FICO的评分模型应用十分普遍,很多金融机构的风控负责人都曾在FICO任职,包括宜信首席科学家郑茂林、京东金融消费风险官程建波等。

那么,FICO的评分模型中,除了银行用户的信用卡消费数据和车贷、房贷数据之外,还涉及到哪些消费数据呢?

想做互联网学什么专业,互联网征信下的评估流程

注意,社交数据并不在列表中。宜信的郑茂林认为,如果实在没有什么别的数据可以用,才能用社交数据来做个替代品。与其他数据相比,社交数据主观性太大,是可以由用户自己去刻意维护、甚至是可以捏造的非客观数据。这和天弘基金产品经理李骏的观点类似。李骏也曾向极客金融透露,社交数据指向性较低,目前用来评估个人信用的难度还比较大。

二、抓取线上数据、让它变得有用,你还需要克服3个问题

想算出可靠的征信数据,并不是把这些数据抓取过来再随意组合这么简单,你还需要克服3个行业内普遍面临的问题。

1、获得用户的授权

这个问题对电商而言尤为重要,可以细分为两部分:

一是要在用户体验的层面上,得到用户的认可:京东的程建波提出,电商难以获得用户授权的原因在于,在用户那儿,电商账户还没有达到银行账户的等级。

用户使用银行账户的目的就是运作资金,所以即使步骤十分繁琐,也会配合银行提供所有信息,但用户使用电商账户的目的是买东西,“他就会想,我就来买个东西,你凭什么要我拍照上传我的身份证号啊,他就会产生排斥”。

怎么平衡风险控制和用户体验,是电商在收集数据做征信时必须要考虑的问题。

二是要在用户的心里接受度上,获得用户的授权:目前,支付宝的控件可以在PC端读取到机器的信息,去做一些安全方面的判断。这样一来,就避免了一个居心叵测的人使用同一台电脑注册了100个支付宝账户,要去做一些非法行为的情况。这样的好处是让征信市场变得更为有序,但是并非每一个控件在用户那里都能够得到支付宝的待遇,很多用户是不会授权控件去访问机器属性的。各家金融机构在这方面也是各出奇招,百度钱包的赵翔宇透露,百度甚至会通过读取用户浏览器的分辨率,去判断这个账户是不是在同一台电脑上登陆的。

所以目前来看,非银行类金融机构做征信,还需要设立某种规则去教育市场、教育用户,提高用户的接受度。这不是某一家机构在某个情境下能够完成的事情,还需要大家的在一段比较长的时间内的共同努力。

2、确定账户的属性

支付类活动数据,很多时候和身份识别数据是对不上的,这又分为两种情况。

第一种情况是账户的所有者长期授权另一个人来使用这个账户,比如一对夫妻,妻子长期使用丈夫的账号买东西。以京东为例,这样的做法对于京东商城来说并无大碍,不管是妻子还是丈夫,买了东西付了款都是一样的。但是对于京东金融来说,账户和使用者身份对不上,在白条授权、征信数据搜集时就会有很大问题。

第二种情况是有些电商平台上的老买家,会把自己的积分或者消费折扣拿到另一个平台上去卖。还是以京东为例,京东商城的钻石级买家可以用很低的折扣享受一些商品优惠,有的买家会把这个优惠商品挂到淘宝上去,用高一点的折扣去卖。比如某产品在京东商城卖1000元,钻石级买家只需要500元即可买到,那么这个买家就有可能在淘宝上挂个链接,以750元的价格代购商品,替别人下单,这样下单的人便宜了250元,这个买家也白赚了250元。钻石级买家直接填写收货人的地址,这样一来,就出现了“淘宝下单、京东送货”的情况。这样的账户属性判定起来就很困难,给征信模型的建立增加了难度。

这些没有不正当目的的交叉交易数据已经干扰到了授信,更遑论那些蓄意为之的扰乱行为。要在不影响用户体验的情况下合适账户属性,让账户数据变得可用,还是个比较艰难的过程。

3、企业内部建立统一的模型

不断有从业者呼吁建立行业数据共享机制,但事实上,即使在一个企业内部,数据也很难被有效地共享。

百度就面临着这样的问题。百度钱包的赵翔宇透露,百度已经在内部推行一个大风控平台机制,去搜集其他征信机构、风控机构使用百度搜索的信息,为百度自己的征信和风控提供参考。

问题在于,由于数据标准不统一,即使有了这个平台,百度钱包却对接不上、利用不了这些数据。目前,百度搜索、百度贴吧等百度的账户体系,各自搜集着各自的数据,建立了不同的模型,这些模型是无法对接的。“在他那儿看来这叫大数据,但拿到我们这边我们就懵了,不知道怎么用”,赵翔宇说。

如此看来,数据共享的第一步是要在企业内部建立起统一的数据标准,避免数据资源浪费。

三、不能够从线上直接抓取的数据,你可以借鉴2个方法

需要准确识别用户身份,但是由于账户混乱或其他原因无法做到时,可以采取两种方法:一是让用户拍照上传身份证和本人头像,但这样做用户体验较差;二是到线下去做面签,比如京东正在计划利用物流网点的优势发展线下面签。程建波透露,“京东正在考虑给某些产品做线下的面前,让用户把相应的证件带到京东的物流网点这儿来,做一个审核”。

第一种方法会伤害用户体验,但第二种方法却未见得使用与所有企业,毕竟不是每个企业都有京东自己的物流优势。这两种方法只是提供了借鉴,具体的操作方法还要依据企业自己的优势去设计。