想做互联网怎么办 (互联网征信下的评估流程)

编者按：

12月5日，新金融联盟主持了以“关于信用的无线畅想”为主题的沙龙，邀请到来自百度钱包、京东金融、宜信、橙子银行、汇付天下、FICO等互联网金融机构的风控业务负责人，从风险控制的角度讨论如何利用大数据做征信。极客金融（微信号：jikejinrong）作为本次活动的协办方，将沙龙上学习到的干货和大家分享。

2014年下半年，互联网金融对征信的需求变得迫切。征信系统建设的工作此前主要由央行完成，但央行在征信数据上存在短板，仅掌握银行客户的信用卡消费记录和一些房贷、车贷记录，征信报告的实际覆盖面仅为2.9亿人。为了补足短板，央行“喊话”阿里、腾讯加入征信体系建设，也正在向民间征信机构发放牌照。

在企业方面，像BAT、P2P平台这样掌握了大数据的互联网企业，也开始建立自己的征信模型。按照2013年12月央行出台的《征信机构管理办法》，全国将有不到十家企业第一批获得个人征信牌照，包括芝麻信用、腾讯征信、深圳鹏元等。这些企业掌握着诸多数据来源，但目前也面临着如何挑选有用数据的问题。

央行和这些互联网金融机构准备怎么做征信的呢？简单来说有三个步骤：

1、判断从哪些维度去评估用户信用、需要用到哪些数据；

2、能够直接从互联网上获取的数据，考虑怎么把它抓取过来；

3、不能够直接从互联网上获取的数据，考虑通过其他手段去获取。

那么问题又来了，这三个步骤具体怎么操作呢？

一、评估用户个人信用，除了银行信用卡消费数据外，你还需要get到3类信息

央行正在与美国征信机构FICO的决策与分析管理技术团队合作，建立个人消费者征信体系。FICO给个人消费者做评分的方式是：接入各大银行和金融服务机构的数据，开发出一个统一的数据模型，再提供给各家公司。

在美国，几乎每个消费者都有自己的FICO信用评分；在中国，央行、建行、工行、招行、农行等银行，以及宜信、有利网等P2P平台，也与FICO有合作。从美国中小P2P平台的情况来看，如果没有使用FICO的模型，他们每做一个*款贷**要500到1000美元这样的成本，如果用了的话成本能降到100美元以下。

事实上，FICO的评分模型应用十分普遍，很多金融机构的风控负责人都曾在FICO任职，包括宜信首席科学家郑茂林、京东金融消费风险官程建波等。

那么，FICO的评分模型中，除了银行用户的信用卡消费数据和车贷、房贷数据之外，还涉及到哪些消费数据呢？

想做互联网学什么专业,互联网征信下的评估流程

注意，社交数据并不在列表中。宜信的郑茂林认为，如果实在没有什么别的数据可以用，才能用社交数据来做个替代品。与其他数据相比，社交数据主观性太大，是可以由用户自己去刻意维护、甚至是可以捏造的非客观数据。这和天弘基金产品经理李骏的观点类似。李骏也曾向极客金融透露，社交数据指向性较低，目前用来评估个人信用的难度还比较大。

二、抓取线上数据、让它变得有用，你还需要克服3个问题

想算出可靠的征信数据，并不是把这些数据抓取过来再随意组合这么简单，你还需要克服3个行业内普遍面临的问题。

1、获得用户的授权

这个问题对电商而言尤为重要，可以细分为两部分：

一是要在用户体验的层面上，得到用户的认可：京东的程建波提出，电商难以获得用户授权的原因在于，在用户那儿，电商账户还没有达到银行账户的等级。

用户使用银行账户的目的就是运作资金，所以即使步骤十分繁琐，也会配合银行提供所有信息，但用户使用电商账户的目的是买东西，“他就会想，我就来买个东西，你凭什么要我拍照上传我的身份证号啊，他就会产生排斥”。

怎么平衡风险控制和用户体验，是电商在收集数据做征信时必须要考虑的问题。

二是要在用户的心里接受度上，获得用户的授权：目前，支付宝的控件可以在PC端读取到机器的信息，去做一些安全方面的判断。这样一来，就避免了一个居心叵测的人使用同一台电脑注册了100个支付宝账户，要去做一些非法行为的情况。这样的好处是让征信市场变得更为有序，但是并非每一个控件在用户那里都能够得到支付宝的待遇，很多用户是不会授权控件去访问机器属性的。各家金融机构在这方面也是各出奇招，百度钱包的赵翔宇透露，百度甚至会通过读取用户浏览器的分辨率，去判断这个账户是不是在同一台电脑上登陆的。

所以目前来看，非银行类金融机构做征信，还需要设立某种规则去教育市场、教育用户，提高用户的接受度。这不是某一家机构在某个情境下能够完成的事情，还需要大家的在一段比较长的时间内的共同努力。

2、确定账户的属性

支付类活动数据，很多时候和身份识别数据是对不上的，这又分为两种情况。

第一种情况是账户的所有者长期授权另一个人来使用这个账户，比如一对夫妻，妻子长期使用丈夫的账号买东西。以京东为例，这样的做法对于京东商城来说并无大碍，不管是妻子还是丈夫，买了东西付了款都是一样的。但是对于京东金融来说，账户和使用者身份对不上，在白条授权、征信数据搜集时就会有很大问题。

第二种情况是有些电商平台上的老买家，会把自己的积分或者消费折扣拿到另一个平台上去卖。还是以京东为例，京东商城的钻石级买家可以用很低的折扣享受一些商品优惠，有的买家会把这个优惠商品挂到淘宝上去，用高一点的折扣去卖。比如某产品在京东商城卖1000元，钻石级买家只需要500元即可买到，那么这个买家就有可能在淘宝上挂个链接，以750元的价格代购商品，替别人下单，这样下单的人便宜了250元，这个买家也白赚了250元。钻石级买家直接填写收货人的地址，这样一来，就出现了“淘宝下单、京东送货”的情况。这样的账户属性判定起来就很困难，给征信模型的建立增加了难度。

这些没有不正当目的的交叉交易数据已经干扰到了授信，更遑论那些蓄意为之的扰乱行为。要在不影响用户体验的情况下合适账户属性，让账户数据变得可用，还是个比较艰难的过程。

3、企业内部建立统一的模型

不断有从业者呼吁建立行业数据共享机制，但事实上，即使在一个企业内部，数据也很难被有效地共享。

百度就面临着这样的问题。百度钱包的赵翔宇透露，百度已经在内部推行一个大风控平台机制，去搜集其他征信机构、风控机构使用百度搜索的信息，为百度自己的征信和风控提供参考。

问题在于，由于数据标准不统一，即使有了这个平台，百度钱包却对接不上、利用不了这些数据。目前，百度搜索、百度贴吧等百度的账户体系，各自搜集着各自的数据，建立了不同的模型，这些模型是无法对接的。“在他那儿看来这叫大数据，但拿到我们这边我们就懵了，不知道怎么用”，赵翔宇说。

如此看来，数据共享的第一步是要在企业内部建立起统一的数据标准，避免数据资源浪费。

三、不能够从线上直接抓取的数据，你可以借鉴2个方法

需要准确识别用户身份，但是由于账户混乱或其他原因无法做到时，可以采取两种方法：一是让用户拍照上传身份证和本人头像，但这样做用户体验较差；二是到线下去做面签，比如京东正在计划利用物流网点的优势发展线下面签。程建波透露，“京东正在考虑给某些产品做线下的面前，让用户把相应的证件带到京东的物流网点这儿来，做一个审核”。

第一种方法会伤害用户体验，但第二种方法却未见得使用与所有企业，毕竟不是每个企业都有京东自己的物流优势。这两种方法只是提供了借鉴，具体的操作方法还要依据企业自己的优势去设计。