数据银行信贷业务中的应用实践及建议
作者:朱良平
来源:《中国金融电脑》 2015年第12期
    中国建设银行股份有限公司风险管理部 朱良平
    大数据是当前社会各界的热点议题之一。商业银行作为社会各机构中最早积累、应用大数据的主体,在大数据领域已经探索出了不少成熟的、有价值的应用模式。随着利率市场化改革临近收官,利差缩窄、市场竞争更加激烈、业绩增长乏力将是商业银行未来一段时间内面临的主要经营环境。严峻的经营态势促使银行通过开展大数据分析等方式内部挖潜,以实现“盘活存量、用好增量”,有效提升业绩、管控风险。本文以银行信贷业务全生命周期管理为视角,分析总结了大数据在商业银行传统信贷业务各流程环节的应用实践,并提出了若干应用建议。
    一、大数据在银行信贷业务中的应用实践
    大数据可以应用在信贷业务流程各环节中。本文主要探讨大数据对银行传统的客户营销、客户准入、贷后预警、客户流失分析、贷款催收等环节的具体应用。
无抵押个人贷款
    1. 客户营销环节的应用
    从上世纪六七十年代开始,欧美发达地区银行就已经采用了大数据分析的思维开展客户营销活动。典型的做法是银行先圈定一批大样本客户,以寄送邮件、电话营销等方式对客户进行普适性营销活动,同时采集首次营销活动后的客户响应数据,建立客户响应分析模型,寻不同客户体的响应规律,建立客户响应模型,再对客户进行精确营销,大幅提升营销效果。
    近几年来,在各类技术手段得到广泛应用的背景下,银行业基于大数据的客户营销模式层出不穷,主要可归结为以下两种类型。
    第一类是基于大数据的交叉销售模式,其中又包括基于银行内部数据的交叉营销和基于银行外部数据的交叉营销。在基于银行内部数据的交叉销售领域,业界已经开发出了若干种成熟的金融产品。以建设银行、中信银行等开发的POS 贷为例,其基本思路就是通过分析银行POS 商户的交易流水数据,结合商户的其他基本信息、征信信息等,筛选出POS 交易量高、稳定的商户,以预授信方式给其推送无抵押信用贷款。该模式和互联网金融领域的阿里小贷模式类似,阿里小贷也是基于网络商户交易数据发放小额无抵押信用贷款。其他类似的产品还有小企业网银循环贷、个人快贷等。基于银行外部数据的金融产品有建设银行的税易贷等,其基本思路是和税务局合作,根据企业纳税流水数据,筛选出纳税额高、稳定的企业,综合考虑征信等信息,为其发放信用贷款。目前,银行基于上述大数据
的交叉销售模式仅仅是一个开始,考虑到银行在各业务线上沉淀的海量数据,上述思路很容易推广至其他的交叉销售领域。如在银行内部数据交叉分析领域,可以根据企业结算数据遴选客户进行预授信;通过对客户存款的大数据分析为客户提供理财类产品销售(或反之);基于理财类数据营销信贷类产品(或反之);信贷类产品之间开展相互交叉销售;根据客户资金活动的规律数据推送针对性企业理财产品等。在银行外部数据交叉分析领域,除了和税务局合作,还可以和海关、工商、专利局等外部机构合作,根据其提供的外部数据开展营销服务。
    第二类是基于大数据的个性化推荐营销模式。如记录客户在网银等入口的选择习惯和产品购买习惯数据,分析客户产品偏好和风险偏好,将适合客户的产品/ 服务放在最容易被客户接触的入口,从而为其推送精准的、有针对性的产品或服务。除了记录单客户的选择习惯,还可以根据客户与客户之间的产品偏好和风险偏好关联性,为其推送个性化产品。类似亚马逊公司的产品交叉推送服务(如买了A 金融产品的用户中有多少还会买B产品,浏览了A 金融产品的用户中有多少会购买C 产品等),在银行营销推送上也有较大的应用空间。通过上述个性化营销推送方式,大数据提供了产品的精确指向/ 个性化推荐。
    总的来说,目前银行基于大数据的交叉营销方式方兴未艾,未来还将衍生出若干新的做法。银行采用大数据方式开展交叉营销分析,可以以较低成本提升客户的产品覆盖率,增加客户黏性,延长客户的生命周期。
    2. 客户准入(授信审批、定价和额度管理)环节的应用
    信贷客户准入环节的授信审批领域也是大数据在银行信贷业务中的核心应用之一。早在上个世纪五十年代,欧美银行业基于申请贷款客户的基本信息、产品信息、风险缓释信息等数据,开发出了针对零售信贷业务的评分卡和非零售业务的评级模型,对客户信用风险等级进行自动化定量化评定,并在信用等级和信用评分基础上,将专家经验和自动评分、自动决策规则结合,实现了人工+ 自动化决策结合的授信审批方式。在欧美银行业,部分零售业务的自动化审批决策率可以达到90% 以上,大幅提高了银行授信审批的效率,节约了宝贵的审批人资源,有效控制了银行风险。
    近年来,随着银行数据采集范围的扩大和建模技术方法的更新,银行已经开始探索采用大数据方式,完善传统的客户评级评分模型,优化自动审批策略。与传统的评级评分模型相比,基于大数据的评级评分模型主要存在如下特点。
    一是数据维度更广,变量更为丰富。传统的评级评分模型通常有10~20 个变量,主要包括客户基本信息、资产(AUM)、收入(工资发放信息)、产品、交易结构安排、风险缓释、征信(银行内部征信和外部征信)、交易流水等类型的信息。在大数据时代,除了上述价值密度较高的传统信息以外,可以增加价值密度相对较低但体量较大的数据,包括网络消费数据、网络浏览与偏好数据、用户偏好数据等。可以将大量变量(可达数百个乃至数千个)纳入模型中,模型区分能力更佳、更稳定。
    二是采用模型嵌套模型的技术架构。将稀疏的大数据信息先通过子模型加工成密集信息,即将子模型的输出信息作为母模型的输入变量,将信息逐层加工,形成模型嵌套模型的技术方案。子模型可以采用较新的技术如神经网络、随机森林、支持向量机等机器学习算法,母模型可以采用传统的、成熟的logistic 回归等技术方法,在模型应用框架不发生太大变化的情况下,实现更好的区分效果。
    三是采用候选模型动态调整机制,一旦部分子模型效果下降至某个最低阈值,则该模型会被剔除出子模型序列,替补模型会立刻增补进入到子模型序列中。
    上述大数据和新技术的使用,使得单一变量、单一模型效果的波动,难以对模型整体效果造成实质性影响,从而实现了模型效果的相对稳定,模型预测效果也得到了提升。银行基于以上大数据信息生成的信用风险评级、评分,结合专家设定的业务规则,嵌入到信贷业务流程系统中,共同形成了信贷业务自动化审批策略,可以更好地识别客户风险,极大提升效率。
    大数据在授信审批环节的另一个应用是额度和价格(利率)的制定、调整。一般来说,在信贷业务的授信审批环节会同时确定信贷业务的额度和价格。在新客户首次准入时,可以根据大数据统计出的同类客户风险参数、各项成本参数、市场敏感性参数来设定授信额度。对存量客户,可以根据客户的风险特征变化情况、贷款支用情况、逾期情况等大数据计算客户行为评分,并计算影子额度,基于影子额度对现有额度进行实时调整。在采用大数据和自动评分机制框架下,银行对客户额度的调整时间
可以从之前的数天缩短到数秒,极大提升了客户体验。与此类似,贷款定价也可以根据大数据方式来确定和调整。除了采用大样本统计风险参数以确定贷款价格以外,在利率市场化环境下,银行还可以为多类样本客户设定不同测试利率价格,计算不同客户对利率定价敏感性系数以及竞争对手对测试利率的反应情况,从而确定最优贷款定价策略。
    3. 贷后监控和预警应用
    贷后管理是国内银行信贷业务流程中管理相对较为薄弱的环节,也是大数据能发挥良好作用的领域。传统上,国内银行贷后管理的普遍做法是由客户经理及所在支行分散式地负责收集客户贷后信息,管理效率较低。在贷后管理实践中,往往在企业经营形势已经出现了巨大变化且无法挽回以后,总分行管理机构才能获知消息,造成银行在贷款处置中的被动局面。近一段时间以来,部分银行将大数据应用在贷后管理领域中,已经取得了良好的效果。
    大数据在银行客户贷后风险预警体系的应用主要包括单客户风险预警、客户风险预警、风险传染预警等领域。在单客户贷后风险预警系统建设中,一种做法是在企业贷款支用环节,在客户支用贷款资金以后,银行可以采用大数据手段,采集企业资金流向数据,分析企业资金流向规律,对企业未按照约定支付、支付规律出现异常的进行预警。另外一种常见的做法是建设客户大数据信息监测库,动态抓取社交媒体、网站新闻、环保、工商、税务、海关、企业股票价格、企业债券价格、企业CDS 价
格等涉及客户的外部信息,通过文本分析及内容挖掘技术,对涉及企业的关键词和负面新闻进行识别,将识别后的信息转换成标准分类,建立企业信息索引库,结合企业在银行内部的征信信息、交易流水信息、贷款逾期信息、资金往来异动信息等,部署企业信息预警规则,建立完整的企业预警信息系统。在此基础上,将其和银行信贷系统打通,把预警系统中按规则触发的信息,发送总分支行的有关责任主体,完善贷后预警体系。当然,以上预警体系的建设思路,适当修改部分数据来源和应用规则以后,还可以应用于银行本身的舆情监控与分析中。
    大数据在客户风险的监测和分析中典型的应用之一是担保圈风险监测。银行可以根据数万信贷客户之间互相担保关系的大数据,生成担保圈关系图谱,并建立担保圈风险监测体系。在担保圈中,可以出担保圈中的关键风险人,一旦担保链中出现崩塌式违约,可以及时切断风险在担保链上的波浪式传导;在担保圈中,出高危担保圈、良性担保圈,实现担保圈风险分类、监控和处置。除了担保圈分析,还可以采用上述思路,建立上下游供应链企业客户、集团客户、商圈客户风险动态监测和预警。如采用大数据分析对个人住房贷款/ 个人汽车贷款开展集中违约监测,可有效识别假个贷、问题贷款,减少贷款损失。主要方法是根据贷款发放支行、合作楼盘、合作4S 店等合作方信息,结合贷款金额、贷款发放时间、贷款还款时间、还款网点、还款渠道、还款金额、个贷集中违约时间等信息,提前识别假个贷和问题贷款的客户。根据识别客户的规律,在监测系统中设定假个贷、客户违约监测规则,有针对性地设定楼盘准入和其他风险管理缓释措施。
    大数据在贷后管理中的另外一项应用是风险传染(关联风险)的监测和预警。银行可以根据大数据分析,发现客户在银行不同敞口之间风险梯次传播规律,实现不同产品/ 敞口之间的风险预警,及时止损。如可以根据小企业主的法人代表和实际控制人的个人贷款风险特征(如信用卡体现、额度使用情况),监测小企业公司贷款的风险状况,还可以通过企业员工代发工资情况监测企业资金链变化和经营风险等。反过来,也可以根据企业贷款风险情况,分析企业主个人贷款(如个人经营性贷款、个人消费贷款、信用卡)风险状况的变化,及时调整有关风险敞口,减少风险在各贷款产品之间的相互传导。在零售领域,也可以根据信用卡风险特征变化监测个贷风险特征情况。
    当然,采用大数据开展贷后管理和预警并不意味着其可以完全替代客户经理和支行在贷后管理中的作用,而是有效的补充。以大数据为基础的贷后监测工具需要融入到整个贷后管理机制内。构建一套人工监测和大数据监测相结合,分散监测和集中监测相辅相成,内部和外部信息共享和融合的机制,是银行实施有效贷后管理的解决之道。
    4. 反欺诈领域应用
    反欺诈是银行信贷风险管理领域的古老议题,也是大数据技术最能发挥作用的领域之一。无论是在传统的公司信贷、贸易融资、个人信贷、信用卡等传统信贷业务领域,还是在电子银行、银行电商平台、自助设备、POS 等新兴业务领域,大数据均能发挥作用。本文主要以大数据在传统信贷业务反欺诈的应用为讨论对象,聚焦零售信贷业务,特别是信用卡业务领域的大数据反欺诈。
    信贷业务领域的反欺诈主要集中在申请反欺诈和行为反欺诈。申请反欺诈主要包括客户真实身份识别(申请欺诈者以他人名义获得和使用信用卡)和申请资料填写不实(故意提供不实的申请信息,以获得信用卡或得到较高信用额度)。申请反欺诈领域可以采用大数据技术,通过对提取的多个信息来源的客户数据进行交叉比对分析,判定客户信息真实性。如采用中文模糊匹配技术,比对申请人填写的家庭地址、单位地址、公司名称、手机号码等中文信息与其历史信息的一致性,以及与外部征信数据的一致性,形成信息相似度概率或得分,结合判定规则判定其是否存在申请欺诈;也可以将客户手机号码、地址与历史申请数据库比对,分析是否存在重复申请、团体欺诈和中介申请等;还可以查询申请贷款的企业主或个人是否在银行欺诈黑名单中;以及通过与外部信息渠道合作,判断企业主/ 个人是否和银行现存欺诈黑名单存在密切关系(如亲属关系、频繁通信等),通过计算得出其与现存欺诈黑名单的关联度指数,并加以应用。