数据在⾦融⾏业的应⽤
⾦融⾏业是典型的数据驱动⾏业,每天都会产⽣⼤量的数据,包括交易、报价、业绩报告、消费者研究报告、各类统计数据、各种指数等。所以,⾦融⾏业拥有丰富的数据,数据维度⽐较⼴泛,数据质量也很⾼,利⽤⾃⾝的数据就可以开发出很多应⽤场景。
如果能够引⼊外部数据,还可以进⼀步加快数据价值的变现。外部数据中⽐较好的有社交数据、电商交易数据、移动、运营商数据、⼯商司法数据、公安数据、教育数据和银联交易数据等。
⼤数据在⾦融⾏业的应⽤范围较⼴,典型的案例有花旗银⾏利⽤ IBM 沃森电脑为财富管理客户推荐产品,并预测未来计算机推荐理财的市场将超过银⾏专业理财师;摩根⼤通银⾏利⽤决策树技术,降低了不良贷款率,转化了提前还款客户,⼀年为摩根⼤通银⾏增加了 6 亿美⾦的利润。
从投资结构上来看,银⾏将会成为⾦融类企业中的重要部分,证券和保险分列第⼆和第三位,如图 1 所⽰。下⾯将分别介绍银⾏、证券和保险⾏业的⼤数据应⽤情况。
图 1  中国⾦融⾏业⼤数据应⽤投资结构
银⾏⼤数据应⽤场景
⽐较典型的银⾏的⼤数据应⽤场景集中在数据库营销、⽤户经营、数据风控、产品设计和决策⽀持等。⽬前来讲,⼤数据在银⾏的商业应⽤还是以其⾃⾝的交易数据和客户数据为主,外部数据为辅以描述性数据分析为主,预测性数据建模为辅,以经营客户为主,经营产品为辅。
银⾏的数据按类型可以分为交易数据、客户数据、信⽤数据、资产数据等 4 ⼤类。银⾏数据⼤部分是结构化数据,具有很强的⾦融属性,都存储在传统关系型数据库和数据仓库中,通过数据挖掘可分析出其中的⼀些具有商业价值的隐藏在交易数据之中的知识。
国内不少银⾏已经开始尝试通过⼤数据来驱动业务运营,如中信银⾏信⽤卡中⼼使⽤⼤数据技术实现了实时营销,光⼤银⾏建⽴了社交⽹络信息数据库,招商银⾏则利⽤⼤数据发展⼩微贷款。如图 2 所⽰,银⾏⼤数据应⽤可以分为 4 ⼤⽅⾯:客户画像、精准营销、风险管控、运营优化。
图 2  银⾏⼤数据应⽤的 4 ⼤⽅⾯
1)客户画像
客户画像应⽤主要分为个⼈客户画像和企业客户画像。个⼈客户画像包括⼈⼝统计学特征、消费能⼒、兴趣、风险偏好等数据;企业客户画像包括企业的⽣产、流通、运营、财务、销售和客户数据,以及相关产业链的上下游等数据。需要指出银⾏拥有的客户信息并不全⾯,基于银⾏⾃⾝拥有的数据有时候难以得出理想的结果,甚⾄可能得出错误的结论。
例如,如果某位信⽤卡客户⽉均刷卡 8 次,平均每次刷卡⾦额 800 元,平均每年打 4 次,从未有过投诉,如果按照传统的数据分析,该客户是⼀位满意度较⾼,流失风险较低的客户,但是,如果看到该客户的微博,得到的真实情况是,⼯资卡和信⽤卡不在同⼀家银⾏,还款不⽅便,好⼏次打没接通,客户多次在微博上抱怨,该客户的流失风险较⾼。所以银⾏不仅仅要考虑银⾏⾃⾝业务所采集到的数据,更应整合外部更多的数据,以扩展对客户的了解。
宋茜珉豪① 客户在社交媒体上的⾏为数据
通过打通银⾏内部数据和外部社会化的数据,可以获得更为完整的客户画像,从⽽进⾏更为精准的营销和管理,例如,光⼤银⾏建⽴了社交⽹络信息数据库。
② 客户在电商⽹站的交易数据
通过客户在电商⽹站上的交易数据就可以了解客户的购买能⼒和购买习惯,从⽽帮助银⾏评判客户的信贷能⼒。例如,建设银⾏将⾃⼰的电⼦商务平台和信贷业务结合起来,阿⾥⾦融根据⽤户过去的信⽤即可为阿⾥巴巴⽤户提供⽆抵押贷款。
王菲李亚鹏年龄③ 企业客户的产业链的上下游的数据
如果银⾏掌握了企业所在的产业链的上下游的数据,则可以更好地掌握企业的外部环境发展情况,从
⽽预测企业未来的状况。
④ 其他有利于扩展银⾏对客户兴趣爱好的数据
还有其他有利于扩展银⾏对客户兴趣爱好的数据,如⽹络⼴告界⽬前正在兴起的 DMP 数据平台的互联⽹⽤户⾏为数据。
2)精准营销
在客户画像的基础上,银⾏可以有效地开展精准营销
① 实时营销
实时营销是根据客户的实时状态来进⾏营销的,例如,根据客户当时的所在地、客户最近⼀次消费等信息有针对性地进⾏营销。当某客户采⽤信⽤卡采购孕妇⽤品时,可以通过建模推测怀孕的概率,并推荐孕妇类喜欢的业务。也可以将客户改变⽣活状态的事件(换⼯作、改变婚姻状况、置居等)视为营销机会。
② 交叉营销
十大情侣旅游胜地
交叉营销就是进⾏不同业务或产品的交叉推荐,例如,招商银⾏可以根据客户交易记录进⾏分析,有效地识别⼩微企业客户,然后⽤远程银⾏来实施交叉销售。
③ 个性化推荐
银⾏可以根据客户的喜好进⾏服务或者银⾏产品的个性化推荐,例如,根据客户的年龄、资产规模、理财偏好等,对客户进⾏精准定位,分析出其潜在的⾦融服务需求,进⽽有针对性地营销推⼴。
④ 客户⽣命周期管理
客户⽣命周期管理包括新客户获取、客户防流失和客户赢回等。例如,招商银⾏通过构建客户流失预警模型,对流失率等级前 20% 的客户发售⾼收益理财产品予以挽留,使得⾦卡和⾦葵花卡客户流失率分别降低了 15 个和 7 个百分点。
现代化的商业银⾏正在从经营产品转向经营客户,因此⽬标客户的寻,已经成为银⾏数据商业应⽤的主要⽅向。通过数据挖掘和分析,发现⾼端财富管理和理财客户成为吸收存款和理财产品销售的主要应⽤领域。
① 利⽤数据库营销,挖掘⾼端财富客户
利⽤数据库营销是⼀种挖掘⾼端财富客户的有效⽅法。银⾏可以从物业费代缴服务中寻⾼端理财客户。通过帮助⼀些物业公司,特别是包含较多⾼档楼盘的物业公司,进⾏物业费的代扣代缴,银⾏可以依据物业费的多少,来识别⾼档住宅的业主。
例如,银⾏可以从数据库中发现物业费代扣⾦额超过 4000 元的客户,然后结合其在本⾏的资产余额,进⾏针对性的分析,从⽽可以帮助银⾏到⼀些主要资产不在本⾏的⾼端⽤户,为这些⽤户提供理财服务和资产管理服务。某家股份制商业银⾏曾经利⽤该营销⽅法,在两个⽉内吸引到⼗多亿的存款。
② 利⽤刷卡记录来寻财富管理⼈
⾼端财富⼈是所有银⾏财富管理重点发展的⼈。中国具有上百万的⾼端财富⼈,他们平均可⽀配的⾦融资产在⼀千万⼈民币。⾼端财富⼈具有典型的⾼端消费习惯,覆盖奢侈品、游艇、豪车、⼿表、⾼尔夫、古玩、字画等消费场景。银⾏可以参考 POS 机的消费记录,结合移动设备的位置数据识别出这些⾼端财富管理⼈,为其提供定制的财富管理⽅案,吸收其成为财富管理客户,增加存款和理财产品销售。
③ 利⽤外部数据到⽩⾦卡⽤户
⽩⾦信⽤卡主要⾯对⾼端消费⼈,是信⽤卡公司希望获得的⾼价值⽤户。尽管这些⼈很难通过线下的⽅式进⾏接触,但是银⾏可以通过参考客户乘坐头等舱的次数、出境游消费⾦额、数据漫游费⽤等来发现这些潜在的⽩⾦卡客户。通过与其他⾏业的消费信息进⾏关联分析发现潜在客户是典型的⼤数据关联应⽤消费场景。
3)风险管控
利⽤⼤数据技术可以进⾏对中⼩企业贷款风险的评估和对欺诈交易的识别,从⽽帮助银⾏降低风险。
① 中⼩企业贷款风险评估
信贷险⼀直是⾦融机构需要努⼒化解的⼀个重要问题。为数众多的中⼩企业是⾦融机构不可忽视的客户体,市场潜⼒巨⼤。但是,中⼩企业贷款偿还能⼒差,财务制度普遍不健全,难以有效评估其真实经营状况,⽣存能⼒相对⽐较低,信⽤度低。
据测算,对中⼩企业贷款的平均管理成本是⼤型企业的 5 倍左右,⽽风险成本却⾼很多。这种成本、收益和险的不对称导致⾦融机构不愿意向中⼩企业全⾯敞开⼤门。
现在,通过使⽤⼤数据分析技术,银⾏可通过将企业的⽣产、流通、销售、财务等相关信息与⼤数据挖掘⽅法相结合的⽅式进⾏贷款风险分析,从⽽量化企业的信⽤额度,更有效地开展中⼩企业贷款。
例如,“阿⾥⼩贷”依据会员在阿⾥巴巴平台上的⽹络活跃度、交易量、⽹上信⽤评价等,结合企业⾃⾝经营的财务健康状况进⾏贷款决定。巨力集团杨子的父亲
“阿⾥⼩贷”⾸先通过阿⾥巴巴 B2B、淘宝、天猫、⽀付宝等电⼦商务平台,收集客户积累的信⽤数据,包括客户评价数据、货运数据、⼝碑评价等,同时引⼊海关、税务、电⼒等外部数据加以匹配,建⽴数据模。
其次,通过交叉检验技术辅以第三⽅验证确认客户的真实性,将客户在电⼦商务平台上的⾏为数据映射为企业和个⼈的信⽤评价,并通过评分卡体系、微贷通⽤规则决策引擎、风险定量化分析等技术,对地区客户进⾏评级分层。
最后,在风险监管⽅⾯,开发了⽹络⼈际爬⾍系统,可获取和整合相关⼈际关系信息,并通过设计规则及其关联性分析得到风险评估结论,再通过与贷前评级系统的交叉验证,构成风险控制的双保险。
② 欺诈交易识别
银⾏可以利⽤持卡⼈基本信息、卡基本信息、交易历史、客户历史⾏为模式、正在发⽣⾏为模式等,结合智能规则引擎进⾏实时的交易反欺诈分析,例如,IBM ⾦融犯罪管理解决⽅案帮助银⾏利⽤⼤数据有效地预防与管理⾦融犯罪;摩根⼤通银⾏利⽤⼤数据技术追踪盗取客户账号或侵⼊⾃动柜员机(ATM)系统的罪犯。
4)运营优化
⼤数据分析⽅法可以改善经营决策,为管理层提供可靠的数据⽀撑,使经营决策更加⾼效、敏捷,精确性更⾼。
① 市场和渠道分析优化
通过⼤数据,银⾏可以监控不同市场推⼴渠道尤其是⽹络渠道推⼴的质量,从⽽进⾏合作渠道的调整和优化,同时,银⾏也可以分析哪些渠道更适合推⼴哪类银⾏产品或者服务,从⽽进⾏渠道推⼴策略的优化。211和985大学的区别
② 产品和服务优化
银⾏可以将客户⾏为转化为信息流,并从中分析客户的个性特征和风险偏好,更深层次地理解客户的习惯,智能化分析和预测客户需求,从⽽进⾏产品创新和服务优化。例如,兴业银⾏通过对还款数据的挖掘来⽐较区分优质客户,根据客户还款数额的差别,提供差异化的⾦融产品和服务⽅式。
③ 舆情分析
银⾏可以通过爬⾍技术,抓取社区、论坛和微博上关于银⾏以及银⾏产品和服务的相关信息,并通过
⾃然语⾔处理技术进⾏正负⾯判断,尤其是及时掌握银⾏以及银⾏产品和服务的负⾯信息,及时发现和处理问题;对于正⾯信息,可以加以总结并继续强化。同时,银⾏也可以抓取同⾏业的正负⾯信息,及时了解同⾏做得好的⽅⾯,以作为⾃⾝业务优化的借鉴。
证券⾏业数据应⽤场景
证券⾏业的主要收⼊来源于经纪业务、资产管理、投融资服务和⾃由资⾦投资等。外部数据的分析,特别是⾏业数据的分析有助于其投融资服务和投资业务。
证券⾏业拥有的数据类型有个⼈属性信息(如⽤户名称、⼿机号码、家庭地址、邮件地址等)、交易⽤户的资产和交易纪录、⽤户收益数据。证券公司可以利⽤这些数据和外部数据来建⽴业务场景,筛选⽬标客户,为⽤户提供适合的产品,提⾼单个客户收⼊。
证券⾏业需要通过数据挖掘和分析到⾼频交易客户、资产较⾼的客户和理财客户。借助于数据分析的结果,证券公司就可以根据客户的特点进⾏精准营销,推荐针对性服务。
如果客户平均年收益低于 5%,交易频率很低,就可以建议其购买证券公司提供的理财产品。如果客户交易⽐较频繁,收益也⽐较⾼,那么就可以主动推送融资服务。如果客户交易不频繁,但是资⾦量较⼤,就可以为客户提供投资咨询服务,激活客户的交易兴趣。客户交易的频率、客户的资产规模和
客户交易量都是证券公司的主要收⼊来源,通过对客户交易习惯和⾏为的分析,可以帮助证券公司获得更多的收益。
除了利⽤企业财务数据来判断企业经营情况以外,证券公司还可以利⽤外部数据来分析企业的经营情况,为投融资以及⾃⾝投资业务提供有⼒⽀持。
例如,利⽤移动 App 的活跃和覆盖率来判断移动互联⽹企业的经营情况,电商、⼿游、旅游等⾏业的 App 活跃情况完全可以说明企业的运营情况。另外,海关数据、物流数据、电⼒数据、交通数据、社交舆情、邮件服务器容量等数据可以说明企业经营情况,为投资提供重要参考。
⽬前,国内外证券⾏业的⼤数据应⽤⼤致有以下 3 个⽅向:股价预测,客户关系管理和投资景⽓指数预测。
1)股价预测
2011 年 5 ⽉,英国对冲基⾦ Derwent Capital Markets 建⽴了规模为 4 000 美⾦的对冲基⾦。该基⾦是基于社交⽹络的对冲基⾦,通过分析 Twitter 的数据内容来感知市场情绪,从⽽指导进⾏投资,并在⾸⽉的交易中实现盈利,其以 1.85% 的收益率,让平均数只有
0.76% 的其他对冲基⾦相形见绌。
⿇省理⼯学院的学者,根据情绪词将 Twitter 内容标定为正⾯或负⾯情绪。结果发现,⽆论是如“希望”的正⾯情绪,还是如“害怕”“担⼼”的负⾯情绪,其占总 Twitter 内容数的⽐例,都预⽰着道琼斯指数、标准普尔 500 指数、纳斯达克指数的下跌。
美国佩斯⼤学的⼀位博⼠则采⽤了另外⼀种思路,他追踪了星巴克、可⼝可乐和耐克三家公司在社交媒体上的受欢迎程度,同时⽐较它们的股价。他发现,Facebook 上的粉丝数、Twitter 上的听众数和 Youtube 上的观看⼈数都和股价密切相关。另外,根据品牌的受欢迎程度,还能预测股价在 10 天、30 天之后的上涨情况。
2)客户关系管理房屋抵押银行贷款利率
① 客户细分
客户细分是指通过分析客户的账户状态(类型、⽣命周期、投资时间)、账户价值(资产峰值、资产均值、交易量、佣⾦贡献和成本等)、⼀交易习惯(周转率、市场关注度、仓位、平均持股市值、平均持股时间、单笔交易均值和⽇均成交量等)、投资偏好(偏好品种、下单渠道和是否申购)及投资收益(本期相对和收益、今年相对和收益和投资能⼒等),来进⾏客户聚类和细分,从⽽发现客户交易模式类型,岀最有价值和盈利潜⼒的客户,以及他们最需要的服务,更好地配置资源和政策,改进服务,抓住最有价值的客户。
② 流失客户预测
券商可根据客户历史交易⾏为和流失情况来建模,从⽽预测客户流失的概率。例如,2012 年海通证券⾃主开发的“给予数据挖掘算法的证券客户⾏为特征分析技术”主要应⽤在客户深度画像及基于画像的⽤户流失概率预测中。
通过对海通 100 多万样本客户、半年交易记录的海量信息分析,建⽴了客户分类、客户偏好、客户流失概率的模型。该项技术通过客户⾏为的量化分析来测算客户将来可能流失的概率。
3)投资景⽓指数预测