画像分析(1-1)如何为客户画像?
1、⽤户画像
1.1、为什么要为⽤户画像?
在互联⽹⼤数据时代,得⽤户者得天下。
以庞⼤的⽤户数据为依托,构建出⼀整套完善的⽤户画像,借助其标签化、信息化、可视化的属性,是企业实现个性化推荐、精准营销强有⼒的前提基础。
深⼊了解⽤户画像的含义,掌握⽤户画像的搭建⽅法,显得尤其重要。
1.1.1、⽤户画像
⽤户画像:⽤户画像是真实⽤户的虚拟代表,是建⽴在真实数据上的⽬标⽤户模型。
企业对到的⽬标⽤户,挖掘每⼀个⽤户的⼈⼝属性、⾏为属性、社交⽹络、⼼理特征、兴趣爱好等数据,经过不断叠加、更新,抽象出完整的标签,组合并搭建出⼀个⽴体的⽤户虚拟模型,就是⽤户画像。
1.1.2、打标签怎么做数据分析
打标签:给⽤户“打标签”是⽤户画像最核⼼的部分。所谓“标签”,就是浓缩精炼的、带有特定含义的⼀系列词语,⽤于描述真实的⽤户⾃⾝带有的属性特征,⽅便企业做数据的统计分析。
不同的受众体、不同的企业、不同的⽬的,给⽤户打的标签往往各有侧重点,应该具体问题具体看待。
1.1.3、打标签
2D⽤户画像和3D⽤户画像
但是,有些标签适⽤于所有情况,应该加以理解和掌握。我把常见的标签分成两⼤类别:相对静⽌的⽤户标签以及变化中的⽤户标签。相对应的,由静态标签搭建形成的画像就是2D⽤户画像;由静态标签+动态标签构建出来的即是3D⽤户画像。
1.2、静态的⽤户信息标签以及2D⽤户画像
1.2.1、⼈⼝属性标签
⼈⼝属性标签是⽤户最基础的信息要素,通常⾃成标签,不需要企业过多建模,它构成⽤户画像的基本框架。
⼈⼝属性包括⼈的⾃然属性和社会属性特征:姓名、性别、年龄、⾝⾼、体重、职业、地域、受教育程度、婚姻、星座、⾎型......。⾃然属性具有先天性,⼀经形成将⼀直保持着稳定不变的状态,⽐如性别、地域、⾎型;社会属性则是后天形成的,处于相对稳定的状态,⽐如职业、婚姻。
1.2.2、⼼理现象属性标签
⼼理现象包括⼼理和个性两⼤类别,同样具有先天性和后天性。对于企业来说,研究⽤户的⼼理现象,特别是需求、动机、价值观三⼤⽅⾯,可以窥探⽤户注册、使⽤、购买产品的深层动机;了解⽤户对产品的功能、服务需求是什么;认清⽬标⽤户带有怎样的价值观标签,是⼀类什么样的体。
具体的⼼理现象属性标签包括但不限于:
1.2.3、静态标签的⽤途
因为⼈⼝属性和⼼理现象都带有先天的性质,整体处于稳定状态,共同组成⽤户画像最表⾯以及最内⾥的信息素,由此形成稳定的2D⽤户画像。
1.3、动态的⽤户信息标签以及3D⽤户画像
1.3.1、⽹站⾏为属性
这⾥我们主要讨论的是⽤户在⽹站内外进⾏的⼀系列操作⾏为。常见的⾏为包括:搜索、浏览、注册、评论、点赞、收藏、打分、加⼊购物车、购买、使⽤优惠券......。
在不同的时间,不同的场景,这些⾏为不断发⽣着变化,它们都属于动态的信息。企业通过捕捉⽤户的⾏为数据(浏览次数、是否进⾏深度评论),可以对⽤户进⾏深浅度归类,区分活跃/不活跃⽤户。
1.3.2、社交⽹络⾏为
是指发⽣在虚拟的社交软件平台(微博、、论坛、社、贴吧、twitter、Instagram)上⾯⼀系列⽤户⾏为,包括基本的访问⾏为(搜索、注册、登陆等)、社交⾏为(邀请/添加/取关好友、加⼊、新建等)、信息发布⾏为(添加、发布、删除、留⾔、分享、收藏等)。
1.3.3、⾏为标签的⽤途
给⽤户打上不同的⾏为标签,可以获取到⼤量的⽹络⾏为数据、⽹站⾏为数据、⽤户内容偏好数据、⽤户交易数据。这些数据进⼀步填充了⽤户信息,与静态的标签⼀起构成完整的⽴体⽤户画像,就是所说的3D⽤户画像。
1.4、⽤户画像的价值
企业必须在开发和营销中解决好⽤户需求问题,明确回答“⽤户是谁——⽤户需要/喜欢什么——哪些渠道可以接触到⽤户——哪些是企业的种⼦⽤户”。
更了解你,是为了更好的服务你!可以说,正是企业对⽤户认知的渴求促⽣了⽤户画像。
⽤户画像是真实⽤户的缩影,能够为企业带来不少好处。
1.4.1、指导产品研发以及优化⽤户体验
在过去较为传统的⽣产模式中,企业始终奉⾏着“⽣产什么就卖什么给⽤户”的原则。这种闭门造车的产品开发模式,常常会产⽣“做出来的东西⽤户完全不买账”的情况。
如今,“⽤户需要什么企业就⽣产什么”成为主流,众多企业把⽤户真实的需求摆在了最重要的位置。
在⽤户需求为导向的产品研发中,企业通过获取到的⼤量⽬标⽤户数据,进⾏分析、处理、组合,初步搭建⽤户画像,做出⽤户喜好、功能需求统计,从⽽设计制造更加符合核⼼需要的新产品,为⽤户提供更加良好的体验和服务。
1.4.2、实现精准化营销
精准化营销具有极强的针对性,是企业和⽤户之间点对点的交互。它不但可以让营销变得更加⾼效,也能为企业节约成本。
以做活动为例:商家在做活动时,放弃⾃有的⽤户资源转⽽选择外部渠道,换⽽⾔之,就是舍弃⾃家精准的种⼦⽤户⽽选择了对其品牌⼀⽆所知的活动对象,结果以超出预算好⼏倍的成本获取到新⽤户。
这就是不精准所带来的资源浪费。
包括我前⾯所提到的,⽹购后的商品推荐以及品牌商定时定点的节⽇营销,都是精准营销的成功⽰范。
要做到精准营销,数据是最不可缺的存在。以数据为基础,建⽴⽤户画像,利⽤标签,让系统进⾏智能分组,获得不同类型的⽬标⽤户,针对每⼀个体策划并推送针对性的营销。
1.4.3、可以做相关的分类统计
简单来说,借助⽤户画像的信息标签,可以计算出诸如“喜欢某类东西的⼈有多少”、“处在25到30岁年龄段的⼥性⽤户占多少”等等。
1.4.4、便于做相关的数据挖掘
在⽤户画像数据的基础上,通过关联规则计算,可以由A可以联想到B。
沃尔玛“啤酒和尿布”的故事就是⽤户画像关联规则分析的典型例⼦。
我们认识到⽤户画像具有的极⾼价值,下⾯就来看看该如何搭建⽤户画像。
2、如何构建⽤户画像
2.1、⽤户画像准备阶段——数据的挖掘和收集
2.1.1、对⽹站、活动页⾯进⾏SDK埋点
预先设定好想要获取的“事件”,让程序员在前/后端模块使⽤ Java/Python/PHP/Ruby 语⾔开发,撰写代码把“事件”埋到相应的页⾯上,⽤于追踪和记录的⽤户的⾏为,并把实时数据传送到后台数据库或者客户端。
所谓“事件”,就是指⽤户作⽤于产品、⽹站页⾯的⼀系列⾏为,由数据收集⽅(产品经理、运营⼈员)加以描述,使之成为⼀个个特定的字段标签。
我们以“⽹站购物”为例,为了抓取⽤户的⼈⼝属性和⾏为轨迹,做SDK埋点之前,先预设⽤户购物时
的可能⾏为,包括:访问⾸页、注册登录、搜索商品、浏览商品、价格对⽐、加⼊购物车、收藏商品、提交订单、⽀付订单、使⽤优惠券、查看订单详情、取消订单、商品评价等。
把这些⾏为⽤程序语⾔进⾏描述,嵌⼊⽹页或者商品页的相应位置,形成触点,让⽤户在点击时直接产⽣⽹络⾏为数据(登陆次数、访问时长、激活率、外部触点、社交数据)以及服务内⾏为数据(浏览路径、页⾯停留时间、访问深度、唯⼀页⾯浏览次数等等)。
数据反馈到服务器,被存放于后台或者客户端,就是我们所要获取到的⽤户基础数据。
2.1.2、A/B test
然⽽,在⼤多数时候,利⽤埋点获取的基础数据范围较⼴,⽤户信息不够精确,⽆法做更加细化的分类的情况。⽐如说,只知道⽤户是个男性,⽽不知道他是哪个年龄段的男性。
在这种情况下,为了得到更加详细的,具有区分度的数据,我们可以利⽤A/B test。
A/B test就是指把两个或者多个不同的产品/活动/奖品等推送给同⼀个/批⼈,然后根据⽤户作出的选择,获取到进⼀步的信息数据。
为了知道男性⽤户是哪个年龄层的,借助A/B test,我们利⽤抽奖活动,在奖品页⾯进⾏SDK埋点后,
分别选了适合20~30岁和30~40岁两种不同年龄段使⽤的礼品,最后⽤户选择了前者,于是我们能够得出:这是⼀位年龄在20~30岁的男性⽤户。
以上就是数据的获取⽅法。有了相关的⽤户数据,我们下⼀步就是做数据分析处理——数据建模。
2.2、⽤户画像成型阶段——数据建模
2.2.1、定性与定量结合
定性化研究⽅法就是确定事物的性质,是描述性的;
定量化研究⽅法就是确定对象数量特征、数量关系和数量变化,是可量化的。
定性的⽅法,在⽤户画像中,表现为对产品、⾏为、⽤户个体的性质和特征作出概括,形成对应的产品标签、⾏为标签、⽤户标签。
定量的⽅法,则是在定性的基础上,给每⼀个标签打上特定的权重,最后通过数学公式计算得出总的标签权重,从⽽形成完整的⽤户模型。⽤户画像的数据建模是定性与定量的结合。
2.2.2、给标签加上权重
给⽤户的⾏为标签赋予权重。
⽤户的⾏为,我们可以⽤4w表⽰: WHO(谁);WHEN(什么时候);WHERE(在哪⾥);WHAT(做了什么),具体分析如下:
WHO(谁):定义⽤户,明确我们的研究对象。主要是⽤于做⽤户分类,划分⽤户体。⽹络上的⽤户识别,包括但不仅限于⽤户注册的ID、昵称、⼿机号、邮箱、⾝份证、微博号等等。
WHEN(时间):这⾥的时间包含了时间跨度和时间长度两个⽅⾯。“时间跨度”是以天为单位计算的时长,指某⾏为发⽣到现在间隔了多长时间;“时间长度”则为了标识⽤户在某⼀页⾯的停留时间长短。
越早发⽣的⾏为标签权重越⼩,越近期权重越⼤,这就是所谓的“时间衰减因⼦”。
WHERE(在哪⾥):就是指⽤户发⽣⾏为的接触点,⾥⾯包含有内容+⽹址。内容是指⽤户作⽤于的对象标签,⽐如⼩⽶⼿机;⽹址则指⽤户⾏为发⽣的具体地点,⽐如⼩⽶官⽅⽹站。权重是加在⽹址标签上的,⽐如买⼩⽶⼿机,在⼩⽶官⽹买权重计为1,,在京东买计为
0.8,在淘宝买计为0.7。
WHAT(做了什么):就是指的⽤户发⽣了怎样的⾏为,根据⾏为的深⼊程度添加权重。⽐如,⽤户购买了权重计为1,⽤户收藏了计为0.85,⽤户仅仅是浏览了计为0.7。
当上⾯的单个标签权重确定下来后,就可以利⽤标签权重公式计算总的⽤户标签权重:
标签权重=时间衰减因⼦×⾏为权重×⽹址权重
举个例⼦:A⽤户今天在⼩⽶官⽹购买了⼩⽶⼿机;B⽤户七天前在京东浏览了⼩⽶⼿机。
由此得出单个⽤户的标签权重,打上“是否忠诚”的标签。
通过这种⽅式对多个⽤户进⾏数据建模,就能够更⼴的覆盖⽬标⽤户,为他们都打上标签,然后按照标签分类:总权重达到0.9以上的被归为忠实⽤户,ta们都购买了该产品......。这样的⼀来,企业和商家就能够根据相关信息进⾏更加精准的营销推⼴、个性化推荐。