【⼲货】最全数据分析常⽤术语!
作为产品经理,需要对⽤户进⾏聚类分析。⼀般从事数据分析⾏业的朋友对这类词并不陌⽣,但是像市场运营⼈员就会把这类些名词概念搞混,导致结果不准确。数据分析相关概念多且杂,容易搞混。为了便于⼤家区分,今天⼩编就来盘点⼀下数据分析常⽤的术语解释。建议⼤家收藏起来⽅便查看。
按照以下三类进⾏汇总。
1、互联⽹常⽤名词解释
2、统计学名词解释
3、数据分析名词解释
⼀、互联⽹常⽤名词解释
1、PV(Page View)页⾯浏览量
指某段时间内访问⽹站或某⼀页⾯的⽤户的总数量,通常⽤来衡量⼀篇⽂章或⼀次活动带来的流量效果,也是评价⽹站⽇常流量数据的重要指标。PV可重复累计,以⽤户访问⽹站作为统计依据,⽤户每刷新⼀次即重新计算⼀次。
2、UV(Unique Visitor)独⽴访客
指来到⽹站或页⾯的⽤户总数,这个⽤户是独⽴的,同⼀⽤户不同时段访问⽹站只算作⼀个独⽴访客,不会重复累计,通常以PC端的Cookie数量作为统计依据。
3、Visit 访问
指⽤户通过外部链接来到⽹站,从⽤户来到⽹站到⽤户在浏览器中关闭页⾯,这⼀过程算作⼀次访问。
Visit可重复累计,⽐如我打开⼀个⽹站⼜关闭,再重新打开,这就算作两次访问。
4、Home Page 主页
指⼀个⽹站起主⽬录功能的页⾯,也是⽹站起点。通常是⽹站⾸页。
5、Landing Page 着陆页
指⽤户从外部链接来到⽹站,直接跳转到的第⼀个页⾯。⽐如朋友给我发了⼀个介绍爆款T恤的淘宝链接,我点开会直接跳转到介绍T恤的那个页⾯,⽽不是淘宝⽹众多其他页⾯之⼀,这个介绍T恤的页⾯可以算作是着陆页。
6、Bounce Rate 跳出率
指⽤户通过链接来到⽹站,在当前页⾯没有任何交互就离开⽹站的⾏为,这就算作此页⾯增加了⼀个“
跳出”,跳出率⼀般针对⽹站的某个页⾯⽽⾔。
跳出率=在这个页⾯跳出的⽤户数/PV
7、退出率
⼀般针对某个页⾯⽽⾔。指⽤户访问某⽹站的某个页⾯之后,从浏览器中将与此⽹站相关的所有页⾯全部关闭,就算此页⾯增加了⼀个“退出“。
退出率=在这个页⾯退出的⽤户数/PV
8、Click 点击
⼀般针对付费⼴告⽽⾔,指⽤户点击某个链接、页⾯、banner的次数,可重复累计。⽐如我在PC端看到⼀则新闻链接点进去看了⼀会就关了,过了⼀会⼜点进去看了⼀遍,这就算我为这篇新闻贡献两次点击。
9、avr.time 平均停留时长
指某个页⾯被⽤户访问,在页⾯停留时长的平均值,通常⽤来衡量⼀个页⾯内容的质量。
avr.time=访客数量/⽤户总停留时长
10、CTR 点击率
指某个⼴告、Banner、URL被点击的次数和被浏览的总次数的⽐值。⼀般⽤来考核⼴告投放的引流效果。
CTR=点击数(click)/被⽤户看到的次数
11、Conversion rate 转化
指⽤户完成设定的转化环节的次数和总会话⼈数的百分⽐,通常⽤来评价⼀个转化环节的好坏,如果转化率较低则急需优化该转化环节。
转化率=转化会话数/总会话数
12、漏⽃
通常指产⽣⽬标转化前的明确流程,⽐如在淘宝购物,从点击商品链接到查看详情页,再到查看顾客评价、领取商家优惠券,再到填写地址、付款,每个环节都有可能流失⽤户,这就要求商家必须做好每⼀个转化环节,漏⽃是评价转化环节优劣的指标。
13、投资回报率(ROI:Return On Investment )
反映投⼊和产出的关系,衡量我这个投资值不值得,能给到我多少价值的东西(⾮单单的利润),这个是站在投资的⾓度或长远⽣意上看的。
其计算公式为:投资回报率(ROI)=年利润或年均利润/投资总额×100%,通常⽤于评估企业对于某项活动的价
值,ROI⾼表⽰该项⽬价值⾼。
14、重复购买率
指消费者在⽹站中的重复购买次数。
15、Referrer 引荐流量
通常指将⽤户引导⾄⽬标页⾯的URL(超链接)。在百度统计中,引荐流量叫做“外部链接”。
16、流失分析(Churn Analysis/Attrition Analysis)
描述哪些顾客可能停⽌使⽤公司的产品/业务,以及识别哪些顾客的流失会带来最⼤损失。流失分析的结果⽤于为可能要流失的顾客准备新的优惠。
17、顾客细分&画像(Customer Segmentation & Profiling)
根据现有的顾客数据,将特征、⾏为相似的顾客归类分组。描述和⽐较各组。
18、顾客的⽣命周期价值 (Lifetime Value, LTV)
顾客在他/她的⼀⽣中为⼀个公司产⽣的预期折算利润。
19、购物篮分析(Market Basket Analysis)
识别在交易中经常同时出现的商品组合或服务组合,例如经常被⼀起购买的产品。此类分析的结果被⽤于推荐附加商品,为陈列商品的决策提供依据等。
20、实时决策(Real Time Decisioning, RTD)
帮助企业做出实时(近乎⽆延迟)的最优销售/营销决策。⽐如,实时决策系统(打分系统)可以通过多种商业规则或模型,在顾客与公司互动的瞬间,对顾客进⾏评分和排名。
21、留存/顾客留存(Retention / Customer Retention)
指建⽴后能够长期维持的客户关系的百分⽐。
22、社交⽹络分析(Social Network Analysis, SNA)
描绘并测量⼈与⼈、组与组、机构与机构、电脑与电脑、URL与URL、以及其他种类相连的信息/知识实体之间的关系与流动。这些⼈或组是⽹络中的节点,⽽它们之间的连线表⽰关系或流动。SNA为分析⼈际关系提供了⼀种⽅法,既是数学的⼜是视觉的。
23、⽣存分析(Survival Analysis)
估测⼀名顾客继续使⽤某业务的时间,或在后续时段流失的可能性。此类信息能让企业判断所要预测时段的顾客留存,并引⼊合适的忠诚度政策。
⼆、统计学名词解释
1、绝对数和相对数
绝对数:是反应客观现象总体在⼀定时间、⼀定地点下的总规模、总⽔平的综合性指标,也是数据分析中常⽤的指标。⽐如年GDP,总⼈⼝等等。
相对数:是指两个有联系的指标计算⽽得出的数值,它是反应客观现象之间的数量联系紧密程度的综合指标。相对数⼀般以倍数、百分数等表⽰。相对数的计算公式:
相对数=⽐较值(⽐数)/基础值(基数)
2、百分⽐和百分点
百分⽐:是相对数中的⼀种,他表⽰⼀个数是另⼀个数的百分之⼏,也成为百分率或百分数。百分⽐的分母是100,也就是⽤1%作为度量单位,因此便于⽐较。
百分点:是指不同时期以百分数的形式表⽰的相对指标的变动幅度,1%等于1个百分点。
3、频数和频率
频数:⼀个数据在整体中出现的次数。
频率:某⼀事件发⽣的次数与总的事件数之⽐。频率通常⽤⽐例或百分数表⽰。
4、⽐例与⽐率
⽐例:是指在总体中各数据占总体的⽐重,通常反映总体的构成和⽐例,即部分与整体之间的关系。
⽐率:是样本(或总体)中各不同类别数据之间的⽐值,由于⽐率不是部分与整体之间的对⽐关系,因⽽⽐值可能⼤于1。
5、倍数和番数
倍数:⽤⼀个数据除以另⼀个数据获得,倍数⼀般⽤来表⽰上升、增长幅度,⼀般不表⽰减少幅度。
番数:指原来数量的2的n次⽅。
6、同⽐和环⽐
同⽐:指的是与历史同时期的数据相⽐较⽽获得的⽐值,反应事物发展的相对性。
环⽐:指与上⼀个统计时期的值进⾏对⽐获得的值,主要反映事物的逐期发展的情况。
7、变量
变量来源于数学,是计算机语⾔中能储存计算结果或能表⽰值抽象概念。变量可以通过变量名访问。
8、连续变量
在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。在⼀定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作⽆限分割,即可取⽆限个数值。如:年龄、体重等变量。
9、离散变量
离散变量的各变量值之间都是以整数断开的,如⼈数、⼯⼚数、机器台数等,都只能按整数计算。离散变量的数值只能⽤计数的⽅法取得。
10、定性变量
⼜名分类变量:观测的个体只能归属于⼏种互不相容类别中的⼀种时,⼀般是⽤⾮数字来表达其类别,这样的观测数据称为定性变量。可以理解成可以分类别的变量,如学历、性别、婚否等。
怎么做数据分析