社交⽹络分析中重要指标说明
在图分析过程中有⼀部分指标在解读图的过程中是⼗分重要的,正确理解这些概念,对图分析和理解⽹络具有很重要的意义。
学术上⾯对图中常⽤指标的解释如下:
度中⼼性(Degree Centrality)
是在⽹络分析中刻画节点中⼼性(Centrality)的最直接度量指标。⼀个节点的节点度越⼤就意味着这个节点的度中⼼性越⾼,该节点在⽹络中就越重要。
接近中⼼性(Closeness Centrality)
反映在⽹络中某⼀节点与其他节点之间的接近程度。将⼀个节点到所有其他节点的最短路径距离的累加起来的倒数表⽰接近性中⼼性。即对于⼀个节点,它距离其他节点越近,那么它的接近性中⼼性越⼤。
胆固醇高十大饮食禁忌 降低胆固醇中介中⼼性/中间中⼼性(Between Centrality)
制作甜甜圈以经过某个节点的最短路径数⽬来刻画节点重要性的指标。
一路向西 王李丹妮特征向量中⼼性(Eigenvector Centrality)
董洁的个人资料⼀个节点的重要性既取决于其邻居节点的数量(即该节点的度),也取决于其邻居节点的重要性。
曝陈乔恩片酬太贵度中⼼性(degree)
设想⼀下,你在上有个账号,那么是不是意味着好友数量越多,那么你的社交圈⼦越⼴?(假设都是真实好友,不考虑微商神马的奇葩情况)⽐如我有20个好友,那么意味着20个结点与我相连。如果你有50个好友,那么意味着你的点度中⼼度⽐我⾼,社交圈⼦⽐我⼴。这个就是点度中⼼性的概念。 当然,刚才这个情况是⽆向图的情形,如果是有向图,需要考虑的出度和⼊度的问题。 在刚才的基础上拓展⼀下,假如我们要⽐较你在微博和上的点度中⼼度,刚才的⽅法是否适⽤?如果说使⽤与微博的⼈数差不多,那么的确可以。但是如果说⽤户数量不⼀样呢?那么我们需要考虑到去规模化的问题,这就是标准化的点度中⼼性的理念。
接近中⼼性(closeness)
对于了解图论的朋友⽽⾔,最短路这个概念⼀定不陌⽣。我们设想⼀个实际⽣活中的场景,⽐如你要建⼀个⼤型的娱乐商场,你可能会希望周围的顾客到达这个商场的距离都可以尽可能地短。这个就涉及到接近中⼼性的概念,接近中⼼性的值为路径长度的倒数。 接近中⼼性需要考量每个结点到其它结种丹妮图片
点的最短路的平均长度。也就是说,对于⼀个结点⽽⾔,它距离其它结点越近,那么它的中⼼度越⾼。⼀般来说,那种需要让尽可能多的⼈使⽤的设施,它的接近中⼼度⼀般是⽐较⾼的。
中介中⼼性(betweenness)
这个度量很有意思。这个有点像是我们⾝边那种社交达⼈,我们认识的不少朋友可能都是通过他/她认识的,这个⼈起到了中介的作⽤。 中介中⼼性指的是⼀个结点担任其它两个结点之间最短路的桥梁的次数。⼀个结点充当“中介”的次数越⾼,它的中介中⼼度就越⼤。如果要考虑标准化的问题,可以⽤⼀个结点承担最短路桥梁的次数除以所有的路径数量。