数据挖掘:计算边的中介中⼼值edge_betweennessvalue
⽂章⽬录
前⾔
中介中⼼性(betweenness centrality)
这个度量很有意思。这个有点像是我们⾝边那种社交达⼈,我们认识的不少朋友可能都是通过他/她认识的,这个⼈起到了中介的作⽤。
中介中⼼性指的是⼀个结点担任其它两个结点之间最短路的桥梁的次数。⼀个结点充当“中介”的次数越⾼,它的中介中⼼度就越⼤。如果要考虑标准化的问题,可以⽤⼀个结点承担最短路桥梁的次数除以所有的路径数量。
中介中⼼性/中间中⼼性(Between Centrality) 。以经过某个节点的最短路径数⽬来刻画节点重要性的指标。
提⽰:⽹上关于节点的中介中间值计算案例很多,但是⼏乎没有关于边的。
⼀、题⽬
吴虹飞事件
话不多说,直接上题
计算各边的中介中⼼值?
⼆、步骤
吴妍书绯闻1,计算任意两节点之间的所有最短路径。
孙红雷前女友
2022年夏至2,若该路径经过所求的边,则该边的中介中间值+1.
3,若两点之间的最短路径有多条,按⽐例累加中介中间值。
如图所⽰:
任意两点的组合共⽤21种;
温州大学是几本
根据题中的图,出21种组合的最短路径;
若求边AD的中介中间值,则看看这21种最短路径中有多少是包含AB的,见上图有5种,所以,边AB的中介中间值为5.结果
扩展
边的中介中间值是⽤来计算GN算法的,简单介绍如下:上古四大魔兽
Girvan-Newman algorithm
直观来看,在社内部节点之间相互连接的边密度较⼤,因此,通过边来识别社是⼀种较为直观的社发现算法。Girvan-Newman算法即在该启⽰下发展⽽⾔,如果去除社之间连接的边,留下的就是社。对于社⽽⾔,较先去除的边,中⼼性较低,⽽中介中⼼性则较⼤。因此,逐步去除中介中⼼性最⼤的边,直⾄结束。
Girvan-Newman算法的详细步骤:
(1)计算⽹络中所有边的中介中⼼性;
(2)去除中介中⼼性最⾼的边;
(3)重新计算去除边后的⽹络中所有边的中介中⼼性;
(4)跳⾄步骤2,重新计算,直⾄⽹络中没有边存在。