![巴拉巴西网络科学](https://wfqqreader-1252317822.image.myqcloud.com/cover/719/28252719/b_28252719.jpg)
1.3 度、平均度和度分布
度是节点的一个关键属性,表示该节点和其他节点之间的链接个数。在手机通话网络中,度表示一个人通过手机联系过的人数;在引文网络中,度表示一篇论文获得的引用数。
度
我们使用ki表示网络中第i个节点的度。例如,对于图1-2所示的无向网络,我们有k1=2,k2=3,k3=2,k4=1。在无向网络中,总链接数L可以使用节点度之和来表示:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P74_206171.jpg?sign=1738891101-MCtVt6z1YyxmLxnL9ITLzfxYP8UJ8MGF-0-9ac64e7f8dab65eba6f2411cb2161927)
在计算节点度之和时,每个链接被计算了两次,因此公式1.1中有一个系数1/2。例如,在图1-2中,连接节点2和节点4的链接,在计算节点2的度时被计算了一次,在计算节点4的度时又被计算了一次。
平均度
平均度是网络的一个重要属性(边栏1.2)。在无向网络中,平均度被定义为:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P74_206172.jpg?sign=1738891101-zGL0Ghl2WAtcBWtYJbzReD5SapnyPgZQ-0-d597e3049511c5380e8cc338b15ef93a)
边栏1.2
统计知识简要回顾
对于N个样本x1,…,xN,4个重要的统计量:
均值:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P74_206174.jpg?sign=1738891101-7sbekHd43aVdKhPyMF1bCyZQ1hwnrDPk-0-852d67b7118aaf8f4114cd108d65a7c9)
n阶矩:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P74_206175.jpg?sign=1738891101-gzwEmuM4Uh24jOa2iQs9IPqal2vt5WsH-0-5d0fbc437879d6cf0e9dc8426c1f1b88)
标准差:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P74_206176.jpg?sign=1738891101-fhYE8Mo7Mw5Mdb9PHRRC29I7XBTsNSar-0-30c26506bad2b0d4f84fee0aeab800b6)
样本分布:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P74_206177.jpg?sign=1738891101-v4tCpODRuqhFlWV2hOWcPCedmDqQhp8p-0-12634b88924362299cb98a435c2ae60b)
这里px满足归一化约束
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P74_206178.jpg?sign=1738891101-4S9XPCt0SevPGfZ6Fn3vQ4GFfWPaX3pR-0-8eccec042ca8bc6c7a167d72a95b1246)
有向网络中,需要区分入度和出度。入度表示指向节点i的链接个数,而出度
表示节点i指向其他节点的链接个数。从而,节点i的度为:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P75_206185.jpg?sign=1738891101-odipCH8WqwYUFe1rxMjDMbrAh1HwnlyL-0-6f92e11b3bef726d07dafb4f036c63bc)
例如,在万维网中,网页的出度kout表示该网页指向的网页数目,其入度kin表示指向它的网页数目。有向网络中的总链接数为:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P75_206186.jpg?sign=1738891101-owT6xos6xyuO7ButY8dDWGJ7IajZgj8u-0-4eee30a3a3a853a4c73b10110c92e088)
这里不像公式1.1那样有一个系数1/2:公式1.4的两个求和项将出度和入度分开进行计算。有向网络的平均度为:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P75_206187.jpg?sign=1738891101-OZPfZLOV0Tx85QSfrQ1MU07TurbXKiIP-0-7b9c6a80f72ece29ab5e994fbfc0ecce)
度分布
度分布pk表示“网络中随机选出的一个节点其度为k”的概率。由于pk是一个概率,则其必须满足归一化约束,即:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P75_206188.jpg?sign=1738891101-hcjZC2gikz9ljoVv60BrYEED8lhZnGYa-0-f224fcaa2fe5701bd99f3d639f5dfded)
对于有N个节点的网络而言,其度分布可以表示成归一化的直方图(图1-3):
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P75_206189.jpg?sign=1738891101-UOKAEuRIGEQ5iPqYcNxIBQYgr7tN8GqD-0-4fac6d5cd25ccb9658e27c38ecf88302)
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P76_3117.jpg?sign=1738891101-e9JvRgAUBeSnfbJulkNHC5qvi8fjyj6O-0-a9567ef0307a78ba5718c6ecb698478a)
图1-3 度分布
网络的度分布可以由公式1.7计算得到。
(a)该网络大小为N=4,其度分布如图b所示。
(b)4个节点中有一个度为1的节点(k1=1),因此p1=1/4;有两个度为2的节点(k3=k4=2),因此p2=1/2;有一个度为3的节点(k2=3),因此p3=1/4。没有度大于3的节点,因此,对于任意k>3,我们有pk=0。
(c)对于一维格子网络而言,所有节点的度都是2。
(d)图c所示网络的度分布是克罗内克(Kronecker)的德尔塔函数,即pk=δ(k-2)。
这里的Nk是指度为k的节点个数。因此,度为k的节点个数可以根据度分布计算出来,即Nk=Npk。
度分布被认为在网络科学中发挥了核心作用,特别是在无标度网络被发现之后[8]。其中一个原因是,大多数网络性质可以通过度分布计算得到。例如,网络平均度可以写成:
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P76_206194.jpg?sign=1738891101-qtWImc6ZTPjon6TJMPkFp2iZJFbHPiT6-0-9d06184c5905edea942a5304ff47d470)
另一个原因是,度分布的具体函数形式决定着很多网络现象,例如网络健壮性和病毒传播。接下来,让我们看一看真实网络中有着怎样的度分布(图1-4)。
![](https://epubservercos.yuewen.com/9E455E/16154823505021006/epubprivate/OEBPS/Images/Figure-P77_4729.jpg?sign=1738891101-eW96mv7ymexZtG0RNMthVlc3Y6NCD19W-0-ca87255a66553c89bbf3c88b639c55aa)
图1-4 一个真实网络的度分布
真实网络中,节点的度差异很大。
(a)酵母的蛋白质相互作用网络(表1-1)。每个节点对应一个酵母蛋白质,链接表示实验发现的蛋白质间的相互作用。注意,底部所示的几个蛋白质有自环,它们的度为2。
(b)图a所示的蛋白质相互作用网络的度分布。节点的度分布在0(对应孤立节点)和92(对应度最大的那个节点,此类节点通常被称为枢纽节点)之间。度不同的节点,其个数也差异很大:度为1的节点有几乎一半(p1=0.48),而只有一个节点的度为92(p92=1/N=0.0005)。
(c)度分布通常画在双对数坐标下。当然,除了采用双对数坐标之外,也可以直接绘制lnpk关于lnk的函数。采用双对数坐标的好处会在第3章进行讨论。