I.1 曲折之路
如今,每年有十余个学术会议、研讨会和讲习班在关注网络,有百余本书及多本重点期刊专注于网络领域,大部分大学开设了网络科学课程,有三个大洲的大学设置了网络科学博士学位,科研资助机构也在网络领域投入了数亿美元的经费。看到这些,人们不禁会想,这个仅出现十余年的领域真可谓一帆风顺。不过,受此种效应的影响,我们可能会忽略一个最耐人寻味的问题:网络领域是如何成长得这么快的?
我把这一章视为我的科学发现旅程,原因其实很简单:我并没有打算对上述问题提供一个无偏见的回答,而是希望从一个参与者的角度去回忆网络科学的兴起。我恰好是最了解这个参与者的人,因为“他”就是我。我想回忆的并不是什么胜利大游行,相反,我经历的是一场曲折坎坷的旅行,一场充满挫折、矛盾和冲突的旅行。这一章也不是什么全貌图,而是主要关注我在穿越网络科学的“森林”时,反复碰到的那些令人难以忘记的“树”。需要提醒大家的是,科学发现绝不像教科书中描述的那样直观和自然,而是像接下来几页里你将看到的那样充满曲折。
我的首篇关于网络的论文(1994年)
我对网络的着迷始于1994年,即我在IBM传奇之地——沃森研究中心做短期博士后的那几个月。考虑到假期即将来临——假期期间不能留在IBM,我决定利用这段时间更多地去了解我的雇主(当时,IBM几乎就是计算机的代名词)。于是我去了沃森图书馆,寻找关于计算机科学的入门书籍。
怀着对计算机领域科学问题的好奇心,我从沃森图书馆借阅了一本书。这本书涵盖了很多内容,包括算法、布尔逻辑(Boolean Logic)和NP-完全性(NP-completeness)。我对书中讲述最小生成树问题的一章特别感兴趣。我发现,书中介绍的克鲁斯卡尔(Kruskal)算法很好地对应了统计物理学领域的著名模型——侵入渗流。于是,在圣诞节过去的两个月后,也就是1995年2月24日,我的第一篇关于网络的论文在《物理评论快报》(Physical Review Letters)上发表了[1]。该论文阐述了物理学和计算机科学领域中这两个广泛研究的网络问题之间的等价性(图I-1)。在如此有影响力的物理期刊上发表一篇单作者论文对于我的学术生涯来说无疑是重要的,不过这一举措的真正影响远不止于此:这篇论文打开了我对网络科学研究的热情之门,奠定了我随后数十年对网络热爱的基础。
图I-1 1994—1995:我在网络领域的首次尝试
我在1994年的寒假构思出了第一篇关于网络的论文,将计算机科学领域著名的最小生成树问题和统计物理学领域广泛研究的侵入渗流关联在一起。这标志着我对网络科学长期追求的开始。
失败1:第二篇论文(1995年)
学得越多,我越觉得自己对真实网络知之甚少。居住在纽约市的我,想象着曼哈顿地下铺设的数百万条电线、电话线和光缆线到底有多么复杂。图论告诉我们,这些网络中的节点是随机连接的,然而我并不这么认为。我坚信,一定有某些组织原则在支配着我们日常生活中使用的网络。寻找这些组织原则恰好是统计物理学家的拿手好戏,毕竟他们经训练而成的思维方式就游弋在有序和随机的边界。
随后的几个月里,我阅读了贝拉·波罗巴斯(Béla Bollobás)关于图论的优秀著作[2],这使我接触到了保罗·埃尔德什(Paul Erdös)和阿尔弗雷德·雷尼(Alfréd Rényi)在图论方面的经典工作[3]。与此同时,斯图尔特·考夫曼(Stuart Kaufmann)富有远见的作品使我意识到网络对于生物领域的重要性[4]。在这些书籍中,两种截然不同的视角碰撞在了一起:一边是由定理驱动的枯燥的数学世界,一边是考夫曼那种不受数学羁绊的肆意想象(图I-2)。
图I-2 1995:有序,还是随机?
这三本书中的两本启发我开启了网络科学之旅。我现在想不起来第一本书的标题或副标题了,这本我在1994年从IBM沃森研究中心图书馆借阅的书好像是叫“计算机科学的50个问题”。
在博士后岗位上工作了8个月后,我接受了美国圣母大学(University of Notre Dame)提供的教职,这使我在IBM余下的4个月内可以专注地完成我的第二篇关于网络的论文。这篇题为《随机网络动力学:连通性和一阶相变》[5]的论文,是我探究网络拓扑结构的首次尝试。该论文将波罗巴斯的世界和考夫曼的世界结合在一起,探索了网络结构的改变会如何影响布尔系统的演变(图I-3)。论文背后的观察非常简单:改变随机网络的平均度,布尔系统将经历一次相变。因此,如果不能完全理解网络的结构,你就无法解释布尔系统的行为。
图I-3 1995—1997:一直没有发表的网络论文
这是我在网络科学领域的第二次尝试,也是我探究网络拓扑作用的首篇论文。在被4个期刊拒稿后,这篇论文于1995年11月出现在Arxiv的在线服务器上。我最终放弃了将其发表在期刊上的想法。
这篇论文受到了很多想法的启发,这些想法源于蜂窝网、互联网和万维网。然而,我过去发表论文的物理期刊几乎不涉及此类研究。因此,我努力尝试,去寻找上述发现在我所在领域中的应用。最终,我决定把我的发现应用于神经网络——物理学家经常研究的一个主题。在我看来,关注神经网络的物理学家应该会认可网络的重要性。然而,我错了。这次决定标志着随后4年间我的网络科学之旅中一系列失败的开始。
1995年11月10日,我将完成的论文投稿到《科学》杂志,之后便回到波士顿参加美国材料研究学会的年度会议。在那里,我碰到了《自然》杂志的编辑菲利普·鲍尔(Philipp Ball),他对交叉学科很感兴趣。我有幸向他介绍了那时令我非常着迷的新研究对象——网络。于是,当我的论文在几周后被《科学》杂志拒稿时,我将它发给了菲利普,希望《自然》杂志会对它感兴趣。的确如此,论文被送审了。
不过,论文的评审人对网络并不那么着迷。其中一位评审人在他的评审意见中坦率地写道:
1.论文的研究动机不清晰;
2.技术上很受限;
3.关于演化和互联网的推测不切实际。
当然,这位评审人是正确的:论文中没有解释为什么我们需要关注网络。答案都在我脑子里,但由于我博士毕业不过一年,仅仅靠4年前读博士时才开始学习的英语,实在是难以把脑中的想法通过文字变成故事。
我很失望,并于1996年4月25日将该论文再次投稿到《物理评论快报》——结果并没有好多少,论文经过漫长的评审过程之后再次被拒收。1997年11月21日,在首次投稿两年后,我又把该论文投稿到《欧洲物理快报》(Europhysics Letters)。那时候,我的网络科学之旅的第二个重大失败已经开始了。
失败2:绘制万维网地图
当我为第二篇论文的发表而付出艰苦努力时,我开始感觉到,要想继续前进,就需要放弃我一直使用的图论,而应该做物理学家擅长的事情:从真实世界中寻找灵感。也就是说,我需要地图——确切地说是真实网络的地图。
在蒂姆·伯纳斯-李(Tim Berners-Lee)开放万维网5年后,也就是谷歌创立的两年前,那时的万维网还处于成长期。许多在实验室中开发出来的搜索引擎,譬如JumpStation、RBSE Spider或Webcrawler,开始尝试绘制万维网链接结构的地图。1996年2月,我向一些运行此类网络爬虫工具的研究人员发送了邮件(图I-4),希望他们能够提供部分数据——当然,最好是有完整的地图,哪怕没有这样的地图,能够知道每个节点拥有多少个链接也足够了。“我希望使用这些数据绘制一个直方图。”我写道。我希望得到这个在三年之后被我们称为“万维网的度分布”的直方图。
图I-4 1996:寻求数据
这是我寻求数据时发出的一封邮件。邮件发给了一些在20世纪90年代搭建网络爬虫的计算机科学家,我希望他们能够共享一些关于万维网拓扑的数据。回过头来看,这并不是一封非常有说服力的邮件,没有人回复也就不足为奇了。我不得不再等两年,直到郑浩雄(Hawoong Jeong)加入我的实验室并搭建了我们自己的网络爬虫。这个网络爬虫收集到的数据让我们发现了无标度网络。如果能够像我希望的那样,在1996年就得到这些数据,我们可能会提前三年发现无标度网络。
没有人说“不”。实际上,没有人顾得上答复我。就在等待回复的时候,我的第二篇论文遭遇了最后一击——它被《欧洲物理快报》拒稿了。
到那时为止,我的网络之旅可谓非常让人失望。我的第二篇关于网络的论文向4个期刊投稿,经过了三轮评审。没有人说它是错误的,评审人的意见很简单:谁关心网络呢?那时候,我打算获取真实数据的“B计划”也进入了死胡同。我感到失望,同时也承受着发表论文和申请经费的压力,于是,我逐渐开始从网络转向相对稳妥些的量子点方面的研究。
我真的是别无选择。成为助理教授两年后,我的首项经费资助才姗姗来迟,要成为终身教授更是前景渺茫。虽然我是那么相信网络,过去三年里拿得出手的也只有一篇论文和一系列的失败罢了。不过,转向更传统的研究课题让我得到了回报:到1997年年底,我得到了两项经费资助,这使我可以雇用几个学生和一个博士后了。
复兴(1998年)
1997年,我居住在芝加哥,每隔一天去一趟圣母大学。为了打发无聊的两个小时车程,我开始听一些书的磁带。有一天,我在图书馆看到一本童年时读过的书——艾萨克·阿西莫夫的《基地》(图I-5)。浏览这本书时,我被哈里·谢顿(Harry Seldon)能够预测数百年后人类命运的能力深深吸引了。
图I-5 1997:复兴
阿西莫夫的科幻小说《基地》三部曲促使我重返网络科学领域。
《基地》是一本极好的科幻小说:非常有趣,描述的未来遥不可及,但从某种抽象角度来看又是合理的。
连接圣母大学和芝加哥市的90号公路两侧是大片的玉米地,这使我能够打开思绪,思考很多荒诞的问题:怎样才能把阿西莫夫的科幻世界变成现实?是否可以设计出一些方程,从而对社会这样复杂的系统进行预测呢?为了达到这个目标,我能做些什么?在我关于量子点的研究进行得有声有色时,阿西莫夫把我的思考拉回到那些让我经历了很多挫折却从未失去兴趣的事物上——网络和复杂系统。
1998年年初,我打算再试一次。我规划了一个与网络相关的新研究项目,于3月在圣母大学最好的餐厅邀请了我的学生雷卡·阿尔伯特(Réka Albert)共进午餐。雷卡那时攻读硕士学位刚满一年半,但成绩斐然。她关于颗粒介质的论文刚刚成了《自然》杂志的封面文章,而她正在进行的研究项目的初步结果看上去也非常好。因此,我邀请她共进午餐的目的看起来很不现实:我希望说服雷卡放弃她几乎就要成功的研究,我想让她和我一起研究网络。
当我让我最好的学生加入这场网络之旅时,我没有什么鼓励的话可以对她讲。我不得不告诉她,我关于网络的第二篇论文被4个期刊拒稿,可能永远都无法发表。网络这个研究题目在当时没有学术群体,没有专业期刊,也没有资助。我必须坦诚地对她说,似乎并没有人关心这个研究题目。因此,从事网络研究有很大的风险,可能会让她之前的成功之路戛然而止。
然而,我同时也告诉雷卡,成功必须经历风险。而且在我看来,网络值得赌一次。
午餐后,我把一个密密麻麻写满字的文档交给了雷卡,上面写的是我对网络科学的构思。我设想,大概需要6个月时间量化网络拓扑,接下来还需要6个月去理解网络拓扑对网络动力学的影响。然后,我们便可以转向真实的问题,探索网络拓扑和网络动力学的共同演化。
当然,我心里完全没谱:我无法预见拓扑所能提供的重要意义。不过,那不是当时的重点,重要的是她平静而优雅的回应——雷卡同意了,她加入了我前途未卜的网络之旅。
失败3:小世界(1998年)
1999年之前,那些研究网络的科学家几乎毫无交集,时至今日我仍然百思不得其解。一部分原因是,当时存在着一个小而活跃的社会网络学术群体,该群体的形成可以追溯到20世纪40年代。实际上,我们今天关于小世界问题所知道的很多东西来自1960年左右的一篇鲜为人知的论文,该论文的作者是社会学家伊锡尔·德索拉·普尔(Ithiel de Sola Pool)和数学家曼弗雷德·科亨(Manfred Kochen)。虽然这篇论文在1978年之前一直没有发表[6],它的预印版却在社会网络学术群体中流传甚广,并且启发了斯坦利·米尔格拉姆(Stanley Milgram)在1967年完成小世界实验[7]。而米尔格拉姆的工作在1/4个世纪后又启发了剧作家约翰·格尔(John Guare)创造出“六度分隔”这个概念。
普尔和科亨所采用的模型,与同一时期的图论学家埃尔德什和雷尼提出的模型一样。但是,在社会学的论文中,没有任何证据表明社会学家知道当时出现的关于随机图的大量数学文献。另外,埃尔德什和雷尼的开创性工作虽然启发了很多随机图方面的工作,但是图论领域没有人知道社会网络学术群体的存在,他们关于小世界的研究成果也没被引用过。
这两个学科之间的界限集中体现在两个学术群体所关注的问题不同:图论学家关心的是相变、子图和巨连通分支,而令社会学家着迷的则是小世界、弱链接和社区。对社会学家而言,拥有一百个节点的网络便难以理解了,而令数学家兴奋的是节点数趋于无穷大时的极限情况。
1998年,当邓肯·瓦茨(Duncan Watts)和史蒂夫·斯托加茨(Steven Strogatz)关于小世界网络的论文[8]在《自然》杂志上发表时,我首先想到的就是我第二篇关于网络的论文在该杂志上发表失败的尝试。在阅读他们这篇论文时,我发现自己那篇论文失败的原因显而易见,让人恼火:我犯了一个“取景错误”。两篇论文都采用了随机网络范式。但是,我问的问题是物理学家感兴趣的,而论文定位的对象却是神经科学家。相反,瓦茨和斯托加茨问的问题根源于社会学,六度分隔为他们的稿件做了很好的叙述铺垫。
同时,小世界模型对于我和雷卡那时正在研究的问题而言似乎是一个终结。作为物理学家,我们关注的是不能由随机性产生的模式。因此,我们当时正在寻找真实网络中存在而那些固态物理学广泛研究的规则网络和埃尔德什与雷尼的纯随机网络不能刻画的现象。瓦茨-斯托加茨模型介于规则网络和随机网络之间,而规则网络和随机网络正是我们试图规避的两个极端。因此,我们把他们这篇论文放在一边,将其视为行进道路上的干扰。仅仅几个月后,当我们意识到小世界可以为我们的网络之旅提供一些意想不到的帮助时,我再次拿出了这篇论文。
绘制网络地图(1998年)
1998年,当郑浩雄以博士后身份加入我的研究组时,雷卡和我已深深沉浸在网络研究中。毕业于韩国著名大学——首尔大学的郑浩雄有着丰富的计算机方面的知识。1998年秋天的一个晚上,我来到他的办公室,与他讨论他在量子点方面的研究进展——那时候他的主要研究项目是量子点。我们不经意间谈到了网络,这促使我向他讲述了我获取万维网真实拓扑数据时的失败经历。我问他是否知道如何搭建一个网络爬虫——网页采集器的通俗说法。郑浩雄说他之前没有做过,但愿意试一下。就这样,几周后,郑浩雄的网络爬虫就开始忙着爬进万维网了。我那曾经失败的探索万维网结构的“B计划”复兴了。
我们决定使用郑浩雄收集到的数据来延续我在1996年搁置的研究(图I-4),测量万维网的度分布。我们被一个简单的问题驱动:万维网到达它的逾渗阈值了吗?埃尔德什和雷尼预言,当网络的链接密度小于某个临界值时,网络会破碎成很多个彼此不连通的团。而一旦链接密度达到临界阈值,网络中会涌现出一个巨连通分支,该连通分支大到几乎可以将其视为整个网络。
万维网还能被分裂成许多彼此不连通的部分吗?还是像当时人们所认为的那样已经连成一个大网络了?无论答案是什么,这个问题都非常有趣。为了回答这个问题,我们需要知道万维网的度分布。现在,郑浩雄的网络爬虫可以帮助我们做到这一点。当从郑浩雄收集的数据中绘制出万维网的度分布时,我们着实吃了一惊:我们没有看到随机网络理论所预言的泊松分布,出现在眼前的是一个幂律分布。
郑浩雄的数据展示出的结果和我在过去4年的网络之旅中学到的一切大相径庭。在有关网络的各类文献中,幂律度分布并没有被提及过。实际上,在那个时候,几乎没有人注意到幂律度分布:关于随机图和社会网络的文献都想当然地认为度分布是泊松分布。我们观测到的幂律分布预测,万维网中存在枢纽节点——枢纽节点是拥有大量链接的节点,它们在随机图中几乎不可能出现。当时已有的模型都无法解释枢纽节点的出现。
1999年3月30日是我的32岁生日,那天,我给郑浩雄发了一封邮件,告诉他我要开始撰写我的第三篇网络论文。一个很容易想到的写法是专注于真实发现,这很简单:万维网代表着一种新型的网络,一种之前人们尚未认识到的组织形式。不过,我隐隐感觉到,这样写会是一个错误。那时候,我已经开始认为,我的第二篇网络论文的失败与科学没有多少关系,而是因为前面提到的“取景错误”。如果专注于本质,观测的科学价值就显得过于枯燥,不可能会引起《自然》杂志编辑们的兴趣。于是,我决定尝试特洛伊木马的方式:把这个发现藏在六度分隔的后面。我们给这篇论文起名为“万维网的直径”,声称万维网中的六度分隔实际上是“十九度分隔”(图I-6),然后就把论文寄给了《自然》杂志[9]。
图I-6 1999:“十九度分隔”团队
照片来自2000年的《商业2.0》杂志。照片上的人是雷卡·阿尔伯特、郑浩雄和我,照片是在我们关于万维网拓扑的论文发表不久后拍摄的。
发现(1999年)
论文提交后不久,我赴西班牙和葡萄牙进行了为期两周的长途旅行,旅行的最后一站是一个在波尔图大学召开的研讨会。驾车穿越伊比利亚半岛时,我的脑海里一直萦绕着这样的问题:为什么会有枢纽节点呢?为什么是幂律分布呢?
为了弄清楚是什么使万维网如此特别,我们需要了解更多的网络。因此,在飞往欧洲之前,我开始尝试寻找更多的网络地图。第一幅网络地图来自杰伊·布罗克曼(Jay Brockman)。布罗克曼是圣母大学的一位计算机科学教授,他向我们提供了一个IBM生产的计算机芯片的布线图。邓肯·瓦茨给了我们一个电网的地图,布雷特·查登(Brett Tjaden)向我们分享了好莱坞演员数据库。我把这些都留给了雷卡,让她在我旅行这段时间内分析一下这些网络地图。
1999年6月14日,雷卡通过电子邮件向我汇报了她的分析结果,那时候我已经在波尔图了。在电子邮件的最后,她写下了这样一行文字:“我查看了这些网络的度分布,在几乎所有这些系统中,度分布的尾部都遵循着幂律分布。”
雷卡的这句话就像晴天霹雳一样。我再也不能专心地听报告了,脑海里开始不停地思考这个发现的内涵。差异很大的万维网和好莱坞演员网络,居然具有同样的幂律分布,我们之前在万维网上看到的幂律分布居然是普遍的。因此,幂律分布的出现一定是由于某个法则或机制在起作用。而且,既然幂律分布适用于演员网络、计算机芯片网络和万维网等不同类型的网络,关于它如何出现的解释一定是非常简单和基本的。
我需要一个安静的地方来仔细思考。于是,我离开研讨会,回到我在会议期间居住的神学院。
不过,我没有走太远。就在从波尔图大学步行到神学院的15分钟内,我找到了解释。我在房间内开始计算,试图将自己的想法变成数学语言。然后,我发送了一个传真给雷卡,让她做一些数值模拟,以验证我快速想到的这个结论(图I-7)。
图I-7 “无标度”传真
这是我于1999年6月14日从葡萄牙波尔图发给雷卡·阿尔伯特的传真。这条匈牙利语和英语混杂的传真描述了如今被称为“巴拉巴西-阿尔伯特模型”的算法。该模型解释了无标度网络形成的原因,并勾勒出了计算度指数的连续介质理论(第4章)。
几个小时后,她的回复通过电子邮件发过来了。令我感到吃惊的是,我的结论居然可行。一个非常简单的模型,只含有两个要素——生长和偏好连接,却很好地解释了我们在万维网和好莱坞演员网络中观测到的幂律分布。
匆忙(1999年)
从葡萄牙回去后,我只能在圣母大学停留7天,然后就要去罗马尼亚的特兰西瓦尼亚(Transylvania)开始为期一个月的假期。然而,我不愿意等到一个月后再将这个发现公开。这就意味着,在葡萄牙的剩余2天加上回美国后的7天里,我就得把论文写好。
我想立刻就开始。不过,我女朋友提醒我,我答应过她在旅行的最后2天不工作的。我们原计划要去里斯本度假。于是,我只好先陪她一起在里斯本游玩,把论文写作计划推迟到从里斯本飞往纽约的8小时的航班上。不过,旅途中,我根本无法将网络从脑海中抹去:当我在圣克鲁斯(Santa Cruz)的狭窄街道上漫步时,论文的雏形逐渐形成了。
飞机一起飞,我就急匆匆地拿出电脑开始打字。在我刚刚写完论文引言部分的时候,正在把一杯可乐递给我身边乘客的空姐一不小心把可乐全洒在了我的键盘上。她不仅毁掉了我那台崭新的笔记本电脑,还打碎了我计划在飞机上完成论文初稿的梦想。
我不能就此放弃。最终,我在那个懊悔不已的空姐向我提供的便笺本上完成了论文初稿。一周后,论文投稿到了《科学》杂志。
不过,我好像是患上了妄想症。那时候,我们有两篇论文在评审中。第一篇论文报告了我们在万维网中的发现,这篇论文正在《自然》杂志的评审过程中。第二篇是刚刚投稿到《科学》杂志那篇,论文指出无标度性质是普适的,并且提出了一种理论来解释无标度性质出现的原因。没错,《自然》和《科学》是最著名的两大学术期刊,但这两个期刊的拒稿率也很高,只有不到10%的投稿最终能够发表。这意味着我们的两篇论文都被拒收的概率超过了81%,而都被接收的概率还不到1%。
我曾经的那篇网络论文在我最终放弃之前,经历了长达两年的坎坷投稿历程。如果这两篇论文也遭遇了同样的命运该怎么办?如果其他人也同时做出了同样的发现该怎么办?我们发现的这个现象是如此明显、随处可见,有人独立发现它的可能性非常大。我需要一个备选方案。
物理学领域有一个惯例,一篇简短论文在《自然》、《科学》和《物理评论快报》上发表之后,通常紧接着会有一篇长论文发表,以介绍更多的细节。于是,在那7天里,雷卡、郑浩雄和我又写了一篇长论文。我打电话给Physica A期刊的主编吉恩·斯坦利(Gene Stanley),告诉他说,如果他能够快速给出决定,我就打算把自己最炙手可热的论文投稿到Physica A。我不知道他是否相信我所说的“炙手可热”。不过,他答应了会快速评审。
没过几天,我的妄想就被证明是有根据的。我刚刚到达我的家乡特兰西瓦尼亚,就收到了《科学》杂志的拒稿邮件。虽然有些失望,但我坚信这篇论文的结论是重要的。于是,我做了一件之前从没有做过的事:打电话给拒收我论文的编辑,做最后的努力,去尝试改变他的决定。
令我吃惊的是,我成功了,他将我的论文送审了。几个月后,1%的可能变成了现实:《自然》、《科学》和Physica A都接收了我的论文[9],[10],[11]。虽然出乎意料,但这是对我过去5年在网络科学领域经历的诸多挫折的最好回报。
180度转变(1999年)
四个学生和一个博士后——那时候我的研究组并不大。除了雷卡之外,其他人都在研究面和量子点。在那篇投稿到《科学》杂志的论文被接收几天后,我召开了一次研究组会议,并在会上做出了一个让研究组成员感到震惊的声明。我告诉他们,我打算退出材料科学的研究。原因很简单:我不想再分散时间和精力。在距离评终身教授还有三年的时候,我决定转变研究领域,从量子点转到网络。我让研究组的成员选择:要么和我一起开始新的旅程,要么离开。
两个学生离开了,其他人选择跟随我一起开启新的未知旅程。
失败4:经费(1999年)
如果我们进入的是一个已经建立起来的领域,并且做好了研究工作,那么获得科研经费只是时间问题。然而,进入一个还不存在的领域将使我们面临不可预知的困难。
好消息是,那时我刚刚获得美国国家科学基金(NSF)在量子点方面的经费支持。坏消息是,我对这个研究题目不再感兴趣。当然,我假装在从事量子点方面的研究,从而继续使用这项经费。不过,这样的做法让我感到内心不安。于是,我打电话给国家科学基金的管理部门,询问是否可以使用这项经费从事网络方面的研究。
答复是“不行”。要么做量子点方面的研究,要么把经费退还给国家科学基金。这是一个进退两难的境地:一方面,我有经费去从事我已经失去兴趣的增量式研究;另一方面,对于那个有可能会实现突破的研究,我却没有经费支持。
最终,我选择了梦想,把经费退了回去。这令我的研究组面临很大的压力:我们急需新的经费支持,但是还没有资助机构认可网络这样一个研究题目。后来,我注意到美国国防部高级研究计划局(Defense Advanced Research Projects Agency,简称DARPA)在征集“让未来的网络在受到攻击时仍然能够提供服务”的技术。
现在回过头看,这明显是为计算机网络设计方面的专家准备的——计算机网络设计是计算机科学的一个活跃分支。不过,我坚信,没有人能在缺少对网络拓扑及其固有脆弱性的初步理解的情况下构建出具有容错能力的网络。我们刚刚发现的网络无标度性质及随之而来的枢纽节点,对DARPA打算研制的技术一定具有重要意义。有我们在《自然》和《科学》杂志上刚刚发表的论文作为基础,我决定立刻开始撰写申请书。
不过,我们还需要一个确凿的证据,让DARPA的项目管理者相信网络拓扑对于网络健壮性的重要作用。因此,雷卡开始通过从无标度网络中随机删除节点来模拟互联网节点的随机失效。她对比了随机失效和网络攻击(删除枢纽节点)对网络连通性的影响。二者的差异非常大:无标度网络在随机失效面前表现得非常健壮,但在面临攻击时却异常脆弱。我们立刻把这一发现写进项目申请书,并且相信我们已经毫无疑问地证明了网络拓扑在网络容错能力方面的重要意义(图I-8)。
图I-8 1999:健壮性
这幅图来自我们于1999年11月1日提交的DARPA申请书,展示了网络拓扑对网络容忍错误和攻击能力的影响。这幅图的原始标题预见了我们一年后发表在《自然》杂志上的那篇关于容错的论文[12]:
“攻击和随机失效对电网的连通性的影响。我们构建了一个有40000个节点的电网,该网络中一个节点拥有k个链接的概率为P(k)~k-3。假定攻击一般而言针对系统中拥有链接数最多的节点。为了研究攻击带来的影响,我们从网络中删除链接数最多的M个节点。上面一条曲线展示了‘孤岛’数目关于M的函数。例如,删除链接数最多的10个节点,会导致整个网络碎裂成500个‘孤岛’——孤岛彼此之间无法通信。随机失效等概率地影响网络中的每个节点,由于大部分节点只拥有少数几个链接,失效很少会带来大的影响。实际上,随机删除M个节点只能让网络分成少数几个不连通的团,而网络的整体连通性基本不受影响。”
11月1日,项目申请书提交了。随后,我对雷卡和郑浩雄说,我们在申请书中提出的问题非常令人兴奋,不能等到DARPA的经费支持批复了再开始研究这个问题,必须立刻行动。于是,在对我们的发现进行扩充之后,我们将其投稿到《科学》杂志。又一次,论文没有送审就被拒收了。
我再次打电话给《科学》杂志的主编,得到的回应是,在他看来,这篇论文的结果与我们之前那篇论文相比没有重大进步。我目瞪口呆,却无法说服他,只好把论文改投到《自然》杂志。
几个月后,DARPA拒绝了我们的项目申请。但是,《自然》杂志接收了我们的论文,并作为封面论文发布(图I-9)[12]。
图I-9 2000:阿喀琉斯之踵
2000年7月27日那期《自然》杂志的封面。封面上重点介绍了我们关于复杂网络容忍攻击和错误能力方面的论文。这篇论文受到了我们那个(未获资助的)DARPA申请书中的想法启发[12]。
失败5:滑稽的错误
每当有重大科学发现出现时,总会有一些研究人员将保持宇宙平衡作为其人生使命,竭尽所能地将该科学发现从地球上抹掉。网络科学在展现出其革新力量之前,也必须经受命中注定的质疑。
“滑稽的错误”是加州理工学院控制论学家约翰·多伊尔(John Doyle)在其对网络科学十余年的质疑中经常使用的短语,他自称是网络方面的专家。小世界性质是让人惊奇的,它很容易被想到,而且已经有几十年的研究历史了。无标度性质却不同,因此招致了很多我们当时无法回答的质疑:如果这一性质是普适的,那么为什么十余年来一直没有人发现?生长和偏好连接是否只是无标度性质众多解释中的一个?自帕累托时代起,我们就已经知道了幂律,这次又有什么不同呢?贝拉·波罗巴斯则更直接,我们在布达城堡第一次见面时,他对我说,如果没有严格的数学证明,无标度性质可以说“根本不存在”。
这些质疑是有原因的:只有经历过数学训练的研究人员才能理解无标度的概念。由此导致的理解真空给误解和讹传提供了空间。约翰·多伊尔那个言过其实的说法正好填补了这个空间——每当有记者将这个问题抛给他时他总会这样说。
接下来,风向慢慢变了。何塞·门德斯(José Mendes)、谢尔盖·多罗戈夫茨夫(Sergey Dorogovtsev)和锡德·雷德纳(Sid Redner)使用速率方程方法从连续介质理论的角度为无标度网络提供了严格的数学基础[13],[14]。贝拉·波罗巴斯和他的一些合作者在一篇里程碑式的论文中为无标度性质提供了严格的证明[15]。什洛莫·哈夫林(Shlomo Havlin)和他的学生将网络健壮性和逾渗理论关联在了一起[16],而贝拉·波罗巴斯和奥利弗·赖尔登(Oliver Riordan)为之提供了严格的证明[17]。一系列随之而来的发现揭示了无标度性质如何深刻地改变了网络的行为,譬如罗穆阿尔多·帕斯托尔-萨托拉斯(Romualdo Pastor-Satorras)和亚历山德罗·维斯皮那尼(Alessandro Vespignani)关于无标度网络上不存在疾病传播临界值的经典发现[18]。学术界由此开始意识到度分布在网络研究中的核心地位。接下来我们将在本书中看到,几乎所有网络特性的解读都必须考虑度分布,包括六度分隔、网络健壮性和社区结构。关于网络的许多根本性问题的提出吸引了数以百计的研究人员从事网络研究,网络科学因此逐渐形成。
小结
如果愿意,你也可以将前面提到的这些事情看作一系列的成功:在接下来的十余年中,1999年《科学》杂志发表的那篇关于无标度网络的论文成了物理科学中引用次数最多的论文。2000年《自然》杂志发表的那篇关于网络容忍失效和攻击方面的论文不仅是该期刊的封面文章,而且对于我们理解网络健壮性产生了深远影响。雷卡和我在接下来的一年又写了一篇关于网络的综述论文,详细介绍了这个领域的理论基础,该论文是《现代物理评论》(Review of Modern Physics)引用次数最多的论文[19]。美国科学院2015年出版的美国国家研究委员会(National Research Council)年度报告中使用了“网络科学”一词,并建议美国政府投入数亿美元的经费支持这个新领域的研究,同时将该领域视为一个新的独立学科。最后,两家著名的科学出版社——剑桥大学出版社、牛津大学出版社,一个顶级的工程学会——美国电气电子工程师学会(IEEE),各自创办了一个期刊,专注于网络科学领域的研究进展。从各个角度来看,我们都可以说一个新的学科诞生了,在一个学科高度交叉的充满活力的学术群体的支持下诞生了。
科学的成功之路从来都不是一条直线(图I-10)。新思想的产生往往需要数年的酝酿。你可以把无标度网络理论视为一个例外,这个思想的火花从想法产生到论文投稿只用了10天时间。然而,若没有那5年毫无成果的磨炼,这个火花也不会燃烧成大火。
图I-10 通往成功的不同路径
一位卡通画家绘制的关于成功的作品。该作品生动地刻画了我早期从事网络科学研究的曲折历程,其中充满了各种失败和死胡同。
网络科学提醒我们注意科研合作和导师制度在科学中的重要作用。在雷卡和郑浩雄加入我的网络科学之旅之前,我所拥有的只是一系列的想法和失败。如果没有郑浩雄的网络爬虫技术,我们根本不可能发现无标度性质。雷卡的数学能力为我们探究无标度模型背后的理论提供了保障。如果不是美国西北大学的医师和研究人员佐尔坦·欧尔特沃伊(Zoltán Oltvai)说服我们将网络应用到细胞生物学中,并耐心地指导我们去熟悉那奇妙的蛋白质和代谢物,我们随后在生物网络领域的研究将不会发生[20],[21],[22]。这些发现不是一个人完成的,而是真正的共同发现。
如今,许多领域将网络科学归于它们的范畴。数学家声称网络科学是图论的一部分;社会学家认为网络科学属于他们研究了几十年的社会网络范畴;物理学则为网络科学的研究提供了普适性概念和许多解析工具;生物学领域投入了数亿美元的经费绘制亚细胞网络;计算机科学从计算机算法角度为研究大规模网络提供了帮助;工程领域则在基础设施网络方面投入了大量精力。难以想象,这么多完全不同的学科是如何走到一起,共同哺育了这个新学科的。
这本教科书见证了网络科学诞生的奇妙旅程,以及其中取得的一连串令人兴奋的进展。网络科学后续的成功依赖于我们保持其多学科特性的能力,我们希望每个科学家都能为网络科学的发展带来自己独有的视角。这种思想和观点的碰撞正是网络科学的强大之处和力量之源。