We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 黎建辉:科研背后那张网

黎建辉:科研背后那张网

2025/3/13
logo of podcast 中科院格致论道讲坛

中科院格致论道讲坛

AI Deep Dive AI Chapters Transcript
People
李建辉
Topics
我,李建辉,回顾了中国科技网三十年的发展历程,从最初连接科学院内部研究所,到连接全国科研机构,再到服务于大科学装置和联合国可持续发展目标(SDGs)评估,见证了中国科研信息化建设的巨大进步。 我参与了中国互联网接入国际互联网的历史性时刻,并分享了中国科技网建设过程中的诸多挑战和经验,例如在青海湖建设生态环境监测网络的经历,以及为FAST等大科学装置提供高速数据传输和计算服务的案例。 在服务于SDGs评估方面,我们利用科技网和科技云构建了地球大数据科学平台,为全球土地退化和恢复评估等工作提供了数据和方法论支持,并获得了国际社会的广泛认可。 展望未来,我们将继续建设高速、互联的科研网络,连接科研要素,服务于国家科技创新战略,为数字时代科技发展贡献力量。

Deep Dive

Chapters
本文讲述了中国科技网30年发展历程,从1994年4月20日接入国际互联网的64K专线,到如今的百G网络,回顾了中国科技网建设的历程和重要节点,以及背后的故事和意义。
  • 中国科技网于1994年4月20日接入国际互联网
  • 最初的网络是为了共享昂贵的超级计算机资源
  • 科学院领导具有远见卓识,坚持建设64K专线连接国际互联网
  • 中国成为第77个接入互联网的国家

Shownotes Transcript

大家下午好我是来自中国和谐院计算机网络信息中心的李建辉我们今天在这里能隆重地庆祝中国前工人接入互联网 30 周年 4 月 20 日我们知道 4 月 20 日这个日子怎么来的吗如果我们要想回答这个问题的话我想提到一个人这个人是我的同事他是叫李俊老师

三个星期前我们在一次会上见到他我跟他说我说李老师我对您的敬仰如滔滔江水绵绵不绝他就黑黑地笑他说你怎么着你调侃我是吧其实真的不是因为那个时候我是发自内心的感想因为那个时候我正在准备写一篇文章对中国科技网的整个三十年的历史做一个回顾就查了一些资料

我知道原来 4 月 20 号是这么回事就 4 月 19 号的晚上李军老师在网络室值班大概晚上 10 点到 11 点钟的时候他突然发现说我能上美国的这个网络了在美国的网络上还有很多的东西很兴奋在很遗憾的时候他把这个

这个消息到了第二天早上 4 月 20 号来告诉我们的领导然后我们就知道中国互联网前工程接入国际互联网就是 4 月 20 号我就跟他开玩笑我说你要早一点说是不是我们还可以早一天接入这个国际互联网呢

而至于我自己那就得从这张照片开始我是 1999 年的 4 月 1 号跨州大学的校门进到了我们中国科学院计算机网络信息中心那么这张照片拍摄于 25 年前的今天在那一天我们同样在纪念中国 internet 开通五周年那么我不知道大家能不能在这个照片里面找到我我估计有点难度

是这一位这个小伙看起来还不错长得也很清秀满头黑发岁月这把剃头刀帮我把头发剃掉了不少我很荣幸参加了这样的一个活动因为那个时候我刚刚走出校园而且这个活动还是一次国际中美之间的一次高层的网络的一个学术研讨会那我去听了一些会议的报告老实话我真听不懂

我听他们说的词 backbone 我现在知道骨干网 root 路由都是些啥呀我从来没听说过但是我也很荣幸至少我参与了这样的一个过程但是从此之后 25 年来我成为一个互联网的使用者到它的应用的开发者到今天负责整个科技网的建设者一路走来就跟互联网结下了一生不解的这样的一个情缘

我们作为网络中心的一份子我每天从门口进进出出的时候看到这个牌子其实我们还是很非常的骄傲的自豪的这个牌子说中国的互联网从这里起步

这个牌子上大家可以看当时叫中关军科研释放网络记录了它整个网络的一个情况它有三个主要的节点那么其中那个大的环你看下面那个就是把科学院在中关针的这些研究所连在一起那么那边还有一个环看来是一个是北大的一个是清华的他们这三个区域连在一起形成了一个地区系的网络

那么这个网络当时的目的是为了共享一些资源更重要的是要共享这里面我们将来当时比较昂贵的先进的还要从国际进口的那些大的超级计算机做科学计算做模拟当时这个工程是由国家纪委支持由四行贷款

它本身没有一个责任说要连国际互联网但是这个工程的领导者我们科学院的领导和我们之前的同事们他们以一种前所未有的远见和魄力和他们的坚持建成了一条 64K 的这样的专线连到了美国实现了中国跟全公论的国际互联网的互联成为了国际上第 77 个接入互联网的国家

这是一种何等的荣耀但是这个网络有了以后我们在京区的这些科学院的研究所很快就可以使用这个网络跟国际发邮件了跟交流了然后享受到这个便利但是我们科学院啊

有一百多个研究所分布在全国很多十几个不同的城市你比方说上海南京广州等等他们也要上网怎么办科学院就说好我们把这个网络推到全国我们当时启动了一个工程叫中国科学院的百所联网就把科学院一百多个研究所都联到这个网上来大家都能使用互联网但是同时

我们发现在这个过程里面其他的科研机构比方说农科院 林科院各个地方的这些科研机构他们也想上网他们也想使用这个网上来进行国际交流而是我们再把这个网络往外延伸我们就建立了一张网我们叫中国科技网从 1996 年一直运行到今天专门为我们的科研工作者服务的一张网络那我们知道前些年云计算风起云涌

那个光有网络是不是还不够我们的科研工作还需要做大量的计算打着数据乘除甚至做分析做协作所以我们在 18 年的时候我们又建立了一朵云我们叫中国科技云从科技网到科技云是一个自然的演进那么这个云上大家

可以使用这个中国科技云给大家提供的计算的服务乘储的服务数据的科研数据的管理共享的服务包括计算分析的服务科研协作的服务等等那大家一定会问说我们有那么多的网络我们家上网很便宜联通电信是吧我有很多云阿里云为什么你还建一个网还建一个云有什么意义呢

那关于这个问题呢我想从分享三个方面的故事第一个就是关于野外台战电网大家会问什么是野外台战就是科研人员啊他要去掌握某个区域的这个比方说他的气候的情况他的生态的情况对吧环境的情况他要在那个地方啊建一块地圈一块地出来放一些装置放一些设施在那里监测那些数据甚至在那里可能还有一些试验田

这些台站它大部分都远离城市基本上都是在很远很远的荒郊无人的地方我很荣幸我曾经跑遍了科学院上百个这样的台站他们是没有互联网的那么他们碰到了最主要的问题是我的这些数据能不能快速地实时地传到我的数据中心跟全国的科研人员快速地共享和分析那这个故事呢我想

回到大概十五六年前一个下午我的导师严宝平研究员我跟他开会他突然跟我说一句小黎 走 跟我去青海湖如果你看过周星驰演的那个电影叫《大话细游》的话可能里面有个场景唐生对着他的徒弟说走 天竺我真有那感觉然后我回去拿了一些简单的换洗衣服跟着他去了青海湖

那是我第一次去青海湖我们知道青海湖有四千四百多平方公里很大的一个它有很好的这个这个治养环境跟生态但是青海湖是鸟的天堂大家很多人去观鸟每年的春天的时候这个鸟从南边从南亚一直飞到那里去生大一只呼吸鸟那么每年的秋天的时候它们在飞走那里有个鸟岛我们去干什么

我们的严老师要我们去为青海湖建一张网建一个利用信息化的设施来给它监测它的整个的生态环境

花了很多年带着我们建了这样的一张网你可以看这里面有一些地区叫什么淡岛海星石三块石每一个都是在青海湖的一个很小的小岛上那上面都是鸟我们要在那个岛上要建监控设备实现那个岛上通过无线的设备把数据传过来最后我们要通过我们的科技网连到我们的数据中心做整理共享然后我还要分发给科学院的很多不同的研究所

在这里做研究这样的一个工作我们做了很多年我们开玩笑我们作为颜老师的学生我们的师兄弟一个共同的记忆说起来就是青海湖因为我们每个人几乎都被他指派到青海湖去干各种各样的工作现在想起来其实也是一种收获大家可以看这些照片

其实这样的一些设备现在看起来你好像很容易其实当时真的不容易那大概是十五六年前你们看看比如说这个太阳能板

它这个岛上离岸大概有 20 公里左右它只有个很小很小的小船到那去那个太阳能板你搞多大大了运不上去那么小了它不够用那我们想了很多的办法就是把这个太阳能板中国测试多大合适这个太阳能板升上去我们还要做设置因为它不关着的时候我得让那些设备停电否则它不够它能源不够这个也是一个要经过长期的实验才了解的

还有你这 20 公里的距离用什么办法把那个数据直接传过来有限肯定不合适成本要低那我们当时用了一些无线网桥的这个方式那你无线网桥它很远你要递得准递得准它那个效率才好那么还有你看这旁边还有一个黑箱子所有的设备你在野外日晒雨淋的你得保证它能正常地工作那我们得做个箱子把它封起来

那这个箱子封起来你把它封得很好把它密封了那当然很好啊那晒日怎么办它很热啊太阳晒起来很热那个高原的辐射很大的

那你要把它打开那它又怎么去防水防其他的东西我们想了很多的办法来解决这样的一些问题当时你们会觉得说我们都是一些硕士都是一些博士都去干这件事情我们的老师说从干这些事情开始做学问有了这些观测设备我们就能看得到这些非常

罕见的动物的行为你看这只鸟在摇滚的摄像头它的孵蛋它们打架它们怎么像人一样各种各样的行为我们不用观测它我们在任何一个地方都可以看到现在很多的这样的生态的观测都是采取这样的方式刚刚说到了野外台战

我们科学院有好几百个这样的野外台战你看这张图上分布在各种各样的包括生态观测的特殊环境观测的植物观测的都需要通过科技的网络来给它做数据的传输做设备的监控做这样的工作那么在 08 年的时候通过国家的支持我们参与了中国的下一代互联网的建设

我们专门建了 53 条专线来把 32 个台全部联网但实际上这是不够的你看到站其中的比例非常少那么接下来会不会讲到我们还会大力地去把整个野外台站的联网做好能够让我们获得高质量的一手的对环境对生态的这样的关键数据为我们的科研服务那么第二个场景就是服务于大科学装置大家会问什么叫大科学装置

比方说我们做科学研究的时候,它需要一些大的这种共享的这样的观测,是比方说大的天望远镜,你们可能也听说过,500 米口径的那个射电望远镜在贵州的那个锅,是吧,这就是一个典型的代表。还有和好船,我去参加过,像三亚深海所的,有那个焦龙号的那个和好船,它出海,很多人在上面做实验。

那还有做那个粒子物理研究的对照机咱们在高能所的这些都是大的装置这些装置它都会产生大量的数据怎么来计算来分析这些数据其实也是一个问题那么我的故事呢就成我和这个 FAST 的这个首席科学家李迪研究员的一次在一次会上的交流说起他告诉我他在做这个多目标星天

他那个寻天一小时就可以产生 136 个 TB 的这种数据这些数据怎么运回来到数据中心处理怎么去分发给其他的合作伙伴来协同的处理他觉得是个很大的难题我就跟他说我说那我来帮帮你我们来试一试还有办法能不能解决你这个问题

因為那時候我也在找這樣的好的科學應用讓我們的網和雲怎麼為它做服務來驗證我們的一些技術的方法對不對

而是乎我就组织了一个团队利用我们科技网的这些资源我们建了一条从贵州到北京怀柔的一条百 G 一百个 G 的这样的网络我们家里基本上是千兆这中间差了多个数量级至少五个五个六个数量级这样的一条网络来给他传数据大家觉得你就高速公路修好了这个六车道八车道是不是就马上就可以跑六车道八车道网络不是这样的

当你在长距离大贷款传输的时候你是很难把那个网络的贷款用好的

我们测试的时候你能用到 50% 60%就不错了就大概是 50 到 60 个 G 你太快你跑不起来那我们当时就用了很多的技术手段包括数据的压缩这个协议的优化让这条网络能够跑到 90 多个 G 的这个带宽来传输数据然后这个数据到了北京以后我们再做分析做处理再分发给其他的合作伙伴

即使是这样其实光有一条带宽也不能解决大中子里面的数据传输的快速效率的问题因为它整个处理的过程是一个非常复杂的过程大家可以看大概只有这么三个阶段首先它原始数据下来以后它要把不同时段关在的数据融合分析去造然后规划它要做预处理这个时候它用的是一些大的这种所谓的云计算的能力一些服务器来算

算完以后他要放到一个大的超算的环境区里面用他的科学的软件来做科学的发现的这样的计算那个时候他要推到一个大的计算就是高性能计算去算那么算完以后有结果他结果可能还要做一些分析甚至还用一些 AI 的方法比方来做一些目标的发现这三个阶段它是一个流水线一样的在做的我们

我们怎么样去让这样的一个这么大规模的数据和算力网络能够协同起来像流水线一样这样的做那我们的团队就研发了提出了这样的一个叫算力工厂的这样的一个方式然后我们就用开发了一套中间件的软件我们叫 scale box 然后能够

把底层的数据的这个这个资源的调度数据的这个传输像这个流水一样快速地转起来那么我们做完以后让他的这个这个这个数据处理的速度能提高一个一个数量级那么我们在 2002 年的时候支持他们他们

首次发现了重复快速射电报这个是全人类的首次而且他入选了中国十大科技这个新闻结果发表在 Nature 上文章里面他致谢我们那么今年我们这是他又发现了新的快速射电报那么他也发表了而且把我们的团队的成员列为共同的作者

其实这样的大装置还有很多很多中国有 77 个包括在建的在运行的科学院有大概有 25 个在运行有 13 个在建他们都需要这样的方式这样的科研网络和云支持他快速地做数据的传输分析计算快速地产生科研的成果我们知道科学的成果比的就是一个块

谁先出来你今天出来发表了你可能就是全世界第一你明天再出来这就是第二个就没有意义了所以大家可以知道这个网络和这个能力对他们的共识对他们的这个作用有多大

那么第三个是我自己亲自参与的一个事就是服务于联合国的可持续发展目标大家知道就是 15 年联合国的 193 个成员国在纽约的叫可持续发展大会上一致通过了说未来到 2030 年我们要实现全人类的可持续发展有 17 个发展目标比方说消除贫困

这个零饥饿等等包括这个教育是吧还有环境什么生物等等这样的它每一个目标下面又有一些具体的目标和指标有现在有 230 多个这样的目标和指标这些指标是需要量化的去进行评估和监测的知道它能不能实现什么时候实现但是做这件事需要的是数据和方法

还需要我们的平台对吧但是当时提出来说有 60%的指标基本上是没有数据的在 17 年的时候你看右手边那个图还有 38%的指标全人类都不知道说我用什么方法用什么数据来做这件事那么我们科学院在 2018 年的时候启动了一个地球大数据科学工程的先导专项

专项的首席郭华东先生就提出来在 19 年说我们能不能用地球大数据的方法用我们的能力来为 SDG 指标的评估提供一个新的解决方案那为此我们做了四五年这样的工作我也很有幸虔诚地参与了这个过程利用网络利用基础设施为了构建一个新的平台

那么可以看出来我们建了一个地球大数据的科学的一个平台我们通过我们科技网能够把全科学院的二十几个研究所的高速的连起来让它的数据能够快速的汇聚到我们在怀柔的一个大的融合的基础设施上在这个上面我们研发了各种数据管理分析包括核实化的这样的工具更重要的是我们提做了各种对这个指标直接计算的这样的一些工具

那么这个就改变了整个我们做这个评估做这种研究的方式传统的方式我们这个平台上有 19.5 个 PB 的数据你要下载下去现在的网络你 30 天都下不下去没地方存那

那你现在是只需要通过你的笔记本连上这个平台在这个平台上写代码调用我们的算法分析数据甚至直接用我们的一些做好的指标分析工具来分析这个指标进评估其中我们做了一个就是这个针对沙哈拉沙漠以南的一个叫绿色长城的一个工具在非洲在推广而且我们这个平台的性能是非常好的

其中举一个例子我们那里有一个所生态中心他们做从 1800 到 2100 三百年这个时间里面全中国区的这个生态系统固碳进行评估

那他是把中国这么大的 960 万平方公里的土地划成 10 公里的网格然后按天的方式来做计算模拟他说他自己弄让他的平台环境一个月也搞不出来在我们这里我们给他优化以后在平台上他一天就会做一次这样的计算可以想一想这个速度是多么的不一样对科学的研究的这个作用是多么的不一样

那么我们也支持国华东院士的团队海长 SDGS 评估出了非常好的成果比方说左手边这个是这个团队对全球的土地退化和恢复做了评估然后得出了结论被时运王毅国务委员在联合国大会上直接引用说我们统筹山水林田胡扫沙系统治理为全球贡献了五分之一的土地净恢复面积

我们也从 19 年到 23 年一直在写地球大数据资深科学发展的这样的一个报告这个报告连续五年都有国家领导人发布在联合国的这个场合发布那么 19 年是被作为中国参与联大的四份重要的文件之一那么 2023 年是由我们的国家副主席韩正在联合国大会期间发布外交部评价说为国际社会填补了数据和方法论的空排

在这个过程里面迎来了我人生的高光时刻 2023 年的春节我在家就接到电话说郭老师说还会视频会议我就上视频会议说有联合国的高官要访问我们中心叫科技发展大数据国际研究中心因为我也是那个中心的现在的副主任我们要做准备了

韩养会回来以后我三天就待在这个房子里面来准备把我们的系统怎么跟他演示那么终于迎来了 2 月 2 日我们知道那一天是 77 届联大的主席克洛西访问这个中心我跟他做了系统的演示我们的数据我们的平台基于网络怎么支持 SDG 指标的评估怎么为科技发展做贡献为发展中国家做贡献

那当时我讲完了以后我问他你有什么问题吗他看了看郭老师说真的可以提问吗可以可以然后他就真的提了几个问题给我探讨了三个问题

他结束了以后他说这是我见过的最先进的信息技术看到了令人震撼的成果找到了志同道合的朋友当年的梦想变成了现实那个是我这 25 年来印象最深刻的那一天那个时刻

那么我们的网络是一个天然就是个全球互联的网络我们的中国科技网和现在跟欧洲的科技网络跟美国的科技网络跟全世界所有的科技网络进行高速的互联来支持我们国家无论是在新的能源还是粒子物理还是在天文方面这样的一些合作那么我们讲完了我们的网络的昨天今天未来在哪里

那么大家看这张图未来的三到五年我们将会基于现有的基础上来重新构建一张新的科研的网络按照国家的整个大的科技创新的大的布局我们有四个枢纽北京 上海 广州和成都然后我们还有八个区域中心那么这个网络基本上是百计以上的一个高速的网络

那么这个网络还跟国际高速的互联它来支持实现我们所说的所有的科研要素包括大装置野外台战数据中心算力中心和我们的实验室科研人员全部的互联构建一个数字化的环境来为在数字化的时代网络化的时代的科技创新做实实在在的贡献

那谁来做这件事情这照片中的我们或者说他们这是昨天下午我们的团队为了这个演讲专门照的一张照片可以看出来有少量的像我这样的 70 后大量的是 80 后和 90 后甚至是 00 后未来在他们身上责任也在他们肩上我希望我们不辜负历史给我们的这样的一个责任谢谢大家