北京市科技装备业商会公共邮箱:btecc@btecc.org.cn
王怀民院士:推动中国开源创新从参与融入到蓄势引领
作者:
商会秘书处
时间: 2022-08-24
浏览量: 667
作为数字时代的新趋势,开源正以“开放、共享、协同+商业模式”的新型生产方式,以“自由”的传播形式,成为推动全球科技发展的核心引擎。而在全世界开源大发展的背景下,近年来中国开源的发展速度已成为全球最快,“支持数字技术开源社区等创新联合体发展”、“完善开源知识产权和法律体系”等要求被写入国家“十四五”规划,彰显了开源对于中国经济和科技发展的重要性。
从UNIX进入中国至今,中国开源的发展已走过三十余年,由最初的学习借鉴阶段,发展到参与融入的阶段,将逐步演进到蓄势引领新阶段,当前中国开源正处于空前的加速阶段。
近日,中国计算机学会(CCF)开源发展委员会执行委员安旭专访了中国科学院院士、CCF开源发展委员会主任王怀民教授。王院士由自身的开源经历切入,从微观到宏观为大家深度解读了中国开源发展的过去、现在与未来。
一、中国开源发展第一阶段:学习借鉴
80年代初:开放系统推动UNIX在产业界迅速传播
中国开源经过三十年的发展,经历了两个重要阶段。三十年前,开源的一些思想和成果刚开始进入中国。彼时,王院士刚刚获得博士学位,走上工作岗位,他开展研究所用的计算平台是搭载UNIX系统的商用工作站,而UNIX操作系统正是1969年末从贝尔实验室开源到教育界的。在1970年代,UC Berkeley(加州大学伯克利分校)获得了UNIX许可证,并在此基础上进行开发,随后开始以BSD开源许可证发行。那时几乎没有人意识到,美国的开源自此开始了快速的发展和传播。
在1980年代初,硅谷的硬件生产工业化已经十分成熟,而如何在先进的计算机上配备操作系统以方便更多人使用成为当时最急迫的需求。王院士回忆道,在自己读博时,SUN工作站的产品已经比较成熟,他开始使用SunOS进行工作。遗憾的是,这一版本在SUN公司付给AT&T和贝尔实验室知识产权费后转为闭源。贝尔实验室成为UNIX知识产权的供应商,所有使用其操作系统的厂商都要向其付费,对学术界也同样如此。后来那些已经习惯于操作系统源代码自由传播的研究人员就基于UNIX开发出了可以开源的FreeBSD,开源和闭源的冲突也日趋激烈。 王院士坦言,1970年代IBM操作系统的系统API(应用程序接口)不对第三方开放,在他读博士时才有了开放系统这一概念,但它不是指开放源代码,而是指开放操作系统的 API。随着开放软件基金会(Open Software Foundation)的诞生,产业界用开放系统作为标准化操作系统的API,并以这种形式达成了某种意义上的平衡,推动了UNIX操作系统的迅速传播。 与此同时,软件工程领域的面向对象技术也走向成熟,推动了整个软件技术和产业的迅猛发展。90年代:从自由软件走向开源软件
王院士进一步分享道,进入1990年代,互联网从学术界的“小网”走向了商业应用的“大网”。此前的互联网仅作为学术界的一种交流平台,跟普通百姓的生产生活毫无关联。然而,到了1992年,美国为推动信息高速公路的建设进行了一大批商业性投资,激励了社会资源注入。在美国政府和市场力量的共同推动下,互联网从研究机构走出,成为可以为全社会享用的技术和信息基础设施,同时也推动中国更快的联接世界。
与此同时,当时国家863计划已经全面推进,“发展高科技、实现产业化”成为1990年代中国863计划的指导原则,是中国赶上信息科技世界潮流的重要切入点。分布式面向对象技术作为当时世界上最先进的技术之一,仅仅为学术界所知。王院士感悟到做软件不仅要掌握方法原理,更要让它变成一个可广泛使用的软件产品,因此希望能够将分布式面向对象技术引入中国并将其产业化。此后的七、八年,他一直致力于此项工作。在彼时的中国,产业化就是买美国的产品,中国高等教育为美国和西方的产品进入中国提供了高端人力支持,虽然这为中国的信息化在一个高起点上快速发展打下了基础,但面临着核心技术无法自主可控的问题。王院士深感开源世界里有着更有价值的源代码,于是和企业开展了合作,通过开放的标准和开源代码把分布对象中间件技术转化成产品,这些经验让他受益匪浅。 也正是在这一过程中,王院士从推动开放系统走到了掌握开放源代码。后来伴随着《大教堂与集市》等传播开源理念文章的问世,开源软件的概念在中国开始传播。1998年,王院士进入到国家863计划智能计算机主题专家组,作为一名专家组成员来为国家出谋划策以推动我国的软件发展。此时,传统的软件工程发展已经陷入瓶颈期,而开源世界却为软件学术界和产业界提供了高质量的软件,这些软件并没有局限于经典的工程化方法,而是由一些如作坊一般的极客小组开发,其中必然蕴含着丰富的有价值的开发机理和方法,王院士意识到,开源非常值得研究。 2000年前后,互联网在中国快速传播,信息安全问题成为一大隐患,做中国自己的操作系统成为国家意志。2000年,国家863计划决定投入1000万人民币资助我国自己的操作系统研发。在王院士所在的专家组进行技术路线讨论时,面对当时主导全球操作系统技术和市场的WinTel联盟,王院士提议可以用开源的模式来做我国的操作系统,此后在国家科技部的指导下,受专家组委派,他牵头负责创建共创软件联盟。共创软件联盟旨在遵循开源许可证规则对863计划的软件成果进行开源培育和孵化,并以开放源代码的协同创新模式作为中国基础软件发展的主要路径,对我国开源产业发展起到了重要的推动作用。 从1991年到2005年,这十五年的发展可以被称为中国开源创新的第一个阶段,是一个学习借鉴的过程。 从2006年到2021年则是中国开源发展的第二阶段,是一个持续参与并融入全球开源生态的过程。无论是国家科研机构还是新型信息科技企业都意识到,中国不仅是开源代码的使用者和开源技术的学习者,更应该参与融入到开源代码的创作与开放过程中,深入研究开源创新机制,主动推动开源创新实践。王院士以自己的亲身经历阐述了这个过程。 王院士谈到,当时,在学术界乃至于产业界都很少有人把开源模式作为研究对象。2006年,他主持了国家863计划的一个重点研究项目“可信的国家软件资源共享与协同生产环境”,提出要将开源机理引入到可信软件的开发,将传统的形式化验证、软件测试等可信保障机制拓展到软件开发过程可信、证据可信等方面。在此思想指导下,他领导项目组将开源模式纳入到软件开发方法研究视野,推动中国开源软件开发环境的建设。王院士说:中国的软件开发者不再仅仅使用开源代码,而且还研究开源模式、贡献开源代码,成为开源社区治理的参与者。王院士主持的国家863项目也诞生了一个平台,即Trustie(确实)平台。直到今天,确实平台已经成为中国计算机学会的开源平台,并且在开源生态中持续演进,而这正是我国在“参与融入”国际开源生态所做的众多工作的一个代表。 王院士提到,中国在全球开源创新活动中扮演着重要角色。中国开源开发者数量及贡献度增长已成为全球最快,据全球最大的开源项目托管平台GitHub统计,截至2021年,GitHub的全球开发者用户共计7300万,其中中国开发者用户达到755万,位居全球第二,GitHub甚至预测到2030年中国开发者将成为全球最大的开源群体。中国的开源发展非常之快,还体现在很多国际上的重要开源项目,中国人都在其中发挥了重要作用。例如,在Linux kernel 的发布版本(从4.14版到5.8版)中,来自中国的开发者的贡献规模已经名列前茅,很多中国的大公司,如华为、阿里、腾讯、百度等都在其中做了重要的贡献。特别是由此产生的一些Linux商用运行者也逐步转入中国,如服务器操作系统openEuler开源社区由华为主导维护,桌面操作系统优麒麟项目由国防科技大学所主导的社区持续有效运转。除了国产操作系统,近年来openGauss、OceanBase、TDengine等国产数据库管理系统,以及百度飞桨(PaddlePaddle)、华为昇思(MindSpore)、清华计图(Jittor)等源自中国的机器学习框架,也陆续地加入开源大家庭,为开源创新实践赋能。时至今日,中国在开源上的“参与融入”已经步入深层次的发展阶段。在王院士看来,应该把开源作为未来中国软件乃至于IT领域创新的一个重要模式。在开源创新上,通过深层次的参与融入进而转变到蓄势引领的新阶段,这也正是中国计算机学会(CCF)成立开源发展委员会这一开源创新联合体的初衷。2021年3月,开源还第一次被写进了国家的“十四五”规划,其中明确提到要支持开源创新联合体的探索发展,特别是适合中国发展策略的开源创新联合体的发展,要完善开源创新的知识产权,实现创新链和产业链高效对接。 开源其实是一种创新模式和生态网络。王院士提到,如果要在国际上拥有竞争力,只做消费者是不够的,我们还要做原创者、引领者。在我国软件领域和开源领域当下的发展中,我们应该具备这样一种自觉,努力推动中国开源的创新发展。“十四五”规划的发布正是中国开源创新由参与融入向蓄势引领转变的一个重要推动力,需要在此基础上支持各类创新主体开放资源、开放源代码,从而在一个不确定性的世界中去寻求确定性。 在这一过程中,国内一系列开源创新联合体相继出现,比如共创软件联盟、中国开源软件推进联盟、开放原子开源基金会等。那么,中国特色的开源创新联合体应该是什么样子呢?王院士与众多开源界专家学者交流后共同得出了一个认知:以学术共同体为载体推动开源,可能是中国开源发展不同于其他开源组织的又一个重要探索和创新。 这一学术共同体就是中国计算机学会(CCF),因为CCF已经具备成熟的产学研联合机制和丰富的开源创新实践经验,由CCF创建开源发展委员会具备显著条件。CCF开源发展委员会(CCF ODC)的使命是为“开源创新服务”,愿景是“成为汇聚开源创新的高地”,理念是“创新、开放、共享、协作”。委员会希望推进三方面的工作,提供实体性的服务:首先要构建一个服务于全部会员、全社会乃至全世界的新型开源创新平台;其次要在这个平台上孕育原创于中国、能够走向世界的开源创新项目;第三要培养开源创新人才,支撑原发于中国的有世界影响力的开源生态建设。 CCF是学术共同体的学术交流平台,连接研究机构和人才培养机构,后来进一步向企业拓展。今天,信息技术作为一个技术创新的重要领域,把技术变成现实生产力是推动企业能力提升的重要抓手,也是信息技术学科所独有的特点。与通常的自然科学和基础学科不同,信息技术学科本身就是一个工程学科,是一个“有用”的学科,天然要服务于经济社会发展。CCF的发展为推动开源创新提供了重要的平台和基础。 开源发展委员虽然仅成立半年,已经发布开源创新平台GitLink(确实开源),并在此平台上托管运营了包括矽璓(XiUOS)、夜莺(NightIngale)、计图(Jittor)、群智感知系统平台(CrowdOS)等重要的原创性开源项目。同时,委员会也推动了一系列有价值的开源人才教育服务,如开源创新大赛、开源夏令营、开源高校行等。此外,委员会还利用开源模式推进软件教育的改革,以改变软件实践教育薄弱的现状。 在推进委员会的工作运行过程中,人才培养工作的推动比较顺畅,这主要得益于过去学会对此有着丰富的经验,但委员会各项工作的有效推进以及使命的达成必须要依托一个好的开源基础设施。为此,委员会创立了专注于开源创新服务的平台——“确实开源”,英文名为GitLink。该平台正是基于此前的Trustie 平台升级而来。 当前,GitHub是国际上较有影响力的开源平台,很多中国的开源项目都会加入其中。GitHub是一个由微软运作的商业化平台,而微软恰是利用其在商业界的核心主导地位实施盈利的高手。当下复杂的国际科技竞争态势,尤其是近五年来美国的长臂管辖导致的GitHub对外服务限制给开源界带来了巨大的震动。中国要实现高水平科技自立自强,中国的开源创新就必须从参与融入进入蓄势引领的历史新阶段,中国不能没有自己的开源创新平台。王院士希望GitLink平台能够承担起这一使命。GitLink平台具有以下三大特点: 首先,GitLink平台本身就是开源的。它从Trustie而来,希望有更多的参与者,包括产业界、学术界、开源组织等,能够参与进来,一起来定义和推动GitLink不断创新,让GitLink发展成为一个新型的开源服务平台。 其次,GitLink希望成为一个集开发运维于一体的、智能化的云原生平台。过去的开源平台大都仅作为开源代码托管平台,GitLink不仅是开源代码的聚集地,还应该是一个为开源软件提供商业服务和运行的聚集地,还是用户进行交流学习的聚集地。 第三,GitLink还希望在软件开发范式上有所发展。过去,主流软件开发范式是工程范式,并有一系列支撑工程范式的软件开发平台。此后又发展出了开源范式,开源范式显然与工程范式不同,它不按照经典的瀑布模型从需求获取到代码实现的方式做软件,而是通过原型系统快速发布与迭代软件作品,最终消费者通过意见反馈的方式迭代明确需求。相比较而言,工程范式是以确定性的需求为起点,然后通过企业确定性的资源投入,以工程化的组织方式产出产品,具备确定性,但是缺乏敏捷性;开源模式则不做任何确定性承诺,通过大规模群体的自组织方式,进行多样化探索形成创新作品,长于创新,但是缺乏确定性。GitLink 希望融合工程范式与开源范式,探索支持“宏观演化、局部求精”的群智范式,关注和解决如何让作品变成产品、如何让产品的确定性在作品的创作过程中也能体现。 希望未来能有更多的开发者了解和参与GitLink,希望GitLink在中国开源创新的历程中做出重要贡献,尤其是为中国开源创新从参与融入向蓄势引领的转变做出贡献,在开源创新领域成为具有世界影响力的高地。四、面向未来:用开源创新留下当代中国人的文明“足迹” 王院士认为,未来的中国必将成为世界科创中心,GitLink平台应该成为所有开源创新者播种其“创新理想”、汲取养分、迅速成长的家园,成为在世界科创环境中耀眼夺目的明星,这才是中国开源创新步入蓄势引领或达到创新引领的阶段所应有的“姿态”。 最后,王院士寄语未来,希望GitLink承担起蓄势引领、开源创新的重任,期待大家满怀信心,共同努力,保持足够的专注和投入,持续推动这一工作。人的生命虽然有限,但人类文明源远流长。人类文明被文字、器物承载和传递,推动着文明的持续发展。当今,软件成为记载人类现代文明的一种新形式。软件既是给人读的,更是给计算机“读”的,现代文明越来越多被软件记载下来,并由计算机执行,在今天的互联网上运行。中华文明5000年,延续至今,从未间断,是人类文明发展史的奇迹。今天的中国人应当以计算机软件的方式为创造数字文明留下当代中国人的“足迹”,为构建人类命运共同体做出当代中国人更大的贡献。