王小云在第七届数字中国建设峰会数据标准化和数据基础设施分论坛数据基础设施专场上的发言
发布时间:2025-05-13 10:28 文章来源:峰会组委会秘书处

数据安全与数据基础设施建设

中国科学院院士、清华大学高等研究院杨振宁讲座教授

王小云

  尊敬的各位领导,我今天报告的内容就是数据安全与数据基础设施建设,跟我们这个主题非常吻合。今天我主要介绍以下4个方面的内容。

  一、密码与数据安全

  刚才刘局长已经说了,好多关于区块链、隐私计算实际上都是打通数据要素,高效流通非常基础性的技术。我们国家高度重视数据安全,实际上习近平总书记提出要维护国家数据安全、保护个人信息和商业秘密、加快构建数据基础制度体系。习近平总书记也提出以颠覆性技术发展新质生产力,实际上数据和数据安全都是新质生产力重要的领域。我们在2022年中共中央、国务院发文提出,保护个人隐私和确保公共安全前提下来保障我们的数据,实际上做隐私计算的人都非常清楚,就是隐私计算可以保障这个属性。

  全球的话,也出台了很多数据安全战略,包括很多条例,我们不能说太多。有一个比较有影响力的就是欧洲的通用信息保护条例,这是执行得比较好的一个条例。美国开展的密码隐私计算专项,特别是高速芯片来保障,实际上就是抢占这个行业产业高地的部署。2024年,大家知道美国白宫发布了一些关键新兴技术国家战略,包括数据隐私、数据安全、网络安全技术,还有分布式账本,实际上大部分都是跟数字技术有关系。今天我们的数据安全面临很多重要的问题,大家往往忽略的就是数据篡改的攻击,大家觉得加密就行了。但是大家一定注意,不管你是哪种网络,专用的还是公开的网络,实际上攻击者都是用一样的能力来进行篡改的,大家一定注意这个问题。比如说我们心脏起搏器,你心跳200下,胰岛素泵给你的剂量篡改到20倍,这个人的生命很难保障的,这是数据篡改的攻击。还有一种数据篡改的攻击,大家要注意,是无碰撞攻击,有碰撞一定是有攻击的。大家一定注意,就这个技术的出现催生了一些病毒,攻击我们的基础设施,这就是借用密码算法攻击的两个重大的攻击事件。密码这么重要,它保障的是信息安全的机密的完整性、可验证性。

  今天我们国家已经有比较完备的法律体系,包括密码法、数据安全法等一系列的法律。从法律层面,我们国家是世界领先的,世界领先的法律体系逐步建立起来。下面介绍密码技术和隐私计算,首先是密码技术,完善密码系统的概念,密码学实际上最早是从军事发展的,就是点到点的通讯。互联网时代的通讯就是一对多的通讯,这就是国外加密发展起来的。今天我们直接到后面的,刚才跟林惠民院士交流,实际上我们密码学本身就是扛量子计算攻击的,今天我们又回到现代密码学的开始的地方,密码学最早的设想我们已经实现了。美国2006年制作高维格的密码研究的三个算法,一个是基于哈市函数,所以说就可以看出来互联网的密码大体的研究的范围。美国还进行了第二批标准的制定,有4个算法,其中两个已经被破解了,清华大学也破解了一个,我们这个团队给它进行了破解。2023年的话,美国就征集了第二大批次的40个签名的算法,这个阶段我们成功设计的具有数据难题的,真正的抗量子计算机攻击的算法。美国国家现在也明白过来了,就是给机器加强密码的合作,实际上就是为了应对中国的挑战,我们国家在这方面还是非常先进的。高维格密码很简单,实际上1983年高斯提的一个概念,它有两大数学难题,就是找一个最短的格向量。第二个问题就是我们认定了一个目标向量器,找最近的一个格点,所以我们设计就是这两个数学难题,对抗量子计算机的攻击。大家看,实际为什么设计这个密码算法非常成功,我给学生提了一个问题,我们做一个高斯采样算法就可以了。你采得最好,你设计的密码算法就是国际上最好的。但是有一个问题,因为密码格是随机格,它是随机高斯,我们离散高斯就是随机高斯分布,我们的密码算法就可以设计得是安全的,它有一个光滑参数,我们团队围绕这个高斯测度进行采样。实际上,我们给了一个高斯采样的通用算法,并且给出了高斯光滑参数一个新的定义,一个新的公式,就是你做出一个最好的高斯采样,你设计的密码算法就是最好的。所以获得了去年的最佳论文,所以我们一定要注意关键核心问题,一般的暂时先不做。

  美国尼斯特经过六年选出4种算法,三个是高维格,现在我们国家的密码团队设计的多个算法综合性能超过了美国标准。实际上,抗量子计算机攻击的密码算法的最大优势是比不抗量子计算机攻击的密码速度还要快。

  二、密码技术与隐私计算

  大家知道我们希望数据进行计算的时候,加密以后全是密文,如果对它进行操作,这是很难的问题,函数毕竟不一样。2023年,联合国大数据工作组发布了隐私计算,刚才我非常高兴,我们的刘局长提到了安全计算,提到了隐私计算。我们这个团队做了一个非常好的工作,BFV已经是RSI标准层,这是非常核心的加密算法,但是有人提出来大素数下并行计算,只要是大素数的时候可以进行同台加密计算,它的最大的问题就是效率低,这是学界的难题。我们提出来一个新型的算法,大家知道加密就是用这一些算法来支持的,所以这是最核心的一个算法。我们提高了151倍,传统的就是计算两三分钟要停机12小时降噪,现在我们是计算两三分钟只停14分钟降噪就行了,这是软件的实现。下一步是硬件实现,如果硬件实现就是秒级实现了,运行两三分钟就停止两三秒钟,因为大家都在计算,它安全性是衰减的,不能一直计算下去,它是这么一个概念,大家就可以看出来了,这就是美国做的工作,我们把它提升了151倍。我们还有一个后续的工作,也得到了比较好地体现,现在应该说,并行运算的算法是可以进行工业化部署了,特别是硬件实现的。

  三、数据基础设施安全

  关键信息基础设施建设是非常必要的,不管是什么行业,实际上密码系统、密码计算最多达到4级安全,如果是芯片可以达到5级、6级、7级,所以硬件是基础设施,是我们整个国家的最重要的基础设施的部署,从安全性来说,软件是达不到这个高度的。目前,我们的金融、电力、交通做商用密码的部署方面已经部署完了,我们银行卡全部覆盖,我们的电表几年前已经达到5级以上,还有我们的ETC也是通过商用密码的部署。我要介绍一款最重要的基础密码设施就是密码芯片,就是SEA,它要支撑整个的加密,大家知道,密钥和软件保护一样,怎么保护都很难,我们做的实验就不具体说了,软件保护能力很弱的。如果把这个主密钥放在硬件里面,安全级别是非常高的,能够抵抗。就是因为芯片的各种攻击,诞生了密码学领域的第六大会议,专门是针对硬件安全的,所以也有几十年的发展,有大量的攻击,也催生了测评行业的诞生。大家看一下CC,就是信息技术安全评估认证,国际CC认证。国际CC认证,我只说密码芯片的,只说硬件的,大家知道实际上美国跟加拿大、欧洲四国实现了6国、7组织他们来发起的,他们也公布了一个ISO标准。目前有31个国家、100个实验室,中国一个实验室也没有。我们国家整个的软件、硬件所有的信息系统达到怎么一个安全级别根本没有概念,所以我们国家是需要测评认证突破,也是一种封锁,是卡脖子技术。实际上,依靠公布的ISO标准,我们国家已经实现了密码芯片的5级测评,还有一个测评体系,就是BSI测评。BSI测评实际上是英国牵头的一个全球授权的密码产品测评实验室。目前已经部署了3家,山东高维密码测评有限公司实际上拿到了这个测评资质,拿到资质有一个好处是什么?就是我们的密码产品出口的时候,在我们实验室测评就可以了,然后你再出口。但是以往是把核心代码放到国外实验室测评,现在可以不用交出去,自己在内部测就行了。

  四、区块链技术及发展

  区块链技术实际上来源于比特币了,为什么区块链技术有两类技术?一个是挖比特币的时候需要对数据进行同步,也就是通过分布式系统对数据进行同步,那就是意味着分布式共识协议是非常重要的一个支撑技术。另外,还有大量的密码技术,也是区块链的支撑技术。此外,分布式共识协议的安全性证明是经过密码数字签名来得到安全性证明的,所以说密码技术在区块链里面起到了非常重要的关键的支撑作用。关于分布式共识协议有两个图灵奖了,从2009年比特币产生以后,特别是第二代共识里面,实际上它就开始对这个区块链进行了很好的支撑作用。到2014年以后,区块链联盟链概念提出来,到今天第三代共识,大家看一下,这里面有我们国家的区块链共识,迪诺和大圣在第三代共识里面它的指标性能是达到可证明安全的,并且迪诺和大圣的实现效能比哈希的效率高、速度更快。

  下面介绍一下Dyno迪诺区块链。它实际上最先的一个目标就是实现动态共识,大家知道我们的区块链,我们想能够实现在一个不宕机的情况下完成它的加入和退出。如果要实现动态的可证明安全的共识,结构就破坏了,要重新证明它的安全性。迪诺公司是具备可证明安全一个新的协议,实现了不宕机。它的安全性证明它的性能达到了1秒6.8万笔交易,在国际公开的所有的联盟的共识里面,没有人公布达到5万笔交易,我们是唯一的一家是达到6.8万笔交易,我们公布的数据与我们信通院的测评是一致的,被立项为国家标准。

  还有一个大圣,就是说另外一个思想,3F加一个节点,2F加一个节点的数据,为什么要TF+1?因为它的假设有F个坏的节点。大家要注意,实际上我们效率要基于F+1投票,不是2F+1。但是有一个问题,如果你F+1进行了投票,是否是达到可证明安全?这是很难的事情。所以说我们最终用了三种证书,保证不管是哪种网络通讯的环境下,不管是强的还是一般的标准的,它仍然达到最高的安全性证明,我达到F+1的安全性证明的强度,我的效率是利用的F+1的效率,这个思想是非常先进的,目前,分布式共识领域很多人开始用这种思想进行投票了。这个目前大家看性能是哈希1倍以上,如果高并发的一下可以达到35倍以上,目前已经被国际清算银行写入货币白皮书。还有一个协议目前也被东南亚五个国家设计成央行数字货币,数字货币就是密码协议加区块链或者是区块链加密码协议,所以设计了五个国家的央行数字货币,也构建了亚洲数字支付平台。目前交易额超过150亿,作为国家试点,现在开始到非洲落点。

  最后,我想介绍一下分布式数字芯片。毫无疑问,WEB3.0目前表现为两代技术,一个是分布式数字芯片,为数字基础设施提供信任的底座。大家知道万维网联盟提供的GRG有170例解决方案,目前我们团队跟电信领域的同行探讨,现在手机系统提前部署WEB3.0的可能性。如果手机网络,因为我们自己的手机号是实体的是可控的,它要通过区块链技术和分布式数字芯片支撑这两大WEB3.0这两个最核心的内容。

  我的报告就是这些,谢谢。

  (以上内容根据嘉宾发言速记整理)

附件下载

扫一扫在手机上查看当前页面