数据时代的数据安全挑战与对策
中国工程院院士
孔志印
尊敬的各位领导、各位专家,我今天带来的报告是《数据时代的数据安全挑战与对策》,相对黄院士报告的高屋建瓴,我这个是一个比较集中的话题。习近平总书记在主持中央全面深化改革领导小组第二十六次会议的时候强调,数据基础制度建设事关国家安全发展大局,要维护国家数据安全,保护个人信息、商业秘密,促进数据高效流动使用,赋能实体经济,统筹推进数据产权流通交易,数据收益分配和安全治理。
近几年,我们国家的数据安全不断得到强化和发展。《中华人民共和国网络安全法》里对数据的安全目标进行了规定,即保障网络数据的机密性、完整性和可用性。《中华人民共和国数据安全法》提到的数据安全目标,是确保数据处于有效保护和利用的状态,以及具备保证持续安全状态的能力。应该说《中华人民共和国数据安全法》强调的数据安全是数据利用背景下的安全,是持续动态的安全能力。这个定义更符合数据时代的特点,也就是说,数据流转共享才能产生价值,合规使用才能产生正向价值,合法共享才能促进数据空间的繁荣。
一、数据安全面临的挑战
数据安全的特点。在传统意义上数据安全是什么,就是把数据封闭在组织内部,面向特定业务用于保护数据的机密性、完整性、可用性,防止数据被泄露,也防止在内部不当访问和被破坏,这是传统意义上的特点。在数据时代的数据安全是什么,就是立足数据作为规模巨大、千奇百态的生产要素,保护数据在组织内部得到有效治理,在组织之间能够有效共享交换流动,在共享交换流动期间数据的权属得到保护,能够融合分析,能够得到提升。其本质还是网络空间的一个重要组成部分。
我们再看一下传统的物质要素和数据要素之间有什么异同。传统的物质要素具有明确的权属特性,可标识、可称量、可定价,还有质量要求。有些物质要素要求不可切分,可以基于等价原则进行交换,对于物质要素的保护主要是通过物理手段控制对物质的接触和访问、使用,这是传统的物质要素。数据要素和传统的物质要素有了显著的不同,数据具有强流动性、可切分性、可复制性、可交换性、可融合性。这些特性使得数字的权属很难确定,价值也很难确定,安全管控也很难,需要很强的技术和管理方法的创新才能得到保障。
数据安全面临三个方面的挑战。一是开放性带来的挑战。传统模式下是不同的组织自己生产数据、自己消费数据,数据的安全保护主要是组织内部通过网络安全、数据安全的平台来保护数据,以保证数据不被外部部门拿走,保证数据在本部门、本组织内部能够合法访问,不被非法访问和破坏。但是到了数据时代,数据要“走”出自己的组织,参与交换交易和共享。数据“走”出自己的部门以后,就面临几个问题:权属能不能得到保护?安全能不能得到保障?价值能不能得到回报?会不会被恶意利用,反过来追究本部门的责任?这些现象导致了数据孤岛的出现,难以形成数据共享交换平台。数据的融合价值也难以涌现,这就是我们现在面临的问题。
二是数据规模性带来的影响。在一个宏大的数据空间和数据中心内部,数据关系多维交织,我们现在面临实时数据、非实时数据、结构化数据、非结构化数据等,不同的数据安全属性描述起来差异非常大,使用要求也各不相同,没有办法做到统一的安全管理。由于数据规模、应用规模不断增长,用户也在不断变化,需求也不断变化,这样数据安全策略的复杂性呈指数级增加,引起了管控难度由量变到质变的转变。这样很可能导致两个极端,一个是过度授权,一个是授权不足。
三是分离性带来的影响。首先,是数据上云以后,数据的所有权和数据管理权分离。再就是,数据参与共享和交换以后,数据的管理权拥有权和使用权分离。总的来说,在数据时代,由于数据规模的增大,数据的流转、共享、融合、分析成为数据组织应用的新生态,数据安全就面临开放性、规模性、分离性这三个力量的作用。这个问题解决不好,数据作为生产要素在网络空间里进行交易交换就非常困难,所以只有覆盖数据全生命周期的内生安全,才能建立一个开放、共享、安全的数据空间。
二、 数据安全的应对之策
数据时代,数据的保护目标、对象、场景都发生了巨大的变化,因此需要以数据为中心,重新审视和构建数据安全保护的方法论。
一是构建以区块链和密码为底层架构的数据价值交换体系。与物质生产资料相比,数据作为生产资料也应该具有价值权属的特性,应该基于价值和权属设计数据的交换规则,构建数据生产和消费生态,就是说建立数据生产资料的生产关系。通过数据确权,明确数据为谁所有、可以被谁所用、可以干什么。通过数据定价,推动数据的重要性和价值工作的标准化、规范化,这是构建数据保护的法理依据。
这里我们面临着一些难点和痛点问题,就是权属难,行为不可信,数据价值不好定。这需要我们达成共识,需要基于共识进行定价和授权,需要基于合约进行数据保护、数据交换,要利用密码进行权属的保护。正好区块链技术和密码技术在这个方面能够支撑分布式存储、智能合约,同时具有无中心、不可篡改和可追溯的特点。通过区块链技术,可以实现数据的定价、确权,以及基于合约的数据交换,使生产者愿意共享数据,消费者能够正常地消费数据,从而推动形成安全、有序、繁荣的数据交换生态。这是我们以区块链和密码技术构建的一个安全的数据交换价值体系。
二是采用面向过程的方法实施数据治理。借鉴ISO质量体系,实施数据安全治理工作能够将宏观目标原则制度落实为一个明确而具体的过程,使数据治理工作能够可视化和可评价。具体来说,首先是过程的策划,也就是要明确组织内部有哪些类型的数据、什么密级的数据、数据存储在哪里、可以被哪个业务部门访问、数据的使用经过什么审批,将数据的分类分级描述出来,将各类数据可以合规使用的过程标识出来,对数据使用有一个清晰的保障。其次是过程的实施,就是说将上面策划的过程制作成手册,让领导、普通用户、数据的管理和运维人员都清楚自己的责任,并督促其执行规定。在技术方面,要将策划的结果和结论转换成数据安全策略,基于数据安全策略对各级各类数据采用身份认证、防护控制、加密等技术手段,在系统中进行控制。然后是过程检查,就是要检查策划是不是得到了遵守,这也是这个过程进行升级的依据之一。最后是过程的改进。就是当一个部门在处理数据和应用数据有了新的业务的时候,或者已有的业务已经过时,需要对整个过程进行调整改进升级。
三是创造适应数据流通场景的数据安全技术。首先,大力发展基于人工智能的数字安全技术。现在我们面临的数据空间非常复杂,数据量非常大。这种情况下即使是最专业的团队也面临人手不足,手上的数据工具非常多,也不知道该用哪个。比如,我们用人工智能加自动化技术,通过网络传输和云中常态化部署敏感数据识别和分类手段,可以增强数据资产的可视性,通过自动化进行数据的识别和分类技术,能够从源头数据、源数据中重构业务场景,并且可以理解最敏感的数据在什么地方、谁有权访问、谁正在访问以及他们用这些数据干什么,这有助于组织更好地治理数据,更好地合法合规利用数据。
再是,大力发展保护数据权属和价值的隐私计算技术。很多专家都讲了隐私计算,主要是解决数据拥有权和使用权的分离问题,怎么让数据流动起来。数据以明文的方式参与共享,无法避免会被其他用户滥用,但是用传统的加密技术加密以后,又没有办法参与融合分析,这个价值又难以释放。怎么解决这个问题?现在就是利用隐私计算技术。现在隐私计算技术发展很快,多个行业需求方和厂商都在陆续加入,共同推动这项技术的发展,包括同态加密技术,可信执行环境、联邦学习。现在我们面临的场景还不那么丰富,还无法在一个复杂场景下把这些技术用好。另外,这些技术效率比较低,计算时间比较长,这些问题需要我们进一步地克服。
在数据时代,我们把数据做好、把安全工作做好,在发展的过程中解决安全问题。同时数据安全要能够推动数据进行流转交易、能够在大的数据空间里发挥价值。新时代的数据安全,既需要管理部门、信息系统建设者和数据用户共同努力,多方协同,也需要在技术手段、标准规范、管理制度多管齐下。最后要落实到具体场景里,包括工业制造、现代农业、交通运输,在这些场景,去研究数据交易交换问题以及安全解决问题。这样才能不断完善数据安全和数据要素,形成网络数据空间。
我的汇报完毕,谢谢大家。
(以上内容根据嘉宾发言速记整理)
扫一扫在手机上查看当前页面