孟庆国在第八届数字中国建设峰会电子政务分论坛上的发言
发布时间:2025-11-12 16:15 文章来源:峰会组委会秘书处

面向人工智能的政务数据治理与共享

清华大学计算社会科学与国家治理实验室执行主任、清华中国电子数据治理工程研究院院长

孟庆国

  尊敬的各位领导、各位专家,非常荣幸受邀参加今天下午的论坛。钦敏主席先前强调了电子政务建设中统筹协调机制的重要性,特别指出政务数据共享的必要性。孙总工也探讨了在人工智能时代,如何有效利用人工智能推动基层服务创新,这不仅能显著减轻我们的工作负担,还能提供更高效、便捷的创新途径;反之,若处理不当,也可能带来新的负担。我将围绕这一主题展开分享,重点讨论面向人工智能时代的政务数据治理与共享问题。

  特别是自今年春节以来,DeepSeek的迅速普及,许多基层政府积极拥抱大型语言模型,尤其是在基层政务服务领域,大型模型已成为人工智能时代创新的关键场景。实际上,无论是当前热议的生成式人工智能,还是以往基于规则的人工智能,本质上都是通过分析海量数据,从中发现规律以解决实际问题。

  因此,人工智能可应用于政务的众多方面,包括智能问答、办公自动化、顾问生成等。人工智能不仅促进了基层政务服务的创新,实际上也为我们带来了操作上的便捷减负。

  具体来说,从数字政府的发展历程来看,可以大致划分为几个阶段,尽管这些阶段的划分可能并不十分严谨。

  在计算机和互联网时代的数字政府建设中,我们强调技术驱动;随着数据驱动趋势的增强,我们可以将其定义为数字政府;而现在,大型模型的运用标志着模型驱动的兴起。因此,从技术驱动到数据驱动,再到模型驱动,我们对数据的理解、定义和要求发生了显著变化。

  在技术驱动时期的电子政务,我们更多关注数据的采集和数据库建设;而在数字政府时代,我们更强调跨部门的数据打通和共享,以实现一体化的政务服务模式,包括一网通办、一网通管、一网协同等创新形式。此时,数据共享的核心创新在于数据共享平台机制的实现。

  现在,我们正拥抱大型模型,通过模型驱动实现政务服务创新。模型的实现依赖于高质量的数据集、数据管理和知识库构建。因此,我们还需进一步统筹和建设新的数据和算力基础设施。

  从这个意义上讲,人工智能时代数据驱动的作用并未减弱,反而更加重要。我们不仅要进行数据采集、维护、管理和共享,还要强调对数据的进一步标注和处理,以清晰理解大数据之间的关联,构建知识库。知识库作为一种外挂形式的政务创新,在许多基层探索中已成为关键技术路径。

  当然,一些地方政府也会进行微调,无论是外挂还是微调,数据集都变得至关重要。因此,政务数据集和政务知识库的构建变得迫在眉睫。如果仅是简单接入而未对数据进行深入处理,政务大模型可能无法发挥预期效果。

  此外,在考虑数据集和知识库的同时,我们还需建立统筹协调机制。如果不能统筹协调数据集的开发和使用,那么训练出的大模型或知识增强的大模型可能只适用于特定场景。将来,如果每个场景都拥有自己的大模型,我们可能会面临模型孤岛的问题。

  在基层减负的过程中,面对众多APP,将来手机上可能会出现许多垂直领域的大模型。如果模型之间相互孤立,同样会给基层带来负担,增加操作上的不便。因此,在推进人工智能建设应用时,在构建数据集和数据库的过程中,我们必须引入统筹协调机制。这样,在许多场景下,包括互动咨询、审批许可、智能问答、智能搜索等领域,我们才能更好地构建模型生态,形成数据集和数据知识库的综合性架构体系,而不是每个部门或业务场景都独立构建一套知识库、一个大模型。这样我们才能真正解决大模型应用问题,同时减轻基层负担。

  当然,随着大模型应用的增多,DeepSeek的本地化部署可以在一定程度上解决安全问题。但在未来,随着大模型的广泛应用,对政务数据共享以及知识库共享的需求将发生变化,此时对政务数据和政务知识的安全管理变得尤为迫切。

  因此,在人工智能时代,我们不仅需要进一步关注数据,还需要进一步完善数据集和数据库的建设。这样,我们才能更好地拥抱政务大模型,让政务大模型发挥赋能作用,为我们带来更加便捷、高效的创新使用方式。

  以上是我的观点,请大家批评指正,谢谢大家!

  (以上内容根据嘉宾发言速记整理)

扫一扫在手机上查看当前页面