李硕在第六届数字中国建设峰会数字产业集群分论坛上的主题演讲
发布时间:2024-01-12 12:42 文章来源: 峰会组委会秘书处

  大模型—数字化智能化新机遇

  李硕

  百度副总裁

  各位领导、各位专家。我今天的报告题目是关于大模型,以及大模型给我们整个的产业的数字化和智能化可能带来的一些新的机遇,以及最新的一些思考。

  记得去年7月份,来参加第五届数字中国大会,在另外一个会场也讲过大模型,那个时候没有太多人理解和关注这件事情。其实大模型在过去的几年发展理念,大家也都是同源的,最早来自Google的非常重要的一篇论文,全部都来自这篇论文来的基本的理论和实践。首先我觉得对于任何一个行业、企业或者我们作为知识工作者,参与到今天的各种角色里面,可能我们首先要思考的就是,我们的工作界面和机器未来如何划分?现在我们能看到用AIGC生成一些可用的草稿文章,画一张图片,甚至未来更格式化地去完成PPT的创作,旅游规划的路书的创作,对于电脑来说已经不是非常困难的任务了。

  从人工智能的角度这样发展,可以让我们的这些原来停留在论文、理论上的东西,变成了我们的现实,我们的企业和行业里面的从业者可以非常便捷地获得这种能力。另外一个方面,就是我们各行各业的专家,将自己的知识和经验通过新的模式,将其转化为机器和模型,可以理解、学习不断增强的部分。

  未来有一种新的可能,就是在各行各业里面,都是从之前的师傅带徒弟,徒弟会是机器。机器还有一个特点,就是可以和不同的师傅学习,再经过自己的融会贯通,形成更好的结果,辅助我们实际的生产和决策的过程当中。

  从我们行业角度来发展,对于产业的IT应用,如果按照一个线性推论,大家理解说以后是不算每个地方都要有一个模型存在,那我的每个软件应用是不是都需要有一个模型。但我们把这个问题放在一个五年、十年,更长远的角度来反过来思考的话,那整个IT架构都有可能发生非常大的变化。很多营销人员所使用的能力,之前的培训都是完成标准话术的培训,但是一旦交给机器,可能创造更多新的可能性。在制造行业里面,我们也能看到这已经辅助工程师把不可能的情况先筛选掉,把大概率可能情况推送到设计工程师面前,基于机器完成的一部分工作的这个基础上再往前推进,这背后都有一个东西就是模型。今天我们听起来还不怎么理解的这个东西就是模型。

  它就是要完成一个特定的任务,这个任务能更好地帮助我们在特定场景下完成我们的生产效率、工作效率。之前我们建基础设施,从早期买大型机到后面买服务器,在服务器的基础上构建PaaS层、做应用,整个IT架构实施下来没有三五年,一个企业的数字化转型很难完成,也培养了市场上大量的PPT工程师,给各家企业讲数字化。

  基于AI 的是时代,整个IT架构发生了大的变化,不再是打地基,五年之后见到成品房,而是从房子入手,我到底想要什么,然后我用基础的大模型、行业里面的模型,以及企业里面的需求,快速搭建需要的应用。对未来的模型穿透,可以看到企业级应用开发将大大地降低成本、加快速度。未来一定会出现很多领军高科技的创业企业,大型的集团公司,或者产业园区,通过构建自己的智算中心,形成具有自己行业特征的模型。

  使用通用的基础的大模型,加上行业领域支持的大模型,去构建一个企业的应用,就会更快。我们可以理解,基础大模型就是这个企业雇用了一个本科生,这个本科生可以基于企业需求来完成任务。但是如果有了中间这层,我们可以认为我们雇佣的人具备这个领域的知识,他是一个研究生硕士、博士这样的研究生,他具备了这个领域专业的知识。再往上一层就是和企业直接相关的一层,就是这三层应用构建了未来整个大模型产业的生态。

  过去几年很多的智算中心,包括我前段时间去一些东部沿海地区,很多的产业园领导问我说:“你们百度有没有需求?我们有算力。”然后我就问你们是什么算力?什么时候建的,建的什么算力?我只能说接下来的应用会发生很大变化,这个算力可能我们用不了的,而且未来的企业更多地朝着智能化的方向发展,我觉得在选择什么样的算力发展方向,确实是很重要的、需要预判的领域。

  在未来制造业领域里面,汽车制造是制造行业最复杂的环节。在这么大的制造企业里面,如果应用这种生成应用,可以大幅度提升汽车的研发设计的效率。像每家企业有上千名系统工程师,他们每天非常重要的工作,就是基于设计的需求,在两万个零部件的上百个物理参数里面,找到满足设计需求的各种组合,把这些组合生成文档、图纸、代码,这个就是今天研发的过程。但是我们已经看到,生成AI今天写出来的代码能力,通过内部评测,已经相当于一个工程师经过一两年培训之后的水平。未来的生成应用,完全可以基于这种知识结构和范式来实现这样一个过程,大大加速我们内部的无论是IT,还是系统设计的这样的研发过程。

  在电力系统领域也有这样一个应用,在构建新型电力系统里面,最大的一个挑战就是我如何把系统架构从仿真到这种大规模的参数,让系统可以学会,并完成决策。这个领域里面的挑战也会更大,但是也看到人工智能确实对我们构建这种新型能源系统带来了全新的可能性。

  我出去演讲,经常和现场很多专家说,我今天演讲稿绝对不是用我们内部产品生成的,但实际上我让它给我打个草稿,包括未来没有发生的事情,我让它给我打个草稿,它写得还是挺有逻辑的。我有时候也会给我们的市场和宣传部门交流,是不是和一个刚入职的本科生理解水平差不多?其实也是差不多的,就是这些知识和概念构建在一起,形成一篇通稿,现在看起来,是一件没有那么困难的事情。

  综上所述,我觉得未来各行各业、每家企业都需要考虑我们该如何应用这种新兴技术,再去快捷地、低成本地构建我们数字化所需要的应用。在这种全新的AI研发范式的发展过程中,从大力出奇迹到反馈驱动的创新,再到数据应用,应该是边用边完善的过程,都是整个行业的发展带给我们的启发。当然,在可解释性、数据安全、隐私保护等等一系列方面也有很多挑战,我们愿意和在座的所有朋友和线上的合作伙伴一起共同面临这些挑战,将这种技术更快地推进到制造、能源、电力等等行业的一线,让它发挥作用。

  (以上内容根据嘉宾发言速记整理)

扫一扫在手机上查看当前页面

附件下载