数字中国建设峰会
返回
曾大军在第六届数字中国建设峰会人工智能分论坛上的主题演讲
中国科学院自动化研究所副所长
发布时间:2024-08-20 11:05 文章来源:峰会组委会秘书处
加速推动人工智能大模型及演进技术发展
曾大军
中国科学院自动化研究所副所长

尊敬的各位领导、各位专家、各位嘉宾,大家上午好,下面汇报我们对人工智能大模型的一些理解和思考。

这个报告本来安排的是我们研究所徐波所长来做的,他有一个紧急公务,我来代讲。

大模型与Chat GPT的突破

人工智能大模型或基础模型泛指参数数量巨大的、大规模预训练深度神经网络模型,Cha tGPT的巨大成功使其核心的支撑技术大模型也在全球范围内备受关注。近几年,国内外各类型的大模型层出不穷,刚刚曹主任也提到了。Chat GPT作为一个现象级的产品,其实是由2018年GPT1一步步发展来的,这张片子简单地显示,就是GPT大模型本身技术的谱系。Chat GPT系统本身应该准确地说不是科学上大的突破,而是技术积累到一定程度之后的大集成和使用效果上的大突破,是工程实践的一个里程碑。

Chat GPT已具备一定的对动态、开放、场景的认知能力,Chat GPT为我们打开了一个通向通用人工智能的窗口。尽管Chat GPT还是一个黑盒子,它的创造者OpenAI自己最近也发表文章,说自己也不清楚为什么Chat GPT的表现如此出色,背后的机理和原理到底是什么,其实现在这也是国际上人工智能界的很多人攻关的一个方向。

系统是超级的算法加上超级的算力,再加上超级数据的耦合,终于创造了工程的奇迹。在算法层面,训练Chat GPT大致上分三步。第一步,是自监督学习,让海量的文本知识进行一个统一的表示。

第二步,监督学习。使模型可以理解并遵循人类的指令。

第三步,强化学习。使模型以符合人类偏好的方式完成内容的生成。

大模型及技术演进态势

总结大模型及技术的演进有四个方面的发展趋势。

第一个发展趋势信息技术应用和创新生态发生巨变。

第二个发展趋势重塑再造决策智能的范式。

第三个发展趋势向小型化和领域化方向发展。

第四个发展趋势更加通用的人工智能有望实现。

党和国家早已在人工智能领域做了前瞻性布局,科技部和其他单位通过各种专项都支持了一批产出非常丰厚的项目,新一代人工智能研究的体系其实已经形成了。人工智能基础研究也已从传统的数据智能扩展到了人工智能的五大形态,大数据智能、跨模态智能、群体智能、混合增强智能和自主智能。尽管美国的总体上讲在人工智能领域依然领先,但是我国在一些重要领域与美国的差距正在持续缩小。

发展我国大模型的一些思考

对我国大模型技术培育和突破,有几点不成熟的思考。

第一点思考需要加速大模型技术的落地应用。

点思考建议集中优势力量突破通用底座大模型。

点思考进行多种技术路径的交汇融合通向AGI。

相比而言,人脑的功耗非常低,计算效率也非常高,我们国家在人工智能与脑科学融合交叉方向已经有了很好的研究基础。借这个机会也简单介绍一下,我们所研发的大模型“紫东·太初”。我们所大模型的研究是2019年开始的,2021年的7月发布了紫东太初1.0,紫东太初1.0是全球首个千亿参数的图文音三模态大模型,它实现了跨模态数据之间的统一表示和相互生成,从一专一能迈向了多专多能。在2022年的世界人工智能大会上,“紫东太初”1.0,获2022世界人工智能大会SAIL奖。我们所即将发布的紫东太初2.0,是面向物联网时代的大模型,在单模态形式下,可分别对文本、图片、音频和视频等不同模态数据单模型建模。

最后,做一个简单小结。充分发挥我国人工智能应用和市场优势,多层次推动人工智能大模型及演进技术,建立从垂直行业大模型,到通用底座大模型,再到通用人工智能的多层次大模型的演进技术,对于建立能满足我国数字经济可持续发展的灵活低碳AI至关重要。

谢谢大家!

(以上内容根据嘉宾发言速记整理)

扫一扫在手机上查看当前页面

附件下载