从AI技术突破到行业大模型实践
科大讯飞智慧环保总经理
钟志杰
尊敬的各位领导和专家,大家下午好,下面由我给大家介绍从AI技术到行业大模型的实践和探索,因为时间有限我简要介绍一下人工智能技术的一些发展史。
一、人工智能发展历程和最新进展
人工智能从1956年达特茅斯会议开始之后,经历了四次浪潮,第一次浪潮是1970年左右的时期。第二次浪潮主要是在1990年左右,第三次浪潮是在2000年之后,第四次浪潮在2022年以后,我们富国的ChatGPT之后整个的浪潮掀起得快,人工智能的定义其实就是和人一样进行这样感知、认知包括决策的人工程序或者一个系统。
我们对人工智能整个的技术分为三个层次的定义,第一运算智能,就是能写会算,这个方面得到其实应用得比较多。第二感知智能,就是让机器能听会说,能看会认,这个方面举个通俗的例子,能够让机器像人一样把话说出去,也就是语音合成,大家在现在这个技术应用经常会用到,不管是在场馆的播放,或者公交车的报站等等,包括客服电话的服务等等都有大量的语音合成技术的应用,大家在用导航的过程中都会用到郭德纲的声音等等这里面都是语音合成技术的应用,包括我们的语音识别,包括现在图文识别或者是行为识别等等,都是我们大量的能看会认的动作。第三认知智能,能够让机器像人一样,能理解、会思考,这也是人工智能发展的最后一个层次。
我们从感知智能来看,能看会认科大讯飞在医疗领域的应用,肺结节影像识别,已经在2017年达到了医生的平均水平。目前在视觉识别上,大模型的任务识别已经超过了人类平均水平。
同时,在复杂场景图文识别全面应用,不管在原来传统的印刷体,包括现在手写体公式的一些识别上,都取得了重要突破。特别是在美国被纳入美国实体名单之后,2022年多项国际识别比赛中,突破了多层嵌套的公式识别,都取得了相应很好的成绩,都是冠军。
下面给大家看一个例子,我们说的感知智能这块取得的成效。语音识别更多运用识别,在大模型的加持下最新的一些效果。
这是我们除了中文识别之外,在多语种识别包括在意图理解最新的突破。智医助理2017年通过了国家临床执业医师资格考试,我们的智医助理考的是456分,超过了96.3%的人类考试。同时,教育领域广泛应用整个认知智能。我们在12个省级行政区的高考推广整个认知智能应用。同时30个地市的中考包括3000多所学校里常规化应用我们的人工智能去做整个作文的评分系统。
科大讯飞在2023年5月份发布了讯飞星火1.0版本,目前为止发布了最新的X1版本整个效果对标了OpenAI的o1,跟华为打造了首个基于全国产化自主可控的全算力平台训练平台。我们基于此前在强化学习方面的积累,2024年10月份实现了搜索整个算法的创新,跑通了深度推理模型的一些算法。
目前发布的X1星火大模型的版本,参数仅仅是我们DeepSeekR1的1/50。我们可以看到相应的一些不管是在我们语种识别等等各个领域的表现上来讲,基本上都是差不多的。
看一下我们在认知智能,从语音交互到我们语音视频流实时多模态交互上面的一个能力表现。这是我们科大讯飞打造的一个虚拟人。
我们现在这个虚拟人在很多领域,特别是在客服领域,都在深度应用。以上是我们的一些人工智能技术的介绍。基于我们在各个行业的一些应用探索。
二、行业大模型建设路径
通用大模型在赋能中常见问题,一是不懂行业知识。行业知识通用大模型虽然广泛学习各种知识,但是对每一个特定行业里面的特定领域的知识是不足的,特别在专业知识上的积累和理解,会导致知识缺失的问题,包括模型幻觉的问题。现有大模型怎么训练出来的呢?通过海量知识去做了一些预训练,预训练解决模型知识的问题,能够决定模型的上限,预训练之后做一些微调或者是强化增强、训练增强都是做后处理。后训练主要是解决模型对齐的问题,让模型在预训练过程中获得的能力能够更好发挥出来。后训练的效果基本上直接决定了模型的实际效果。二是解决它不能理解我们任务的类型是什么。我们在专业领域通常有一些特定应用场景,特别是这些特定业务场景本来复杂度比较高,如果只用通用大模型直接一些问答,基本上没有办法实现专业的一些任务理解,包括我们的实现路径,也没有办法做到高精度地执行。
基于以上的问题,我们对行业大模型的构建整个技术路线做了分层:
第一,分层建设技术路线
L0层整个基础通用大模型,本身我们各个领域都在推动。
L1层行业大模型的构建,目前各个行业都需要做的一个行业大模型,本身需要采取增强的预训练技术+微调训练方法,我们把语料的构成,包括从语料的配比到构建的方案等等,包括适用场景做了区分。
L2场景就是场景大模型,特定的场景里面用到的一些,包括我们的一些应用等等,重点采用一些微调的方式。整个行业构建,刚才我看主任整个体系构建里,也是按照这个逻辑来设计的。这个逻辑设计保证大模型以后不管多模型的调用都有很好的效果。
我们在行业大模型整个构建之后,还在规划一个从底层规划到执行落地全套解决方案里非常重要的点,整个体系建设不管从算力开始、建设开始,我们本身科大讯飞做的时候,选择了跟华为合作。所以,我们有全国首个万卡全栈国产化的一个集群。
第二,顶层规划到执行落地的全套解决方案,我们在整个采集/采编过程中,高质量数据的语料构建的工具链已经是完整的,有一个完整的工具链。训练的模型可以通过各种尺寸的大模型都可以通过可视化的方式有一些工具链供大家来选择。
能够解决大模型落地的“最后一公里”。同时,我们也是国家网信办备案的全面开放的大模型。我们在整个过程中,也可以通过这样一个统计数据证明我们的应用成效。
科大讯飞刚才说到智能体平台,是一套基于大模型开发智能化应用的方案和工具的一个沉淀,主要面向单点应用解决大模型快速开发的工具问题。
第三,面向行业场景,企业在生产经营智能化的经验能够沉淀下来,这里可以通过选定基础大模型的建模方式,提供一整套的智能体开发平台。
当然,基础大模型不管是用讯飞星火还是DeepSeek都是可以的,同时在信源的接入上,我们可以接入内外部的信源,或者贯穿政府内外部的信源可以覆盖高频场景的信息查询,同时我们快速的开发工具链和技能,包括我们打通了行业私域知识等等,能够通过我们增强的技术让我们整个使用效果越来越好,通过这样的智能体平台,未来我们在各个场景里面都可以打造出来更好用的智能体。基于以上智能体平台的介绍,给各位领导看一下整个智能体平台的演示。
因为这个视频比较长,最后一个模块其实就是行业大模型创新的一个实践分享,这里面也有大量的视频,后面大家有需要的话可以给大家再分享一下,包括我们在20多个行业里面其实在构建这样一个行业大模型,其实环保之外我们在水利、政务、工业、法律、科研、传媒、石化等等各个领域都在构建行业大模型,目前科大讯飞本身自己已经有了300多个智能体的应用,包括在行业里的应用,包括一些通用的智能体应用等等。
最后我们对生态环境行业构建大模型的规划和建议,规划统一调度自主可控的算力网,构建功能多样规范统一的一个工具链,统一标准的管理运营体系等等,发布自主领先可靠的环保行业大模型。我看部里面整个架构和构建都是非常成熟的,也希望有机会更多地参与到生态环境大模型构建的事业里面来。以上就是我的汇报,不足之处请各位领导批评指正。
(以上内容根据嘉宾发言速记整理)
扫一扫在手机上查看当前页面
