工业大模型应用报告
参与单位
指导单位:中国通信工业协会
撰写单位:腾讯研究院中国通信工业协会物联网应用分会毕马威企业咨询(中国)有限公司腾讯云智慧行业五部
目录
大模型为工业智能化发展带来新机遇
1.1. 大模型开启人工智能应用新时代1.2. 大模型有望成为驱动工业智能化的引擎1.3. 大模型应用落地需要深度适配工业场景
大模型和小模型在工业领域将长期并存且分别呈现U型和倒U型分布态势 .6
2.1. 以判别式AI为主的小模型应用呈现倒U型分布 62.2. 以生成式AI为主的大模型应用呈现U型分布2.3. 大模型与小模型将长期共存并相互融合
3. 工业大模型应用的三种构建模式, 11
3.1. 模式一:预训练工业大模型 113.2. 模式二:微调 123.3. 模式三:检索增强生成 133.4. 三种模式综合应用推动工业大模型落地 14
大模型应用探素覆盖工业全链条 16
4.1. 大模型通过优化设计过程提高研发效率 16大模型拓展生产制造智能化应用的边界4.2. 194.3. 大模型基于助手模式提升经营管理水平 234.4. 大模型基于交互能力推动产品和服务智能化 25
28
工业大模型的挑战与展望
5.1. 工业大模型应用面临数据质量和安全、可靠性、成本三大挑战5.2. 工业大模型应用将伴随技术演进持续加速和深化
1.大模型为工业智能化发展带来新机遇
1.1.大模型开启人工智能应用新时代
大模型引领人工智能技术创新和应用.自1956年达特茅斯会议(DartmouthConference)提出人工智能的概念以来,人工智能技术经历了多个发展高峰和低谷.在这一长期的发展过程中,人工智能技术不断演进,逐步朝者更高的智能水平和适应性发展.2022年11月30日,OpenAI发布了ChatGPT,引发了行业热潮,直至今日,业界普遍认为,大模型时代已经到来,也象征着人工智能并启了迈向通用人工智能(AGI ArtificialGencral Intclligence)的新阶段.在大模型出现之前,人工智能通常需要针对特定的任务和场景设计专门的算法,这种方法虽然在特定领域有效,但人们对“智能“的期望是能够适应多种任务和场景的智能系统,单一任务的人工智能系统已经无法满足这些更广泛的需求.大模型能够跨越传统人工智能的局限性,理解和推理的能力有了极大的飞跃,同时也提高了复用的效率,为人工智能技术在更多领域的应用提供了坚实的基础,推动人类社会迈向通用人工智能(AGI)的新阶段.
通用性和复用性是大模型的关键价值.2017年,GoogleBrain(谷歌大脑)团队在其论文《AttentionIsAllYouNeed》中创造性地提出Transformer架构,凭借注意力机制,极大地改善了机器学习模型处理序列数据的能力,尤其是在自然语言处理(NLP)领域.Transformer架构的出现,为后续的大模型如ChatGPT等奠定了技术基础.ChatGPT、Bert等大模型通过海量数据和庞大的计算资源支持,使得模型具备了强大的通用性和复用性.大模型可以被广泛应用于自然语言处理、计算机视觉、语音识别等领域的各种任务,能够为各种应用和开发人员提供共享的基础架构,并进一步通过微调、零样本学习等方式,直接在一系列下游任务上使用,取得一定的性能表现,支持不同行业、不同场景的应用构建.
大模型展现出三大基础特征.目前大模型并没有明确的定义,狭义上指大语言模型,广义上则指包含了语言、声音、图像等多模态大模型.如李飞飞等人工智能学者所指出,这些模型也可以被称为基础模型(FoundationModel).我们认为,大模型主要具备以下三大特征:
参数规模大:大模型的参数规模远大于传统深度学习模型.大模型发展呈现“规模定律”(ScalingLaw)特征,即:模型的性能与模型的规模、数据集大小和训练用的计算量之间存在幂律关系,通俗而言就是“大力出奇迹”.不过“大"并没有一个绝对的标准,而是一个相对概念.传统模型参数量通常在数万至数亿之间,大模型的参数量则至少在亿级以上,并已发展到过万亿级的规模.如OpenAI的GPT-1到GPT-3,参数量从1.1亿大幅拉升到1750亿,GPT-4非官方估计约达1.8方亿.
泛化能力强:大模型能够有效处理多种未见过的数据或新任务.基于注意力机制(Attention),通过在大规模、多样化的无标注数据集上进行预训练,大模型能够学习掌握丰富的通用知识和方法,从而在广泛的场景和任务中使用,例如文本生成、自然语言理解、翻译、数学推导、逻辑推理和多轮对话等.大模型不需要、或者仅需少量特定任务的数据样本,即可显著提高在新任务上的表现能力.如OpenAI曾用GPT-4参加了多种人类基准考试,结果显示其在多项考试中成绩都超过了大部分人类(80%以上),包括法学、经济学、历史、数学、阅读和写作等.
支持多模态:大模型可以实现多种模态数据的高效处理.传统深度学习模型大多只能处理单一数据类型(文本、语音或图像),大模型则可以通过扩展编/解码器、交叉注意力(Cross-Attention)、迁移学习(Transferlearning)等方式,实现跨模态数据的关联理解、检索和生成.多模态大模型(LMMs,LargeMulimodal Models)能够提供更加全面的认知能力和丰富的交互体验,拓宽AI处理复杂任务的应用范围,成为业