电厂|从超越 GPT-4T 说起:大模型如何走出“不可能三角”?

科技动态 2024-06-28 19:26 阅读:9

电厂|从超越 GPT-4T 说起:大模型如何走出“不可能三角”? 第1张

作者 商迪安‍‍

随着大模型在各个行业应用场景逐步推广开来,2024 年过半,“需求与问题同时涌现”成为了当前中国大模型落地需要面对的现状。

大模型应用的主要问题,源于著名的“不可能三角”理论。随着 2023 年大模型应用逐渐深入,各家大厂都陆续发现了大模型往往难以获取到特定领域的大量专业知识,而获取大量专业知识以及进行推理训练则需要大量的计算资源,进而导致大模型使用成几何倍增长。

同时,诸如 ChatGPT 等基于 Generative Pre-trained Transformer 架构的自然语言处理神经网络模型,本身存在着“无所不包“的特征,原理上决定了这是以牺牲特定领域的内容精度为代价。

在专业性、经济性与泛用性三点上难以取得平衡,这就是此前困扰大模型行业深度应用的“不可能三角”。

有了问题,自然有对应的解决方案,从 2023 下半年开始,面向行业头部企业、解决企业模型落地需求的方案如雨后春笋般出现,并针对此次已经存在很久的数字孪生、智慧城市、智能驾驶等领域,都能看到国产大模型的大量实践应用,并从其中快速迭代。

国产大模型的快速迭代,从讯飞星火的四个大版本迭代上能看成清晰的脉络:从 2023 年五月讯飞星火大模型正式推出,到今年五月底升级的讯飞星火 V3.5Max 版本时,已经在文本生成、逻辑推理以及数学/代码能力上超过 GPT-4 Turbo,再到 V4.0 版本七大核心能力全面提升,全面对标GPT-4 Turbo。有了大量行业数据作支撑,国产大模型的能力也随之突飞猛进。

在 2023 年上半年,科大讯飞与华为联手打造出中国首个万卡规模大模型国产算力平台“飞星一号”之后,人工智能+ 已成为国家战略。

用“国产化替代”一词形容,甚至也已经显得不够准确:国产大模型如有高国产化率以及很强的本土发展特征,这些特质同样是外来者难以替代的。

但随着过去一年的“试水“,大模型应用中也暴露出不少问题:其中最普遍的问题是模型与应用的结合,在大模型本身能力的基础上,需要深入理解行业需求。这也在很大程度上决定了行业早期的用户画像。

根据证监会科技发展司司长姚前的说法:国内大模型大多在发展初期就考虑到了私有化部署的需求,让国产大模型在 2024 年呈现出百花齐放的涌现景象,几乎所有模型在训练之初就考虑私有化部署的需求,包括在车机、手机以及更多物联网设备端侧部署的能力。

这些应用中逐渐清晰的用户特征,在讯飞星火过去一年的发展中几乎都能找到对应的落地方案:在汽车领域,包括一汽、奇瑞、广汽、长城等厂商,都选择了语音交互国内市场占有率最高的星火汽车智能座舱,来作为下一代智能汽车座舱体验的解决方案。

在物联网领域,讯飞星火目前已经与海尔、美的等头部企业建立合作,并发布基于讯飞星火打造交互模式的智能家居产品;这些都是基于科大讯飞打造的云边端一体化以及软硬件一体化的解决方案。

在 6 月 27 日、科大讯飞星火大模型 V4.0 的发布现场,科大讯飞展示了其在多人混杂场景语音转写能力的突破,三位讯飞研究员在现场同时混杂说话,正常人耳甚至已经难以分辨,但借助于基于多模态的声音识别技术,讯飞听见已经能准确从其中实现三人各自的语音分离,并实时转写出对应的速记内容。

电厂|从超越 GPT-4T 说起:大模型如何走出“不可能三角”? 第2张

其中,包括制造业与交通等相对传统的领域,由于大模型应用起步较晚,往往在急需数字化转型的同时,也缺乏规范的数字化业务经验。

但这些用户在尝鲜阶段仍然有着大量的需求:今年年初爆发的“大模型厂商 API 价格战”,很大程度上就是这种需求的体现:用户与开发者对大模型有着巨大的使用与测试需求。

机遇中也包含着大量前所未见的挑战:这些对大模型有急切需求的用户中,大部分此前并未接触过在工作流程中融入大模型的概念。

很多潜在用户即使清楚大模型对于自身业务的潜力,却并不清楚这种能力该如何跟现有业务结合,现成的大模型整合方案中,不少也难以利用用户的数据集精调出适合用户实际需求的大模型。

这些问题,即是对模型能力本身的考验,也对模型背后厂商技术整合能力提出了更高的要求。用户寄希望于行业模型能带来实打实的改变,有了改变,才有可能更加科学地认识大模型能力的边界。

”愿意付出成本,就意味着一定要看到回报“ 一位接受采访的智能家居产品经理的回答,很能代表当前大模型行业应用潜在用户的普遍态度:如果没有相比此前成倍的增长,即使模型本身价格已经卷到极致,也很难吸引用户买单。

但换言之,在突破了技术难点,能给传统行业用户急需的数字化增长与精准触达需求带来解决方案,自然也会吸引传统行业用户:自去年五月发布以来,讯飞星火大模型已经成为包括国家能源集团、中国石油、中国移动、交通银行等传统行业多领域头部企业的首选。

“这些都是客户慎重选择、各家 PK 后的结果“ 科大讯飞刘庆峰在介绍讯飞星火大模型用户画像时这样说到。这些分布在各行业、在各自的领域有大量优质用户的企业,在成为讯飞星火用户的同时,也通过自身的实践,累计着大模型解决方案的落地经验。

即使“大模型改变世界”的时刻尚未到来,在这个过程中,大模型成长,会逐渐从满足每个人的需求,变成满足每一个用户独一无二的需求,这个问题看似矛盾,却是当下大模型时代人类最有潜力解决的本质问题:

大模型落地的竞争,归根结底是行业解决方案和服务能力的竞争。

在这一问题的回答上,科大讯飞既有着世界一流能力的模型,也有着过去十余年软硬件布局累计下来的 C 端软/硬件产品开发实践经验,以及数百万的智能硬件用户;这些先发优势,让科大讯飞在大模型应用中,有着近乎先人一步的落地速度。

在发布讯飞星火 V4.0 的同时,科大讯飞同时还发布了包括星火智能批阅机这样一款硬件,在支持多学科多题型批改的同时,还能实时生成多维分析表格。用自身行动给大模型在教育领域的落地做了首先示范。让讯飞星火有了“最会做题的大模型“这一称呼。

这也反映出大模型眼下最真实的需求,用户需要在每一个领域,都可以快速开箱即用的产品,以及有足够经验的厂商,在不同领域复制出“最会驾驶的大模型““最会看病的大模型”。

尤其是自创业以来就坚持大模型全国产化战略的科大讯飞,在中美大模型逐渐探索出大相径庭的两条发展道路的当下,也更有机会打造出独属于中国用户的各类消费大模型产品。

电厂|从超越 GPT-4T 说起:大模型如何走出“不可能三角”? 第3张

在最初的喧嚣逐渐尘埃落定之后,帮大模型落地打通“最后一公里”,成为了解决之道以及生存的关键,那些难以在实际应用场景中生存下来的大模型,最终都将被淘汰。

在大模型能力的基础上,只有准确洞察用户需求中大模型的落地定位,给现有体验带来改变的大模型,才有机会成为更多用户的选择。并在这个过程中逐渐完善大模型目前存在的短板,形成正向循环。