橙色云资讯 - 工业互联网行业信息门户

竞相研发大模型，各家资本市场表现如何？

智者先行 2023-09-21

3231 字丨阅读本文需 8 分钟

ChatGPT热潮涌动，正处于冷静期的人工智能投资和产业布局迎来小阳春。

但对于大模型概念，确实喧嚣过，但是目前来看，繁华褪尽，市场似乎并不买账。

8月15日，《生成式人工智能服务管理办法（征求意见稿）》开始施行，AIGC产品合规之路明朗，于是，国产大模型密集发布，百度、讯飞、商汤等一众大模型玩家开始抢夺ToC市场。

那么人们手机中的“第一个大模型应用”能不能成为AI生成的“第一入口”？值得深究。

一、“AI大模型”是什么？有什么用？

如果将AI比作电力，那么大模型则相当于发电机，能将智能在更大的规模和范围普及。

大模型的智能能力在未来将成为一种公共基础资源，像电力或自来水一样随取随用。

每个智能终端、每个APP，每个智能服务平台，都可以像接入电网一样，接入由IT基础设施组成的智力网络，让AI算法与技术能够更广泛地应用于各行各业。

最底层是AI通用大模型，上面可以做AIGC，比如说Midjourney可以画画，Jasper可以写文案等；

也可以基于底层模型做对话机器人，比如基于ChatGPT。

在美国，除了OpenAI和巨头，还有另外三、四家创业公司也都在做AI通用大模型，都有大几亿美金的投入。

首先它有超强的语言能力，在学习语言的过程中，也学习了很多知识和逻辑。

模型学会了非常底层的结构和机制。万物都是自然产生的，语言也好，生物结构也好，它一定符合某种我们目前难以解释的规律。

模型经过互联网上所有的数据训练之后，它也获得了某种属于自己的解读方式。

现在的通用大模型，即使进行了微调后，依旧可以做多个任务。

预训练的核心是让它有基础的认知和逻辑能力，通过微调引导，让它能够在各项任务上处理得更好，知道怎么使用已有的知识。

二、国内公司与机构竞相研发

百度：用开源的深度学习平台“飞桨”训练“文心一言”

“目前，百度的大模型产品‘文心一言’没有开源，但训练出‘文心一言’的产业级深度学习框架——飞桨是开源的。”百度飞桨框架产品负责人张军说。

大模型训练会面临算力、存储、宽带等多方面的挑战，解决这些挑战才能让模型可训练，且能训练得快。由于百度“文心一言”是用深度学习框架“飞桨”训练出来的，所以“飞桨”的发展也跟“文心”系列大模型的发展是在基本同步调下进行的，最早像10亿的模型，只用数据并行就可以，后面到百亿级需考虑分组参数切片并行的技术，到千亿模型基本上需要考虑混合并行技术，更大规模的模型已经是MoE（稀疏专家模型）了。目前，“飞桨”已发布业内首创的4D混合并行训练策略，即包括以上四种方式，整个训练大模型需要几种并行策略混合同步使用，这样才能让大模型训练成为可能。

此外，为了把深度学习分布式训练做得更加智能化，“飞桨”还有一个端到端自适应的分布式训练架构。“飞桨”框架因为百度对大模型的需求原因做了很多分布式训练的方式，尤其是在参数服务器架构和稀疏大模型训练上做得比较多。张军表示，大模型训练是非常有挑战的事情，如果从最下面的基础设施到芯片，到上面的框架平台，到模型算法，再到上面的应用，整个全栈面临的挑战还需要一直探索和研究。

阿里巴巴：用“通义千问”模型提供开源服务

“通用AI，语言模型（LM）连接一切。”阿里巴巴达摩院高级算法专家林俊旸表示。在做“通义千问”模型时，他们发现一个强大的语言模型是通用AI系统的核心，它除了连接世界知识之外，还可以连接图像、语音、视频等各种模态，同时还能连接外部系统，比如开源模型和应用程序编程接口（API）。

“通义千问”是通义模型系列的一个新成员，而通义模型系列是阿里巴巴达摩院积极投身开源社区所做的开源模型，包括一系列的基础模型、自然语言基础模型、多模态基础模型等。其中，“通义千问”是通过大数据做预训练，得到的一个具有全面自然语言理解和自然语言生成能力的大模型。

“通义千问”能做哪些事情？林俊旸表示，它能进行对话聊天、逻辑推理、文案创作等，不仅是“玩具”，还能帮工作人员提升生产力；它还要走向多模态，通过一个强大的LM连接图像、语音、视频等，比如放一张吴京的照片，不仅能识别出来，还能给出他的介绍；此外，“通义千问”模型还能跟广大开源模型和开放API协调互动，典型应用如LM+搜索、LM+订外卖等。尤其是，“通义千问”能跟模型开源社区进行很好的互动，通过连接模型的方式实现更大的能力。

林俊旸总结道，“目前‘通义千问’在做的事情，就是以语言为桥梁，连接世界知识，以此为基础连接多模态，同时还能连接外部系统，打造生产工具。”

腾讯：面向AI大模型提供高性能无损算力网络

大模型需要大算力。腾讯数据中心网络架构师李宝嘉表示，由于大模型服务的用户数量逐渐增多，处理的任务也更加复杂，因此，模型规模就会变得非常大。而AI大模型训练的网络需求是大带宽、零丢包、高可靠，目前网络技术很难达到AI大模型预训练的需求。

为解决这一难题，腾讯AI大模型的整体框架最底层有两个平台，一个是星辰算力平台，负责端侧类的算力调度；一个是星脉网络平台，负责整网大规模集群的网络调度。在这两个平台上又构建了太极机器学习平台，能提供便捷的模型开发能力和部署能力，支撑各种类型的模型，尤其是针对ChatGPT类的模型也有定制化优化，保证训练效率，降低成本。

面向AI大模型集群网络技术的展望，李宝嘉表示，希望能和业界一起探索解决现在所面临的难题，如算力网卡方面希望能实现无拥塞网络，在网计算方面希望能实现计算加速等。

三、大模型向C端、B端渗透

大模型最直接的应用，是语音助手。语音助手领域的应用，最顺利的可能还是汽车。

文心一言收获了吉利、长城、红旗、东风日产、岚图，ChatGPT接入奔驰，星火大模型接入广汽，华为盘古接入赛力斯……这也是大模型最容易商业化的场景之一。毕竟，对于车载场景来说，语音助手应用是刚需，也是比较成熟的B端落地领域。

大模型向C端渗透过程中，虽然已经迈出重要的一步，但距离真正的大规模应用，恐怕还有距离。

如今的欢呼，倒像是半场开香槟，现实是大模型还远未到成熟的阶段。

人们需要接受的是，大模型看起来很强，但你真正用它去解决问题的时候，会发现真正没有那么的强。

对于一些最实际的，哪怕是简单的需求，大模型都还没有办法满足，背后有数据的问题，生态的问题，但归根到底，还是只能有限地解决实际需求。

首先是数据新鲜度的问题。在实际的使用过程中，我们发现，同样的问题，大模型给出的答案甚至不如搜索。数据新鲜度的问题，本质上是数据生态的孤岛问题。

大模型落地B端的一个最大阻碍是不能理解业务。

举个例子，金融领域是强数据导向的领域，人们需要在数据的基础上去做决策，如果把大量的数据以及金融理论用来训练AI，那么面对瞬息万变的市场，大模型的决策有多少的准确度？用户敢不敢用？

之前马斯克曾表示，FSD V12几乎完全是神经网络，构筑了一套端到端自动驾驶技术。也就是说，端到端的信息输入输出过程是一个“黑箱”。

你不知道AI是怎么具体做决策的，但是你最终会得到一个可用的结果。大多数时候，这样的应用是没有问题的，比如出行领域，人们需要的是安全到达目的地，即便是决策黑箱的问题存在，但并不影响实际应用。决策黑箱最大的问题是决策信任的问题，云到端的大模型也有类似的问题。

比如，你问大模型一个问题，AI问题给出的答案够不够真实可信？这个问题还需要花大力气解决。简单点说，要去教大模型什么样的结果是正确的，是易用的，这就需要不断把模型的输出结果跟现实去“对齐”。

这也是大模型落地C端的一个重要挑战。

输出结果的真实性，有效性能不能得到最基本的保证？这是大模型应用能否真正迎来大爆发需要解决的前置问题。

四、大模型产品化的窗口期不多了

事实上，AI赛道的泡沫被挤出之后，市场清楚地知道，大模型真正的价值还是在于产品化。而产品化的关键，不仅是技术的比拼，也是产品经理能力的比拼。

在这一点上，上个时代的“王者”们（比如阿里、腾讯）可能比百度们更有经验和话语权。

一方面，产品化的关键在于能够精准定义用户需求。

比如，大家目前都比较青睐于去做AI原生应用，但AI原生应用如何能够更好地去满足用户的实际需求，靠的还是产品定义。

另一方面，产品化之后，大模型才有差异化，而商业化其实是产品化自然而然的结果。

在体验过各家发布的大模型产品后，有这么一种强烈的感觉，虽然叫不同的名字，但大家的产品并没有太多差异，能够完成的任务类型都差不多。

比如，刚开始用文心一言，你会觉得确实很厉害，什么问题都能给出答案，一旦涉及稍微深度点的内容，就会发现他给出的答案太公式化，而且大多数时候像是空话、套话。

不只是文心一言、讯飞的星火大模型、商汤的商量SenseChat，大家表现其实都差不太多。

本质上，这是因为大模型本质上不是强人工智能，还是需要靠数据去不断训练，并不是真正意义上根据信息去做判断。所以差异化的关键，还是在于最终的应用产品。

所以，这些细分应用上的产品能力，可能会是用户能不能真正把大模型用起来的关键。

用户大量用起来之后，用来训练AI的数据足够多，AI大模型的能力便能够突飞猛进。ChatGPT真正的起飞，也是在大量用户涌入之后。

可以预见的是，大模型开放之后，AI原生应用会出现一波爆发，而在应用爆发之后，能够有多少用户留下来，可能是“文心一言”们需要深入思考的问题。

文章来源：互联网江湖，AI芯天下，亦城时报

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：智者先行

0 0

参与评论

登录后参与讨论 0/1000

下一篇黑科技加持让春晚拥有无限可能：盘点那些春晚上的黑科技，今年会有啥？

今天已经是腊月二十二了，再过8天就到了传统...

2022-01-24

竞相研发大模型，各家资本市场表现如何？

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

竞相研发大模型，各家资本市场表现如何？

参与评论

为你推荐

天玑8000加持！Redmi Note 12系列入网：首次搭载旗舰级芯片

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

半年融资827亿，1.2万字看懂新能源汽车产业图谱

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(3月第三周) | 工信部将开展汽车软件在线升级管理试点；湖南发布智能网联汽车产业“十四五”规划

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

中国智慧城市“药方”如何化解海外城市治理症结？

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

RISC-V只适用于嵌入式芯片？以IoT为立足点，RISC-V正在“征服”整个半导体世界

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

国产CIS开始向2亿像素时代迈进，巨头垄断格局或将被打破

国产屏厂TCL华星要打入苹果供应链：为iPad、MacBook出货LCD

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

Nreal国内首发AR眼镜，消费级AR眼镜潮即将爆发，VR/AR产业链开启“卡位战”

研究人员研发仿生二合一纳米电子传感器，可同时测量细胞电气和机械反应

国家电投与阿里巴巴宣布战略合作，数字化转型这条路上，央企各显神通

新材料七国的竞争版图：热门行业分布大集锦，未来10年的市场机会或许在这

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

SiC迎来“奇点时刻”，盘点近期产能、需求量、交易等行业大事件

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜ 镁客网每周硬科技领域投融资汇总

下一个10年，将会发生的12个趋势

从工业机器人产业链看智能制造机会

最新总结：冬奥会的100个创业机会

后疫情时代，OTA如何回血

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总