国内又一开源大模型发布,To C赛道越来越精彩了!

AI前沿人 2023-11-07
2878 字丨阅读本文需 7 分钟

零一万物6日正式开源发布预训练大模型 “Yi系列模型”。此次零一万物开源发布的Yi系列模型,包含34B和6B两个版本。

据悉,在Hugging Face 英文测试公开榜单 Pretrained 预训练开源模型排名中,Yi-34B 在各项性能上表现强劲,以70.72的分数位列全球第一;同时,在C-Eval中文权威榜单排行榜上, Yi-34B超越了全球所有开源模型位列第一。

此外,此次开源的Yi-34B模型还发布全球最长、可支持200K 超长上下文窗口(context window)版本,可以处理约40万汉字超长文本输入。

目前,Yi系列模型已在 Hugging Face、ModelScope、GitHub 三大全球开源社区平台正式上线,同时开放商用申请,给开发者在使用LLM的过程中提供更多、更优质的选择。

零一万物创始人及CEO李开复表示:“零一万物自创立之初就坚定了全球第一的初衷和目标。自3月底官宣、团队逐渐到位,6、7月开始写的第一行代码,零一万物在短短的4个月时间之内,做出让我们非常自豪地的产品。”

同时,李开复强调,34B的模型尺寸在开源社区属于稀缺的“黄金比例”尺寸。相比目前开源社区主流的7B、13B等尺寸,34B模型具备更优越的知识容量、下游任务的容纳能力和多模态能力,也达到了大模型 “涌现”的门槛。开发者基于Yi-34B模型,可以打造非常多领域和类型的商业应用。

谈及零一万物下一步计划,李开复透露,在完成 Yi-34B 预训练的同时,已经旋即启动下一个“千亿参数模型”的训练。同时,零一万物还将基于Yi 基座模型,快节奏开源发布一系列的量化版本、对话模型、数学模型、代码模型和多模态模型等。

不过,李开复也强调,AI 2.0是巨大科技革命,平台和应用将改变世界,大模型能力到位后,最大的商机一定是ToC超级应用(Super APP)。

大模型向杀手级应用进化

几个月的重度使用,让小刘切身感受到了国内大模型的迭代。他主要使用的讯飞星火与文心一言,同样是在国内大模型的C端赛道中,最具代表性的两家。

最为明显的变化,在于大模型已经从最初一个简单的文字对话窗口演变为支持图、文多模态交互窗口,而且文心一言、讯飞星火等面向用户的大模型都在陆续上线不同的场景prompt,帮助用户降低使用门槛。

小刘称,他刚开始使用讯飞星火时,不仅多轮对话与交互能力较差,大约5~8次对话后,大模型便会“忘记”之前的对话,甚至还经常碰上一次回答难以生成全文的“断裂”现象,其原因或许在于讯飞星火对生成tokens数的限制。

然而现在,小刘反映称,讯飞星火已经可以轻松生成千字规模的文章,虽然偶尔免不了一些AI痕迹严重的口水话,但是在2~3轮对话中基本可以解决。

不甚愉快的使用体验一度让小刘转而投入文心一言的怀抱,但随着场景prompt的出现,小刘开始在两家之间摇摆。我们可以看到,即使讯飞星火入场相较文心一言更短,但模型能力以及消费级的基础应用却可以很快追上。单就模型而言,已经露出同质化竞争的迹象。

况且我们放眼全球市场的话,还存在如OpenAI、Claude等闭源寡头,单纯以模型为商业化支点将面临巨大的竞争压力。事实上,深入产业的商业化叙事与开源拥抱市场的低门槛叙事便是在这样竞争压力之下所诞生。

进一步说,C端大模型的竞争不在于模型本身,而需要另一个支点。目前看来,这一支点大概率会是杀手级应用。

“卷大模型没有意义,卷应用机会更大”,正如百度CEO李彦宏所说,C端大模型的竞争已经进入应用层,一款杀手级应用的出现将具备率先收割大部分用户并成为“超级入口”的潜力。就像曾诞生了《愤怒的小鸟》、《水果忍者》等应用的IOS。

如果我们参考IOS生态的发展路径,首个爆款《愤怒的小鸟》的出现相比App Store的出现晚了一年左右时间,这或许是我们期待的首个爆款出现所需的时间。这款应用可能出现在任何一款面向公众的大模型中,除了内部开发外,发力应用层的玩家们迫切需要的是为第三方开发者们提供完整工具链与生态环境。

从百度近期的动作来看,我们不难发现因循这一逻辑的布局。

近日,百度在其年度的云智大会上为5月31日开启的“文心杯”创业大赛颁奖,并推出百度智能云千帆大模型平台2.0,其中隐藏着的暗线便是百度依据第三方开发者的反馈,就模型开发的工具链,自3月27日发布的千帆大模型平台1.0版本迭代。

内部开发方面,百度也将自己作为立身之本的搜索优先重构,文心一言界面的百度搜索插件默认开启,而代表AI能力的“对话”入口也百度网页端的子栏目中位于最靠前的位置——两者互为入口,走上了“结合”这个最基本的重构之路。

只是在使用体验上,AI搜索还存在数据时效、幻觉等固有问题,导致AI搜索的用户体验甚至不如纯粹的搜索。即使考虑到这大多是大模型目前的共同问题,其“重构”的逻辑也与百度喊出的“AI原生”并不相关。

参照移动互联网的迭代经验,传统互联网中存在淘宝、QQ等应用只需要简单无线化便可以搭上移动互联网快车的先例,在确保不掉队的前提下谋求更大的业务可能。只是更大的机会在于原生应用,无论是基于手机定位能力的网约车还是基于手机即时通信能力的微信。

相比既往业务的重构,原生应用成为爆款的可能性会更大。

商业化仍需持续探索

现阶段,大模型的盈利方式主要包括大模型、大模型+算力、大模型+应用。其中,大模型和大模型+算力为主要盈利方式。

智谱AI盈利方式和行业盈利方式基本一致,一是根据客户需求,提供大模型定制化开发服务。云端私有化本地私有化最高价格分别为120万元/年和3690万元/年。

二是标准版大模型,提供API接入方式,按照tokens使用收费。ChatGLM-Turbo、CharacterGLM、Text-Embedding收费标准分别为0.005元/千tokens、0.015元 / 千tokens、0.005元/千tokens。

这里的tokens可简单理解为“字”或“词”,目前市场上针对tokens尚缺乏一个完整的标准。通义千问、Chat GPT、文心一言的1token相当于1个汉字,星火大模型和Baichuan53B相当于1.5个汉字,混元大模型则为1.8个汉字,英文上几家大模型企业定义更是千差万别。

收费标准上,除Chat GPT接近1元/1k token,其他大模型企业费用相对便宜,这虽能提高大模型在TOC端的渗透率,但也意味着大模型厂商需完成海量用户积累才能给企业带来更多营收。

据七麦数据显示,文心一言iOS端、讯飞星火iOS端近一个月日均下载量均在2万以下。同时考虑到APP下载到次日留存、七日留存会存在较大的漏斗模型。显然,当前文心一言和讯飞星火iOS端真实用户数量明显不足。

文心一言虽效仿微软Colpilot推出包月会员服务,但一方面ToC端用户被移动互联网免费教育多年,会员付费意识不强。如腾讯音乐今年二季度会员付费率为16.7%,这一数字和Spotify40%以上的付费率相比,整体偏低。

另一方面,ToC端对大模型尝鲜感较强,大模型现有能力对用户留存有限。厂商对ToC端收费后续将陷入用户流失,增加广告投放费用获取新用户,用户持续流失的恶性循环中。

在ToB端,因我国企业净利润率和欧美企业相比尚存在差距,国内企业软件付费意识普遍不强,这点从中美软件收入占GDP比重也能看出。而且在当前中小企业、民营企业普遍追求降本增效活下去的背景下,其自然优先考虑投产比问题。

但ToB端定制大模型成本极高,企业除需支付大模型厂商百万千万的定制费用外,也需同时承担数据准备和预处理的成本、模型训练和调优的成本、部署和运维的成本、模型更新和迭代的成本,以及法规合规成本,内部人员调动成本等等。

以科大讯飞T20学习机为例,因其搭载星火大模型,其价格比T10高出2000元。有知情人士透露,增加的2000元仍未能覆盖大模型成本。但目前市面普通学习机,其硬件版权购买的总成本也仅在1000-1500元左右,这就更加凸显了大模型在商业应用中的高昂成本。

高成本投入下,却是何时盈利的不确定。以搭载大模型实物产品为例,在消费者逐渐被全网最低价教育下,过高的产品售价很容易劝退消费者。仍以科大讯飞T20学习机为例,其8000多元的售价让其在京东平台上评论较少,抖音前端显示销量4000+。但考虑兴趣电商退款率问题,真实销量自然可想而知。降低产品售价,虽能带动销量,但无法覆盖大模型成本。矛盾之下,企业又会如何抉择呢?

爱分析相关报告也指出,目前大模型商业化提速较快的行业为能源和金融,其原因在于这两个行业密集分布的央国企。央国企数据基础设施建设完备、算力投入高、AI应用场景多且基础强,这些原因促进央国企与大模型的快速融合。

文章来源: 光子星球,DoNews,TechWeb

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:AI前沿人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...