OpenAI大模型要开源,商业市场会不会受挤压?开源反而将带动商业

微观人 2023-05-16
2828 字丨阅读本文需 7 分钟

根据The Information的最新爆料,OpenAI即将发布一款全新的开源大语言模型。

虽然目前还不清楚,OpenAI是不是打算利用即将开源的模型,来抢占Vicuna或其他开源模型的市场份额。

但几乎可以肯定的是,新模型的能力大概率无法与GPT-4甚至GPT-3.5相竞争。

毕竟,270亿美元的估值也决定了,OpenAI最先进的模型将会被用于商业目的,尽管前两个版本的GPT都是开源的。

对此,OpenAI的发言人没有回应置评请求。

开源大模型,要颠覆硅谷大厂?

UC Berkeley的计算机教授Ion Stoica正是使用Meta的研究开发Vicuna的学者之一。

为了提高Vicuna的能力,Stoica和同事们正在努力增加模型中的计算数量,这将有助于处理涉及推理的任务,比如写代码。

开发Vicuna的是一个伯克利的团队,每年的预算为数百万美元,其中大约50万美元来自包括微软、谷歌和亚马逊在内的上市公司。

UC Berkeley的计算机教授Ion Stoica表示,现在的免费AI模型,在性能上已经「相当接近」谷歌和OpenAI的专有模型了,毫无疑问,大多数开发者最终都会选择免费模型。

一方面,开源模型可以让开发者使用自己的数据来解决特定的问题。

另一方面,像Vicuna这种模型的训练成本甚至可以低至几百美元,而且还不用向大厂支付昂贵的使用费。

如果Stoica的看法正确,开源AI必将颠覆谷歌、OpenAI、微软等出售专有模型使用权的大厂的商业计划。

Vicuna的质量和开源AI的寒武纪大爆发,让谷歌工程师Luke Sernau警告同事,谷歌在努力追赶OpenAI时,太过关注专有软件了。

如果免费、高质量的平替没有使用限制,谁会去付费使用带有条条框框的谷歌产品呢?开源AI的发展正在超越我们,谷歌应该在开源社区中建立自己的领导地位,并放弃对我们模型的部分控制。

这份备忘录迅速在整个行业内引起了共鸣——即使Sernau或许高估了开源AI的能力,低估了它们的成本和风险,但大多数从业者都同意,Meta非常有可能从中获益。

比如,Meta在内部会使用AI模型进行内容推荐和广告定位,当开发者改进Meta的模型时,Meta就可以把这些改进纳入自己内部的AI。

Meta CEO小扎对此筹谋已久。

4月,在他与分析师的一次电话会议中,他曾这样谈到公司的策略——如果行业能够在我们使用的基础工具上达成标准化,那么我们就能从其他人的改进中受益,这样会更好。

谷歌倒是没有完全采用专有的方式来处理AI软件。

早在2020年,谷歌就发布了一个开源语言模型T5,让开发者可以构建能够执行翻译和摘要任务的软件。随后,谷歌又发布了一个更先进的Flan-T5。

但是,根据Stoica和其他从业者的说法,Meta发布的软件能够在谷歌模型的基础上做出显著改进,这让开发者选择Meta模型的可能性大大增加了。

不过,Stoica表示,谷歌在开源软件方面仍有两个优势。

1. 如果谷歌利用其不向外部开放的用户数据,模型在某些专业领域(如内容推荐)的表现可能会更好。

不过,谷歌发言人表示,公司并没有在现有用户数据上训练其基础模型。

2. 搜索公司在管理大规模计算机基础设施方面的专长,意味着它能够以更低的成本来运行模型,包括为云客户提供服务。

与此同时,OpenAI在收集数百万人与ChatGPT互动方式的数据上,已经抢得了先机,这会更有助于OpenAI改进AI软件,更不用提它和微软的合作协议。

开源蓬勃发展

开源软件已经存在了几十年,这是互联网生态运行的基础。但是构建强大模型的成本意味着开源人工智能直到大约一年前才开始腾飞,它很快就变成了一个富矿。

看看最近几周就知道了。2023 年 3 月 25 日,倡导免费开放人工智能的初创公司 Hugging Face 推出了首款开源聊天机器人 HuggingChat,对标 ChatGPT 即 OpenAI 于 2022 年 11 月发布的聊天机器人。 HuggingChat 建立在一个名为 Open Assistant 的开源大型语言模型之上,该模型经过了大约 1.3 万名志愿者的帮助训练,并于一个月前发布。但是,Open Assistant 本身是建立在 Meta 的 LLaMA 之上的。

然后是 StableLM,这是一个开源的大型语言模型,由 Stability AI 公司于 3 月 19 日发布,该公司开发了热门的文本到图像模型 Stable Diffusion。一周后,也就是 3 月 28 日,Stability AI 发布了 StableVicuna,这是 StableLM 的一个版本,与 Open Assistant 或 HuggingChat 一样,它针对对话进行了优化(StableLM 是 Stability 对 GPT-4 的回应,而 StableVicuna 则对标 ChatGPT)。

这些新的开源模型只是过去几个月发布的一系列模型的一部分,包括 Alpaca(来自斯坦福大学的团队)、Dolly(来自软件公司 Databricks)和 Cerebras-GPT(来自人工智能公司 Cerebras)。这些模型大多建立在 LLaMA 或 EleutherAI 的数据集和模型上,而 Cerebras-GPT 遵循 DeepMind 设置的模板。未来肯定还会出现更多。

对一些人来说,开源是一个原则问题。人工智能研究员、YouTube 用户扬尼克·基尔彻(Yannic Kilcher)在一段介绍 Open Assistant 的视频中说:“这是一项全球社区的努力,旨在将对话式人工智能的力量带给每个人……让它摆脱少数大公司的控制。”

“我们永远不会放弃为开源人工智能而战,”Hugging Face 的联合创始人朱利安·肖蒙德(Julien Chaumond)曾在推特上写道。

对其他人来说,这是一个利益问题。Stability AI 希望在聊天机器人上复现它在图片生成上取得的辉煌:推波助澜,然后从使用其产品的开发人员的创新中受益。该公司计划充分利用这一创新,并将其重新投入到面向广大客户的定制产品中。Stability AI 的 CEO 爱马德·莫斯塔克(Emad Mostaque)表示:“我们激发创新,然后进行挑选。这是世界上最好的商业模式。”

不管怎样,大量免费和开放的大型语言模型将这项技术推向了世界各地数百万人的手中,激励了许多人创造新的工具并探索它们的工作原理。比德曼说:“使用这项技术的途径比以往任何时候都要多。”

“坦率地说,人们使用这项技术的方式多得令人难以置信,令人兴奋,”美国弗里德弗兰克律师事务所的律师阿米尔·加维(Amir Ghavi)表示。他代表了包括 Stability AI 在内的多家生成式人工智能公司。“我认为这证明了人类的创造力,而这正是开源的全部意义所在。”

“开源”带动“商业”

那么问题来了,一家提供“平台社区”的“开源”公司,又是如何盈利的呢?

首先,“开源”就是一个正确的决定。

Hugging Face凭借开源项目Transformers,积累了巨大的影响力,聚集了广大开发者构建了庞大的社区Hugging FaceHub,也赢得了客户与投资者的信任,这使得它的商业化转型水到渠成。

对此,红杉资本合伙人PatGrady也表示,“他们优先考虑的是应用,而不是变现,我认为这是正确的做法。他们看到了Transformer模型在NLP之外的应用方式,看到了成为GitHub的机会,这不仅是面向NLP,而且会延伸到机器学习的每个领域。”

而且,纵观过去十年,市场上初创公司的创业历程,会发现开源模式的商业可行性得到过有力的印证。像MongoDB、Elastic、Confluent等,都是收入增长最快的开源公司,它们都实现了盈收,并且还在市场中存活了下来。

Hugging Face的创始人之一,Clément也因此坚信,“初创公司可以通过某种方式为开放的社区赋能,此种方法产生的价值,比通过搭建一个专有工具,产生的价值高出上千倍。”

甚至公开表示,“考虑到开源机器学习的价值和它的主流地位,其使用量就是递延收入。机器学习会成为技术开发的默认方式,而且Hugging Face会成为这方面的头号平台,并创造出数十亿美元的收入。”

因此,Hugging Face选择了“开源带动商业”,这一商业化发展路径,并在2021年开始提供付费功能。

目前,Hugging Face的盈利业务主要有三类:

付费制会员:提供更加优质的服务和社区体验,来获得收益;

数据托管:根据不同参数需求,提供不同的按小时收费托管服务;

AI解决方案服务:目前的主打产品,围绕NLP、Vision等方向为客户提供定制化解决方案,以获得技术服务费用。

值得一提的是,从2020年开始,Hugging Face就开始做面向企业的定制自然语言模型,并推出了包括AutoTrain、InferenceAPI&;Infinity、PrivateHub、ExpertSupport等,针对不同开发者类型的个性化产品。

目前,1000多家公司已经成为了Hugging Face的付费客户,主要是大型企业,包括英特尔、高通、辉瑞、彭博社和eBay。

2021年,Hugging Face已经实现收入1千万美元,从数据上来看,Hugging Face这套的“开源带动商业”的策略是成功的。

这也印证了Hugging Face的CEO,Clément所说的,“公司不需要从创造的价值中获取100%的红利,只需将其中1%的价值变现,但即便只是1%,也足够让你成为一家高市值的公司。”

简而言之,Hugging Face凭借开源社区积累影响力,而后逐步向SaaS产品和企业服务拓展。这种渐进式的转型,让Hugging Face在开源和商业化之间,取得了良好的平衡,也是其能取得成功的重要原因。这种发展策略也让Hugging Face成为了AI界独树一帜的存在,并为其他AI初创公司树立榜样。

但是,开源生态也有它自己的软肋,因为商业化的发展很可能会伤害到自然生长的社区环境。对此,Hugging Face的做法是加强对技术的管控,维护自己的开源生态;同时,向科研领域深挖。

“机器学习技术仍然还处于早期发展阶段,开源社区的潜力是巨大的。在未来5到10年,我们一定还会看到更多开源机器学习公司的崛起。”

文章来源: 新智元,DeepTech深科技,极客公园

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...