GPT-4“王炸”发布:10秒就可做出一个网站,AI大模型战火愈盛谁能占据高地?

人工智源库 2023-03-15
2335 字丨阅读本文需 6 分钟

CHATGPT热度还未散去,CHATGPT开发商OpenAI发布了更强大的GPT-4,堪称“王炸”产品。

当地时间3月14日,OpenAI公开发布大型多模态模型GPT-4,与CHATGPT所用的模型相比,GPT-4不仅能够处理图像内容,且回复的准确性有所提高。目前GPT-4没有免费版本,仅向CHATGPT plus的付费订阅用户及企业和开发者开放。

1、GPT-4带来的四个惊喜

作为一个重要的迭代升级版本,GPT-4相对于上一代而言,在多个性能上有显著的提升,这没有让我们失望。具体来看,关键的升级主要是以下几个方面:

惊喜1、文字输入限制提升至2.5万字

上一个版本,输入的文字不能超过3000字,而GPT-4将这一限制提升到了2.5万字。这个提升,将进一步扩展其应用范围。输入的不再限制于问题,用户可以直接输入文本内容,比如一篇文章甚至一篇报告。

惊喜2、可以输入图片了

上一代产品只能输入文本内容,此次更新升级,可以输入图片内容了。

从这个例子可以看出,GPT-4可以可以“理解”图片的特征,而且可以理解多个图片之间的关联关系,并可以依据用户的指令,来将图片的特征描述出来。

惊喜3、更聪明、更准确

为了了解这两种模型之间的差异,OpenAI在各种基准测试上进行了实验,包括最初为人类设计的模拟考试。OpenAI继续使用最新的公开测试(在奥林匹克和AP免费回答问题的情况下)或购买2022-2023版的模拟考试。

可以发现,当任务的复杂性达到足够的阈值时,GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。

此外,OpenAI还在为机器学习模型设计的传统基准测试上评估了 GPT-4。GPT-4 的性能大大优于现有的大型语言模型,以及大多数最先进的 (SOTA) 模型,具体比较如下表:

惊喜4、深度学习堆栈可预测性的扩展

对于像 GPT-4 这样的大模型,进行广泛的模型调整是不可行的。因此,模型的可扩展性就具有重要的价值。

从上述结果可以发现,GPT-4 可以用更少的计算量来实现更准确的预测。

此外,OpenAI成功预测了HumanEval数据集子集的通过率,从计算量减少 1000 倍的模型推断,其结果如下:

可以发现,GPT-4 的表现要比GPT-3.5好很多。

根据 OpenAI 的描述,该模型展示了“在各种专业和学术领域对标人类水平的表现”。GPT-4 在模拟律师考试中获得了前10%的成绩,而其前身 GPT-3.5(ChatGPT 的基础)得分排位在后 10% 左右。

GPT-4 在其他各种考试中也表现出色,例如美国高校入学考试 SAT 数学考试,其获得了800 分中的 700 分成绩。然而,它暂时并不具备所有学科能力,例如在AP英语语言和作文中仅获得 2 分。

2、加速的 AGI

2022 年 11 月 30 日,当 OpenAI 推出 ChatGPT 测试版的时候,也许不会料到,这款大语言模型加持下的对话机器人,会成为科技史上第一个最短时间用户破亿的产品,同时让全球科技从业者,再次因为 AI 的进展而兴奋起来。

而仅仅在 3 个月之后,OpenAI 就推出了下一代产品 GPT-4,其迭代非常具有「硅谷速度」了,从更新频率上也能看出,团队对于拿下大语言模型赛道的必胜之心。

虽然相对于上一代产品,GPT-4 的进化不算「革命性」的,但是各项指标上百分之几十的提升,依然会为已经很热的 AI 赛道,再添一把火。

同时,一边联手微软,让 ChatGPT 在全球最大商业软件 Office、以及基建 Azure 云上落地;一边通过开放 API 接口,接入更多商业合作伙伴,OpenAI 也成功将自己转型为类似云一样的平台型企业,生生闯出一条大模型的商业化之路,开了研究成果转商业的先河。

GPT 到底是不是通向人工智能的圣杯——通用人工智能的正确道路,现在还不好说。但可以肯定的是,GPT 的成功,已经让人们像当年互联网革命一样,想利用 AI「重新改造一切」。

GPT-4 的及时推出,给渴望改造和变革的人们,又打了一针强心剂。

3、相遇在AI大模型下一站:多模态

不论是文心一言还是GPT-4,多模态都有望成为一大卖点。实际上,对于整个人工智能行业而言,多模态感知是建立人工通用智能(AGI)的关键一步,基于此AI模型有望能执行人类水平的一般任务。

文心一言是生成式对话产品(聊天机器人),也有“中国版ChatGPT”之称,主要基于百度文心大模型技术。该模型如今已迭代多代,从单一自然语言理解延伸到视觉、文档、文图、语音等多模态多功能。

百度搜索全线整合文心一言后,可能提供文本、语音、图像等多模态的搜索能力和AI生成能力。

而GPT-4本身便是大模型,其前一代模型GPT-3.5则是ChatGPT的核心技术支撑。

微软德国公司首席技术官Andreas Braun已提到,GPT-4将是多模态的,可管理不同语言数据的输入和输出,也能同时输出文本、图像甚至视频。

在此之前,微软已于上周发布并开源了Visual ChatGPT,该模型包含不同的视觉基础模型,用户可通过图像与ChatGPT交互,并提出复杂的视觉问题或编辑指令。

4、微软“全家桶”vs百度“朋友圈”

眼下,百度文心一言与ChatGPT/GPT-4应用规模都已初具雏形。

先说GPT-4。此前微软已将ChatGPT整合进自家公司的产品“全家桶”,而将这一聊天机器人与搜索引擎Bing(必应)融合后,即便传出诸如“影子人格”Sydney等负面消息,新AI版本New Bing的吸引力也没有减弱——推出一个月后,必应日活量首次突破1亿人,每日约有1/3用户会与基于ChatGPT开发的Bing Chat AI交互。

而更进一步来看,微软那场3月16日的活动主题,便是“用人工智能重塑生产力”,公司还将展示类ChatGPT人工智能在Teams、Word、Outlook等Office应用中的作用。

另一厢,文心一言背靠百度,自然也不担心应用普及。今年2月22日,李彦宏在发给百度全员的财信中已宣布,计划将多项主流业务与文心一言整合,以提高用户粘性。

同时,百度近期已提交注册多个商标名称,包括Searchat、百度百晓生、百度晓搜、Chatflow等,疑似与本次整合计划相关。而根据注册名称来看,产品或将搭载百度数字人度晓晓,提供更智能的AI对话式搜索。

值得一提的是,相较微软与GPT-4,百度还提早筹备,为文心一言扩张B端“朋友圈”。数据显示,截至2023年3月3日,已有400多家企业宣布接入文心一言,涉及传媒、影视、汽车、软件等多领域公司。

5、AI大模型战火愈盛 如何占据高地?

如今AI大模型技术快速迭代,ChatGPT声名鹊起之后,谷歌、微软、百度、阿里等海内外一众公司纷纷加快了脚步。细数AI大模型竞赛参与者中,各家在模型开发方面,基本都已具有一定技术积累,因此业内认为各科技厂商推出AI大模型的技术难度并不算大。

那么在这场比赛中,如何才能占据高地?商业模式及数据或许是两大关键。

一方面,广发证券预计,未来各科技厂商或将更加聚焦于AI大模型的产品定位和商业化落地。因此在AI大模型领域,下一阶段竞争关键将是能否探索出稳定可持续的商业模式(尤其是To B商业模式),以及确定合理的产业链。

另一方面,数据质量和来源的广泛化与高质量是模型算法突破的重要基础条件。在AI大模型对于训练数据的数据量、场景覆盖面有较高要求的情况下,分析师认为该领域的竞争将越来越集中在科技与互联网巨头群体内。

至于文心一言与GPT-4的具体情况如何,百度与微软的正面碰撞结果怎样,还有待时间揭晓。

文章来源: Edu指南,数据猿,极客公园,科创板日报

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:人工智源库
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...