CHATGPT热度还未散去,CHATGPT开发商OpenAI发布了更强大的GPT-4,堪称“王炸”产品。
当地时间3月14日,OpenAI公开发布大型多模态模型GPT-4,与CHATGPT所用的模型相比,GPT-4不仅能够处理图像内容,且回复的准确性有所提高。目前GPT-4没有免费版本,仅向CHATGPT plus的付费订阅用户及企业和开发者开放。
1、GPT-4带来的四个惊喜
作为一个重要的迭代升级版本,GPT-4相对于上一代而言,在多个性能上有显著的提升,这没有让我们失望。具体来看,关键的升级主要是以下几个方面:
惊喜1、文字输入限制提升至2.5万字
上一个版本,输入的文字不能超过3000字,而GPT-4将这一限制提升到了2.5万字。这个提升,将进一步扩展其应用范围。输入的不再限制于问题,用户可以直接输入文本内容,比如一篇文章甚至一篇报告。
惊喜2、可以输入图片了
上一代产品只能输入文本内容,此次更新升级,可以输入图片内容了。
从这个例子可以看出,GPT-4可以可以“理解”图片的特征,而且可以理解多个图片之间的关联关系,并可以依据用户的指令,来将图片的特征描述出来。
惊喜3、更聪明、更准确
为了了解这两种模型之间的差异,OpenAI在各种基准测试上进行了实验,包括最初为人类设计的模拟考试。OpenAI继续使用最新的公开测试(在奥林匹克和AP免费回答问题的情况下)或购买2022-2023版的模拟考试。
可以发现,当任务的复杂性达到足够的阈值时,GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。
此外,OpenAI还在为机器学习模型设计的传统基准测试上评估了 GPT-4。GPT-4 的性能大大优于现有的大型语言模型,以及大多数最先进的 (SOTA) 模型,具体比较如下表:
惊喜4、深度学习堆栈可预测性的扩展
对于像 GPT-4 这样的大模型,进行广泛的模型调整是不可行的。因此,模型的可扩展性就具有重要的价值。
从上述结果可以发现,GPT-4 可以用更少的计算量来实现更准确的预测。
此外,OpenAI成功预测了HumanEval数据集子集的通过率,从计算量减少 1000 倍的模型推断,其结果如下:
可以发现,GPT-4 的表现要比GPT-3.5好很多。
根据 OpenAI 的描述,该模型展示了“在各种专业和学术领域对标人类水平的表现”。GPT-4 在模拟律师考试中获得了前10%的成绩,而其前身 GPT-3.5(ChatGPT 的基础)得分排位在后 10% 左右。
GPT-4 在其他各种考试中也表现出色,例如美国高校入学考试 SAT 数学考试,其获得了800 分中的 700 分成绩。然而,它暂时并不具备所有学科能力,例如在AP英语语言和作文中仅获得 2 分。
2、加速的 AGI
2022 年 11 月 30 日,当 OpenAI 推出 ChatGPT 测试版的时候,也许不会料到,这款大语言模型加持下的对话机器人,会成为科技史上第一个最短时间用户破亿的产品,同时让全球科技从业者,再次因为 AI 的进展而兴奋起来。
而仅仅在 3 个月之后,OpenAI 就推出了下一代产品 GPT-4,其迭代非常具有「硅谷速度」了,从更新频率上也能看出,团队对于拿下大语言模型赛道的必胜之心。
虽然相对于上一代产品,GPT-4 的进化不算「革命性」的,但是各项指标上百分之几十的提升,依然会为已经很热的 AI 赛道,再添一把火。
同时,一边联手微软,让 ChatGPT 在全球最大商业软件 Office、以及基建 Azure 云上落地;一边通过开放 API 接口,接入更多商业合作伙伴,OpenAI 也成功将自己转型为类似云一样的平台型企业,生生闯出一条大模型的商业化之路,开了研究成果转商业的先河。
GPT 到底是不是通向人工智能的圣杯——通用人工智能的正确道路,现在还不好说。但可以肯定的是,GPT 的成功,已经让人们像当年互联网革命一样,想利用 AI「重新改造一切」。
GPT-4 的及时推出,给渴望改造和变革的人们,又打了一针强心剂。
3、相遇在AI大模型下一站:多模态
不论是文心一言还是GPT-4,多模态都有望成为一大卖点。实际上,对于整个人工智能行业而言,多模态感知是建立人工通用智能(AGI)的关键一步,基于此AI模型有望能执行人类水平的一般任务。
文心一言是生成式对话产品(聊天机器人),也有“中国版ChatGPT”之称,主要基于百度文心大模型技术。该模型如今已迭代多代,从单一自然语言理解延伸到视觉、文档、文图、语音等多模态多功能。
百度搜索全线整合文心一言后,可能提供文本、语音、图像等多模态的搜索能力和AI生成能力。
而GPT-4本身便是大模型,其前一代模型GPT-3.5则是ChatGPT的核心技术支撑。
微软德国公司首席技术官Andreas Braun已提到,GPT-4将是多模态的,可管理不同语言数据的输入和输出,也能同时输出文本、图像甚至视频。
在此之前,微软已于上周发布并开源了Visual ChatGPT,该模型包含不同的视觉基础模型,用户可通过图像与ChatGPT交互,并提出复杂的视觉问题或编辑指令。
4、微软“全家桶”vs百度“朋友圈”
眼下,百度文心一言与ChatGPT/GPT-4应用规模都已初具雏形。
先说GPT-4。此前微软已将ChatGPT整合进自家公司的产品“全家桶”,而将这一聊天机器人与搜索引擎Bing(必应)融合后,即便传出诸如“影子人格”Sydney等负面消息,新AI版本New Bing的吸引力也没有减弱——推出一个月后,必应日活量首次突破1亿人,每日约有1/3用户会与基于ChatGPT开发的Bing Chat AI交互。
而更进一步来看,微软那场3月16日的活动主题,便是“用人工智能重塑生产力”,公司还将展示类ChatGPT人工智能在Teams、Word、Outlook等Office应用中的作用。
另一厢,文心一言背靠百度,自然也不担心应用普及。今年2月22日,李彦宏在发给百度全员的财信中已宣布,计划将多项主流业务与文心一言整合,以提高用户粘性。
同时,百度近期已提交注册多个商标名称,包括Searchat、百度百晓生、百度晓搜、Chatflow等,疑似与本次整合计划相关。而根据注册名称来看,产品或将搭载百度数字人度晓晓,提供更智能的AI对话式搜索。
值得一提的是,相较微软与GPT-4,百度还提早筹备,为文心一言扩张B端“朋友圈”。数据显示,截至2023年3月3日,已有400多家企业宣布接入文心一言,涉及传媒、影视、汽车、软件等多领域公司。
5、AI大模型战火愈盛 如何占据高地?
如今AI大模型技术快速迭代,ChatGPT声名鹊起之后,谷歌、微软、百度、阿里等海内外一众公司纷纷加快了脚步。细数AI大模型竞赛参与者中,各家在模型开发方面,基本都已具有一定技术积累,因此业内认为各科技厂商推出AI大模型的技术难度并不算大。
那么在这场比赛中,如何才能占据高地?商业模式及数据或许是两大关键。
一方面,广发证券预计,未来各科技厂商或将更加聚焦于AI大模型的产品定位和商业化落地。因此在AI大模型领域,下一阶段竞争关键将是能否探索出稳定可持续的商业模式(尤其是To B商业模式),以及确定合理的产业链。
另一方面,数据质量和来源的广泛化与高质量是模型算法突破的重要基础条件。在AI大模型对于训练数据的数据量、场景覆盖面有较高要求的情况下,分析师认为该领域的竞争将越来越集中在科技与互联网巨头群体内。
至于文心一言与GPT-4的具体情况如何,百度与微软的正面碰撞结果怎样,还有待时间揭晓。
文章来源: Edu指南,数据猿,极客公园,科创板日报
参与评论
登录后参与讨论 0/1000