橙色云资讯 - 工业互联网行业信息门户

GPT-4“王炸”发布：10秒就可做出一个网站，AI大模型战火愈盛谁能占据高地？

人工智源库 2023-03-15

2335 字丨阅读本文需 6 分钟

CHATGPT热度还未散去，CHATGPT开发商OpenAI发布了更强大的GPT-4，堪称“王炸”产品。

当地时间3月14日，OpenAI公开发布大型多模态模型GPT-4，与CHATGPT所用的模型相比，GPT-4不仅能够处理图像内容，且回复的准确性有所提高。目前GPT-4没有免费版本，仅向CHATGPT plus的付费订阅用户及企业和开发者开放。

1、GPT-4带来的四个惊喜

作为一个重要的迭代升级版本，GPT-4相对于上一代而言，在多个性能上有显著的提升，这没有让我们失望。具体来看，关键的升级主要是以下几个方面：

惊喜1、文字输入限制提升至2.5万字

上一个版本，输入的文字不能超过3000字，而GPT-4将这一限制提升到了2.5万字。这个提升，将进一步扩展其应用范围。输入的不再限制于问题，用户可以直接输入文本内容，比如一篇文章甚至一篇报告。

惊喜2、可以输入图片了

上一代产品只能输入文本内容，此次更新升级，可以输入图片内容了。

从这个例子可以看出，GPT-4可以可以“理解”图片的特征，而且可以理解多个图片之间的关联关系，并可以依据用户的指令，来将图片的特征描述出来。

惊喜3、更聪明、更准确

为了了解这两种模型之间的差异，OpenAI在各种基准测试上进行了实验，包括最初为人类设计的模拟考试。OpenAI继续使用最新的公开测试（在奥林匹克和AP免费回答问题的情况下）或购买2022-2023版的模拟考试。

可以发现，当任务的复杂性达到足够的阈值时，GPT-4 比 GPT-3.5 更可靠、更有创意，并且能够处理更细微的指令。

此外，OpenAI还在为机器学习模型设计的传统基准测试上评估了 GPT-4。GPT-4 的性能大大优于现有的大型语言模型，以及大多数最先进的（SOTA）模型，具体比较如下表：

惊喜4、深度学习堆栈可预测性的扩展

对于像 GPT-4 这样的大模型，进行广泛的模型调整是不可行的。因此，模型的可扩展性就具有重要的价值。

从上述结果可以发现，GPT-4 可以用更少的计算量来实现更准确的预测。

此外，OpenAI成功预测了HumanEval数据集子集的通过率，从计算量减少 1000 倍的模型推断，其结果如下：

可以发现，GPT-4 的表现要比GPT-3.5好很多。

根据 OpenAI 的描述，该模型展示了“在各种专业和学术领域对标人类水平的表现”。GPT-4 在模拟律师考试中获得了前10%的成绩，而其前身 GPT-3.5（ChatGPT 的基础）得分排位在后 10% 左右。

GPT-4 在其他各种考试中也表现出色，例如美国高校入学考试 SAT 数学考试，其获得了800 分中的 700 分成绩。然而，它暂时并不具备所有学科能力，例如在AP英语语言和作文中仅获得 2 分。

2、加速的 AGI

2022 年 11 月 30 日，当 OpenAI 推出 ChatGPT 测试版的时候，也许不会料到，这款大语言模型加持下的对话机器人，会成为科技史上第一个最短时间用户破亿的产品，同时让全球科技从业者，再次因为 AI 的进展而兴奋起来。

而仅仅在 3 个月之后，OpenAI 就推出了下一代产品 GPT-4，其迭代非常具有「硅谷速度」了，从更新频率上也能看出，团队对于拿下大语言模型赛道的必胜之心。

虽然相对于上一代产品，GPT-4 的进化不算「革命性」的，但是各项指标上百分之几十的提升，依然会为已经很热的 AI 赛道，再添一把火。

同时，一边联手微软，让 ChatGPT 在全球最大商业软件 Office、以及基建 Azure 云上落地；一边通过开放 API 接口，接入更多商业合作伙伴，OpenAI 也成功将自己转型为类似云一样的平台型企业，生生闯出一条大模型的商业化之路，开了研究成果转商业的先河。

GPT 到底是不是通向人工智能的圣杯——通用人工智能的正确道路，现在还不好说。但可以肯定的是，GPT 的成功，已经让人们像当年互联网革命一样，想利用 AI「重新改造一切」。

GPT-4 的及时推出，给渴望改造和变革的人们，又打了一针强心剂。

3、相遇在AI大模型下一站：多模态

不论是文心一言还是GPT-4，多模态都有望成为一大卖点。实际上，对于整个人工智能行业而言，多模态感知是建立人工通用智能（AGI）的关键一步，基于此AI模型有望能执行人类水平的一般任务。

文心一言是生成式对话产品（聊天机器人），也有“中国版ChatGPT”之称，主要基于百度文心大模型技术。该模型如今已迭代多代，从单一自然语言理解延伸到视觉、文档、文图、语音等多模态多功能。

百度搜索全线整合文心一言后，可能提供文本、语音、图像等多模态的搜索能力和AI生成能力。

而GPT-4本身便是大模型，其前一代模型GPT-3.5则是ChatGPT的核心技术支撑。

微软德国公司首席技术官Andreas Braun已提到，GPT-4将是多模态的，可管理不同语言数据的输入和输出，也能同时输出文本、图像甚至视频。

在此之前，微软已于上周发布并开源了Visual ChatGPT，该模型包含不同的视觉基础模型，用户可通过图像与ChatGPT交互，并提出复杂的视觉问题或编辑指令。

4、微软“全家桶”vs百度“朋友圈”

眼下，百度文心一言与ChatGPT/GPT-4应用规模都已初具雏形。

先说GPT-4。此前微软已将ChatGPT整合进自家公司的产品“全家桶”，而将这一聊天机器人与搜索引擎Bing（必应）融合后，即便传出诸如“影子人格”Sydney等负面消息，新AI版本New Bing的吸引力也没有减弱——推出一个月后，必应日活量首次突破1亿人，每日约有1/3用户会与基于ChatGPT开发的Bing Chat AI交互。

而更进一步来看，微软那场3月16日的活动主题，便是“用人工智能重塑生产力”，公司还将展示类ChatGPT人工智能在Teams、Word、Outlook等Office应用中的作用。

另一厢，文心一言背靠百度，自然也不担心应用普及。今年2月22日，李彦宏在发给百度全员的财信中已宣布，计划将多项主流业务与文心一言整合，以提高用户粘性。

同时，百度近期已提交注册多个商标名称，包括Searchat、百度百晓生、百度晓搜、Chatflow等，疑似与本次整合计划相关。而根据注册名称来看，产品或将搭载百度数字人度晓晓，提供更智能的AI对话式搜索。

值得一提的是，相较微软与GPT-4，百度还提早筹备，为文心一言扩张B端“朋友圈”。数据显示，截至2023年3月3日，已有400多家企业宣布接入文心一言，涉及传媒、影视、汽车、软件等多领域公司。

5、AI大模型战火愈盛如何占据高地？

如今AI大模型技术快速迭代，ChatGPT声名鹊起之后，谷歌、微软、百度、阿里等海内外一众公司纷纷加快了脚步。细数AI大模型竞赛参与者中，各家在模型开发方面，基本都已具有一定技术积累，因此业内认为各科技厂商推出AI大模型的技术难度并不算大。

那么在这场比赛中，如何才能占据高地？商业模式及数据或许是两大关键。

一方面，广发证券预计，未来各科技厂商或将更加聚焦于AI大模型的产品定位和商业化落地。因此在AI大模型领域，下一阶段竞争关键将是能否探索出稳定可持续的商业模式（尤其是To B商业模式），以及确定合理的产业链。

另一方面，数据质量和来源的广泛化与高质量是模型算法突破的重要基础条件。在AI大模型对于训练数据的数据量、场景覆盖面有较高要求的情况下，分析师认为该领域的竞争将越来越集中在科技与互联网巨头群体内。

至于文心一言与GPT-4的具体情况如何，百度与微软的正面碰撞结果怎样，还有待时间揭晓。

文章来源： Edu指南，数据猿，极客公园，科创板日报

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：人工智源库

0 0

参与评论

登录后参与讨论 0/1000

下一篇 10步猜你心中所想实测必应读心机器人

　　第1页：实测必应读心机器人　　互动问...

2013-06-08

GPT-4“王炸”发布：10秒就可做出一个网站，AI大模型战火愈盛谁能占据高地？

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

GPT-4“王炸”发布：10秒就可做出一个网站，AI大模型战火愈盛谁能占据高地？

参与评论

为你推荐

天玑8000加持！Redmi Note 12系列入网：首次搭载旗舰级芯片

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

半年融资827亿，1.2万字看懂新能源汽车产业图谱

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(3月第三周) | 工信部将开展汽车软件在线升级管理试点；湖南发布智能网联汽车产业“十四五”规划

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

中国智慧城市“药方”如何化解海外城市治理症结？

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

RISC-V只适用于嵌入式芯片？以IoT为立足点，RISC-V正在“征服”整个半导体世界

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

国产屏厂TCL华星要打入苹果供应链：为iPad、MacBook出货LCD

国产CIS开始向2亿像素时代迈进，巨头垄断格局或将被打破

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

Nreal国内首发AR眼镜，消费级AR眼镜潮即将爆发，VR/AR产业链开启“卡位战”

研究人员研发仿生二合一纳米电子传感器，可同时测量细胞电气和机械反应

国家电投与阿里巴巴宣布战略合作，数字化转型这条路上，央企各显神通

新材料七国的竞争版图：热门行业分布大集锦，未来10年的市场机会或许在这

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

SiC迎来“奇点时刻”，盘点近期产能、需求量、交易等行业大事件

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜ 镁客网每周硬科技领域投融资汇总

下一个10年，将会发生的12个趋势

从工业机器人产业链看智能制造机会

最新总结：冬奥会的100个创业机会

后疫情时代，OTA如何回血

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总