大模型问世一年,国内企业几家欢喜几家愁,离落地还差“多高”?

智能未来 2023-11-29
2801 字丨阅读本文需 7 分钟

一年来,国内大大小小的大模型数量早已破百。以文心一言、讯飞星火以及通义千问等为代表的国产大模型,已陆续宣布性能赶超GPT3.5,大模型商业化的问题也正在不断地被提及……

大浪淘沙后,国内也有不少大模型企业宣告解散,知名大模型项目“套壳”国外开源项目等问题频发。

国产大模型的发展,也正遭遇着新的“泡沫”。

数量破百,应用涌现

一年前的今天,伴随着ChatGPT的发布,其所带来的智能涌现和自然语言交互能力,让全球范围内迅速掀起了一阵AI2.0追赶的热潮。

国内方面,在大量C端消费群体纷纷“翻墙”到注册并体验ChatGPT的同时,以百度、阿里巴巴、科大讯飞(45.710, 0.00, 0.00%)以及360等为代表的互联网大厂,以及澜舟科技等少数布局的初创企业,快速地推出了自己的大模型产品。

今年3月16日,百度大语言模型产品“文心一言”率先发布,首批 650 家企业宣布接入文心一言生态。随后,2023年3月29日,360智脑大模型1.0版本发布。今年4月11日,阿里巴巴旗下通义千问亮相发布云峰会,阿里巴巴宣布未来所有产品都将接入“通义千问”大模型。至5月6日,科大讯飞旗下讯飞星火认知大模型发布……

快速跟进的背后,ChatGPT的出现并非瞬时而成,底层支撑其发展的AI大模型技术已经发展多年,国内一线互联网大厂及前沿初创企业已早有布局,成为此番国内厂商得以快速跟进的关键。

据新浪科技此前统计,截至7月31日,国内就已推出超100款大模型产品,其中,仅定位通用大模型和“通用+行业”的企业,便多达26家;此外,“基础+行业类大模型”有7家;金融、医疗、生物、交通、数据分析等行业大模型多达67家。

与此同时,越来越多基于大模型技术能力的AI原生应用,也正在快速地出现。据百度10月17日宣布,在公司文心一言插件生态平台“灵境矩阵”发布一个月后,灵境矩阵开发者申请入驻数便已经超过2.7万,覆盖法律、职场、学习等多个领域。

在与新浪科技沟通中,有正在组织AI创业大赛的策划人员结合自身实践谈道:“大会开启招募仅仅数天,报名参赛的AI应用企业便多达数百家,真的很令人吃惊。”

不断涌现的AI原生应用背后,大模型技术对于开发范式的改变,让更多非技术人员也开始具备快速开发AI原生应用的能力,成为AI原生应用快速涌现的重要原因。

追赶与超越

国产大模型号称赶超GPT3.5

国产大模型厂商与AI原生应用迅速涌现的同时,优质国产大模型迅速赶超GPT3.5,也正在成为既定事实。

今年7月,百度宣布新版本文心一言3.5已超越ChatGPT 3.5;至今年10月17日,文心大模型4.0发布,百度再次喊出了综合能力比GPT-4毫不逊色的口号。此外,10月24日,伴随着星火认知大模型V3.0发布,公司宣布该版本大模型已超越了ChatGPT(GPT3.5)。10月31日,伴随着通义千问App上线,阿里同样宣布通义千问超越GPT-3.5,局部比肩GPT4.0。

国内企业与OpenAI等全球头部企业相比距离真的在缩小吗?

对此,阿里巴巴智能信息事业群研发负责蒋冠军对新浪科技等媒体表示,“国内这大半年时间,中文大模型水平发展很快,大家可以有直观感受。在上半年的时候,各家App里面的错误、不通顺、不顺畅程度很高,但到现在,已经相对很好了。”

在蒋冠军看来,国内头部大模型的整体能力水平或通用智能技术水平,肯定比GTP3.5好,这是确定的。“GTP3.5在线上提供服务的模型并不大,我是相信这个新闻的。国内大模型做到十几B时,大家就发现中文能力和英文能力与GTP相比已经非常接近了。”蒋冠军表示。

大模型人才稀缺薪资走高

算力算法市场活跃

大模型市场的升温也在带动上下游产业链,包括数据、算力和算法,相关领域的人才,例如大模型工程师,在国内也供不应求,收入水平也持续走高。

刘欣旸是一名大模型工程师,他每天主要的工作就是训练各个行业的大模型,在此之前,他从事的是搜索引擎的开发。在2022年,他转型研发大模型技术。

某人工智能企业大模型工程师 刘欣旸:我训练的大模型包括金融行业、房产行业以及医疗行业、水利。毕竟大模型是一个新产生的技术,它到可用还需要进行一定的训练。

根据相关机构的统计,国内人工智能工程师和算法科学家的平均年薪已经超过60万元,而且企业对大模型技术研发人才需求旺盛,部分核心领域存在较大的缺口。

某信息技术集团首席技术官 刘会福:真正懂行业的专家是非常需要的,懂人工智能、懂算法、懂模型的也是非常需要的,因为每一轮人工智能发展的结果都是让那些善于用工具的人更好地生存。

大模型市场的升温也在带动算力算法产业,包括“大模型”的芯片、计算集群、服务器、通信网络硬件以及云计算、数据库、虚拟化功能等软件。算力基础设施和算力服务对大模型训练不可或缺,其性能、质量和稳定性决定了模型训练效果。

在国际市场上,目前一张专门用于训练人工智能大模型的芯片价格甚至被炒到了4.5万美元,折合人民币超过了30万元。国内相关领域芯片的自主研发也在提速。

清华大学人工智能国际治理研究院副院长 梁正:算力是大模型落地一个比较高的门槛,这个层面国家已经在统筹部署,也就是我们国家层面算力网的建设,各个地方有一些计算中心,以前可能更多是CPU,现在就是加上智算GPU。

泡沫消失前穿上泳衣

机会来临之际,市场从不缺乏炒作。闻风而动的人一面不想错过天降的蛋糕,一面又忌惮大模型的高投入与薄利润。话虽如此,但更多人会选择先排个队,即便自己完全不知道会走向哪个终点。

商业的游戏从来都不是稳赚不赔,短短七个月,国内已有超过80个大模型公开测试,热闹异常的市场背后,有着残酷现实:以ChatGPT为代表的通用大模型,或许已经涨到头了。

第三方网站SimilarWeb监测数据显示,今年6月,ChatGPT网站与移动客户端的全球流量(PV)环比下降了9.7%,美国地区的流量环比下降了10.3%。与此同时,ChatGPT的独立访客数量(UV)下降了5.7%,访客在网站上花费的时间也下降了8.5%。

不止如此,投资人也开始谨慎评估大模型,一是他们看到了模型层与应用层巨大的鸿沟,二是他们看清大模型趋于同质化的现象,三是他们的算盘,不会为缺乏行业数据的人而拨动。

大模型的喧嚣正在远去,种种迹象表明,国内大模型正在退去泡沫。走向产业,成为数智创新者和数智实干家,思考的方向。

2023京东全球科技探索者大会暨京东云峰会,推出了京东言犀大模型。这个源于产业,服务产业的大模型,以数智供应链为着手点,切开了大模型的应用瓶颈。言犀大模型训练时融合70%的通用数据与30%数智供应链原生数据,致力于面向知识密集型、任务型产业场景,解决真实产业问题。

硬科技的提出者米磊曾说过,必须在泡沫退去之前,把泡沫变成自己的能力,这样才能在泡沫退去之后还能挣到钱,否则泡沫退去就只是裸泳了。大模型正是需要这样的过程。

历经数月洗牌,大模型逐渐找到了要去的方向。

此时,与通用大模型相比,为医疗、工业、消费等领域带来红利的行业大模型,开始变得更受追捧。

AI原生应用进入爆发前夜

全球来看趋势也是如此,AI原生应用进入了爆发的前夜。通过API,AI原生应用调用大模型,将在互联网、制造、能源、电力、化工、交通等行业不断落地,孕育新时代的百度、淘宝、美团、滴滴等。“大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型,专用的小模型反应快,成本低,大模型更智能,可以用来兜底。”李彦宏说。

百度目前在做的,一是“革自己的命”,将所有的应用重做一遍,另一方面,上线了大模型插件平台并对外开放,降低了应用开发和使用的门槛。据统计,在百度智能云千帆大模型平台上,已经有超过17000家企业在开发产业模型和解决方案。

直到今天,无论是中国也好,美国也好,我认为最好的AI原生应用还有没出现。做大模型还有没有机会?有,但大模型的机会,并不只是大模型本身,更多的机会将来自其上的应用。AI原生时代,我们需要的是100万量级的AI原生应用,而不是100个所谓的大模型。

文章来源: 虎嗅APP,光明网,新浪科技

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:智能未来
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...