国内AI比国外更卷!四大巨头均已下场,谁的大模型更值得展望?

AI新讯 2023-04-20
3531 字丨阅读本文需 9 分钟

AIGC(人工智能生成内容)、人工智能大模型、对话机器人……近年来,人工智能领域技术突破不断,创新成果不断融入社会各个领域,深刻改变着人们的日常工作、生活方式。博鳌亚洲论坛2023年年会上,多位专家学者、行业领袖围绕人工智能领域技术突破和对人类社会的影响等问题,进行了深度研讨交流。

理性看待人工智能颠覆性创新

华为云人工智能领域首席科学家田奇表示,最近人工智能领域前沿技术的巨大突破对社会的影响,或要远远超过当年智能手机的出现。

人工智能已经发展了60余年,为何在近几年突然获得了如此巨大的进步?田奇认为,这是几十年积累后的一次爆发,新出现的人工智能技术,不仅改变着人机交互的方式,还极大地提高了生产力。

不过,专家也表示,当前人工智能还有一定的局限性,那就是还未出现拥有人类情感的智能体。人工智能虽然是个“文理通才”,但它仍建立在人类所有知识和理解的基础上,并没有超过人类整个群体的智慧,更不要说拥有自身情感和智慧了。“就比如最近大火的ChatGPT,它的回答水平虽然已经超越很多个体乃至群体,但从机器的视角看,本质上它对于问答了什么一无所知。”小i集团董事局主席兼首席执行官袁辉说。

平安银行行长特别助理蔡新发表示,人工智能技术的进步之所以能产生革命性意义,是因为其具有跨界、横向、打通的能力。

“科技的发明具有两面性。”清华大学公共管理学院院长朱旭峰表示,人工智能技术在提高各行各业生产效率的同时,又会对社会结构产生深刻影响,往往会伴随着一些行业的消失与崛起。因此,如何利用新的工具,以适应行业新的发展,成为未来是否能够屹立潮头的重要因素。

“未来的5至10年是人工智能技术应用的红利变现期。”袁辉表示,人工智能的新产品已经快速融入各行各业,不断塑造新业态、新场景,带来巨大的商业价值。

大模型推动AI产业化再加速

AI大模型是近年来最为热门的AI细分领域。相比于小模型,AI大模型具备多个场景通用、泛化和规模化复制等诸多优势,被视为是实现通用人工智能的重要研究方向。

无论是最近大火的ChatGPT,还是国内百度公司推出的文心一言,其实都是AI大模型的典型代表。

所谓AI大模型,就是经过大规模数据训练后,能够适应一系列任务的模型。深度学习作为人工智能的重要技术,完全依赖模型自动从数据中学习知识,在显著提升性能的同时,也面临着通用数据激增与专用数据匮乏的矛盾。AI大模型兼具“大规模”和“预训练”两种属性,面向实际任务建模前需在海量通用数据上进行预先训练,能大幅提升AI的泛化性、通用性、实用性。

此外,相对于传统的小模型生成模式,AI大模式能够大幅缩减特定模型训练所需要的算力和数据量,缩短模型的开发周期,还能得到更好的模型训练效果。可以说,AI大模型的真正意义在于改变了模型的开发模式,将模型的生产由“小作坊”升级为工业化的“流水线”,而模型开发模式的转变,将使得AI技术能够更广泛地下沉到一些长尾场景。

当然,AI大模型的开发需要具备丰富的开发资源,以及庞大的数据、算力支撑。

田奇建议,我国要建构统一架构的多模态AIGC,加快大模型和底层硬件的适配,从而达到降本增效的效果。

大模型进入博弈期

GPT-4的发布在各个领域引起了巨大的轰动,因为它在人工智能技术中达到了一个新的高度。在某些领域,GPT-4已经显露出了其绝对优势,或者说“AI霸权”。这里说的“霸权”不是政治学里面的操纵或控制其他国家的地位,类似于之前为人所知的“量子霸权”的说法,即在某一领域产生原有工具远不能及的技术优势。

GPT-4以及众多生成式人工智能的背后,是人工智能大模型的训练结果。随着如ChatGPT和文心一言逐渐进入应用和商业层面,背后的各个大模型也进入关键博弈期。中国能否在未来数年内推出自己的大模型成为关键。

市场争夺战一触即发

大模型竞争同时也是一场市场争夺战。先占领市场、研发排他性强独占性强的优势产品,既是大厂企业的竞争策略,也是优势厂家的竞争结果。目前,谷歌推出类似ChatGPT的大模型Bard之后,谷歌与微软的竞争再起:微软正聚焦在B端(如办公软件、云计算和人工智能相关产品)以及游戏等相关领域,而谷歌则在C端市场、互联网领域推出更多定制化产品。而不管是B端还是C端,对这些优势产品必然有依赖性,这样的依赖性也将是这些产品继续在所处赛道扩大优势的重要方式。

对于那些获得大模型先手优势的企业来说,在这轮竞争中更容易积累“数据雪球”、建立“数据壁垒”。在自然语言处理领域,数据是训练大型语言模型的基础,因此拥有高质量的数据集是非常重要的。

此外,拥有市场和壁垒的企业将进一步对国际标准制定发起进攻。人工智能大模型的国际标准领域,包括模型的设计和开发标准、模型的应用和部署标准、模型的数据隐私和安全标准、模型的伦理和社会责任标准、模型的性能和效果评价标准等等。在某一市场和领域,通过制定国际标准,企业可以获得更广泛的认可和市场份额。特别是对一些排他性的技术、软件和产品,一旦国际标准被确定下来,制定标准者将能够决定市场走向。

国产四大AI大模型

下面我们来盘点一下,国内的几个科技大厂与它们旗下的AI科技大模型生态链!

1、华为AI大模型:“盘古”!

沉寂两年后,华为在今年3月底展示了盘古系列AI大模型,分别为NLP大模型、CV大模型以及科学计算大模型(气象大模型)。其中,盘古NLP大模型是被认为最接近人类中文理解能力的AI大模型;盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。

对此,也有机构表示,盘古NLP大模型可以赋能千行百业,应用于各种场景。在智能营销领域,盘古NLP大模型可以通过文本匹配,问答和对话系统、意图识别等关键技术更好地赋能销售环节,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统,帮助服务人员快速提升业务水平,重塑消费者体验。

对于华为盘古大模型生态链,也可以从算力、硬件配件、基础软件和应用落地等几个角度去挖掘,具体包括:

算力部分:华为AI芯片昇腾是海思设计,但没有上市,所以算力环节主要关注的是给华为做AI芯片服务的整机厂商,主要有神州数码、拓维信息、四川长虹、同方股份、广电运通、紫光股份等。

硬件配件部分:主要是卓易信息,主营云计算设备核心固件业务以及云服务业务,其国产固件市占率第一。

基础软件部分:操作系统有麒麟信安;数据库有海量数据,是华为openGauss数据库商业版第一,占比达到60%;中间件有东方通和宝兰德,其中东方通市占率达到70%。

应用部分:金融领域有润和软件、软通动力、常山北明、中科软,这四家都是华为昇腾AI生态链的公司;智慧城市有云从科技;智慧交通有千方科技和中远海科;ERP有用友网络、汉得信息、赛意信息;工业软件有能科科技、中望软件;办公软件有金山办公。

2、阿里AI大模型:“通义”!

阿里达摩院于2022年9月发布“通义”大模型系列,之后又发布了多个版本的大模型。今年3月,阿里在“魔搭”上线了“文本到视频生成扩散模型”,实现视频生成功能。该模型由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿,扩散结构采用典型的U-Net网络架构,通过反向扩散过程,实现视频生成的功能。

大模型算力方面,阿里云推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,张北智算中心与乌兰察布智算中心,为科研、公共服务和企业机构提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

在应用层面,目前“通义”大模型已经深入到电商、设计、医疗、法律、金融等行业,服务超过200个场景。阎贵成表示,目前阿里“通义”大模型已广泛用于电商、设计、医疗等领域,助力其降本增效。建议关注阿里产业链相关公司,特别是阿里通义大模型合作厂商。

值得注意的是,近日,阿里巴巴达摩院科技有限公司申请注册多个“通义万象”“通义晓语”“通义博研”“通义晓问”“通义万相”商标,国际分类涉及广告销售、科学仪器、网站服务等,当前商标状态均为申请中。

3、腾讯AI大模型:“混元”!

基于海量社交数据、机器学习、NLP等技术积累,腾讯于2022年12月推出了万亿中文NLP预训练模型HunYuan-NLP-1T(混元AI大模型),是目前国内首个低成本、可落地的NLP万亿大模型,且登顶自然语言理解任务榜单CLUE,在模型架构层面,和其他大模型相比,混元首创“层级化”表征,对输入文字/视频做分层后再进行关联性检索,大幅提升检索准确度。

腾讯混元系列AI大模型布局多领域,为类ChatGPT产品构建坚实基础。腾讯的数据、人才和硬件储备是布局AIGC领域的三大优势:数据方面,腾讯现有产品或带来多样化、真实度高的数据和应用场景;此外硬件方面腾讯拥有高性能网络平台、成熟的太极机器学习平台,为模型训练提供坚实基础。

值得注意的是,腾讯近日正式发布全新的AI智能创作助手“腾讯智影”,推出了智影数字人、文本配音、文章转视频等AI创作工具。

4、百度AI大模型:“文心千帆”!

3月27日,百度正式推出“文心千帆”大模型平台,这是百度面向客户提供企业级大语言模型服务的平台。

据了解,文心千帆大模型平台不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链。未来,文心千帆还会支持第三方的开源大模型。相关负责人介绍,文心千帆可实现三分钟做PPT、数字人直播带货、订机票和酒店等操作。

从平台定位上看,文心千帆为一站式企业级大模型平台,平台作为文心大模型服务的唯一入口,为B端企业用户,提供数据管理、自动化模型定制微调以及推理服务云端部署一站式大模型定制服务,并提供文心一言企业级推理云服务。

从应用场景上看,文心千帆可应用于智能对话、智能输入法等通用场景以及电销领域商品介绍、推广文章等特定场景。具体功能包括对话沟通(匹配智能营销、智能客服、情感沟通等需要沟通对话的场景)、内容创作(匹配剧本、故事、诗歌等文本创作场景)、分析控制(匹配代码生成、数据报表、内容分析等深度学习的文本场景)等。

文章来源: 科技日报,粤湾商盟,旌扬投资视角

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:AI新讯
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...