文心一言令人失望,对比chatGPT差在哪儿?其商业价值仍值得肯定

微观人 2023-03-17
3070 字丨阅读本文需 10 分钟

3月16日,百度如约发布了对标chatGPT的中文版「文心一言」。

在昨天的发布会上,李彦宏坦率地承认,测试文心一言时,感觉还是有很多不完美的地方,但因为市场有需求,大家都希望早一点用上最新最先进的大语言模型,所以在此时就推出。

他从5个角度展示了文心一言的能力,分别是文学创作、商业文案创作、数理推算、中文理解和多模态生成。

文心一言 vs ChatGPT

1 文学创作

从用词上来看,文心一言和chatGPT开头的场景描写几乎一模一样。但整首诗的风格却不同,文心一言自始至终都是压抑的、悲观的,chatGPT却给了一个坚定且有希望的ending。

古诗创作文心一言上来就copy了一首家喻户晓的诗词。chatGPT的回答更标准,也作了诗名。

在故事创作上,文心一言似乎有些不合逻辑,人被猫咬了却把猫抱到了医院,直接忽略了人。且结尾也有些胡言乱语,一边不能忘记汤姆带来的恐惧和不安,又要给它建造纪念碑,视为英雄?

chatGPT的故事似乎更有逻辑性,也更符合我的恐怖要求。

2 商业文案创作

在商业文案创作上,文心一言给出的答案更符合我的要求和想法,chatGPT的答案相对啰嗦。

这一个则是文心一言完胜,chatGPT不仅用英文回答,而且还搞错了品牌,将悦刻翻译为YOOZ。

这段开场白文心一言更符合我的需求和想法,chatGPT似乎搞错了对象。

3 数理推算

这是一道小学奥数题,也难住了文心一言和chatGPT。文心一言直接摆烂,回答的内容里有错误代码;chatGPT则是一本正经的胡说八道,看似步骤很多在一步步解题,实际上最后的答案也是错的。

第二个问题是一道从网上down下来的腾讯面试题,文心一言显然没有读懂题意,最后的答案完全风马牛不相及。chatGPT的回答看似步骤合理,但最后的结果却是错的。

4 中文理解

一段《三体》中的摘抄,我更喜欢chatGPT的回答,不仅描述片段的大意,还给出了反问。文心一言的答案貌似偏离了题意。

一个来自赵本山小品的梗,都没有理解。

5 多模态生成

因为chatGPT还不具备图片生成能力,所以只能用文字描述。

作为一个人工智能语言模型,ChatGPT也存在一些缺点和局限性:

1. 知识库的深度和广度仍需要进一步提高:虽然ChatGPT可以回答各种领域的问题,但它的知识库还不够完备,有些问题可能无法找到合适的回答。

2. 生成式对话的质量还有待提高:尽管ChatGPT可以生成自然流畅的对话,但它的生成式对话还不如人类专业演员,有时可能会出现口误或重复等问题。

3. 某些情况下可能会出现错误或不准确的回答:由于训练数据的限制,ChatGPT在某些情况下可能无法正确理解用户的意图,或者回答内容可能不够准确或恰当。

4. 依赖于预先训练的数据集:目前的ChatGPT主要是基于文本进行对话生成的,如果未来想要扩展功能或使用场景,可能需要更多地依赖于预先训练的数据集,这会增加开发难度和维护成本。

5. 中文表达能力有待改进:作为一个英文名称为GPT的机器学习模型,其中文名称“小微”似乎并没有体现出与真实世界中的Micronesia相关的含义和特点,这可能会影响其普及程度和应用范围。

总之,尽管ChatGPT在许多方面都表现出色,但它也存在一些缺点和局限性。

大语言模型无法突击速成,百度有四层技术栈优势

目前,百度是全球大厂中第一个做出对标ChatGPT产品的企业。

李彦宏指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

可以说,文心一言是百度过去多年努力的延续。人类进入人工智能时代,IT技术的技术栈发生了根本性变化,从过去三层到“芯片-框架-模型-应用”四层。今天,百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。

李彦宏认为,百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。事实上,超大规模模型的训练和推理,给深度学习框架带来了很大考验。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了 4D 混合并行技术。

在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有,这是百度非常独特的优势。后续,芯片、框架、大模型和终端应用场景可以形成高效的反馈闭环,帮助大模型不断调优迭代,从而升级用户体验。

生成式AI催生新业态,李彦宏预测三大产业机会

自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。

这意味着很多企业已经理解到,文心一言和生成式AI代表了一个新的技术范式,它会影响到每一家公司。

AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。李彦宏预测,大语言模型将带来三大产业机会。

第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。

文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域,都会因此效率大幅提升,并在每一个行业快速形成新的产业空间,助力数字中国的实现。李彦宏预告称,百度智能云将于近期举办新闻发布会,主题围绕文心一言的云服务和应用产品,既有公有云服务和也可以做私有化部署。

第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。

第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。

李彦宏说,“我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”

对于“中国版ChatGPT”,我们期待的是什么?

审视ChatGPT的成功,它的价值不仅在产品,而更在于底下的基础模型,它仍在不断地更新演化之中。新发布的GPT-4就是模型演化增强的产物。

而ChatGPT的诞生,是世界顶尖科学家经年累月研发的结果,有十年磨一剑的功力,有坐冷板凳的决心,同时也离不开高起点的人才基础和高强度的资本投入。

当我们说到打造“中国版ChatGPT”,我们期待的是一项发生在中国AI界的颠覆性进步。它的背后,是能跟国际比肩的高性能基座模型,是高端算力等“卡脖子”问题获得了攻克,再往大说,是更强大的人才队伍,更优的创新生态。而这些都无法在短短数月时间内发生。

技术进步不是一场百米冲刺,而是漫长的长跑。

如同多年前的AlphaGo,ChatGPT已经成为人工智能发展史上的一个符号,从这个意义上说,它不可被复制,只能被超越。想要超越它,我们需要透过现象,思考本质。

在AI的研究布局中,百度起步得并不晚。自2010年起,百度就把机器学习应用在搜索中,文心大模型(ERNIE)推出于2019年,随后迭代出了ERNIE 1.0、ERNIE 2.0、ERNIE-Tiny等多个版本,目前已经发布了11个行业大模型——“今天的文心一言是过去多年努力的延续。”

李彦宏提到,芯片、框架、大模型和终端应用场景四层架构,可以形成一个高效的反馈闭环,帮助大模型不断调优。在全球范围内,百度是鲜有的在四层架构中都有领先产品的公司。

我们有理由相信,百度能够研发出所谓的“中国版ChatGPT”。但从今天的情形看,人们或许更希望它多用一些时间去沉淀。

发布会上提到,文心一言之所以要在今天推出,是因为市场有需求。

“生成式AI,代表了一个新的技术范式,是一个每家企业都不可以错过的巨大的机会。AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。” 自2月官宣以来,已有超过650家企业宣布接入文心一言生态。

有人对市场的急功近利颇为诟病,但也有人说,这是中国AI发展“最大的底牌”。

百度的设想是这样的,在为创业者和企业提供广阔商业机会的同时,“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你‘士别三日,当刮目相看’的惊喜。”

说到底,对差距的清醒认知是一件好事,而技术的进步,无论是市场驱动还是原始创新引发的突破,都值得认可。那就期待文心一言,在未来让我们“刮目相看”。

文章来源: 雷递,上观新闻,浪在硅谷,解码Decode

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...