橙色云资讯 - 工业互联网行业信息门户

人工智能可以拥有自己的“秘密语言”吗？

AI小助手 2022-06-08

人工智能

1538 字丨阅读本文需 4 分钟

新一代人工智能（AI）模型可以根据文本提示按需生成“创意”图像。Imagen、MidJourney和DALL -E 2等公司开始改变创意内容的制作方式，并涉及版权和知识产权。

虽然这些模型的输出通常是惊人的，但很难确切地知道它们是如何产生结果的。上周，美国的研究人员提出了一个有趣的说法，即 DALL-E 2 模型可能已经发明了自己的秘密语言来谈论物体。

通过提示 DALL-E 2 创建包含文本标题的图像，然后将生成的（乱码）标题反馈回系统，研究人员得出结论，DALL-E 2 认为Vicootes的意思是“蔬菜”，而Wa ch zod rea指的是“海洋生物”鲸鱼可能会吃”。

这些说法令人着迷，如果属实，可能会对这种大型 AI 模型产生重要的安全性和可解释性影响。那么究竟发生了什么？

DALL-E 2 有密语吗？

DALL-E 2 可能没有“秘密语言”。说它有自己的词汇可能更准确——但即便如此我们也不能确定。

首先，现阶段很难验证有关DALL-E 2 和其他大型 AI 模型的任何说法，因为只有少数研究人员和创意从业者可以使用它们。

任何公开共享的图像（例如在 Twitter 上）都应该用相当多的盐来拍摄，因为它们是人类从 AI 生成的许多输出图像中“挑选出来的”。

即使是那些有权访问的人也只能以有限的方式使用这些模型。例如，DALL-E 2 用户可以生成或修改图像，但（还）不能更深入地与 AI 系统交互，例如通过修改幕后代码。

这意味着无法应用用于理解这些系统如何工作的“可解释人工智能”方法，并且系统地调查它们的行为具有挑战性。

那是怎么回事？

一种可能性是“胡言乱语”短语与来自非英语语言的单词有关。例如，似乎创造鸟类图像的 Apoploe 类似于拉丁语Apodidae ，后者是鸟类科的二项式名称。

这似乎是一个合理的解释。例如，DALL-E 2 接受了从互联网上抓取的各种数据的训练，其中包括许多非英语单词。

类似的事情以前也发生过：大型自然语言 AI 模型巧合地学会了在没有刻意训练的情况下编写计算机代码。

都是关于代币的吗？

支持这一理论的一点是，人工智能语言模型不像你我那样阅读文本。相反，他们在处理输入文本之前将其分解为“标记”。

不同的“标记化”方法有不同的结果。将每个单词视为一个标记似乎是一种直观的方法，但是当相同的标记具有不同的含义时会导致麻烦（例如，当你打网球和生火时，“匹配”的含义不同）。

另一方面，将每个字符视为一个标记会产生较少数量的可能标记，但每个标记都传达的有意义信息要少得多。

DALL-E 2（和其他模型）使用一种称为字节对编码(BPE) 的中间方法。检查 BPE 表示中的一些乱码表明这可能是理解“秘密语言”的一个重要因素。

这种“秘密语言”似乎主要是分词器效果。

无论哪种方式，这些选项都不是对正在发生的事情的完整解释。例如，从乱码中删除单个字符似乎会以非常特定的方式破坏生成的图像。而且似乎个别胡言乱语不一定能产生连贯的复合图像（如果真的有一种秘密的“语言”在封面下）。

为什么这很重要

除了求知欲，你可能想知道这是否真的很重要。

答案是肯定的。DALL-E 的“秘密语言”是针对机器学习系统的“对抗性攻击”的一个示例：一种通过故意选择 AI 无法很好处理的输入来破坏系统预期行为的方法。

对抗性攻击令人担忧的一个原因是它们挑战了我们对模型的信心。如果人工智能以意想不到的方式解释胡言乱语，它也可能以意想不到的方式解释有意义的词。

对抗性攻击也引发了安全问题。DALL-E 2 过滤输入文本以防止用户生成有害或辱骂性内容，但胡言乱语的“秘密语言”可能允许用户绕过这些过滤器。

最近的研究发现，某些语言 AI 模型存在对抗性“触发短语”——诸如“zoning tap fiennes”之类的简短无意义短语，可以可靠地触发模型吐出种族主义、有害或有偏见的内容。这项研究是理解和控制复杂深度学习系统如何从数据中学习的持续努力的一部分。

最后，像 DALL-E 2 的“秘密语言”这样的现象引起了可解释性问题。我们希望这些模型表现得像人类期望的那样，但是看到响应胡言乱语的结构化输出会混淆我们的期望。

照亮现有的担忧

你可能还记得 2017 年对一些“发明了自己的语言”的 Facebook 聊天机器人的喧嚣。目前的情况类似，结果令人担忧——但不是“天网即将接管世界”意义上的。

相反，DALL-E 2 的“秘密语言”突出了对深度学习系统的鲁棒性、安全性和可解释性的现有担忧。

在这些系统更广泛地可用之前——特别是在来自更广泛的非英语文化背景的用户可以使用它们之前——我们将无法真正知道发生了什么。

但是，与此同时，如果您想尝试生成一些自己的 AI 图像，您可以查看免费提供的更小的模型DALL-E mini。请注意您使用哪些词来提示模型。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：AI小助手

0 0

参与评论

登录后参与讨论 0/1000

下一篇用Python编程语言来实现阿姆斯特朗数的检查

一、什么是阿姆斯特朗数?如果一个正整数等于...

2020-12-28

人工智能可以拥有自己的“秘密语言”吗？

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

人工智能可以拥有自己的“秘密语言”吗？

参与评论

为你推荐

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

安防智能化升级的一大助力：端边云，有啥不一样？

Nvidia英伟达的AI智能汽车信仰

看三大巨头如何逐鹿智能安防？精细化场景需求提升AI应用范围

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜ 镁客网每周硬科技领域投融资

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

亚马逊、微软、苹果、谷歌：一文读懂科技巨头的2022医疗图谱（二）

对话清华大学张亚勤：AI发展应遵循3R法则

人工智能五年内将爆发 国家与地方政策鼎力支持政策法规

全球“工业4.0”发展现状及产业链上下游分析

最前线丨微软小冰发布社交APP"小冰岛”：不是元宇宙，是虚拟版微信

GMIC2014：智能机器人大热 手游引全球化思考

3D视觉大规模进入消费电子领域，场景落地之争进入白热化阶段

深物联·物联网产业简报【第164期】

加快数智化转型，开启智能制造新时代

HPC、AI与云计算：当智能时代三叉戟在亚马逊云科技完美融合

全球化医学影像AI企业汇医慧影获得战略融资，投资方为英特尔

AR技术已被广泛应用于工业制造，元宇宙将如何变革智能制造？

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜镁客网每周硬科技领域投融资

人工智能五年内将爆发国家与地方政策鼎力支持政策法规

GMIC2014：智能机器人大热手游引全球化思考