想象下有这么一个场景,在你从墨西哥度假回来之后,在街上遇到了一个好朋友。
“假期过得如何啊?”你的朋友问道。
“很不错,我们对这次旅行非常满意,”你回答说,“那里并不是很潮湿,不过海水倒是有点儿凉。”
没有什么让人感到意外的,不是吗?你和你的朋友都知道,你谈到了当地的天气,因为你用了“潮湿”这个词,还有当地的海水,因为你用了“凉”这个词。现在你再想象一下同样的场景,但是交流的对象是一台计算机,那么会是如何呢?或许你会听到一些非常生硬的答案,比如,“是的,不是,正在计算中…..”之类的。
人类之间的交流和人机交流不一样,因为我们需要依靠语言背景和一些“不言而喻”的假设条件,比如,“水是湿的”,“大家都想要快乐”等等。我们也会知道,与自己对话的人也很清楚同样的道理。这个概念组成了交流的基础,让我们不仅可以快速、有效的进行沟通,还能进行深层意义的探讨交流。
如今的科技已经变得越来越先进,当科技已经变成社会中日常生活的一部分时,却出现了一个主要缺陷,即技术不会进行推理假设。
人们与电子设备的交流越来越多,比如手机和电视。但当我们和Siri交流时,会发现“她”有时连一些简单命令都无法理解。为了让计算机更好地了解我们,我们需要在常识推理领域不断探索,因为没有它,无论是Siri,谷歌眼镜,还是Xbox,都无法进行智能对话。
什么是常识推理?
常识推理是人工智能中的一个领域,旨在帮助计算机更好地理解人类,以一种更加自然的方式与人类进行交流。它需要找到一些方法去收集交流背景假设,再把这些教给计算机。常识推理最成功的一个领域是自然语言处理(NLP)。而机器学习这一块,常识推理也正在悄悄滴渗透到不同的程序之中,比如文本理解,处理和理解。
没有常识,在这个日益增长的数字化移动世界里,很难构建适应性强的自动式自然语言处理系统。我们交谈时,会尝试使用一些有趣的交流方式,因此在进行人机对话的时候,我们也希望计算机能够跟上人类交流的步伐。
常识推理的应用比我们想象的要强大的多。如果问你长颈鹿能在办公室生活吗?就算从未见过长颈鹿在办公室里咀嚼树叶的场景,也肯定能快速回答出这个问题。这是一个很好的例子,你完全不需要完全了解这个世界,却知道如何应用自己对这个世界的认知,来处理之前从未想到过的事情。
常识系统具有高度自适应的能力。当有一个新单词出现的时候,我们会根据上下文的背景去理解,我们会用常识去猜测单词的含义,然后根据自己的猜测不断提炼含义。我们就是要开发一个具有类似功能的系统。学习一些复杂抽象的概念时,也可以通过对某一简单概念的类比,更好地去理解。这正是知名深度学习专家George Lakoff在他《我们赖以生存的隐喻》(Metaphors We Live By)一书中所提到的理论,简单的概念就是常识。
常识推理的两个流派
在常识推理领域里有两个主要的流派,一边希望采用更加逻辑性,且基于规则的表现形式;而另一边则希望采用更多联想,且基于类比的推理,或是说“基于语言”的常识。后者虽然会产生一些模糊的结论,但是却更加接近自然语言的表现方式。不论你是否意识到,其实每天都在用上述两种系统进行交互。
你可能听说过IBM最新的Watson电脑系统,它曾在美国著名的Jeopardy节目上战胜过人类,不过很少有人知道Watson的前身是一个名为Cyc的项目,该项目是由Doug Lenat在1984年创立的,制造商是一家名为Cycorp的公司。该公司开发了一个基于逻辑常识的大型数据库。目前这家公司仍然很活跃,也是世界上最大的逻辑常识项目之一。
在学术领域,基于语言的常识研究当属1999年创建的Open Mind Common Sense(OMCS)和ConceptNet项目。常识推理可以算是人工智能的一个分支,包括存储在纯文本中的信息和大型知识图。依靠众包,该项目在早期获得了成功,目前ConceptNet项目内已经包含了多种语言的1700个常识点。
为什么现在常识推理如此重要?
在过去的几年里,机器学习领域有了长足的进步,比如基于矢量的机器学习和深度学习。他们也一直在推进基于语言的常识,这些技术让人机对话变得更接近于人类交流。
自然语言处理是常识推理最擅长的领域,这项技术也正在进军商业产品。尽管前方仍然有很长的路要走,常识推理在未来的几年里势必将会有快速发展,而且对于如今的企业来说,这项技术也已经足够稳定了。相对于现有本体(ontology )和基于规则的系统,或一些简单的机器学习系统而言,常识推理有些明显的优势。
说不定用不了多久,你和自己的计算机之间就能像前文的对话那样,聊聊度假的事儿。当你告诉计算机墨西哥的海水很冷时,它可能会这样回答:“我很抱歉听到您说那里的海水很冷,不过每年这个时候那里的海水温度的确很低。不过我看到你拍摄的旅行照片,你穿着那件上周买的游泳衣很可爱。”
参与评论
登录后参与讨论 0/1000