机器人数学高考输在语文上:同样的问题不同的表述让机器人变“傻”

中青在线 2017-06-12

高考数学机器人

1344 字丨阅读本文需 3 分钟

  6月7日18时28分,当文科小伙伴终于跟令人头疼的数学科目高考说“拜拜”之后,人工AI-Maths的数学“高考”才正式开始。

  这是继人工智能AlphaGo先后战胜著名棋手李世石、柯洁之后,人工智能向人类的又一次“宣战”,只是这一次的PK对象是中国高中生。

  中国青年报·中青在线记者现场见证了这场有趣的挑战。

  我们在提到机器人的时候,往往能想象出一个有脑袋、有身体、有四肢的人形机器。而今天我们的主角AI-Maths其实并没有“人”的特征。AI-Maths是一组装备了11台服务器的机柜。

  与普通考生每次只能解一道数学题不同,AI-Maths能同时解答多道题。机器人会将一整套卷子分发到多台服务器,多线程并行答题。

  为保证对人类小伙伴的公平,AI-Maths没有接入任何网络和数据库,全靠自己单机完成。它在一间封闭房间内,由三位专家担任“监考官”。不允许过程中出现任何人类的干涉和帮助。

  拿到试卷后,数位工作人员在紧张地进行手动录题和实时检查。考卷以word文档的形式进入AI-Maths的“大脑”。

  18时28分,考试正式开始!还记得被AlphaGo支配的恐惧吗?研发它的成都准星云学科技有限公司CEO林辉说,与为展示技术力量的“阿尔法狗”不同,“高考狗”要做的是“亲民”。AI-Maths注重适配普通家庭的设备和网络环境,未来希望能用于自动批阅试卷。

  AI-Maths的能耗约6~7千瓦,也就是它每做一小时数学题,要吃掉6、7度电。同时,AI-Maths对考试环境有比较高的要求,它很怕热,所以在这个10平方米左右的考场里,工作人员为它准备了两台空调,确保室内温度在25摄氏度以下。

  高考数学机器人的弱项在于——有时候会读不懂题。直接用数学语言表述的题它可以轻松解答,但它不能理解考题里场景式的描述语言。

  如果题目是10-1=?

  人工智能系统可以轻松作答。

  如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”

  同样的问题,不同的表述,面对这样的情况,人工智能系统就“傻”了,它不理解小明是什么、小丽是什么、吃又是什么意思。今晚作答北京卷时,一句“教师人数的两倍多于男学生人数”就卡住了它,让它在这道题上得了零分。

  今年2月,AI-Maths跟成都石室天府中学文科班的学生进行了一场PK,当时AI-Maths只考了93分,等于刚过及格线,低于43名考生考出的106分的平均分。研究人员说,当时AI-Maths就卡在了对题目的理解环节,因为它看不懂应用题中“投资”、“理财”等社会常识。参加考试的学生说:“虽然是考数学,但是我们是赢在了语文上。”

  那次败北之后,AI-Maths“卧薪尝胆”,奋起直追。研究人员对它加大了训练题量。截至目前,AI-Maths已经进行了大约500套试卷、12000道题目的魔鬼式训练。

  历时22分钟,18时50分,AI-Maths完成首套答卷:2017高考文科数学北京卷。得分105分!选择题全对!

  没有休息时间,继续作答全国II卷!

  仅用10分钟!从19时19分至19时29分,AI-Maths答完了全国II卷,得分100分。这回全对的是填空题。选择题也仅错一道。

  评阅试卷的数学老师建议:要想提分,AI-Maths应该学好语文!

  看到AI-Maths的精彩表现,网友纷纷坐不住了:

  许多人误以为AI-Maths的数据库一定装下了成千上万套的数学试卷题,届时只需要快速地进行试题比对、作答就可以了。其实,AI-Maths本身并没有可用作比对的题库。它主要靠系统学习知识点,形成逻辑推理能力后进行自主解题。

  早前,AI-Maths没有知难而退的意识,对于解不出的难题,一种方法不行,它就会尝试下一种方法,有时甚至会为一道题尝试好几百次。所以研发团队专门设置了一个“30分钟解不出来便放弃”的程序,以保证答题速度。

  为了这场特别的考试,AI-Maths训练了大约500套高考真题。但是,林辉表示,这还远远不够!当小伙伴开心地在暑假放飞自我时,AI-Maths还要跟研发人员一起疯狂学习。

  备战2018高考,让我们为“复读”的AI-Maths加油吧!

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:中青在线
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...