AI为你补齐失去的身体功能,科技造福残障人士,人类的未来或许就是“人机共生”

人工智源库 2023-03-29
2309 字丨阅读本文需 6 分钟

运用人工智能,让聋哑人同健听人顺畅交流;戴上机械手臂,让缺少手臂的人“随心而动”;坐上智能轮椅,上下楼梯来回自如……一项项助残“黑科技”不断面世,提高了残疾人群体的幸福感与获得感。

近日,清华大学集成电路学院教授任天令团队研发了一款可穿戴人工喉,可以识别佩戴者喉部发声的信号,并将其转换为语音播放出来,还原准确率超90%。该成果已发表在《自然》人工智能子刊《自然·机器智能》上。任天令教授团队基于石墨烯材料研发的智能可穿戴人工喉,对低频的肌肉运动、中频食管振动和高频声波信息有较高的灵敏度,也具有抗噪声的语音感知能力。同时,人工喉还能通过热声效应将信号转换成声音播放。

1、使用智能可穿戴人工喉进行无声语音交互

著名医学杂志《柳叶刀》2021年发布数据显示,2019年全球共有20.9万例新发喉癌病例,其中男性为18.1万,女性为2.8万。相较于前10年,2010-2019年间喉癌的新发病例数增加了24.7%。

通过集成AI模型,人工喉能够识别一名喉切除术患者模糊说出的日常词汇,准确率超过90%。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。这将有助于帮助发声失能群体恢复发声,造福更多的声音障碍者。同时,人工喉的制作过程简单、性能稳定、易于集成,为语音识别和交互提供了一种新的硬件平台,同时它还有很大的优化和拓展空间。

我们人的语音交流发出声音,来源于声带震动,以及喉部、唇部这些发声器官的协同合作。当说话的时候,如果把手放在喉部,能感觉到喉管是有震动的。不同于麦克风通过空气中的机械波采集声音,人工喉是一个极其敏感的机械传感器,它能够感知喉部细微的震动,可以把它看作一个频域感知范围更广的麦克风。

此外,我们以往的扬声器是通过机械振动来产生声音,但如果喉部一直振动的话,不光会干扰到声音感知,也会影响佩戴的体验。由于石墨烯具有高热导率和低热容率的特点,它还能够通过空气加热、冷却的过程(热声效应)发出声音。因此,人工喉可以被看作为一种“麦克风和扬声器的集合体”,用以辅助人们语音交流。

在实验的过程中,最关键的就是信号采集的问题。因为喉部震动比较微弱,最初采集的数据质量实际上并不是很理想,我们实验人员是在自己身上也尝试过很多次。主要还是得多下功夫不断去实验,这方面没有捷径。

2、AI造福残疾人

残疾人约占全球人口15%,中国残疾人总数在8500万以上。如今,越来越多的残疾人不再甘于做“边缘人”,而是自立自强,积极融入社会、实现自我价值。辅助器具是帮助残疾人自立生活的主要方法之一,能够推动残疾人融入社会,提高残疾人对自我价值的认同感。据统计,近八成的残疾人可以通过辅助器具改善生活质量。残疾人群体对美好生活的向往,为中国辅具产业的发展提供了大市场。

2022年北京冬残奥会上,传递火炬的仿生手、帮助人行走的外骨骼康复机器人、为冬残奥村搭载无障碍便捷智能管理平台等无障碍设备纷纷亮相,科技助残结出硕果。

从2022年北京冬奥会开始,央视的AI手语数字人主播正式上岗。她是一位由手语翻译引擎和自然动作引擎驱动的数字人,在新闻播报、赛事直播和现场采访中带来实时的手语翻译,让听障人士也能够共享冰雪运动的精彩。

据了解,手语数字人背后的百度AI手语平台通过“动作融合算法”,基于《国家通用手语词典》规范精修近11000多个手语动作,让每一个动作的起落之间自然衔接。再配合4D扫描技术训练,使得AI手语数字人表情自然生动,口型生成准确度高达98.5%,可落地于多种公共场合。

中国有2700多万听障人士。此前,由于错别字和延迟等原因,智能字幕很少出现在大型国际赛事的超高清直播中。咪咕视频转播本届北京冬奥会时,为听障人士加上了智能字幕。依托语音识别技术,结合神经网络算法,应用体育垂直场景的实时纠错自然语义能力,智能字幕可达到98%的准确率。

上海市志丹职业技能培训学校是一所提供餐饮、医护等就业技能教学的民办机构,残障人士是其授课的人群之一。上海联通帮助学校在围墙上装上信号接收设备,形成电子围栏。当学生走出校园或进入危险路段,手环将自动传输数据至联通物联平台,并将告警信息推送至校方。

商汤科技正在研发的智能避障眼镜帮助视障人士“看见”。通过眼镜上的ToF和RGB摄像头,在视障者行走的过程中,捕捉图像数据、深度数据与方位信息,以此来识别电线杆、行人、车辆、台阶,以及盲道、人行横道、红绿灯等十余种障碍物和标志物。识别到视频信号后,眼镜将其传输到手机端App,再由算法根据距离、位置、物体属性等信息,进行过滤与危险性评估,向视障者进行实时语音播报。

3、人机共生时代到来

人机共生是人工智能发展的必然趋势,这种新技术、新产品及其应用所带来的是物理世界、生物世界、精神世界三者的整体秩序构建,人机共生会成为未来世界,人类与人工智能体和谐共生的社会。关于人工智能的未来,牛津耶鲁已经推出了《机器人人文时刻表》

2024年,机器人可以写程序;

2026年,机器人基本上可以写高中水平的作文;

2027年,世界上最流行的40首歌曲,不是人写的,而是机器写的;

2028年,AI可以拍电影了:

2049年,中华人民共和国成立100周年时,新闻已经是机器写的;

2059年,数学基本上已消失了,全部由机器来做数学研究。

随着人类不断发展和不断地积累知识,信息积累已经达到了前所未有的高度,人与人之间的信息交流也达到了一个新的高度。与此同时,人工智能的迅猛发展,使得人机共生的交流与整合成为可能。

一方面,设备之间的实时互联,满足设备集成和终端互联的需求;另一方面,数据的实时传递与共享也为大数据、云计算平台提供了数据,方便了数据应用、数据分析以及人工智能的深度学习。

在此基础上,各种智能技术在各自的深度并行发展的同时,也以意想不到速度向集成化、共享化方向发展,呈现出一种新的形态,这就是人机共生。

人工智能发展到这一阶段,人与物之间的关系将不可避免地发生转变,因为,在人机共生时代,已经不再是过去简单的人工制造机器并控制机器的时代,而是一个人机共生的二元社会。

从AI目前的发展趋势来看,其发展势头正猛,势不可当,可以断定,未来会有更多震惊世界的AI出现。当前的社会是人类一元社会,未来的社会是人机共生的二元社会。

文章来源: 金羊网,中国新闻网,人民网,热点我见

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:人工智源库
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...