橙色云资讯 - 工业互联网行业信息门户

对语音进行“修剪”后再AI识别，减少消耗的同时还能提高精确度

微观人 2021-12-07

1158 字丨阅读本文需 3 分钟

随着神经网络越来越大，它们变得更加强大，但也更加耗电，吞噬着电力、时间和计算机内存。研究人员已经探索了减轻负荷的方法，特别是在移动设备上部署，这种压缩方法被称为剪枝--删除最薄弱的环节。新的研究提出了一种修剪语音识别模型的新方法，使修剪过程更加有效，同时也使压缩后的模型更加准确。

研究人员解决了相对不常见的语言的语音识别问题。要想只用监督学习来学习语音识别，软件需要大量现有的音频-文本配对，而这对某些语言来说是很缺乏的。一种叫做自我监督学习的流行方法可以解决这个问题。在自我监督学习中，一个模型在没有任何标签的数据中找到模式--例如狗图像上的 "狗"。然后，人工智能可以在这些模式的基础上，在最小的数据上使用监督学习来学习更有针对性的任务，这个过程称为微调。

在语音识别应用中，一个模型可能会接收数小时的无标签音频记录，让短的部分沉默，然后学习填补空白。在某种程度上，它建立了数据的内部表征，可以向不同的方向发展。然后，在微调中，它可能学会只用几分钟的转录音频来转录一种特定的语言。对于每个声音片段，它都会猜测单词或词语，并根据其正确与否来更新其连接。

这项新工作的作者探索了几种修剪微调的语音识别模型的方法。一种方法被称为OMP（单次幅度修剪），其他研究人员曾为图像处理模型开发过这种方法。他们采用预先训练好的语音识别模型（一个已经完成自我监督学习步骤的模型），并在少量转录的音频上对其进行微调，然后他们对其进行修剪，然后他们再次进行微调。

该团队将OMP应用于几种语言，发现修剪后的模型在结构上与不同语言非常相似。这些结果令他们感到惊讶。这激励了我们的修剪算法。他们假设，鉴于修剪过的模型之间结构的相似性，预先训练过的模型可能不需要太多的微调。这很好，因为微调是一个计算密集的过程。Lai和他的合作者开发了一种新方法，称为PARP（修剪、调整和再修剪），只需要一轮微调。他们将在本月的NeurIPS（神经信息处理系统）人工智能会议上发表他们的论文。该小组的研究是麻省理工学院CSAIL和麻省理工学院-IBM沃森人工智能实验室在低资源语言学习方面持续合作的一部分。

Lai说，PARP从一个预先训练好的语音识别模型开始，然后修剪掉最薄弱的环节，但不是完全删除它们，而只是暂时将它们的强度设为零。然后，它使用标记的数据对模型进行微调，如果这些零点确实重要，就允许它们重新生长。最后，PARP再一次修剪模型。OMP对模型进行微调、修剪、再微调，而PARP对模型进行修剪、微调、再修剪。与微调两次相比，修剪两次在计算上是微不足道的。

在现实的修剪水平下，PARP的错误率与OMP相似，而使用的微调次数是OMP的一半。另一个有趣的发现，在一些设置中，PARP修剪了10%到60%的网络，它实际上比未修剪的模型提高了ASR的准确性，也许是由于消除了网络中的噪音，而OMP没有产生这样的提升。

PARP或类似的东西可以导致ASR模型，与目前的模型相比，速度更快，更准确，同时需要更少的内存和更少的训练。研究者呼吁对实际应用进行更多研究(一个研究方向是将剪枝应用于语音合成模型。他已经向明年的ICASSP会议提交了一篇关于该主题的论文）。第二个信息，鉴于一些令人惊讶的发现，是修剪可以成为我们深入了解这些语音模型的科学工具。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：微观人

0 0

参与评论

登录后参与讨论 0/1000

下一篇语音识别的前世今生 | 深度学习彻底改变对话式人工智能

　　由于深度学习与语音识别相结合，因此对...

2017-08-23

对语音进行“修剪”后再AI识别，减少消耗的同时还能提高精确度

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

对语音进行“修剪”后再AI识别，减少消耗的同时还能提高精确度

参与评论

为你推荐

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

安防智能化升级的一大助力：端边云，有啥不一样？

Nvidia英伟达的AI智能汽车信仰

看三大巨头如何逐鹿智能安防？精细化场景需求提升AI应用范围

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜ 镁客网每周硬科技领域投融资

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

亚马逊、微软、苹果、谷歌：一文读懂科技巨头的2022医疗图谱（二）

对话清华大学张亚勤：AI发展应遵循3R法则

人工智能五年内将爆发 国家与地方政策鼎力支持政策法规

全球“工业4.0”发展现状及产业链上下游分析

最前线丨微软小冰发布社交APP"小冰岛”：不是元宇宙，是虚拟版微信

GMIC2014：智能机器人大热 手游引全球化思考

3D视觉大规模进入消费电子领域，场景落地之争进入白热化阶段

深物联·物联网产业简报【第164期】

加快数智化转型，开启智能制造新时代

独角兽机器人发布！小鹏汽车葫芦里卖的什么药？

HPC、AI与云计算：当智能时代三叉戟在亚马逊云科技完美融合

全球化医学影像AI企业汇医慧影获得战略融资，投资方为英特尔

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜镁客网每周硬科技领域投融资

人工智能五年内将爆发国家与地方政策鼎力支持政策法规

GMIC2014：智能机器人大热手游引全球化思考