智能语音转写乘风起,国内哪几家语音转写技术做得比较好

IOT小达人 2022-12-23
1946 字丨阅读本文需 5 分钟

随着数字化时代的来临,国内各企业为了提升行业竞争力,纷纷开始利用数字化技术,来实现以降本增效为核心的数字化转型,得益于此,助力企业数字化转型升级的SaaS也开始进一步升温。

众所周知,国内企业服务SaaS产业赛道众多、流派迥异,其中向用户提供SaaS类产品与本地化部署解决方案的智能语音转写就是其细分领域的一员。而在疫情等众多因素的共同催化之下,智能语音转写技术的商业化应用也迎来了新的发展机遇。

语音转文字技术日趋成熟

比尔盖茨曾说过:“语音技术将使计算机丢下鼠标键盘”。

语音转文字的本质是什么?是实现人机互动,是让机器人能听会说能懂。而它依托的技术是什么呢?是语音识别技术,语音识别技术也叫自动语音识别。

百度百科给出解释,语音识别技术其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

去年,该技术还入选了北京互联网法院发布的《互联网技术司法应用白皮书》,成为十大典型技术应用之一。

据专家预测,未来10年,语音识别技术将在工业、家电、通信、汽车电子、医疗和家庭服务等多个领域被广泛使用。

智能语音转写乘风起

随着智能语音产品及服务在办公、学习、行业交流等多个场景中的应用越来越广泛,智能语音转写市场整体规模持续上涨,其发展潜力也在逐一释放。据艾瑞咨询发布的《2022年中国智能语音转写行业研究报告》显示,2021年中国智能语音转写市场规模约为215亿元,预计2026年将达到469亿元,呈现高速增长态势。而智能语音转写行业之所以能一直保持快速发展势头,则与三大利好不无关系。

在政策上,国家有关智能语音、语音自动转写、语音同步转录等相关政策的不断出台,使得智能语音转写赛道不断升温。自2017年起,国家有关部门就相继出台了多项政策,鼓励和支持智能语音产业的发展。

在技术上,语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)等技术的持续突破,为智能语音转写技术的精度和速度的提升奠定了基础。

在需求上,得益于人力成本、协同办公、会展交流、跨国沟通等多重因素的共同驱动,智能语音转写的市场需求持续扩大。

但技术从殿堂步入寻常百姓生活,需要产品的链接,如何满足当下用户越来越丰富多元的使用需求?真正做到有爽点的使用感受,这是出给每个人工智能公司产品和业务团队的一项难题。从产品形态来看,智能转写和翻译的产品主要包括SaaS类产品与本地化部署解决方案两大类,其中SaaS市场更是不乏重量级玩家,只不过新入局者众多,行业痛点并未得到很好的解决。

一是,技术实力不足。精准快速的转写和翻译服务往往需要强大的软硬件技术支撑,然而目前大多数语音智能转写玩家,在技术研发和创新上的能力较为有限,这就导致其产品在应用过程中的准确率,难以达到理想效果,不仅无法满足实际使用需求,可能最后还需要人工来处理或纠错,从而降低使用效率。

二是,应用场景单一。如今,智能语音转写产品和服务的应用场景正在逐渐扩大。市面上大多数转写翻译的产品和服务却依旧很难满足用户多场景、多形态的需求,加之有的软硬件产品还出现了链接不顺畅或者账户切换繁冗复杂等情况,让用户交互体验感欠佳。

三是,缺乏定制化服务。对语义的理解有误,语言识别和翻译的准确性就会大打折扣,定制化服务却能有效缓解这一问题。只不过,在目前的入局者中,能够为用户构建独有产品,提供专属服务的玩家少之又少。而缺乏定制化服务,很难真正做到对智能语音转写行业的深耕。

目前,国内提供语音转写技术的厂商主要有:

1、科大讯飞

成立于1999年,2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。一直深耕在人工智能领域,技术很全也很综合,多次在语音识别、语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等各项国际评测中取得佳绩。

在语音转写上,通用语音识别率98%(注:安徽电子产品监督检验所检测,报告编号151209010027),支持中文、英文、中英混合识别。支持12种方言,8种外语,2中民族语言,可提供公有云接口及私有化部署方案。

2、腾讯云

腾讯集团倾力打造的云计算品牌。

在语音转写上,字准率97%,与微信、王者荣耀的语音转文字使用一套服务。支持中文普通话、英语。支持2种方言,4种外语,后续将陆续开放其他语种和方言的识别能力。

3、百度智能云

百度智能云致力于为企业和开发者提供全球领先的人工智能、大数据和云计算服务。

在语音转写上,近场中文普通话识别准确率达98%。支持普通话和略带口音的中文识别,支持英文识别。

4、云知声

2012年6月创立于北京,是国内头部人工智能独角兽企业。

在语音转写上,准确率可达实用标准,适用于会议转写、字幕生成、音频内容分析等场景。

5、思必驰

07年创立于英国剑桥,08年回国落户苏州,12年完成A轮融资,是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术。

在长语音识别转写上,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。云端连续实时语音识别率>97%。

随着语音转文字技术的越来越成熟,语音转文字赛道的竞争越来越接近白热化,而对于用户体验的重视,对细节的把握则成为致胜的关键所在。

文章来源: 语音技术智能汇,刘旷, 陌上有花开

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:IOT小达人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...