橙色云资讯 - 工业互联网行业信息门户

NVIDIA（英伟达）发布全新推理软件，开创交互式会话AI新时代

NVIDIA 2019-12-19

1149 字丨阅读本文需 2 分钟

　　2019年12月18日— — NVIDIA于今日发布一款突破性的推理软件。借助于该软件，全球各地的开发者都可以实现会话式AI，大幅减少推理延迟。而此前，巨大的推理延迟一直都是实现真正交互式互动的一大阻碍。

　　NVIDIA TensorRT 7 作为NVIDIA第七代推理软件开发套件，为实现更加智能的AI人机交互打开了新大门，从而能够实现与语音代理、聊天和推荐引擎等应用进行实时互动。

　　据Juniper Research估计，全世界有32.5亿个数字语音助理被应用于设备中。到2023年，该数字预计将达到80亿，比当今全球人口总和还要多。

　　TensorRT 7内置新型深度学习编译器。该编译器能够自动优化和加速递归神经网络与基于转换器的神经网络。这些日益复杂的神经网络是AI语音应用所必需的。与在CPU上运行时相比，会话式AI组件速度提高了10倍以上，从而将延迟降低到实时交互所需的300毫秒阈值以下。

　　NVIDIA创始人兼首席执行官黄仁勋在GTC China 主题演讲中表示：“我们已进入了一个机器可以实时理解人类语言的AI新时代。TensorRT 7使这成为可能，为世界各地的开发者提供工具，使他们能够构建和部署更快、更智能的会话式AI服务，从而实现更自然的AI人机交互。”

　　全球一些最大、最具创新性的公司已在使用NVIDIA的会话式AI加速功能。在首批使用NVIDIA会话式AI加速能力的企业中，包括了阿里巴巴、百度、滴滴出行、美团、快手、平安、搜狗、腾讯和字节跳动等一些中国最具创新力的领先企业。

　　搜狗公司为全球使用频率最高的手机应用程序——微信，提供搜索服务。搜狗首席技术官杨洪涛表示：“搜狗每天通过输入法、AI硬件、搜索等产品为数亿用户提供语音、图像、翻译、对话以及问答等优质的AI服务，我们使用NVIDIA TensorRT推理平台实现线上实时快速的服务响应，领先的AI能力显著提升了我们的用户体验。”

　　TensorRT 7加快了AI模型的领域扩展。这些模型被用于预测使用递归循环结构（RNN）的时间序列、数据情景。除了用于会话式 AI 语音网络之外，RNN还可以帮助规划汽车或卫星到达时间、预测电子病历中的异常情况预测金融资产和识别欺诈。

　　RNN配置和功能组合的爆炸式增长为快速部署可以满足实时性能标准的生产代码带来了挑战，使得开发者需要花费长达数月的时间创建手写代码优化，从而使得会话式AI仅局限于拥有必要专业人才的少数公司。

　　通过TensorRT的新型深度学习编译器，全球各地的开发者能够将这些网络（例如定制的自动语音识别网络以及用于文本-语音转换的WaveRNN和Tacotron 2）实现自动化，并实现最佳的性能和最低的延迟。

　　新的编译器还能优化基于transformer的模型，例如用于自然语言处理的BERT等。

　　TensorRT 7可以快速优化、验证并部署经过训练的神经网络，为超大型数据中心、嵌入式或汽车GPU平台提供推理能力。

　　NVIDIA的推理平台，包括TensorRT以及多个NVIDIA CUDA-X AI 库和NVIDIA GPU，不只能为会话式AI提供低延迟、高吞吐量的推理能力，也同样能为包括图像分类、欺诈识别、分割、目标检测和推荐引擎在内的其它应用提供低延迟、高吞吐量的推理能力。该平台的各项能力已被一些世界领先的企业和消费技术公司广泛使用，其中包括阿里巴巴、美国运通（American Express）、百度、PayPal、Pinterest、Snap、腾讯和Twitter。

　　TensorRT 7 将在未来几天内开放访问，以用于开发和部署。NVIDIA开发者计划成员可通过 TensorRT 网页免费获得TensorRT 7。此外，新版本插件、语法分析器和样本也将作为开放资源，通过TensorRT GitHub 库提供。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：NVIDIA

0 0

参与评论

登录后参与讨论 0/1000

下一篇让机器学会关系推理，进一步逼近强人工智能

　　AlphaGo和自动驾驶系统都非常的聪明，...

2017-07-03

NVIDIA（英伟达）发布全新推理软件，开创交互式会话AI新时代

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

NVIDIA（英伟达） 发布全新推理软件，开创交互式会话AI新时代

参与评论

为你推荐

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

安防智能化升级的一大助力：端边云，有啥不一样？

Nvidia英伟达的AI智能汽车信仰

看三大巨头如何逐鹿智能安防？精细化场景需求提升AI应用范围

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜ 镁客网每周硬科技领域投融资

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

亚马逊、微软、苹果、谷歌：一文读懂科技巨头的2022医疗图谱（二）

对话清华大学张亚勤：AI发展应遵循3R法则

人工智能五年内将爆发 国家与地方政策鼎力支持政策法规

全球“工业4.0”发展现状及产业链上下游分析

最前线丨微软小冰发布社交APP"小冰岛”：不是元宇宙，是虚拟版微信

GMIC2014：智能机器人大热 手游引全球化思考

3D视觉大规模进入消费电子领域，场景落地之争进入白热化阶段

深物联·物联网产业简报【第164期】

加快数智化转型，开启智能制造新时代

HPC、AI与云计算：当智能时代三叉戟在亚马逊云科技完美融合

全球化医学影像AI企业汇医慧影获得战略融资，投资方为英特尔

AR技术已被广泛应用于工业制造，元宇宙将如何变革智能制造？

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

NVIDIA（英伟达）发布全新推理软件，开创交互式会话AI新时代

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜镁客网每周硬科技领域投融资

人工智能五年内将爆发国家与地方政策鼎力支持政策法规

GMIC2014：智能机器人大热手游引全球化思考