橙色云资讯 - 工业互联网行业信息门户

从概念上看看智能机器人的新范式：深度强化学习

科技小读 2016-08-30

601 字丨阅读本文需 1 分钟

　　近两年机器智能取得重大突破，像围棋九段高手李世石败北Alpha Go，DeepMind团队研发的在Atari多项游戏上超越人类水平。这些突破主要得益于从基于深度学习的视觉、语音、语义感知到动作反馈的激励惩罚强化训练模式。本文从概念上分析深度强化学习的要点，部分摘于ICML 2016 Tutorial里的Deep Reinforcement Learning[1]的报告。

　　强化学习，即机器人根据环境里动作得到的惩罚和激励去自动调整策略。通过训练，机器人学到一组策略：在环境状态S下应采取动作A，（可）能获得最大累积奖励V。

　　强化学习有丰富的交叉学科背景，包括经济学、工程学、神经科学里的博弈论、优化控制，条件反射系统。

　　深度学习，使用深度神经网络实现机器人的记忆，视觉感知，语音语义理解和生成。

　　深度强化学习以深度学习做感知，强化学习训练策略，并且以深度神经网络作为策略载体。相比于传统的多模块组合，深度强化学习实现了从感知到控制的端到端直接训练，减少了模块间信息损失。

　　最近两年在学术理论上，GoogleDeepMind团队在连续性动作控制[2]，异步训练[3]，训练框架[4]，分布式训练[5]等都有重要突破，为的研发奠定理论和实践基础。

　　在特定任务的上，深度增强学习已有广泛实践尝试，例如流水线机器人。

　　在集成应用上，深度强化学习在自动驾驶，聊天机器人[6][7]都有良好的前景。例如，使用分布式训练或异步训练，自动驾驶汽车可以多辆同时在各种环境学习，并且相互交换知识，加速学习过程。聊天机器人可以通过对话过程中用户的反馈来调整自己的语言表达，逐步成长。

　　深度强化学习为智能机器人提供了新的计算范式：提供环境、激励和惩罚、神经网络结构即可训练得到最大化奖励的智能机器人。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：科技小读

0 0

参与评论

登录后参与讨论 0/1000

为你推荐

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

本·周·目·录国内动态● 《汽车软件升级通用技术要求》征求意见● 中国牵头成立ISO车载激光雷达工作组● “自动驾驶测评专项体系框架”等发布● 飞凡与零束共建数智共创中心...

2022-06-20

汽车智能网联汽车自动驾驶汽车

3.1w

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

本·周·目·录国内动态● 广州智能网联自动驾驶混行试点南沙首发● 浙江德清颁发L4级自动驾驶卡车路测牌照● 大众汽车与江汽集团共建合肥智慧物流● 宝马全新7系明年或提供L3...

2022-07-04

汽车智能网联汽车自动驾驶汽车

2.5w

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

目前，燧原科技已完成首款人工智能高性能通用芯片“邃思”的研发和量产。本周硬科技领域投融资事件一共77起，人工智能领域发生36起融资事件，占比47％；半导体领域发生15起...

2022-08-15

人工智能大数据科技

2.1w

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

本·周·目·录国内动态● 长安6月30日起关闭远程智能泊车等功能● 首款前装量产全无人驾驶环卫车批量交付● 理想功率半导体研发及生产基地落户苏州● 速腾聚创与红旗达成多款...

2022-06-06

汽车智能网联汽车自动驾驶汽车

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

本·周·目·录国内动态● 首个自动驾驶公交车标准发布，百度牵头● 京台高速部分路段为智能网联车测试道路● 广州首条L4级无人驾驶公交线路上线运营● 极氪L4级自动驾驶车计划...

2022-01-10

汽车激光雷达 adas

1.9w

中国智慧城市“药方”如何化解海外城市治理症结？

物联网智库原创导读近年来，中国企业的全球影响力正在逐渐凸显，尤其在新兴的物联网领域，得益于日益成熟的5G、AI、云计算等技术和广阔的应用落地土壤，中国物联网企业的扬...

2022-05-31

通信机器人 5g网络

1.9w

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

本·周·目·录国内动态● 工信部发布十四五信息通信行业发展规划● 广汽发布全新“星灵”电子电气架构● 广汽及如祺出行与文远知行合作Robotaxi● 福特宣布车路协同系统正式落...

2021-12-28

汽车无人驾驶 adas

1.9w

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

AI浪潮席卷而来，为企业带来智能化的升级。然而，面对企业碎片化的需求，想要做到快速响应，仅靠AI算法已经远远不够，只有与合适的“躯体”相结合，才能真正实现产业化落...

2022-08-23

智能算法智能城市智能硬件

1.9w

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

一、无边界的元宇宙，可期待的VR/AR 1.1 VR/AR简介虚拟现实（VirtualReality，下称VR），指的是借助计算机系统及传感器技术生成一个三维环境，赋予视觉、听觉、触觉等感官...

2022-08-15

vr 科技 vr领域

1.8w

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

文｜微信公众号：资产交易信息第一章行业概况虚拟数字人指存在于非物理世界中，由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用，并具有多...

2022-01-25

动作捕捉数字人虚拟现实系统

1.8w

“灯塔工厂”的中国路径：智造从点到面铺开

“灯塔工厂”们的探索之路，其实就是这种“大胆想象、小心实践、渐进创新、步步为营”策略的写照。出品｜产业家2022年3月30日，世界经济论坛公布了第8批全球“灯塔工厂”名...

2022-07-29

大数据智造中国智造

1.8w

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

作者:Ada物联网智库原创转载请注明来源和出处导读3月23日,以“AWE新十年,智竞未来”为主题的中国家电及消费电子博览会(AWE2021)盛大开幕,展出面积达15万平米,近千家国内外...

2021-03-24

科技海尔海信集团

1.7w

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

本·周·目·录国内动态● 自然资源部开展汽车高精度地图应用试点● 智能网联汽车测试示范区评估结果发布● 吉利旗下几何汽车将采用华为鸿蒙智能座舱● 小鹏汽车建成中国最大自...

2022-08-08

汽车自动驾驶智能网联汽车

1.7w

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

本·周·目·录国内动态● 北京建设2022年高级别自动驾驶示范区3．0● 上海将制定智能网联汽车终端发展计划● 上汽通用五菱与地平线合作自动驾驶● 极氪上海智能研发中心正式成...

2022-01-24

汽车 adas 智能网联汽车

1.6w

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总

“脚踩风火轮”的“哪吒”是否能跻身第一梯队？本周硬科技领域投融资事件一共70起，人工智能领域发生36起融资事件，占比51%；生物医药领域发生10起融资事件，占比14%；半导...

2022-03-01

科技大数据融资公司

1.6w

下一个10年，将会发生的12个趋势

笔记君邀您阅读前，先思考：未来的衣食住行，会是什么样？元宇宙的本质是什么？当下生活场景的烦恼与科技的关系是什么？一、当下生活场景的烦恼与科技的关系在刚刚过去...

2021-12-22

机器人趋势科技人工智能技术

1.6w

从工业机器人产业链看智能制造机会

　　■智能制造是中国制造2025的核心，是智能制造腾飞的重要基础。制造业是国民经济的主体，是科技创新的主战场，是立国之本和强国之基。在全球产业竞争格局发生重大调整，...

2016-12-28

工业机器人机器人伺服电机

1.6w

最新总结：冬奥会的100个创业机会

“后冬奥时代”来了，更多新的商业机会在等待着创业者们去挖掘。8K比赛画面实时传输、VR直播、虚拟人、“百米级、分钟级”精准气象预报、机器人餐厅、智能可穿戴设备、环保...

2022-02-23

机器人冰雪运动 data-id

1.6w

每个细分方向都是万亿级市场，超6000家公司携资本入局建筑业数字化 | 年度行业

文 | 秦明；编辑 | 石亚琼近三年以来，建筑业伴随着如BIM云平台、AI辅助设计、工业化建筑、智慧建造、绿色节能、BIPV、房产税、PPP、城市更新、新基建、建筑碳中和、REITs等...

2021-12-29

建筑装配式产品管理

1.5w

安防智能化升级的一大助力：端边云，有啥不一样？

大数据、云计算、人工智能、物联网等新兴技术迅猛发展，各行各业都在全面加速数字化转型和智能化建设。步入数智时代，AIoT成了安防行业新的风口与“确定性”，但如何穿越周...

2022-07-08

安防人工智能大数据

1.5w

Nvidia英伟达的AI智能汽车信仰

说起英伟达的智能汽车AI芯片，如我们之前文章智能自动驾驶六大主流车载芯片及其方案，介绍其算力领先，完整工具链，其开放的合作方式，所以很多人都看好，而且那篇文章的投...

2022-03-28

人工智能自动驾驶汽车智能传感器

1.5w

看三大巨头如何逐鹿智能安防？精细化场景需求提升AI应用范围

5G技术的加速落地、AIOT技术的深入应用，让国内不少行业和企业开始向智能化方向快速演进，智能家居市场的发展速度更是有目共睹。而智能安防作为智能家居发展普及的“先锋”...

2022-08-04

人工智能海康威视安防

1.4w

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜镁客网每周硬科技领域投融资

华为前高管、小牛电动创始人李一男创立的造车品牌终于露出面纱。本周硬科技领域投融资事件一共76起，人工智能领域发生26起融资事件，占比36％；半导体领域发生17起融资事件...

2021-12-21

人工智能科技融资公司

1.2w

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

半导体系列（可点击）：（一）～（八）自动驾驶系列（可点击）：（一）～（四）燃料电池系列（可点击）：（一）～（三）十六、移动机器人81．移动机器人：AGV／AMR、叉...

2021-08-16

机器人 agv 移动机器人

1.2w

人脸识别技术哪家强？OPPO专利解读：多帧超分与深度学习结合提升精度

知情郎·眼｜侃透天下专利事儿聊过指纹识别、虹膜识别。今天说人脸识别技术哪家强！国内做人脸识别的科技公司不少。在市场上名气比较大的如炒作了N年的AI四小龙商汤科技、旷...

2022-02-28

人脸识别技术深度学习人脸识别算法

1.2w

亚马逊、微软、苹果、谷歌：一文读懂科技巨头的2022医疗图谱（二）

亚马逊正在推出自己的医疗保健业务，苹果正在将 iPhone 转变为患者能够参与的诊断工具，而谷歌的母公司 Alphabet 通过其投资部门加码人工智能和医疗的融合。那么，微软在做...

2022-01-28

科技临床实验医疗

1.2w

对话清华大学张亚勤：AI发展应遵循3R法则

划重点：在计算机科学及人工智能产业领域，清华大学教授、智能产业研究院（AIR）院长张亚勤有着充分的发言权。作为电气电子工程师协会（IEEE Fellow）历史上获得会士称誉最...

2021-10-13

张亚勤人工智能大学

1.1w

人工智能五年内将爆发国家与地方政策鼎力支持政策法规

　　为贯彻落实《“十三五”国家战略性新兴产业发展规划》，引导全社会资源投向，国家发改委同相关部门组织编制了《战略性新兴产业重点产品和服务指导目录》2016版，明确了...

2017-02-07

人工智能智能制造机器人

1.1w

全球“工业4.0”发展现状及产业链上下游分析

　　对于我国制造业来说，发展的路径应是加紧建立更多新兴技术的研发总部、孵化总部和运营总部、创新总部，对新兴技术要从高起点切入，像硅谷那样，成为全球创新中心。　　...

2016-12-14

工业机器人智能家居智能制造装备

1.1w

最前线丨微软小冰发布社交APP"小冰岛”：不是元宇宙，是虚拟版微信

作者丨邱晓芬从微软拆分的一年后，9月22日，在小冰第九代发布会上，小冰公司发布了首个社交平台APP“小冰岛”。和传统的社交平台不太相同的是，传统的产品是人和人之间的交...

2021-09-23

人工智能微软小冰微信

加载中...

下一篇从“无名”到闻名，展锐业绩飞升背后存在哪些科技企业成长范式

随着5G通信技术、大数据、人工智能等技术的...

2022-01-29

从概念上看看智能机器人的新范式：深度强化学习

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

从概念上看看智能机器人的新范式：深度强化学习

参与评论

为你推荐

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

中国智慧城市“药方”如何化解海外城市治理症结？

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜ 镁客网每周硬科技领域投融资汇总

下一个10年，将会发生的12个趋势

从工业机器人产业链看智能制造机会

最新总结：冬奥会的100个创业机会

每个细分方向都是万亿级市场，超6000家公司携资本入局建筑业数字化 | 年度行业

安防智能化升级的一大助力：端边云，有啥不一样？

Nvidia英伟达的AI智能汽车信仰

看三大巨头如何逐鹿智能安防？精细化场景需求提升AI应用范围

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜ 镁客网每周硬科技领域投融资

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

人脸识别技术哪家强？OPPO专利解读：多帧超分与深度学习结合提升精度

亚马逊、微软、苹果、谷歌：一文读懂科技巨头的2022医疗图谱（二）

对话清华大学张亚勤：AI发展应遵循3R法则

人工智能五年内将爆发 国家与地方政策鼎力支持政策法规

全球“工业4.0”发展现状及产业链上下游分析

最前线丨微软小冰发布社交APP"小冰岛”：不是元宇宙，是虚拟版微信

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜镁客网每周硬科技领域投融资

人工智能五年内将爆发国家与地方政策鼎力支持政策法规