发现汽车网
首页 >> 汽车资讯 >> 正文

历时3年,iDLab实验室

日期:2021-01-12 17:30:53 来源:互联网 编辑:小狐 阅读人数:721

历时3年,清华大学iDLab实验室打造《强化学习和控制》课程及讲义

历时3年,iDLab实验室(图1)

1 iDLab实验室

The Intelligent Driving Laboratory (iDLAB) is a part of the School of Vehicle and Mobility (SVM) at Tsinghua University. This lab focuses on advanced automatic control and machine learning algorithms, and their applications on autonomous driving, connected vehicles, driver assistance and driver behavior analysis, etc. Our research interests are loosely divided into four categories: (1) Perception, decision and control for autonomous vehicles and driver assistance systems (2) Reinforcement learning and optimal control (3) Distributed estimation, learning and control and (4) Large-scale optimization and control of eco-automation and electrified powertrain. We have achieved a series of important research results and peer-reviewed publications publicly available through this website.

2书籍简介

Reinforcement learning and control撰写从2018年启动,至今已历三年,目的是为清华大学开设的同名研究生课程“强化学习与控制”准备英文授课讲义。

历时3年,iDLab实验室(图2)

一、内容简介

历时3年,iDLab实验室(图3)

图2 强化学习型自动驾驶框架

但是该方法的工程应用尚属于起步阶段。一个重要的原因是该方法既具有理论学习的复杂度,又具有工程实践的性。理论上,它隶属于统计学习和最优控制领域的交叉结合部,涉及的数理基础较深,涵盖面较广,难以学习本质机理。实践上,入门者不易短期内熟练掌握关联的编程工具,而且若对算法原理不熟悉,难以对代码进行工程化调整,不能发挥算法的应有性能。为应对上述,《Reinforcement Learning and Control》一书面向工程应用领域的科研人员和技术者,按照原理剖析、主流算法、典型示例三位一体的原则,逐一介绍该方法在动态的学习和控制领域的理论和应用,涉及马尔科夫决策、蒙特卡洛学习、时序差分学习、函数近似、策略梯度学习、近似动态规划、深度强化学习等知识点。

二、内容提要

全书总共包括11章。依次介绍RL概况及基础知识,免模型学习的蒙特卡洛法及时序差分法,带模型学习的动态规划法,间接型及直接型RL,无穷时域及有限时域的近似动态规划,深度强化学习和RL的各类拾遗。

样稿展示

历时3年,iDLab实验室(图4)

历时3年,iDLab实验室(图5)

历时3年,iDLab实验室(图6)

历时3年,iDLab实验室(图7)

李升波,清华大学车辆与运载学院副院长、长聘教授、博导。研究领域:智能汽车与驾驶辅助、强化学习、最优控制等。主参编《Applied Methods and Techniques for Mechatronic Systems: Modeling,Identification and Control》《AAC: Optimization, Controland Diagnosis》《Road Vehicle Automation 3》和《Cooperative Intelligent Transport Systems: Towards High-level AutomatedDriving》等英文学术专著4部,《地面车辆原理》等中文译著1部。

收藏

举报

本文相关词条概念解析:

学习

学习,是指通过阅读、听讲、思考、研究、实践等途径获得知识或技能的过程。学习分为狭义与广义两种:狭义:通过阅读、听讲、研究、观察、理解、探索、实验、实践等手段获得知识或技能的过程,是一种使个体可以得到持续变化(知识和技能,方法与过程,情感与价值的改善和升华)的行为方式。广义:是人在生活过程中,通过获得经验而产生的行为或行为潜能的相对持久的行为方式。

网友评论