【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

栏目: 数据库 · 发布时间: 7年前

内容简介:AI 研习社又有新的学习小组啦!赶快加入我们吧!扫描二维码,即可加入小组

AI 研习社又有新的学习小组啦!赶快加入我们吧!

扫描二维码,即可加入小组

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

课程开始后,小组成员可免费观看课程视频~

AI 研习社获得官方授权,汉化翻译伯克利大学 CS 294-112 《深度强化学习》,于本周四(2018 年 12 月 20 日)正式上线中文字幕版。

伯克利大学 CS 294-112 《深度强化学习》为官方开源最新版本,由伯克利大学该门课程授课讲师 Sergey Levine 授权 AI 研习社翻译。

观看网址: https://ai.yanxishe.com/page/groupDetail/30 (加入小组后即可直接观看)

课程主页: http://rail.eecs.berkeley.edu/deeprlcourse/

油管链接: https://www.youtube.com/playlist?list=PLkFD6_40KJIxJMR-j5A1mkxK26gh_qg37

12 月 20 日开始正式同步更新在 AI 研习社,大约1到2周更新一次。

该课程主题选择深度增强学习,即紧跟当前人工智能研究的热点,又可作为深度学习的后续方向,值得推荐。

   先修要求

想要学习伯克利大学 CS 294-112 《深度强化学习》这门课程,学生需要先学习 CS189 或者其他同等学力课程。本课程将假定学生掌握强化学习、数值优化和机器学习的相关背景知识。 雷锋网雷锋网 (公众号:雷锋网) 雷锋网

如果你对上述主题不是非常了解,那么需要自主学习补充以下知识点:

  • 增强学习和马尔科夫决策过程(MDPs)

MDPs的定义

具体算法:策略迭代和价值迭代

搜索算法

  • 数值最优化方法

梯度下降和随机梯度下降

反向传播算法

  • 机器学习

分类和回归问题:用什么样的损失函数,如何拟合线性或非线性模型

训练/测试误差,过拟合

  视频截图    

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

   课程大纲

第一讲:课程介绍和概览

第二讲:监督学习和模仿学习

第三讲:TensorFlow 和神经网络简述

第四讲:强化学习简介

第五讲:策略梯度简介

第六讲:Actor-Critic 算法简介

第七讲:价值函数介绍

第八讲:高级 Q-学习算法

第九讲:高级策略梯度

第十讲:最优控制和规划

第十一讲:基于模型的强化学习

第十二讲:高级强化学习和图像处理应用

第十三讲:利用模仿优化控制器学习策略

第十四讲:概率和变分推断入门

第十五讲:推断和控制之间的联系

第十六讲:逆向强化学习

第十七讲:探索(上)

第十八讲:探索(下)

第十九讲:迁移学习与多任务学习

第二十讲:元学习

第二十一讲:平行结构和强化学习系统设计

第二十二讲:进阶模仿学习和开放性问题

第二十三讲:客座讲师:Craig Boutilier

第二十四讲:客座讲师:Gregory Kahn

第二十五讲:客座讲师:Quoc Le & Barret Zoph

第二十六讲:客座讲师:Karol Hausman

快来加入学习小组吧!

点击链接: https://ai.yanxishe.com/page/groupDetail/30 选择【加入小组】


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Python编程初学者指南

Python编程初学者指南

[美]Michael Dawson / 王金兰 / 人民邮电出版社 / 2014-10-1

Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。Python可以用于很多的领域,从科学计算到游戏开发。 《Python编程初学者指南》尝试以轻松有趣的方式来帮助初学者掌握Python语言和编程技能。《Python编程初学者指南》共12章,每一章都会用一个完整的游戏来演示其中的关键知识点,并通过编写好玩的小软件这种方式来学习编程,引发读者的兴趣,降低学习的难度。每章最后都会......一起来看看 《Python编程初学者指南》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具