内容简介:AI 研习社获得官方授权,汉化翻译伯克利大学 CS 294-112 《深度强化学习》,今天正式上线中英双语字幕版课程啦!我们先来一睹为快——上手视频约 5 分钟
AI 研习社获得官方授权,汉化翻译伯克利大学 CS 294-112 《深度强化学习》,今天正式上线中英双语字幕版课程啦!
我们先来一睹为快——
第一讲
课程介绍和概览
上手视频约 5 分钟
翻译 | 朱海浩 段小杰 周清逸 字幕 | 凡江
看完是不是不够过瘾!
请扫描下方二维码, 加入官方学习小组
或者直接点击链接: https://ai.yanxishe.com/page/groupDetail/30
即可观看 完整视频
↓↓↓
回复字幕君(微信:leiphonefansub)
加入该课程小组的截图
我们将你拉 入微信群聊
添加时备注“CS294加群”~
课程介绍
伯克利大学 CS 294-112 《深度强化学习》为官方开源最新版本,由伯克利大学该门课程授课讲师 Sergey Levine 授权 AI 研习社翻译。
12 月 20 日开始正式同步更新在 AI 研习社,大约 1 到 2 周更新一次。
该课程主题选择深度增强学习,即紧跟当前人工智能研究的热点,又可作为深度学习的后续方向,值得推荐。
先修要求
想要学习伯克利大学 CS 294-112 《深度强化学习》这门课程,学生需要先学习 CS189 或者其他同等学力课程。本课程将假定学生掌握强化学习、数值优化和机器学习的相关背景知识。
如果你对上述主题不是非常了解,那么需要自主学习补充以下知识点:
-
增强学习和马尔科夫决策过程(MDPs)
MDPs的定义
具体算法:策略迭代和价值迭代
搜索算法
-
数值最优化方法
梯度下降和随机梯度下降
反向传播算法
-
机器学习
分类和回归问题:用什么样的损失函数,如何拟合线性或非线性模型
训练/测试误差,过拟合
视频截图
译者评价
比较有趣,讲课用很多例子来解释,不是那种光给你一大堆公式概念的,感觉偏重实际应用和前沿技术一点,推荐大家来看。
@周清逸
这门课是基本覆盖了强化学习的主要内容和前沿的研究话题,通过理论到应用例子的讲述,以及五次作业(实际上是七次)的实践练习对经典算法的复现,可以让学生达到在强化学习领域的入门研究水平。重点是免费!课程有中文字幕!有作业参考!不过这门课并不是零门槛,需要上过机器学习课程,最好是还上过深度学习(比如cmu deeplearning),最最好用过tensorflow(因为作业的官方基础代码只有tensorflow版本)。
@朱海浩
侧重于增强学习与深度学习相结合,应用在机器人方面的例子比较多,翻译的话老师语速挺快的,虽然语气词比较多,整体逻辑很清晰。
@段小杰
课程大纲
第一讲:课程介绍和概览
第二讲:监督学习和模仿学习
第三讲:TensorFlow 和神经网络简述
第四讲:强化学习简介
第五讲:策略梯度简介
第六讲:Actor-Critic 算法简介
第七讲:价值函数介绍
第八讲:高级 Q-学习算法
第九讲:高级策略梯度
第十讲:最优控制和规划
第十一讲:基于模型的强化学习
第十二讲:高级强化学习和图像处理应用
第十三讲:利用模仿优化控制器学习策略
第十四讲:概率和变分推断入门
第十五讲:推断和控制之间的联系
第十六讲:逆向强化学习
第十七讲:探索(上)
第十八讲:探索(下)
第十九讲:迁移学习与多任务学习
第二十讲:元学习
第二十一讲:平行结构和强化学习系统设计
第二十二讲:进阶模仿学习和开放性问题
第二十三讲:客座讲师:Craig Boutilier
第二十四讲:客座讲师:Gregory Kahn
第二十五讲:客座讲师:Quoc Le & Barret Zoph
第二十六讲:客座讲师:Karol Hausman
相关材料
有关强化学习与 MDP 的介绍资料:
CS188 EdX 课程,从马尔可夫决策过程 I 开始: http://ai.berkeley.edu/home.html
Richard S. Sutton 与 Andrew G. Barto 的《强化学习导论》,第三章和第四章: http://incompleteideas.net/book/the-book-2nd.html
有关 MDP 的介绍,请参阅吴恩达的论文《Shaping and policy search in Reinforcement learning》: http://rll.berkeley.edu/deeprlcourse/docs/ng-thesis.pdf
David Silver 的课程: http://rll.berkeley.edu/deeprlcourse/#related-materials
有关机器学习和神经网络的介绍性资料,请参阅:
Andrej Karpathy 的课程: http://cs231n.github.io/
Geoff Hinton 的 Coursera 课程: https://www.coursera.org/learn/neural-networks
吴恩达的 Coursera 课程: https://www.coursera.org/learn/machine-learning/
Yaser Abu-Mostafa 的课程: https://work.caltech.edu/telecourse.html
写在最后:想要参与这门课程的翻译?添加雷锋字幕组微信 leiphonefansub 为好友,备注CS294译者,即可报名,译者招募长期有效哦~ 雷锋网雷锋网 (公众号:雷锋网) 雷锋网
雷锋网原创文章,未经授权禁止转载。详情见 转载须知 。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 零基础快速学习Kubernetes | 周五开课
- MIT 2019深度学习课程开课,第一课视频&PPT已放出
- DBLE核心研发主讲:MySQL分布式中间件公开课开课啦
- 陈莉君老师主讲的《Linux内核分析与应用》MOOC在学堂在线开课啦,快来选课
- 重磅!谷歌发布 Flutter 2
- Linkis 0.9.1 重磅发布
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
UNIX环境高级编程
W.Richard Stevens、Stephen A.Rago / 尤晋元、张亚英、戚正伟 / 人民邮电出版社 / 2006年 / 99.00元
本书是被誉为UNIX编程“圣经”的Advanced Programming in the UNIX Environment一书的更新版。在本书第1版出版后的十几年中,UNIX行业已经有了巨大的变化,特别是影响UNIX编程接口的有关标准变化很大。本书在保持了前一版风格的基础上,根据最新的标准对内容进行了修订和增补,反映了最新的技术发展。书中除了介绍UNIX文件和目录、标准I/O库、系统数据文件和信息......一起来看看 《UNIX环境高级编程》 这本书的介绍吧!